Подразделение Google AI открыло доступ к Google-Landmarks-v2 — крупному датасету для распознавания достопримечательностей природного и искусственного происхождения, пишет VentureBeat.
Набор данных включает более 5 млн фотографий более чем 200 тысяч культурных памятников, собранных со всего мира. Фотографы сами маркировали снимки и подавали на включение в датасет. Далее исследователи Google дополняли их историческими и менее известными изображениями из виртуального хранилища медиафайлов Викисклад.
Кроме этого, Google открыла исходный код и модель Detect-to-Retrieve, фреймворка для поиска изображений. Модель была обучена на выборке из 80 тысяч изображений оригинального датасета.
Также на своей платформе машинного обучения Kaggle компания запустила два соревнования: Landmark Recognition 2019 и Landmark Retrieval 2019. Задача первого конкурса — создать модель по распознаванию памятников культуры из предложенного датасета, а второго — разработать систему для извлечения картинок, на которых изображена заданная достопримечательность. Призовой фонд соревнований составляет по $25 тысяч, подача заявок на участие уже открыта.
В прошлом году Google выпустила аналогичный датасет Google-Landmarks.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.