Отдел новостей 4 мая 2019, 10:25

Google выпустила крупнейший в мире датасет достопримечательностей Google-Landmarks-v2

Подразделение Google AI открыло доступ к Google-Landmarks-v2 — крупному датасету для распознавания достопримечательностей природного и искусственного происхождения, пишет VentureBeat.

Набор данных включает более 5 млн фотографий более чем 200 тысяч культурных памятников, собранных со всего мира. Фотографы сами маркировали снимки и подавали на включение в датасет. Далее исследователи Google дополняли их историческими и менее известными изображениями из виртуального хранилища медиафайлов Викисклад.

Кроме этого, Google открыла исходный код и модель Detect-to-Retrieve, фреймворка для поиска изображений. Модель была обучена на выборке из 80 тысяч изображений оригинального датасета.

Также на своей платформе машинного обучения Kaggle компания запустила два соревнования: Landmark Recognition 2019 и Landmark Retrieval 2019. Задача первого конкурса — создать модель по распознаванию памятников культуры из предложенного датасета, а второго — разработать систему для извлечения картинок, на которых изображена заданная достопримечательность. Призовой фонд соревнований составляет по $25 тысяч, подача заявок на участие уже открыта.

В прошлом году Google выпустила аналогичный датасет Google-Landmarks.