«Сбер» представил нейросеть, которая создает картинку по описанию на русском языке

ruDALL-E — первая нейросеть, которая может генерировать картинки по запросу на русском языке.

Оставить комментарий

В январе 2021 года нейросеть DALL-E представила OpenAI. Команды «Сбера» SberDevices, Sber AI и SberCloud воспроизвели ее код и запустили обучение модели на платформе ML Space на базе суперкомпьютера «Кристофари».

Нейросеть может обучаться одновременно на картинках и тестах, при этом ruDALL-E создает неограниченное количество новых изображений по заданному описанию.

Обучение нейросети заняло 23 тысячи GPU-часов на массиве данных из 120 млн пар текст-изображение. По данным «Сбера», обучение ruDALL-E стало самым большим нейросетевым вычислительным проектом в России и СНГ.

Модель нейросети с 1,3 миллиарда параметров находится в открытом доступе на GitHub. Также существует вторая версия ruDALL-E с 12 миллиардами параметров. Обе версии в скором времени будут доступны на платформе ML Space.


Читать на dev.by