Отдел новостей 24 ноября 2021, 15:36

Nvidia представила ИИ-систему перевода текста в изображение

Компания представила новую систему на базе технологий ИИ GauGAN2, которая позволяет создавать правдоподобные изображения по текстовому запросу.

Оставить комментарий

Nvidia представила ИИ-систему перевода текста в изображение

Компания представила новую систему на базе технологий ИИ GauGAN2, которая позволяет создавать правдоподобные изображения по текстовому запросу.

GauGAN2 применяет сегментированное картирование, ретушь и преобразование текста в изображение. По сравнению с другими существующими моделями лежащая в основе GauGAN2 нейросеть производит более разнообразные и качественные изображения. Для этого пользователи могут ввести короткую фразу и сгенерировать его ключевые особенности и сюжет.

«Эту стартовую заготовку потом можно дорисовать, сделав ту или иную гору выше и добавив деревья на заднем плане или облака в небе», — сообщила участница команды Nvidia Иша Салиан.

GauGAN2 — это улучшенная версия системы GauGAN, созданной в 2019 году. Ее обучили на более миллиона открытых изображений с платформы Flickr. Новая версия понимает взаимосвязи между объектами, такими как снег, деревья, вода, цветы, кусты, холмы и горы, нейросеть «осознает», какие типы осадков характерны для каждого времени года.

В основе работы системы лежит генеративно-состязательная сеть, состоящая из генератора и дискриминатора. Генератор берет образцы изображений с сопроводительным текстом и предлагает, какие слова соответствуют элементам изображения. Дискриминатор оценивает, соответствует ли это предположение истине.

В версии GauGAN2 использовано уже 10 миллионов изображений для обучения. Если ввести текст «закат на пляже», то сеть сгенерирует соответсвующее изображение; если расширить фразу до «закат на каменистом пляже» или заменить «закат» на «дождливый день», нейросеть поймет значения и внесет соответствующие изменения.

«Сбер» представил нейросеть которая создает картинку по описанию на русском языке

Нейросеть создала привлекательные изображения лиц с помощью активности мозга пользователей

Алгоритм распознавания объектов OpenAI можно обмануть надписью на бумажке

Оставить комментарий

Текст: Отдел новостей Фото: Nvidia Источник: TNW Теги: nvidia, распознавание изображений, нейросеть, ии

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

«Нам нужны новые социальные нормы»: CEO Nvidia считает, что всем придётся адаптироваться к ИИ

«На конференциях часто варят маркетинговый суп». CTO SOFTSWISS — о саммите, с которого уносишь идеи

Сергей Кастюкевич, CTO SOFTSWISS, объездил десятки техконференций. И нередко уходил с одной мыслью: послушать послушал, а унести нечего. Из неё и вырос Tech Race Summit — 10 сентября, Варшава, 30 спикеров от Google до Cloudflare. Поговорили, чем он должен отличаться.

4 комментария

«Раньше — нет». Почему сеньоры теперь готовы на тестовые (даже бесплатные)

Опытные айтишники обычно считают тестовые, особенно бесплатные, кринжатиной. Или уже нет? Может, правила игры на кризисном рынке поменялись? Кто и какие задания раздаёт кандидатам в эпоху AI? Обсудили тестовые-2026.

4 комментария

Гендиректор Perplexity поделился двумя уроками для фаундеров от Хуанга и Маска

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.

Войдите, чтобы оставить комментарий