Новые инструмент Google генерирует картинки без текстового описания (ну почти)

Google представила инструмент под названием Whisk, который генерирует изображения на основе пользовательского изображения, не требуя длинного словесного описания.

Оставить комментарий

Пользователю нужно загрузить картинки с темой, контекстом и стилем, которые следует применить в итоговом изображении. По каждому из трёх пунктов можно загружать несколько картинок для референса, а при желании можно добавлять текстовые инструкции. Если под рукой картинок нет, в Whisk есть значок игральной кости, при нажатии на который инструмент выдаст несколько картинок-промптов (они тоже будут сгенерированы ИИ).

К каждой сгенерированной картинке Whisk создаёт текстовый промпт, который можно уточнить или дополнить, если результат не устраивает. Готовое изображение можно добавить в избранное или скачать.

The Verge отмечает, что на генерацию уходит несколько секунд, что долго, а картинки на выходе получаются немного странными. Google подчёркивает, что инструмент пока не идеален — именно поэтому есть опция редактирования промптов.

Google выпустила Gemini 2.0 — свою самую умную модель
По теме
Google выпустила Gemini 2.0 — свою самую умную модель
Новый генератор видео Veo 2 от Google превосходит своего конкурента Sora от OpenAI
По теме
Новый генератор видео Veo 2 от Google превосходит своего конкурента Sora от OpenAI
YouTube тестирует голосовые комментарии под видео
По теме
YouTube тестирует голосовые комментарии под видео

Читать на dev.by