Support us

Скорость в обмен на лоск: Google представила экспериментальную ИИ-модель, которая работает по новому принципу

Google выпустила экспериментальную опенсорсную модель DiffusionGemma, которая кардинально меняет привычный подход к генерации текста. В отличие от стандартных моделей вроде Gemma 4, которые пишут строго последовательно — слово за словом, новинка генерирует сразу весь массив текста в виде случайного набора «шумных» токенов, а затем за несколько проходов очищает и редактирует его до читаемого состояния. По сути, если обычные ИИ-модели последовательно пишут текст, то DiffusionGemma набрасывает черновик и правит его целиком.

Оставить комментарий
Скорость в обмен на лоск: Google представила экспериментальную ИИ-модель, которая работает по новому принципу

Google выпустила экспериментальную опенсорсную модель DiffusionGemma, которая кардинально меняет привычный подход к генерации текста. В отличие от стандартных моделей вроде Gemma 4, которые пишут строго последовательно — слово за словом, новинка генерирует сразу весь массив текста в виде случайного набора «шумных» токенов, а затем за несколько проходов очищает и редактирует его до читаемого состояния. По сути, если обычные ИИ-модели последовательно пишут текст, то DiffusionGemma набрасывает черновик и правит его целиком.

Такой подход обеспечивает колоссальную скорость и аппаратную эффективность: модель выдает более 1000 токенов в секунду на чипе NVIDIA H100 и свыше 700 токенов на потребительской карте RTX 5090, что до 4 раз быстрее стандартных аналогов при работе одного пользователя на GPU. Под капотом DiffusionGemma находится архитектура mixture-of-experts на 26 млрд параметров, но при генерации активируются только 3,8 млрд, благодаря чему модель требует около 18 ГБ видеопамяти и может запускаться на мощных домашних ПК. За один шаг ИИ обрабатывает параллельно до 256 токенов, что позволяет ему видеть весь блок текста сразу и исправлять внутренние противоречия ещё в процессе генерации.

Главный компромисс новинки — качество текста. Google открыто признаёт, что по глубине, стабильности и точности формулировок DiffusionGemma уступает стандартной линейке Gemma 4. Продукт ориентирован на разработчиков и исследователей для сценариев, где мгновенный отклик важнее идеального слога: например, для автодополнения кода, заполнения JSON-структур, решения логических задач и математических паттернов, а также для интерактивных текстовых помощников, работающих в реальном времени.

Google Переводчик сможет синхронно переводить диалоги на 70+ языках
Google Переводчик сможет синхронно переводить диалоги на 70+ языках
По теме
Google Переводчик сможет синхронно переводить диалоги на 70+ языках
ИИ не приговор: топ-инженер Google объяснил кого на самом деле из разрабов заменяет технология
ИИ не приговор: топ-инженер Google объяснил, кого на самом деле из разрабов заменяет технология
По теме
ИИ не приговор: топ-инженер Google объяснил, кого на самом деле из разрабов заменяет технология
Читайте также
Новая ИИ-модель DeepSeek сделает работу вдвое дешевле предыдущей
Новая ИИ-модель DeepSeek сделает работу вдвое дешевле предыдущей
Новая ИИ-модель DeepSeek сделает работу вдвое дешевле предыдущей
Google представила Gemini 3 Flash — новая модель бесплатна для всех
Google представила Gemini 3 Flash — новая модель бесплатна для всех
Google представила Gemini 3 Flash — новая модель бесплатна для всех
OpenAI прокачала генерацию картинок: ИИ больше не путается в тексте
OpenAI прокачала генерацию картинок: ИИ больше не путается в тексте
OpenAI прокачала генерацию картинок: ИИ больше не путается в тексте
Google представила открытую ИИ-модель, которая запускается на ноутбуке
Google представила открытую ИИ-модель, которая запускается на ноутбуке
Google представила открытую ИИ-модель, которая запускается на ноутбуке

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.