Скорость в обмен на лоск: Google представила экспериментальную ИИ-модель, которая работает по новому принципу
Google выпустила экспериментальную опенсорсную модель DiffusionGemma, которая кардинально меняет привычный подход к генерации текста. В отличие от стандартных моделей вроде Gemma 4, которые пишут строго последовательно — слово за словом, новинка генерирует сразу весь массив текста в виде случайного набора «шумных» токенов, а затем за несколько проходов очищает и редактирует его до читаемого состояния. По сути, если обычные ИИ-модели последовательно пишут текст, то DiffusionGemma набрасывает черновик и правит его целиком.
Google выпустила экспериментальную опенсорсную модель DiffusionGemma, которая кардинально меняет привычный подход к генерации текста. В отличие от стандартных моделей вроде Gemma 4, которые пишут строго последовательно — слово за словом, новинка генерирует сразу весь массив текста в виде случайного набора «шумных» токенов, а затем за несколько проходов очищает и редактирует его до читаемого состояния. По сути, если обычные ИИ-модели последовательно пишут текст, то DiffusionGemma набрасывает черновик и правит его целиком.
Такой подход обеспечивает колоссальную скорость и аппаратную эффективность: модель выдает более 1000 токенов в секунду на чипе NVIDIA H100 и свыше 700 токенов на потребительской карте RTX 5090, что до 4 раз быстрее стандартных аналогов при работе одного пользователя на GPU. Под капотом DiffusionGemma находится архитектура mixture-of-experts на 26 млрд параметров, но при генерации активируются только 3,8 млрд, благодаря чему модель требует около 18 ГБ видеопамяти и может запускаться на мощных домашних ПК. За один шаг ИИ обрабатывает параллельно до 256 токенов, что позволяет ему видеть весь блок текста сразу и исправлять внутренние противоречия ещё в процессе генерации.
Главный компромисс новинки — качество текста. Google открыто признаёт, что по глубине, стабильности и точности формулировок DiffusionGemma уступает стандартной линейке Gemma 4. Продукт ориентирован на разработчиков и исследователей для сценариев, где мгновенный отклик важнее идеального слога: например, для автодополнения кода, заполнения JSON-структур, решения логических задач и математических паттернов, а также для интерактивных текстовых помощников, работающих в реальном времени.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.