Google представила открытую ИИ-модель, которая запускается на ноутбуке
Google DeepMind представила Gemma 4 12B — открытую мультимодальную ИИ-модель, которую можно запускать локально на обычном ноутбуке с 16 ГБ оперативной памяти.
Google DeepMind представила Gemma 4 12B — открытую мультимодальную ИИ-модель, которую можно запускать локально на обычном ноутбуке с 16 ГБ оперативной памяти.
Google DeepMind представила Gemma 4 12B — открытую мультимодальную ИИ-модель, которую можно запускать локально на обычном ноутбуке с 16 ГБ оперативной памяти.
Gemma 4 12B содержит около 12 миллиардов параметров и занимает промежуточное место между более компактной Gemma 4 E4B и старшей моделью Gemma 4 26B. Google позиционирует ее как вариант для локального и edge-развертывания — например, в корпоративных сценариях, где важно не отправлять данные в облако.
Главное техническое отличие Gemma 4 12B — единая архитектура для разных типов данных. В традиционных мультимодальных системах изображения и звук обычно сначала обрабатываются отдельными энкодерами, а затем передаются языковой модели. В Gemma 4 12B Google упростила эту схему: визуальные данные и аудиосигналы напрямую проецируются в общее пространство с текстовыми токенами.
За счет этого модель требует меньше памяти, работает с меньшей задержкой и может выполнять мультимодальные задачи на менее мощном железе. По данным разработчиков, Gemma 4 12B почти достигает результатов более крупной модели 26B в ряде бенчмарков, но при этом потребляет меньше ресурсов.
Модель поддерживает контекстное окно до 256 тысяч токенов. Это позволяет использовать ее для анализа длинных документов, больших фрагментов кода, многостраничных отчетов, транскриптов встреч и других объемных материалов. Также у Gemma 4 12B есть режим пошагового рассуждения и поддержка подключения внешних инструментов, что делает ее пригодной для построения ИИ-агентов.

Модель может обрабатывать не только текст и изображения, но и аудио. В демонстрациях Google показывает сценарии локальной транскрибации, форматирования и перевода голосовых команд без подключения к сети. Модель также может анализировать короткие видеоклипы, сопоставляя кадры и аудиодорожку.
Для бизнеса локальный запуск может быть важным преимуществом. Компании из регулируемых отраслей — например финансового сектора, здравоохранения или госсектора — часто не могут отправлять внутренние документы, код, голосовые записи или визуальные данные во внешние API. Gemma 4 12B позволяет обрабатывать такие данные на устройстве или во внутренней инфраструктуре.
Модель уже доступна через Hugging Face, Kaggle, Ollama, LM Studio и другие платформы. Она также совместима с популярными инструментами для локального запуска и развертывания моделей, включая llama.cpp, MLX, vLLM и SGLang.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.