Николай Чикишев world 4 марта 2026, 12:15

Google представила Gemini 3.1 Flash-Lite — в восемь раз дешевле Pro

Компания представила новую модель искусственного интеллекта Gemini 3.1 Flash-Lite, сделав ставку на скорость работы и низкую стоимость.

Оставить комментарий

Google представила Gemini 3.1 Flash-Lite — в восемь раз дешевле Pro

Компания представила новую модель искусственного интеллекта Gemini 3.1 Flash-Lite, сделав ставку на скорость работы и низкую стоимость.

Модель позиционируется как самое доступное и быстрое решение в линейке Gemini 3 и ориентирована прежде всего на разработчиков и корпоративных пользователей, которым необходимо обрабатывать большие объемы задач в режиме реального времени.

По данным Google, Flash-Lite оптимизирована для минимальной задержки ответа — ключевого параметра для сервисов вроде онлайн-поддержки, модерации контента или генерации интерфейсов. Модель начинает выдавать первый токен ответа в среднем в 2,5 раза быстрее, чем предыдущая версия Gemini 2.5 Flash. Общая скорость генерации текста также выросла примерно на 45% и достигает 363 токенов в секунду.

Gemini 3.1 Flash-Lite демонстрирует более высокую скорость генерации и более низкую стоимость токенов по сравнению с рядом популярных моделей ИИ. Источник: Google.

Одной из новых функций стали так называемые уровни «мышления» (thinking levels). Разработчики могут регулировать глубину рассуждения модели в зависимости от задачи. Для простых операций вроде классификации текста или анализа тональности можно снизить уровень рассуждения, что уменьшает стоимость и ускоряет ответы. Для более сложных задач — например, генерации кода, аналитических панелей или симуляций — модель может использовать более глубокую логику.

Модель демонстрирует довольно высокие показатели в тестах. На Arena.ai Leaderboard она получила рейтинг Elo 1432 (при пороге 1400+ для сильных моделей, близких к топ-уровню). В специализированных бенчмарках Flash-Lite показала 86,9% в тесте научных знаний GPQA Diamond, 76,8% в мультимодальном тесте MMMU-Pro и 88,9% в мультиязычных вопросно-ответных задачах MMMLU.

Главным преимуществом новой модели стала цена. Google установила стоимость на уровне $0,25 за 1 миллион входных токенов и $1,50 за 1 миллион выходных. Это примерно в восемь раз дешевле, чем использование флагманской модели Gemini 3.1 Pro, и заметно ниже цен некоторых конкурентов, включая Claude 4.5 Haiku.

В компании считают, что новая модель лучше всего подходит для массовых задач: перевода, тегирования данных, маршрутизации запросов и модерации контента. Более сложные вычисления и глубокий анализ могут выполнять старшие модели вроде Gemini 3.1 Pro.

Обе модели доступны через Google AI Studio и платформу Vertex AI. Сейчас Gemini 3.1 Flash-Lite распространяется в режиме предварительного доступа, чтобы разработчики могли протестировать модель и дать обратную связь перед полноценным запуском.