Николай Чикишев world 4 сакавіка 2026, 12:15

Google прадставіла Gemini 3.1 Flash-Lite — у восем разоў таннейшы за Pro

Кампанія прадставіла новую мадэль штучнага інтэлекту Gemini 3.1 Flash-Lite, зрабіўшы стаўку на хуткасць працы і нізкі кошт.

Пакінуць каментарый

Google прадставіла Gemini 3.1 Flash-Lite — у восем разоў таннейшы за Pro

Кампанія прадставіла новую мадэль штучнага інтэлекту Gemini 3.1 Flash-Lite, зрабіўшы стаўку на хуткасць працы і нізкі кошт.

Мадэль пазіцыянуецца як самае даступнае і хуткае рашэнне ў лінейцы Gemini 3 і арыентавана перш за ўсё на распрацоўшчыкаў і карпаратыўных карыстальнікаў, якім неабходна апрацоўваць вялікія аб’ёмы задач у рэжыме рэальнага часу.

Па звестках Google, Flash-Lite аптымізаваная для мінімальнай затрымкі адказу — ключавога параметра для сэрвісаў кшталту анлайн-падтрымкі, мадэрацыі кантэнту ці генерацыі інтэрфейсаў. Мадэль пачынае выдаваць першы токен адказу ў сярэднім у 2,5 разы хутчэй, чым папярэдняя версія Gemini 2.5 Flash. Агульная хуткасць генерацыі тэксту таксама вырасла прыкладна на 45% і дасягае 363 токенаў у секунду.

Gemini 3.1 Flash-Lite дэманструе больш высокую хуткасць генерацыі і больш нізкі кошт токенаў у параўнанні з шэрагам папулярных мадэляў ШІ. Крыніца: Google.

Адной з новых функцый сталі так званыя ўзроўні «мыслення» (thinking levels). Распрацоўшчыкі могуць рэгуляваць глыбіню разважання мадэлі ў залежнасці ад задачы. Для простых аперацый кшталту класіфікацыі тэксту ці аналізу танальнасці можна знізіць узровень разважання, што змяншае кошт і паскарае адказы. Для больш складаных задач — напрыклад, генерацыі кода, аналітычных панэляў ці сімуляцый — мадэль можа выкарыстоўваць больш глыбокую логіку.

Мадэль дэманструе даволі высокія паказчыкі ў тэстах. На Arena.ai Leaderboard яна атрымала рэйтынг Elo 1432 (пры парозе 1400+ для моцных мадэляў, блізкіх да топ-узроўню). У спецыялізаваных бенчмарках Flash-Lite паказала 86,9% у тэсце навуковых ведаў GPQA Diamond, 76,8% у мультымадальным тэсце MMMU-Pro і 88,9% у мультымоўных пытальна-адказных задачах MMMLU.

Галоўнай перавагай новай мадэлі стаў кошт. Google устанавіла кошт на ўзроўні $0,25 за 1 мільён уваходных токенаў і $1,50 за 1 мільён выходных. Гэта прыкладна ў восем разоў танней, чым выкарыстанне флагманскай мадэлі Gemini 3.1 Pro, і заўважна ніжэй цэн некаторых канкурэнтаў, уключаючы Claude 4.5 Haiku.

У кампаніі лічаць, што новая мадэль лепш за ўсё падыходзіць для масавых задач: перакладу, тэгіравання дадзеных, маршрутызацыі запытаў і мадэрацыі кантэнту. Больш складаныя вылічэнні і глыбокі аналіз могуць выконваць старэйшыя мадэлі кшталту Gemini 3.1 Pro.

Абедзве мадэлі даступныя праз Google AI Studio і платформу Vertex AI. Зараз Gemini 3.1 Flash-Lite распаўсюджваецца ў рэжыме папярэдняга доступу, каб распрацоўшчыкі маглі пратэставаць мадэль і даць зваротную сувязь перад паўнавартасным запускам.