Дапамажыце dev.by 🤍
Падтрымаць

Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

1 каментарый
Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

Google улічыла водгукі карыстальнікаў пра папярэднюю версію Gemini 2.5 Pro, удасканаліўшы стыль і структуру адказаў мадэлі. Цяпер, як сцвярджае кампанія, мадэль здольная генерыраваць «больш крэатыўныя і лепш адфарматаваныя адказы». Абнаўленне накіраванае на ліквідацыю рэгрэсій, выяўленых у папярэднім рэлізе, каб вярнуць прадукцыйнасць на ўзровень сакавіцкага абнаўлення (03-25).

Крыніца: Google.

Новая версія, па заяве Google, яшчэ лепш спраўляецца з генерацыяй кода, дасягнуўшы рэкорднага выніку 82,2% у тэсце Aider Polyglot. Гэта пераўзыходзіць лепшыя паказчыкі мадэляў OpenAI, Anthropic і DeepSeek з прыкметным адрывам. Мадэль стане агульнадаступнай праз «пару тыдняў» і ўжо сёння з’явілася на платформах для распрацоўшчыкаў AI Studio і Vertex AI, а таксама ў аплікацыі Gemini.

Крыніца: Google.

«[Gemini 2.5 Pro] працягвае лідзіраваць у праграмаванні, паказваючы лепшыя вынікі ў складаных тэстах па кадаванні, — заявіла Google у блогу. — Яна таксама дэманструе найвышэйшую прадукцыйнасць у надзвычай складаных тэстах, што ацэньваюць здольнасці мадэлі ў матэматыцы, навуцы, ведах і лагічным мысленні».

Google актыўна выкарыстоўвае рэйтынгі платформаў LMArena і WebDevArena, дзе карыстальнікі параўноўваюць адказы мадэляў усляпую. Gemini 2.5 Pro дэбютавала сёлета з найвышэйшым рэйтынгам на LMArena, што сведчыць пра перавагу карыстальнікаў яе адказам у параўнанні з іншымі буйнымі мовамі мадэлямі. У новым рэлізе Google павялічыла сваю перавагу, набраўшы дадатковыя 24 балы Elo на LMArena і 35 балаў на WebDevArena, умацаваўшы лідарства ў абодвух рэйтынгах.

«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
Па тэме
«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
Mistral выпусціў інструмент для вайб-кодынгу
Mistral выпусціў інструмент для вайб-кодынгу
Па тэме
Mistral выпусціў інструмент для вайб-кодынгу
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Па тэме
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Чытайце таксама
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала "для сябе"
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала "для сябе"
7 каментарыяў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.