Дапамажыце dev.by 🤍
Падтрымаць

Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

1 каментарый
Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

Google улічыла водгукі карыстальнікаў пра папярэднюю версію Gemini 2.5 Pro, удасканаліўшы стыль і структуру адказаў мадэлі. Цяпер, як сцвярджае кампанія, мадэль здольная генерыраваць «больш крэатыўныя і лепш адфарматаваныя адказы». Абнаўленне накіраванае на ліквідацыю рэгрэсій, выяўленых у папярэднім рэлізе, каб вярнуць прадукцыйнасць на ўзровень сакавіцкага абнаўлення (03-25).

Крыніца: Google.

Новая версія, па заяве Google, яшчэ лепш спраўляецца з генерацыяй кода, дасягнуўшы рэкорднага выніку 82,2% у тэсце Aider Polyglot. Гэта пераўзыходзіць лепшыя паказчыкі мадэляў OpenAI, Anthropic і DeepSeek з прыкметным адрывам. Мадэль стане агульнадаступнай праз «пару тыдняў» і ўжо сёння з’явілася на платформах для распрацоўшчыкаў AI Studio і Vertex AI, а таксама ў аплікацыі Gemini.

Крыніца: Google.

«[Gemini 2.5 Pro] працягвае лідзіраваць у праграмаванні, паказваючы лепшыя вынікі ў складаных тэстах па кадаванні, — заявіла Google у блогу. — Яна таксама дэманструе найвышэйшую прадукцыйнасць у надзвычай складаных тэстах, што ацэньваюць здольнасці мадэлі ў матэматыцы, навуцы, ведах і лагічным мысленні».

Google актыўна выкарыстоўвае рэйтынгі платформаў LMArena і WebDevArena, дзе карыстальнікі параўноўваюць адказы мадэляў усляпую. Gemini 2.5 Pro дэбютавала сёлета з найвышэйшым рэйтынгам на LMArena, што сведчыць пра перавагу карыстальнікаў яе адказам у параўнанні з іншымі буйнымі мовамі мадэлямі. У новым рэлізе Google павялічыла сваю перавагу, набраўшы дадатковыя 24 балы Elo на LMArena і 35 балаў на WebDevArena, умацаваўшы лідарства ў абодвух рэйтынгах.

«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
Па тэме
«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
Mistral выпусціў інструмент для вайб-кодынгу
Mistral выпусціў інструмент для вайб-кодынгу
Па тэме
Mistral выпусціў інструмент для вайб-кодынгу
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Па тэме
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Чытайце таксама
Інвестары хочуць вынік: Microsoft абрынулася пасля паспяховай справаздачы, Meta — узляцела
Інвестары хочуць вынік: Microsoft абрынулася пасля паспяховай справаздачы, Meta — узляцела
Інвестары хочуць вынік: Microsoft абрынулася пасля паспяховай справаздачы, Meta — узляцела
Наступныя 2 гады вырашаць усё: кіраўнік Anthropic напісаў эсэ пра будучыню ШІ
Наступныя 2 гады вырашаць усё: кіраўнік Anthropic напісаў эсэ пра будучыню ШІ
Наступныя 2 гады вырашаць усё: кіраўнік Anthropic напісаў эсэ пра будучыню ШІ
OpenAI прызнала памылку: ChatGPT Agent аказаўся нікому не патрэбны
OpenAI прызнала памылку: ChatGPT Agent аказаўся нікому не патрэбны
OpenAI прызнала памылку: ChatGPT Agent аказаўся нікому не патрэбны
Пентагон і Anthropic канфліктуюць з-за ваеннага прымянення ШІ
Пентагон і Anthropic канфліктуюць з-за ваеннага прымянення ШІ
Пентагон і Anthropic канфліктуюць з-за ваеннага прымянення ШІ

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.