Николай Чикишев world 6 чэрвеня 2025, 12:37

Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

1 каментарый

Google улічыла водгукі карыстальнікаў пра папярэднюю версію Gemini 2.5 Pro, удасканаліўшы стыль і структуру адказаў мадэлі. Цяпер, як сцвярджае кампанія, мадэль здольная генерыраваць «больш крэатыўныя і лепш адфарматаваныя адказы». Абнаўленне накіраванае на ліквідацыю рэгрэсій, выяўленых у папярэднім рэлізе, каб вярнуць прадукцыйнасць на ўзровень сакавіцкага абнаўлення (03-25).

Крыніца: Google.

Новая версія, па заяве Google, яшчэ лепш спраўляецца з генерацыяй кода, дасягнуўшы рэкорднага выніку 82,2% у тэсце Aider Polyglot. Гэта пераўзыходзіць лепшыя паказчыкі мадэляў OpenAI, Anthropic і DeepSeek з прыкметным адрывам. Мадэль стане агульнадаступнай праз «пару тыдняў» і ўжо сёння з’явілася на платформах для распрацоўшчыкаў AI Studio і Vertex AI, а таксама ў аплікацыі Gemini.

Крыніца: Google.

«[Gemini 2.5 Pro] працягвае лідзіраваць у праграмаванні, паказваючы лепшыя вынікі ў складаных тэстах па кадаванні, — заявіла Google у блогу. — Яна таксама дэманструе найвышэйшую прадукцыйнасць у надзвычай складаных тэстах, што ацэньваюць здольнасці мадэлі ў матэматыцы, навуцы, ведах і лагічным мысленні».

Google актыўна выкарыстоўвае рэйтынгі платформаў LMArena і WebDevArena, дзе карыстальнікі параўноўваюць адказы мадэляў усляпую. Gemini 2.5 Pro дэбютавала сёлета з найвышэйшым рэйтынгам на LMArena, што сведчыць пра перавагу карыстальнікаў яе адказам у параўнанні з іншымі буйнымі мовамі мадэлямі. У новым рэлізе Google павялічыла сваю перавагу, набраўшы дадатковыя 24 балы Elo на LMArena і 35 балаў на WebDevArena, умацаваўшы лідарства ў абодвух рэйтынгах.

«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг

Па тэме

«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг

Mistral выпусціў інструмент для вайб-кодынгу

Па тэме

Mistral выпусціў інструмент для вайб-кодынгу

Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль

Па тэме

Читать на dev.by