Николай Чикишев world 6 чэрвеня 2025, 12:37

Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

1 каментарый

Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

Google улічыла водгукі карыстальнікаў пра папярэднюю версію Gemini 2.5 Pro, удасканаліўшы стыль і структуру адказаў мадэлі. Цяпер, як сцвярджае кампанія, мадэль здольная генерыраваць «больш крэатыўныя і лепш адфарматаваныя адказы». Абнаўленне накіраванае на ліквідацыю рэгрэсій, выяўленых у папярэднім рэлізе, каб вярнуць прадукцыйнасць на ўзровень сакавіцкага абнаўлення (03-25).

Новая версія, па заяве Google, яшчэ лепш спраўляецца з генерацыяй кода, дасягнуўшы рэкорднага выніку 82,2% у тэсце Aider Polyglot. Гэта пераўзыходзіць лепшыя паказчыкі мадэляў OpenAI, Anthropic і DeepSeek з прыкметным адрывам. Мадэль стане агульнадаступнай праз «пару тыдняў» і ўжо сёння з’явілася на платформах для распрацоўшчыкаў AI Studio і Vertex AI, а таксама ў аплікацыі Gemini.

«[Gemini 2.5 Pro] працягвае лідзіраваць у праграмаванні, паказваючы лепшыя вынікі ў складаных тэстах па кадаванні, — заявіла Google у блогу. — Яна таксама дэманструе найвышэйшую прадукцыйнасць у надзвычай складаных тэстах, што ацэньваюць здольнасці мадэлі ў матэматыцы, навуцы, ведах і лагічным мысленні».

Google актыўна выкарыстоўвае рэйтынгі платформаў LMArena і WebDevArena, дзе карыстальнікі параўноўваюць адказы мадэляў усляпую. Gemini 2.5 Pro дэбютавала сёлета з найвышэйшым рэйтынгам на LMArena, што сведчыць пра перавагу карыстальнікаў яе адказам у параўнанні з іншымі буйнымі мовамі мадэлямі. У новым рэлізе Google павялічыла сваю перавагу, набраўшы дадатковыя 24 балы Elo на LMArena і 35 балаў на WebDevArena, умацаваўшы лідарства ў абодвух рэйтынгах.