Дапамажыце dev.by 🤍
Падтрымаць

Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

1 каментарый
Gemini стала лепш кодзіць — і абышла ўсе мадэлі OpenAI

Кампанія абнавіла сваю мадэль штучнага інтэлекту Gemini 2.5 Pro, якая, паводле распрацоўшчыкаў, значна палепшыла навыкі праграмавання.

Google улічыла водгукі карыстальнікаў пра папярэднюю версію Gemini 2.5 Pro, удасканаліўшы стыль і структуру адказаў мадэлі. Цяпер, як сцвярджае кампанія, мадэль здольная генерыраваць «больш крэатыўныя і лепш адфарматаваныя адказы». Абнаўленне накіраванае на ліквідацыю рэгрэсій, выяўленых у папярэднім рэлізе, каб вярнуць прадукцыйнасць на ўзровень сакавіцкага абнаўлення (03-25).

Крыніца: Google.

Новая версія, па заяве Google, яшчэ лепш спраўляецца з генерацыяй кода, дасягнуўшы рэкорднага выніку 82,2% у тэсце Aider Polyglot. Гэта пераўзыходзіць лепшыя паказчыкі мадэляў OpenAI, Anthropic і DeepSeek з прыкметным адрывам. Мадэль стане агульнадаступнай праз «пару тыдняў» і ўжо сёння з’явілася на платформах для распрацоўшчыкаў AI Studio і Vertex AI, а таксама ў аплікацыі Gemini.

Крыніца: Google.

«[Gemini 2.5 Pro] працягвае лідзіраваць у праграмаванні, паказваючы лепшыя вынікі ў складаных тэстах па кадаванні, — заявіла Google у блогу. — Яна таксама дэманструе найвышэйшую прадукцыйнасць у надзвычай складаных тэстах, што ацэньваюць здольнасці мадэлі ў матэматыцы, навуцы, ведах і лагічным мысленні».

Google актыўна выкарыстоўвае рэйтынгі платформаў LMArena і WebDevArena, дзе карыстальнікі параўноўваюць адказы мадэляў усляпую. Gemini 2.5 Pro дэбютавала сёлета з найвышэйшым рэйтынгам на LMArena, што сведчыць пра перавагу карыстальнікаў яе адказам у параўнанні з іншымі буйнымі мовамі мадэлямі. У новым рэлізе Google павялічыла сваю перавагу, набраўшы дадатковыя 24 балы Elo на LMArena і 35 балаў на WebDevArena, умацаваўшы лідарства ў абодвух рэйтынгах.

«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
Па тэме
«Няўдалая назва» для знясільваючай працы: фаўндар Coursera пра вайб-кодынг
Mistral выпусціў інструмент для вайб-кодынгу
Mistral выпусціў інструмент для вайб-кодынгу
Па тэме
Mistral выпусціў інструмент для вайб-кодынгу
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Па тэме
Інжынеры сыходзяць з OpenAI у Anthropic у 8 разоў часцей, чым наадварот. Выхадцы са стартапа Альтмана перацягваюць лепшых адусюль
Чытайце таксама
Распрацоўшчыкі пачалі прадаваць «псіхадэлікі» для чат-ботаў
Распрацоўшчыкі пачалі прадаваць «псіхадэлікі» для чат-ботаў
Распрацоўшчыкі пачалі прадаваць «псіхадэлікі» для чат-ботаў
OpenAI будзе працягваць уводзіць
OpenAI будзе працягваць уводзіць "чырвоны код" — СЕО кажа, гэта карысна
OpenAI будзе працягваць уводзіць "чырвоны код" — СЕО кажа, гэта карысна
2026 год стане паваротным для ШІ-індустрыі — прагноз
2026 год стане паваротным для ШІ-індустрыі — прагноз
2026 год стане паваротным для ШІ-індустрыі — прагноз
1 каментарый
GitHub замест ВНУ: як змяняюцца патрабаванні да кандыдатаў у ІТ
GitHub замест ВНУ: як змяняюцца патрабаванні да кандыдатаў у ІТ
GitHub замест ВНУ: як змяняюцца патрабаванні да кандыдатаў у ІТ

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.