Support us

Gemini стала лучше кодить — и обошла все модели OpenAI

Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.

Оставить комментарий
Gemini стала лучше кодить — и обошла все модели OpenAI

Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.

Google учла отзывы пользователей о предыдущей версии Gemini 2.5 Pro, улучшив стиль и структуру ответов модели. Теперь, как утверждает компания, модель способна генерировать «более креативные и лучше отформатированные ответы». Обновление направлено на устранение регрессов, выявленных в предыдущем релизе, чтобы вернуть производительность на уровень мартовского обновления (03-25).

Источник: Google.

Новая версия, по заявлению Google, еще лучше справляется с генерацией кода, достигнув рекордного результата 82,2% в тесте Aider Polyglot. Это превосходит лучшие показатели моделей от OpenAI, Anthropic и DeepSeek с заметным отрывом. Модель станет общедоступной через «пару недель» и уже сегодня появилась в платформах для разработчиков AI Studio и Vertex AI, а также в приложении Gemini.

Источник: Google.

«[Gemini 2.5 Pro] продолжает лидировать в программировании, показывая лучшие результаты на сложных тестах по кодированию, — заявила Google в блоге. —Она также демонстрирует высочайшую производительность в крайне сложных тестах, оценивающих способности модели в математике, науке, знаниях и логическом мышлении».

Google активно использует рейтинги платформ LMArena и WebDevArena, где пользователи сравнивают ответы моделей вслепую. Gemini 2.5 Pro дебютировала в этом году с наивысшим рейтингом на LMArena, что указывает на предпочтение пользователями ее ответов по сравнению с другими крупными языковыми моделями. В новом релизе Google увеличила свое преимущество, набрав дополнительные 24 балла Elo на LMArena и 35 баллов на WebDevArena, укрепив лидерство на обоих рейтингах.

«Неудачное название» для изнурительной работы: фаундер Coursera про вайб-кодинг
«Неудачное название» для изнурительной работы: фаундер Coursera про вайб-кодинг
По теме
«Неудачное название» для изнурительной работы: фаундер Coursera про вайб-кодинг
Mistral выпустил инструмент для вайб-кодинга
Mistral выпустил инструмент для вайб-кодинга
По теме
Mistral выпустил инструмент для вайб-кодинга
Инженеры уходят из OpenAI в Anthropic в 8 раз чаще чем наоборот. Выходцы из стартапа Альтмана переманивают лучших отовсюду
Инженеры уходят из OpenAI в Anthropic в 8 раз чаще, чем наоборот. Выходцы из стартапа Альтмана переманивают лучших отовсюду
По теме
Инженеры уходят из OpenAI в Anthropic в 8 раз чаще, чем наоборот. Выходцы из стартапа Альтмана переманивают лучших отовсюду
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
2 комментария
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Bubble
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.