Gemini стала лучше кодить — и обошла все модели OpenAI
Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.
Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.
Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.
Google учла отзывы пользователей о предыдущей версии Gemini 2.5 Pro, улучшив стиль и структуру ответов модели. Теперь, как утверждает компания, модель способна генерировать «более креативные и лучше отформатированные ответы». Обновление направлено на устранение регрессов, выявленных в предыдущем релизе, чтобы вернуть производительность на уровень мартовского обновления (03-25).
Новая версия, по заявлению Google, еще лучше справляется с генерацией кода, достигнув рекордного результата 82,2% в тесте Aider Polyglot. Это превосходит лучшие показатели моделей от OpenAI, Anthropic и DeepSeek с заметным отрывом. Модель станет общедоступной через «пару недель» и уже сегодня появилась в платформах для разработчиков AI Studio и Vertex AI, а также в приложении Gemini.
«[Gemini 2.5 Pro] продолжает лидировать в программировании, показывая лучшие результаты на сложных тестах по кодированию, — заявила Google в блоге. —Она также демонстрирует высочайшую производительность в крайне сложных тестах, оценивающих способности модели в математике, науке, знаниях и логическом мышлении».
Google активно использует рейтинги платформ LMArena и WebDevArena, где пользователи сравнивают ответы моделей вслепую. Gemini 2.5 Pro дебютировала в этом году с наивысшим рейтингом на LMArena, что указывает на предпочтение пользователями ее ответов по сравнению с другими крупными языковыми моделями. В новом релизе Google увеличила свое преимущество, набрав дополнительные 24 балла Elo на LMArena и 35 баллов на WebDevArena, укрепив лидерство на обоих рейтингах.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.