17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Gemini стала лучше кодить — и обошла все модели OpenAI

Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.

1 комментарий
Gemini стала лучше кодить — и обошла все модели OpenAI

Компания обновила свою модель искусственного интеллекта Gemini 2.5 Pro, которая, по словам разработчиков, значительно улучшила навыки программирования.

Google учла отзывы пользователей о предыдущей версии Gemini 2.5 Pro, улучшив стиль и структуру ответов модели. Теперь, как утверждает компания, модель способна генерировать «более креативные и лучше отформатированные ответы». Обновление направлено на устранение регрессов, выявленных в предыдущем релизе, чтобы вернуть производительность на уровень мартовского обновления (03-25).

Источник: Google.

Новая версия, по заявлению Google, еще лучше справляется с генерацией кода, достигнув рекордного результата 82,2% в тесте Aider Polyglot. Это превосходит лучшие показатели моделей от OpenAI, Anthropic и DeepSeek с заметным отрывом. Модель станет общедоступной через «пару недель» и уже сегодня появилась в платформах для разработчиков AI Studio и Vertex AI, а также в приложении Gemini.

Источник: Google.

«[Gemini 2.5 Pro] продолжает лидировать в программировании, показывая лучшие результаты на сложных тестах по кодированию, — заявила Google в блоге. —Она также демонстрирует высочайшую производительность в крайне сложных тестах, оценивающих способности модели в математике, науке, знаниях и логическом мышлении».

Google активно использует рейтинги платформ LMArena и WebDevArena, где пользователи сравнивают ответы моделей вслепую. Gemini 2.5 Pro дебютировала в этом году с наивысшим рейтингом на LMArena, что указывает на предпочтение пользователями ее ответов по сравнению с другими крупными языковыми моделями. В новом релизе Google увеличила свое преимущество, набрав дополнительные 24 балла Elo на LMArena и 35 баллов на WebDevArena, укрепив лидерство на обоих рейтингах.

«Неудачное название» для изнурительной работы: фаундер Coursera про вайб-кодинг
«Неудачное название» для изнурительной работы: фаундер Coursera про вайб-кодинг
По теме
«Неудачное название» для изнурительной работы: фаундер Coursera про вайб-кодинг
Mistral выпустил инструмент для вайб-кодинга
Mistral выпустил инструмент для вайб-кодинга
По теме
Mistral выпустил инструмент для вайб-кодинга
Инженеры уходят из OpenAI в Anthropic в 8 раз чаще чем наоборот. Выходцы из стартапа Альтмана переманивают лучших отовсюду
Инженеры уходят из OpenAI в Anthropic в 8 раз чаще, чем наоборот. Выходцы из стартапа Альтмана переманивают лучших отовсюду
По теме
Инженеры уходят из OpenAI в Anthropic в 8 раз чаще, чем наоборот. Выходцы из стартапа Альтмана переманивают лучших отовсюду
Читайте также
Пионеры-создатели ИИ заявили, что машины уже сравнялись с человеческим интеллектом
Пионеры-создатели ИИ заявили, что машины уже сравнялись с человеческим интеллектом
Пионеры-создатели ИИ заявили, что машины уже сравнялись с человеческим интеллектом
В США хотят обязать компании отчитываться об увольнениях, вызванных ИИ
В США хотят обязать компании отчитываться об увольнениях, вызванных ИИ
В США хотят обязать компании отчитываться об увольнениях, вызванных ИИ
Глава OpenAI хочет, чтобы его преемником стал ИИ
Глава OpenAI хочет, чтобы его преемником стал ИИ
Глава OpenAI хочет, чтобы его преемником стал ИИ
«Ну не шмогла я»: компании просят вернуться сотрудников, которых уволили из-за ИИ
«Ну не шмогла я»: компании просят вернуться сотрудников, которых уволили из-за ИИ
«Ну не шмогла я»: компании просят вернуться сотрудников, которых уволили из-за ИИ
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.