Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

Google представила Gemini 2.5 — свою самую умную модель, умнее o3 от OpenAI

Google выпустила новое поколение мультимодальных рассуждающих моделей Gemini 2.5. Компания называет Gemini 2.5 Pro Experimental самой умной из выпущенных ею моделей. Она уже доступна в Google AI Studio и в приложении Gemini для пользователей тарифа Gemini Advanced. Компания заявила, что отныне все её новые ИИ-модели будут рассуждающими.

Оставить комментарий
Google представила Gemini 2.5 — свою самую умную модель, умнее o3 от OpenAI

Google выпустила новое поколение мультимодальных рассуждающих моделей Gemini 2.5. Компания называет Gemini 2.5 Pro Experimental самой умной из выпущенных ею моделей. Она уже доступна в Google AI Studio и в приложении Gemini для пользователей тарифа Gemini Advanced. Компания заявила, что отныне все её новые ИИ-модели будут рассуждающими.

Первой моделью со способностью рассуждать на рынке была o1, вышедшая в сентябре 2024 года. Сейчас думающие модели также предлагают Anthropic, DeepSeek, Google, xAI и прочие. Такие модели поглощают больше вычислительных мощностей и требуют больше времени на проверку фактов и обдумывание запроса для более качественного ответа.

Google выпустила свою первую рассуждающую версию Gemini в декабре. Gemini 2.5 считается самой серьёзной попыткой компании посоперничать с продвинутыми моделями линейки «o» OpenAI.

Google утверждает, что Gemini 2.5 Pro на ряде бенчмарков превосходит лучшие из её прежних моделей и некоторые ведущие ИИ-модели конкурентов. Особенно, по словам Google, она хороша в создании веб-приложений и написании кода. Например, на бенчмарке Aider Polyglot, который оценивает навыки редактирования кода у моделей, Gemini 2.5 Pro набрала 68,6% — больше лучших моделей OpenAI, Anthropic и DeepSeek. На SWE-bench Verified для оценки навыков генерации кода Gemini 2.5 Pro набрала 63,8% — больше o3-mini от OpenAI и R1 от DeepSeek, но уступила Claude 3.7 Sonnet от Anthropic, которая достигла 70,3%. На комплексном бенчмарке Humanity’s Last Exam, содержащем тысячи задач по математике, гуманитарным и естественным наукам, Gemini 2.5 Pro показала результат в 18,8%, что лучше большинства флагманских моделей конкурентов.

Контекстное окно Gemini 2.5 Pro составляет 1 млн токенов (оно сможет вместить примерно 750 тысяч слов), в скором времени Google планирует удвоить эту цифру. Расценки на доступ к API компания не огласила, но пообещала больше подробностей в ближайшие недели.

В чат-боте Gemini теперь можно задавать вопросы о содержимом видео и экрана гаджета
В чат-боте Gemini теперь можно задавать вопросы о содержимом видео и экрана гаджета
По теме
В чат-боте Gemini теперь можно задавать вопросы о содержимом видео и экрана гаджета
Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»
Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»
По теме
Anthropic выпустила «гибридную» модель Claude 3.7 Sonnet с выбором режима «мышления»
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
2 комментария
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Bubble
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.