Встретимся на BelTech 3.0. Скидка 10% на билет: DEV
Support us

ИИ получает золото на олимпиадах по математике, но учёные сомневаются, что это прорыв

OpenAI и Google сообщили о прорыве в развитии искусственного интеллекта: экспериментальные модели обеих компаний смогли показать результаты, сопоставимые с лучшими участниками Международной математической олимпиады (IMO).

1 комментарий
ИИ получает золото на олимпиадах по математике, но учёные сомневаются, что это прорыв

OpenAI и Google сообщили о прорыве в развитии искусственного интеллекта: экспериментальные модели обеих компаний смогли показать результаты, сопоставимые с лучшими участниками Международной математической олимпиады (IMO).

Исследователь OpenAI Александр Вэй сообщил, что новая экспериментальная модель компании смогла решить 5 из 6 заданий олимпиады, набрав 35 из 42 возможных баллов — этого достаточно для получения золотой медали на IMO. Для сравнения, в этом году лишь около 10% участников (67 из 630) получили золотые медали.

Вэй подчеркнул, что модель не просто справлялась с вычислениями, а строила сложные и логически безупречные математические доказательства на уровне профессиональных математиков. Однако эта версия ИИ пока недоступна широкой публике: ее релиз, как и внедрение подобных функций в GPT-5, откладывается на несколько месяцев.

Также могла победить и экспериментальная версия Gemini Deep Think, модель идеально решила 5 из 6 задач. Ключевой особенностью Gemini стало то, что модель оперировала исключительно на естественном языке, строя строгие математические доказательства без перехода на формальные языки, как в прошлых экспериментах. Для тренировки Deep Think использовались новые методы обучения с подкреплением и обширная база решений олимпиадных задач.

Несмотря на впечатляющие результаты, у исследователей остаются вопросы к разработчикам моделей. Обе компании не раскрывают детали работы своих систем: речь идет об экспериментальных версиях, которые недоступны ни широкой публике, ни независимым экспертам. Неясно, насколько самостоятельны были решения моделей, в какой степени исследователи помогали в формулировках или выборе подходов и как проходил сам процесс проверки решений.

Также часть специалистов указывает на возможное «натаскивание» моделей на формат олимпиадных задач, что может ограничивать универсальность их достижений. Пока результаты не прошли независимую валидацию и не были воспроизведены вне лабораторных условий, говорить о полном преодолении барьера творческого математического мышления преждевременно, считают критики.

Anthropic выпустила гайд по написанию промптов для чат-ботов
Anthropic выпустила гайд по написанию промптов для чат-ботов
По теме
Anthropic выпустила гайд по написанию промптов для чат-ботов
OpenAI впервые рассказала насколько популярен ChatGPT
OpenAI впервые рассказала, насколько популярен ChatGPT
По теме
OpenAI впервые рассказала, насколько популярен ChatGPT
Эйчар попробовала пройти собеседование у ИИ — и советует держаться от него подальше
Эйчар попробовала пройти собеседование у ИИ — и советует держаться от него подальше
По теме
Эйчар попробовала пройти собеседование у ИИ — и советует держаться от него подальше
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментарий скрыт за нарушение правил комментирования.

Правила тут, их всего 5