Релиз модели OpenAI o3 показал, что затраты на разработку ИИ значительно растут
Новая модель искусственного интеллекта o3 от OpenAI значительно улучшила производительность благодаря масштабированию во время тестирования, однако это достигается за счет существенного увеличения вычислительных затрат, что ставит вопросы о ее практическом применении.
Модель o3 от OpenAI вызвала большой интерес в мире ИИ, поскольку она показывает, что прогресс в масштабировании ИИ не достиг своего предела. o3 значительно превосходит другие модели во время тестов, таких как ARC-AGI (AI Readiness Challenge for Artificial General Intelligence). Это набор сложных тестов и задач, созданных для проверки способности моделей ИИ решать широкий спектр проблем, которые требуют гибкого мышления и адаптации, приближенных к человеческому уровню интеллекта.
We announced @OpenAI o1 just 3 months ago. Today, we announced o3. We have every reason to believe this trajectory will continue. pic.twitter.com/Ia0b63RXIk
Согласно данным TechCrunch, модель o3 она набрала 88% в тесте ARC-AGI, в то время как предыдущая модель o1 набрала всего 32%. Также на сложном тесте по математике o3 показала 25%, в то время как другие модели не превысили 2%.
Масштабирование во время тестирования означает, что OpenAI использует больше вычислительных ресурсов во время фазы вывода (inference), то есть после того, как пользователь вводит запрос. Этот процесс может включать использование большего количества вычислительных возможностей или более длительного времени обработки перед выдачей ответа, иногда от 10 до 15 минут.
Ноам Браун, один из разработчиков o-серии моделей OpenAI, отметил, что o3 была представлена всего через три месяца после o1, что является очень коротким промежутком времени для такого скачка в производительности. Джек Кларк, сооснователь Anthropic, заявил, что o3 является свидетельством того, что прогресс в ИИ будет быстрее в 2025 году, чем в 2024 году. Кларк также предполагает, что в следующем году будут объединены методы масштабирования во время тестирования и традиционное предварительное обучение для дальнейшего улучшения моделей.
Высокопроизводительная версия o3 использовала более $1000 долларов вычислительных ресурсов на каждую задачу, а для прохождения теста ARC-AGI потребовалось ресурсов на более чем $10 тысяч, что делает ее дорогостоящей. Для сравнения, модель o1 использовала около $5 долларов вычислительных ресурсов на задачу, а o1-mini — всего несколько центов.
Создатель теста ARC-AGI Франсуа Шолле считает o3 прорывом в развитии ИИ: модель способна быстро адаптироваться к новым задачам и приближаться к человеческому уровню производительности. Тем не менее Шолле отмечает, что o3 не является AGI (общий искусственный интеллект) и по-прежнему не справляется с некоторыми простыми задачами, которые легко решаются человеком. Кроме того, o3 не решает проблему «галлюцинаций», которая присутствует в больших языковых моделях.
Из-за высокой стоимости вычислительных ресурсов o3 вряд ли станет повседневным инструментом. Скорее всего, она может быть полезна для решения сложных задач, требующих высокой точности, например, для крупных компаний или научных исследований. Профессор Уортонской школы бизнеса Итан Моллик отметил, что o3, вероятно, будет доступна только организациям с большими бюджетами, по крайней мере на начальном этапе.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.