Николай Чикишев 20 марта 2025, 14:03

Исследователи заявили о новом методе масштабирования ИИ, но эксперты настроены скептически

Исследователи создали новый метод масштабирования искусственного интеллекта. Способ «поиска во время вывода» позволяет модели генерировать множество ответов на запрос и выбирать лучший из них. Этот подход может повысить производительность моделей без дополнительного обучения.

1 комментарий

Группа ученых из Google и Калифорнийского университета предложили новый метод обучения больших языковых моделей, который мог бы значительно повысить точность ответов даже у небольших и устаревших моделей. Используя метод «поиска во время вывода», исследователи улучшили результаты модели Gemini 1.5 Pro, которая по результатам превзошла мощную o1-preview от OpenAI по математическим и научным тестам.

До прошлого года доминирующим подходом среди разработчиков ИИ был метод предварительного обучения — обучения все более крупных моделей на больших наборах данных. Этот метод требует огромных вычислительных мощностей и слишком трудозатратен, поэтому ведущие разработчики сосредоточились на иных подходах, в том числе выпуская рассуждающие модели и применяя при обучении синтетические данные.

Хотя предварительное обучение не исчезло, появились два дополнительных закона масштабирования, дополняющих его: масштабирование после обучения и масштабирование во время тестирования. Масштабирование после обучения, по сути, заключается в настройке поведения модели, а масштабирование во время тестирования предполагает применение больших вычислительных мощностей для логического вывода.

Однако другие эксперты сомневаются, что метод стабилен и может претендовать на революционный прорыв в разработке ИИ. Например, исследователь из Университета Альберты Мэтью Гуздиал отметил, что метод работает только в том случае, когда необходим четкий правильный ответ, а большинство задач не подходит под это определение. Исследователь Майк Кук из Королевского колледжа Лондона заявил, что новый метод лишь помогает обходить существующие ограничения, но не улучшает способность модели к рассуждению.

Захват AI Slop: как генеративный ИИ «брутфорсит» интернет и меняет онлайн-реальность

По теме

Захват AI Slop: как генеративный ИИ «брутфорсит» интернет и меняет онлайн-реальность

ИИ-модель Google отлично удаляет водяные знаки с изображений. Фотографы напряглись

По теме

ИИ-модель Google отлично удаляет водяные знаки с изображений. Фотографы напряглись

В Голливуде появляется все больше ИИ-студий

По теме

В Голливуде появляется все больше ИИ-студий

Читать на dev.by