«Это просто бардак»: в ИИ-науке скандал из-за «конвейера» мусорных работ
В академическом сообществе назревает обеспокоенность качеством исследований по искусственному интеллекту после того, как один автор заявил о публикации 113 научных статей за год.
В академическом сообществе назревает обеспокоенность качеством исследований по искусственному интеллекту после того, как один автор заявил о публикации 113 научных статей за год.
Автор публикаций — Кевин Чжу, недавний выпускник Калифорнийского университета в Беркли и основатель компании Algoverse, которая предоставляет школьникам и студентам платные исследовательские программы и помощь в подготовке работ к конференциям.
Из 113 научных работ 89 должны быть представлены на ведущей конференции по машинному обучению NeurIPS. Многие участники программы значатся соавторами статей. На личной странице Чжу утверждает, что его работы уже цитируют OpenAI, Microsoft, Google, Stanford и другие институты.
Ряд исследователей поставили под сомнение научную ценность такого количества работ. Профессор компьютерных наук Беркли Хани Фарид назвал публикации Чжу «катастрофой» и предположил, что значительная часть исследований создана с использованием шаблонных подходов или ИИ-инструментов.
Чжу заявил, что он не единственный автор работ, а их «научный руководитель», и что публикации создавались командами Algoverse. По его словам, программы его компании включают наставничество, методологическую проверку и участие специалистов по направлениям, а использование языковых моделей ограничивалось редактированием текста.
Ситуация, по мнению экспертов, отражает более широкую проблему в сфере ИИ. Крупные конференции испытывают беспрецедентный наплыв заявок: в 2025 году NeurIPS получил более 21,5 тысячи статей — более чем вдвое больше, чем пять лет назад. Рецензенты жалуются на падающее качество работ и подозревают, что часть статей создана или значительно доработана ИИ.
Параллельно растет давление на студентов и исследователей: число публикаций все чаще становится важнее их качества. Некоторые академики отмечают, что публикация десятков высококачественных работ в год практически невозможна. «Это просто бардак. Ты не можешь успевать, не можешь публиковаться, не можешь делать хорошую работу, не можешь мыслить вдумчиво», — считает Фарид.
Организаторы NeurIPS признают, что система рецензирования испытывает перегрузку, и отмечают, что многие работы Чжу были поданы в форматах воркшопов — подразделений конференции с более мягкими критериями отбора. Однако критики считают это недостаточным объяснением столь масштабной публикационной активности одного человека.
Проблему осложняет и то, что многие компании и исследовательские группы публикуют предварительные версии своих работ на платформе arXiv, минуя формальное рецензирование, что еще больше затрудняет ориентирование в научной повестке. По словам Фарида, существенная часть исследований по ИИ сегодня погружена в поток материалов, качество и достоверность которых трудно проверить. «Разобраться в происходящем практически невозможно даже специалистам», — отмечает он.
Прошедший год стал переломным для ИТ: искусственный интеллект вышел за пределы лабораторий и начал менять рынок труда, инфраструктуру и медиа-среду. Мы вспомнили самые яркие и значимые события ИТ-индустрии, о которых писали в этом году.
Я вот вижу, что эксперту не понравилось количество работ. А что по качеству? Если нет ошибок, то из чего весь сыр-бор? "Падающее качество" - это не метрика, а субъективное ощущение. Вот если бы сказали было Х% статей с грубыми ошибками и недочетами, а стало 2*Х%, тогда было бы яснее.
Пользователь отредактировал комментарий 12 декабря 2025, 11:36
Так ревьюверы не могут справиться с тоннами сгенерированного текста, чтобы ответить на этот вопрос.
В условиях тотальной генерации кода/текста, узким местом становятся ревьюверы.
По итогу имеем ситуацию, когда тысячи строк сгенерированного с 95% точностью кода бросаются на ревью, а ревьюверы с уверенностью 50% клацают Approve, чтобы не быть bottleneck.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
это такая рекурсия - статьи про ИИ пишет ИИ, который потом учится на этих же статьях
Да неужели! Какие бессовестные, вздумали писать статьи с помощью ИИ, никогда же такого не было
Я вот вижу, что эксперту не понравилось количество работ. А что по качеству? Если нет ошибок, то из чего весь сыр-бор? "Падающее качество" - это не метрика, а субъективное ощущение. Вот если бы сказали было Х% статей с грубыми ошибками и недочетами, а стало 2*Х%, тогда было бы яснее.
Пользователь отредактировал комментарий 12 декабря 2025, 11:36
.
Пользователь отредактировал комментарий 12 декабря 2025, 12:12
Так ревьюверы не могут справиться с тоннами сгенерированного текста, чтобы ответить на этот вопрос.
В условиях тотальной генерации кода/текста, узким местом становятся ревьюверы.
По итогу имеем ситуацию, когда тысячи строк сгенерированного с 95% точностью кода бросаются на ревью, а ревьюверы с уверенностью 50% клацают Approve, чтобы не быть bottleneck.
И все молятся, чтобы это работало в Production.
Помню, 20 лет назад мой препод по математике жаловался: один написал диссертацию, другой ее опроверг - в итоге 2 доктора наук и 0 результата.
Ничего с приходом ИИ не изменилось. Большая часть работ пишется чисто для портфолио.