«Гэта проста бязладдзе»: у ШІ-навуцы скандал з-за «канвеера» смеццевых прац
У акадэмічнай супольнасці нарастае занепакоенасць якасцю даследаванняў па штучным інтэлекце пасля таго, як адзін аўтар заявіў аб публікацыі 113 навуковых артыкулаў за год.
У акадэмічнай супольнасці нарастае занепакоенасць якасцю даследаванняў па штучным інтэлекце пасля таго, як адзін аўтар заявіў аб публікацыі 113 навуковых артыкулаў за год.
У акадэмічнай супольнасці нарастае занепакоенасць якасцю даследаванняў па штучным інтэлекце пасля таго, як адзін аўтар заявіў аб публікацыі 113 навуковых артыкулаў за год.
Аўтар публікацый — Кевін Чжу, нядаўні выпускнік Калiфарнiйскага ўніверсітэта ў Берклі і заснавальнік кампаніі Algoverse, якая прадастаўляе школьнікам і студэнтам платныя даследчыя праграмы і дапамогу ў падрыхтоўцы прац да канферэнцый.
З 113 навуковых прац 89 павінны быць прадстаўлены на вядучай канферэнцыі па машынным навучанні NeurIPS. Многія ўдзельнікі праграмы фігуруюць як суаўтары артыкулаў. На асабістай старонцы Чжу сцвярджае, што яго працы ўжо цытуюць OpenAI, Microsoft, Google, Stanford і іншыя інстытуты.
Шэраг даследчыкаў паставілі пад сумнеў навуковую каштоўнасць такой колькасці прац. Прафесар камп’ютарных навук Берклі Хані Фарыд назваў публікацыі Чжу «катастрофай» і выказаў здагадку, што значная частка даследаванняў створана з выкарыстаннем шаблонных падыходаў ці ШІ-інструментаў.
Чжу заявіў, што ён не адзіны аўтар прац, а іх «навуковы кіраўнік», і што публікацыі ствараліся камандамі Algoverse. Па яго словах, праграмы яго кампаніі ўключаюць настаўніцтва, метадалагічную праверку і ўдзел спецыялістаў па напрамках, а выкарыстанне моўных мадэляў абмяжоўвалася рэдагаваннем тэксту.
Сітуацыя, на думку экспертаў, адлюстроўвае больш шырокую праблему ў сферы ШІ. Буйныя канферэнцыі адчуваюць бяспрэцэдэнтны наплыў заявак: у 2025 годзе NeurIPS атрымаў больш за 21,5 тысячы артыкулаў — больш чым удвая, чым пяць гадоў таму. Рэцэнзенты скардзяцца на якасць прац, якая падае, і падазраюць, што частка артыкулаў створана або значна дапрацавана ШІ.
Паралельна расце ціск на студэнтаў і даследчыкаў: колькасць публікацый усё часцей становіцца важней за іх якасць. Некаторыя акадэмікі адзначаюць, што публікацыя дзясяткаў высакаякасных прац у год практычна немагчымая. «Гэта проста бязладдзе. Ты не можаш паспяваць, не можаш публікавацца, не можаш рабіць добрую працу, не можаш думаць уважліва», — лічыць Фарыд.
Арганізатары NeurIPS прызнаюць, што сістэма рэцэнзавання адчувае перагрузку, і адзначаюць, што многія працы Чжу былі пададзены ў фарматах воркшопаў — падраздзяленняў канферэнцыі з больш мяккімі крытэрыямі адбору. Аднак крытыкі лічаць гэта недастатковым тлумачэннем такой маштабнай публікацыйнай актыўнасці аднаго чалавека.
Праблему ўскладняе і тое, што многія кампаніі і даследчыя групы публікуюць папярэднія версіі сваіх прац на платформе arXiv, абмінаючы фармальнае рэцэнзаванне, што яшчэ больш ускладняе арыентаванне ў навуковым парадку дня. Па словах Фарыда, істотная частка даследаванняў па ШІ сёння занурана ў паток матэрыялаў, якасць і дакладнасць якіх цяжка праверыць. «Разабрацца ў тым, што адбываецца, практычна немагчыма нават спецыялістам», — адзначае ён.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
это такая рекурсия - статьи про ИИ пишет ИИ, который потом учится на этих же статьях
Да неужели! Какие бессовестные, вздумали писать статьи с помощью ИИ, никогда же такого не было
Я вот вижу, что эксперту не понравилось количество работ. А что по качеству? Если нет ошибок, то из чего весь сыр-бор? "Падающее качество" - это не метрика, а субъективное ощущение. Вот если бы сказали было Х% статей с грубыми ошибками и недочетами, а стало 2*Х%, тогда было бы яснее.
Пользователь отредактировал комментарий 12 декабря 2025, 11:36
.
Пользователь отредактировал комментарий 12 декабря 2025, 12:12
Так ревьюверы не могут справиться с тоннами сгенерированного текста, чтобы ответить на этот вопрос.
В условиях тотальной генерации кода/текста, узким местом становятся ревьюверы.
По итогу имеем ситуацию, когда тысячи строк сгенерированного с 95% точностью кода бросаются на ревью, а ревьюверы с уверенностью 50% клацают Approve, чтобы не быть bottleneck.
И все молятся, чтобы это работало в Production.
Помню, 20 лет назад мой препод по математике жаловался: один написал диссертацию, другой ее опроверг - в итоге 2 доктора наук и 0 результата.
Ничего с приходом ИИ не изменилось. Большая часть работ пишется чисто для портфолио.