Аўтар «вайб-кодынгу» запусціў open source-праект, дзе ШІ сам праводзіць эксперыменты
Былы кіраўнік ШІ-напрамку Tesla і адзін з суаснавальнікаў OpenAI Андрэй Карпаты прадставіў open-source-праект autoresearch — сістэму, якая дазваляе ШІ-агентам самастойна праводзіць сотні даследчых эксперыментаў без удзелу чалавека.
Былы кіраўнік ШІ-напрамку Tesla і адзін з суаснавальнікаў OpenAI Андрэй Карпаты прадставіў open-source-праект autoresearch — сістэму, якая дазваляе ШІ-агентам самастойна праводзіць сотні даследчых эксперыментаў без удзелу чалавека.
Праект апублікаваны на GitHub у выглядзе адносна простага скрыпта прыкладна з 630 радкоў кода. Нягледзячы на мінімалістычную рэалізацыю, ідэя амбіцыйная: аўтаматызаваць навуковы метад і паскорыць развіццё машыннага навучання. Па задуме Карпатага, агент атрымлівае трэніровачны скрыпт і абмежаваны вылічальны бюджэт, пасля чаго самастойна фармулюе гіпотэзы, змяняе параметры мадэлі, запускае эксперыменты і ацэньвае вынікі.
I packaged up the «autoresearch» project into a new self-contained minimal repo if people would like to play over the weekend. It’s basically nanochat LLM training core stripped down to a single-GPU, one file version of ~630 lines of code, then:
У адным з начных запускаў агент выканаў 126 эксперыментаў, знізіўшы паказчык памылкі мадэлі з 0,9979 да 0,9697. У больш доўгім тэсце за два дні сістэма правяла каля 700 аўтаномных змяненняў, выявіўшы каля 20 паляпшэнняў, якія можна было перанесці на больш буйныя мадэлі. У выніку эфектыўнасць навучання вырасла прыкладна на 11%.
Карпаты адзначыў, што назіраць поўны цыкл даследаванняў, выкананы ШІ «ад пачатку да канца і без удзелу чалавека», выявілася нечакана ўражваючым. Па яго словах, агент выявіў памылкі ў наладзе архітэктуры і рэгулярызацыі, якія маглі выслізгваць ад даследчыкаў гадамі.
Эксперымент выклікаў шырокі рэзананс у тэхналагічнай супольнасці. Некаторыя распрацоўшчыкі пачалі маштабаваць ідэю, размяркоўваючы «даследчыя агенты» па сетках з дзясяткаў вузлоў. У адным з такіх тэстаў 35 аўтаномных агентаў правялі больш за 300 эксперыментаў за адну ноч, абменьваючыся знойдзенымі рашэннямі ў рэальным часе.
Бізнес-супольнасць таксама убачыла практычныя перспектывы тэхналогіі. Напрыклад, маркетынгавыя каманды тэарэтычна змогуць запускаць тысячы A/B-эксперыментаў, тэстуючы рэкламныя крэатывы, тэксты лістоў ці пасадачныя старонкі ў цалкам аўтаматычным рэжыме.
У той жа час частка даследчыкаў папярэджвае пра рызыкі празмернай аўтаматызацыі, у прыватнасці, пра магчымую «перааптымізацыю» мадэляў пад канкрэтныя тэставыя даныя і зніжэнне ролі чалавечай экспертызы.
Сам Карпаты лічыць, што падобныя сістэмы змяняюць саму логіку навуковай працы: чалавек робіцца не столькі эксперыментатарам, колькі архітэктарам пошукавага працэсу. Па яго словах, ключавым абмежаваннем развіцця ШІ ў будучыні можа стаць ужо не вылічальная магутнасць, а здольнасць людзей правільна фармуляваць задачы і абмежаванні для аўтаномных агентаў.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.