Канец чалавечых дадзеных: Google абвясціла пра пачатак новай эпохі ШІ
У новай навуковай працы даследчыкі Google Дэвід Сільвер і Рычард Сатан смела заявілі пра пачатак новай эры ў развіцці штучнага інтэлекту, якую яны назвалі «эрай досведу». Гэтая канцэпцыя прадугледжвае, што будучыя ШІ-мадэлі будуць вучыцца, узаемадзейнічаючы з рэальным светам і самастойна генеруючы дадзеныя.
У сваёй працы Сільвер і Сатан выдзяляюць два папярэднія этапы ў развіцці сучаснага ШІ. Першы, «эра сімуляцыі», прыпаў на сярэдзіну 2010-х гадоў і характарызаваўся выкарыстаннем лічбавых сімуляцый для навучання ШІ-мадэляў праз шматразовае паўтарэнне гульняў, такіх як шахматы, покер і Atari.
Прыклад гэтага перыяду — распрацоўка Google AlphaGo, мадэлі, якая навучылася гуляць у го лепш за чалавека. Гэты падыход, заснаваны на навучанні з падмацаваннем, дазволіў ствараць мадэлі, што выдатна спраўляліся з канкрэтнымі задачамі з дакладна вызначанымі ўзнагародамі, але сутыкаліся з цяжкасцямі ў больш агульных і адкрытых сцэнарах.
Другой эрай аўтары называюць сучасную «эру чалавечых дадзеных». Гэты перыяд характарызуецца навучаннем мадэляў ШІ на велізарных масівах дадзеных, створаных чалавекам у інтэрнэце. Менавіта гэты падыход прывёў да з’яўлення ChatGPT і іншых магутных генератыўных ШІ-інструментаў. Ключом да поспеху стаў збор як мага большага аб’ёму высокаякасных чалавечых дадзеных.
Аднак Сільвер і Сатан лічаць, што «эра чалавечых дадзеных» мае свае абмежаванні. На іх думку, залежнасць ад існуючых чалавечых ведаў усталёўвае «столь» для прадукцыйнасці агентаў, не дазваляючы ім выйсці за межы вядомага. Аўтары таксама адзначаюць праблему узрастаючага дэфіцыту дадзеных, якія не могуць задаволіць попыт з боку ШІ-распрацоўшчыкаў.
У якасці рашэння гэтых праблем даследчыкі Google прапануюць перайсці да «эры досведу». У гэтай новай парадыгме мадэлі і агенты ШІ будуць узаемадзейнічаць з рэальным светам і самастойна генераваць новыя дадзеныя. Гэта дазволіць не толькі вырашыць праблему недахопу дадзеных, але і наблізіцца да дасягнення AGI (штучнага агульнага інтэлекту), дзе машыны змогуць пераўзыходзіць чалавека ў большасці сфер.
Аўтары прыводзяць прыклады таго, як гэта можа працаваць. ШІ-асістэнт па здароўі мог бы вызначаць мэты чалавека на аснове камбінацыі такіх паказчыкаў, як пульс у стане спакою, працягласць сну і ўзровень актыўнасці. Адукацыйны памочнік мог бы выкарыстоўваць вынікі экзаменаў у якасці стымулу да вывучэння мовы. Навуковы агент, які імкнецца знізіць глабальнае пацяпленне, мог бы выкарыстоўваць эмпірычныя назіранні за ўзроўнем вуглякіслага газу ў якасці ўзнагароды.
Читать на dev.by