«Хросная маці ШІ»: сапраўдны прарыў пачнецца, калі ШІ навучыцца разумець прастору

Стваральніца ImageNet і заснавальніца стартапа World Labs Фэй-Фэй Лі лічыць, што наступны прарыў у развіцці штучнага інтэлекту адбудзецца не ў мове, а ў прасторы.

Пакінуць каментарый

Знакамітая даследчыца і «хросная маці» ШІ лічыць, што толькі навучыўшыся разумець рух, адлегласць і фізічныя ўзаемасувязі, машыны змогуць стаць па-сапраўднаму творчымі партнёрамі чалавека.

У сваёй новай працы Лі піша, што сучасныя моўныя мадэлі, нават мультымадальныя, застаюцца «сляпымі» да фізікі свету. Яны ўмеюць аналізаваць тэксты і выявы, але не здольныя вызначыць, наколькі далёка знаходзіцца аб’ект, як ён арыентаваны або што адбудзецца, калі яго павярнуць. «Сучасныя мадэлі бліскуча працуюць з інфармацыяй, але не ўмеюць узаемадзейнічаць з рэальнасцю», — адзначае яна.

На думку Лі, інтэлект чалавека ўзнік са здольнасці адчуваць і рухацца: задоўга да мовы або мыслення жывыя арганізмы выбудоўвалі сувязь паміж успрыманнем і дзеяннем. Менавіта гэта — «перцэптыўна-маторнае» кальцо — стала асновай эвалюцыі розуму. Таму сапраўднаму ШІ трэба не проста разумець словы, а будаваць унутраныя мадэлі свету, у якіх працуюць законы фізікі.

Лі прыводзіць гістарычныя прыклады таго, як прасторавае мысленне вызначала навуковыя прарывы: Эратасфен вымераў акружнасць Зямлі па цені, Джэймс Харгрыўз вынайшаў прадзільную машыну «Джэні», убачыўшы, што можна размяшчаць шпіндэлі паралельна, а Уотсан і Крык зразумелі структуру ДНК толькі пасля таго, як пагулялі з трохмернымі мадэлямі.

Для наступнага этапу эвалюцыі ШІ, піша Лі, патрэбны не моўныя, а сусветныя мадэлі — сістэмы, якія не проста апісваюць, а ствараюць і змяняюць трохмерныя сцэны, захоўваючы прычынна-фізічную логіку. Такія мадэлі павінны быць генератыўнымі (здольнымі ствараць цэласныя светы), мультымадальнымі (разумець тэкст, выяву, відэа і жэсты) і інтэрактыўнымі (прадказваць наступствы дзеянняў).

Яе каманда ў World Labs ужо працуе над гэтым напрамкам. Мэта — стварыць алгарытмы, якія змогуць навучацца гэтак жа проста, як моўныя мадэлі навучаюцца прадказанню наступнага слова, але ў прасторавым вымярэнні. Прататып сістэмы Marble здольны па мультымадальнаму запыту ствараць устойлівыя трохмерныя сцэны. Пакуль праект далёкі ад дасканаласці, але Лі бачыць у ім крок да «прасторава ўсвядомленага ШІ».

Першыя аплікацыі Marble звязаны з дызайнам і лічбавым мастацтвам, аднак у будучыні Лі бачыць патэнцыял у робататэхніцы і навуцы: машыны, якія разумеюць прастору, змогуць планаваць дзеянні, праводзіць эксперыменты і даследаваць свет — ад марскіх глыбінь да месяцовых кратараў. Як калісьці зрок стаў эвалюцыйным прарывам для жывых істот, так і здольнасць ШІ разумець прастору, па словах Лі, можа стаць ключом да новай стадыі развіцця машыннага розуму.

Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn — исследование
Па тэме
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn — исследование
Google прыдумала, як вырашыць адну з галоўных праблем ШІ
Па тэме
Google прыдумала, як вырашыць адну з галоўных праблем ШІ
Чем умнее становится ИИ, тем эгоистичнее он себя ведёт
Па тэме
Чем умнее становится ИИ, тем эгоистичнее он себя ведёт

Читать на dev.by