Project Mariner — ноу-хау Google у пошуку: АІ-агент шукае тавары і купляе квіткі за вас

Google паказала даследчы прататып Project Mariner, які можа выконваць дзеянні ў інтэрнэце за карыстальніка. АІ-агенты — новы напрамак пошукавых тэхналогій. Мы разабраліся, з якімі рызыкамі могуць сутыкнуцца распрацоўшчыкі і карыстальнікі.

Пакінуць каментарый

Як працуе AI-агент

АІ-агент Project Mariner можа браць пад кантроль браўзер Chrome, перамяшчаць курсор на экране, націскаць кнопкі і запаўняць формы. Гэта дазваляе выкарыстоўваць сайты і перамяшчацца па іх гэтак жа, як гэта робіць карыстальнік. Праект Mariner працуе як пашырэнне Chrome.

У карыстальніка з’яўляецца спецыяльнае акно чата, у якім агенту можна даручыць выкананне розных задач. Напрыклад, яго можна папрасіць стварыць кошык пакупак у прадуктовай краме на аснове спіса. Затым агент самастойна пяройдзе на старонку крамы, выканае пошук тавараў і дадасць іх у кошык.

Агент робіць здымкі экрана вакна браўзера, перад гэтым карыстальнікі павінны даць згоду на выкарыстанне гэтай функцыі. Выявы адпраўляюцца для апрацоўкі ў воблачны сэрвіс Gemini, затым чат-бот перадае інструкцыі назад на прыладу карыстальніка для навігацыі па старонцы.

Акрамя Project Mariner Google паказала інструмент Deep Research для глыбокага пошуку і даследаванняў у сеціве. Другі агент Jules прызначаны для дапамогі распрацоўшчыкам у напісанні кода. Ён інтэгруецца ў працоўныя працэсы GitHub, аналізуе бягучы ўзровень распрацоўкі і ўносіць змены ў рэпазіторыі. Jules будзе даступны ў 2025 годзе.

Абмежаванні

Цяпер Project Mariner праходзіць стадыю тэсціравання групай адабраных карыстальнікаў (запісацца ў ліст чакання можна тут). Журналісты, якія апрабавалі сістэму, заявілі, што пакуль агент працуе не так хутка, як хацелася б. На кожны рух курсора сыходзіць прыкладна пяць секунд. Часам агент перапыняе выкананне задачы і вяртаецца да акна чата і запытвае ўдакладненні, напрыклад, пра вагу або колькасць тавараў.

Таксама пашырэнне не працуе ў фонавым рэжыме: за дзеяннямі агента неабходна сачыць у адкрытым акне. Такім чынам, карыстальнікам прыйдзецца бачыць старонку сайта, што выгадна ўладальнікам рэсурсаў. Тым не менш прымяненне агента зніжае ўзровень непасрэднага ўзаемадзеяння карыстальнікаў з функцыямі сайта.

Яшчэ адная перашкода: агент не можа аформіць заказ, так як у яго алгарытм не ўключаныя функцыі запаўнення нумароў банкаўскіх карт і іншай плацежнай інфармацыі. Верагодна, распрацоўшчыкі пакуль не дадаюць гэтай функцыі праз недасканаласць алгарытму і рызыкі для канфідэнцыйнасці карыстальнікаў.

«Паколькі [Gemini] цяпер выконвае дзеянні ад імя карыстальніка, важна рабіць гэта крок за крокам. Гэта дадатковая функцыя. Вы, як чалавек, можаце выкарыстоўваць вэб-сайты, і цяпер ваш агент можа рабіць усё, што вы робіце на вэб-сайце», — заявіў галоўны тэхнічны дырэктар Google DeepMind Карая Кавукчуоглу.

Project Mariner не прымае файлаў cookie і не падпісвае пагаднення аб умовах выкарыстання ад імя карыстальнікаў. Распрацоўшчыкі падкрэсліваюць, што зрабілі гэта наўмысна, каб у карыстальнікаў было больш кантролю за дзеяннямі АІ-агента.

Чаму гэта прарыўная тэхналогія

За распрацоўку агента адказвае даследчае падраздзяленне кампаніі DeepMind. Кіраўніца Google Labs Жаклін Канзельман заявіла, што Project Mariner — гэта прынцыпова новы падыход у карыстальніцкім інтэрфейсе. Праект прапаноўвае адмовіцца ад прамога ўзаемадзеяння з сайтамі і аддаць гэтыя задачы генератыўнаму АІ.

Канзельман лічыць, што такія змены могуць закрануць мільёны прадпрыемстваў: ад анлайн-выданняў да рытэйлу, якія раней спадзяваліся на пашукавік Google як адпраўны пункт для прыцягнення карыстальнікаў на свае рэсурсы. Напрыклад, агента можна ўжываць для пошуку рэйсаў і гатэляў, пакупак тавараў для дома, пошуку рэцэптаў і іншых задач.

Інтэрфейс пашырэння ў Google Chrome. Крыніца: Google.

Project Mariner выглядае як адзін са шляхоў развіцця пошукавых сістэм на фоне развіцця АІ-тэхналогій. У перспектыве выкарыстанне АІ-агента можа зусім выключыць неабходнасць самастойнага наведвання сайтаў.

«Project Mariner — гэта прынцыпова новы зрух у парадыгме UX, які мы назіраем проста цяпер. Нам трэба зразумець, як правільна ўсё гэта наладзіць, каб змяніць прынцыпы ўзаемадзеяння карыстальнікаў з інтэрнэтам, а таксама знайсці спосабы, якімі выдаўцы змогуць ствараць уласныя рашэнні для карыстальнікаў на базе АІ-агентаў у будучыні», — паведаміла Жаклін Канзельман.

Как отказаться от использования своих данных для обучения ИИ?
По теме
Как отказаться от использования своих данных для обучения ИИ?

Іншы кірунак — гэта распрацоўка агентаў для дапамогі геймерам. Google ужо супрацоўнічае з распрацоўшчыкамі гульняў, напрыклад, студыяй Supercell. DeepMind правярае здольнасць Gemini інтэрпрэтаваць гульнявыя сусветы. Пра тэрміны запуску прататыпа гульнявога агента пакуль невядома. Google падкрэслівае, што стварэнне такога сэрвісу дапамагае распрацоўваць агентаў для навігацыі як у рэальным, так і ў віртуальным светах.

Тэхналагічныя кампаніі лічаць, што АІ-агенты могуць стаць наступным вялікім скокам наперад для тэхналогіі, пры гэтым чат-боты ўсё часцей бяруць на сябе працу карыстальнікаў. У выпадку поспеху агенты могуць рэвалюцыянізаваць выкарыстанне ПК і мабільных прылад, рэгулярна рэзервуючы рэйсы, арганізоўваючы сустрэчы, а таксама аналізуючы і арганізуючы дакументы. Але тэхналогія аўтаномных памочнікаў застаецца праблемнай, так як ёсць высокая рызыка таго, што памылкі агентаў могуць прыводзіць да дарагіх памылак, якія цяжка выпраўляць.

Sora — новы АІ-генератар відэа ад OpenAI. Як ім карыстацца
Па тэме
Sora — новы АІ-генератар відэа ад OpenAI. Як ім карыстацца
The Game Awards 2024: пераможцы галоўнай геймерскай прэміі
Па тэме
The Game Awards 2024: пераможцы галоўнай геймерскай прэміі
Які пошук лепшы: генератыўны або традыцыйны?
Па тэме
Які пошук лепшы: генератыўны або традыцыйны?

Читать на dev.by