У сеціве завірусіўся новы кітайскі ШІ-агент Manus — яго называюць «другім DeepSeek»
5 сакавіка кітайская кампанія The Butterfly Effect запусціла агентны ШІ-сэрвіс Manus — і вакол прэв’ю-версіі, па словах TechCrunch, ужо больш хайпу, чым вакол канцэртаў Тэйлар Свіфт. Кіраўнік па прадукце Hugging Face назваў навінку самым неверагодным ШІ, які ён калі-небудзь выпрабоўваў, а ШІ-даследчыкі ў захапленні. Афіцыйны Discord-сервер за некалькі дзён вырас амаль да 140 тысяч удзельнікаў, а запрашэнні прадаюцца за тысячы долараў. Але, як адзначае выданне, ажыятаж можа быць не зусім апраўданы.
Manus не быў распрацаваны з нуля — гэта камбінацыя ўжо існых, дадаткова настроеных мадэляў, у тым ліку Anthropic Claude і Alibaba Qwen, якія праводзяць даследаванні, аналізуюць фінансавую дакументацыю і складаюць справаздачы. На сайце агента ёсць іншыя прыклады яго магчымасцей — ад набыцця нерухомасці да напісання кода для відэагульняў.
Распрацоўшчыкі абвесцілі, што Manus пераўзыходзіць канкурэнтаў — напрыклад, інструмент для паглыбленага пошуку і агента Operator ад OpenAI. Так, Manus апярэджвае Operator у бенчмарку GAIA для ШІ-асістэнтаў, які ацэньвае іх здольнасць пошуку ў сетцы, выкарыстання праграм і не толькі. Manus пазіцыянуецца як «не проста чарговы чат-бот», а як «цалкам аўтаномны агент, які сцірае мяжу паміж задумаю і выкананнем».
Аднак першыя карыстальнікі сумняваюцца ў яго ўсемагутнасці. Было заўважана, што Manus часам завісае, паўтарае дзеянні, дапускае факталагічныя памылкі, не заўсёды дадае спасылкі пры цытаванні і можа не заўважаць інфармацыю, якая знаходзіцца ў вольным доступе.
Журналіст TechCrunch піша, што яго досвед таксама быў не самым пазітыўным: Manus не змог замовіць яму сэндвіч з курыцай у лепшай установе раёна — сістэма дала збой праз 10 хвілін. З другой спробы ён знайшоў адпаведную пазіцыю, але не справіўся з афармленнем замовы. Таксама агент не змог забраніраваць авіаквіткі, хоць атрымаў дакладныя інструкцыі — ён толькі выдаў спасылкі на сайты перавозчыкаў, пры гэтым некаторыя аказаліся бітымі. Спробы забраніраваць столік у рэстарацыі і стварыць гульню таксама праваліліся.
Распрацоўшчыкі ў каментары выданню адзначылі, што іх невялікая каманда імкнецца палепшыць Manus і зрабіць яго сапраўды карысным агентам. Яны таксама падзякавалі за ўвесь фідбэк.
Пытанне ў тым, чаму вакол зусім не ідэальнага інструмента столькі ажыятажу. Прычына можа быць у абмежаваным доступе і кітайскіх медыя, якія паспяшаліся назваць Manus прарывам і «гонарам» нацыянальнай распрацоўкі. Акрамя таго, хлусню пра яго тэхнічныя магчымасці распаўсюдзілі ў сацсетках ШІ-інфлюенсеры. Напрыклад, у адным відэа нібыта Manus выконвае шэраг дзеянняў на смартфоне. Але распрацоўшчыкі Manus заявілі, што на відэа не ён.
Некаторыя інфлюенсеры параўналі Manus з DeepSeek, але ёсць істотнае адрозненне: The Butterfly Effect, у адрозненне ад DeepSeek, не займаецца «хатняй» распрацоўкай мадэляў і не выкладала іх у адкрыты доступ.
Варта адзначыць, што Manus пакуль працуе ў рэжыме вельмі ранняга доступу, а кампанія займаецца пашырэннем вылічальных магутнасцяў і выпраўленнем памылак. Аднак нічога інавацыйнага з тэхналагічнага пункту гледжання ў гэтым прадукце няма, заключае TechCrunch.
Читать на dev.by