В сети завирусился новый китайский ИИ-агент Manus — его называют «вторым DeepSeek»

5 марта китайская компания The Butterfly Effect запустила агентный ИИ-сервис Manus — и вокруг превью-версии, по словам TechCrunch, уже больше хайпа, чем вокруг концертов Тейлор Свифт. Глава по продукту Hugging Face назвал новинку самым впечатляющим ИИ, который он когда-либо пробовал, от него в восторге ИИ-исследовали. Его официальный Discord вырос почти до 140 тысяч участников за несколько дней, а приглашения продаются за тысячи долларов. Но как отмечает издание, хайп может быть не совсем оправдан.

2 комментария

Manus не был разработан с нуля — это комбинация уже существующих донастроенных моделей, в том числе Anthropic Claude и Alibaba Qwen, которые проводят исследования, например анализируют финансовую документацию, и составляют доклады. На сайте агента есть другие примеры его возможностей — от покупки недвижимости до написания кода видеоигр.

Разработчики заявили, что Manus лучше конкурентов — например инструмента для углубленного поиска и агента Operator от OpenAI. Так, Manus превосходит первого на бенчмарке для ИИ-ассистентов GAIA, который оценивает их способность выполнять задачи на поиск в сети, использование приложений и не только. Manus позиционируется как «не просто очередной чат-бот», а как «полностью автономный агент, который стирает границу между замыслом и исполнением».

Но ранние пользователи усомнились в его всемогуществе. Было замечено, что он сбоит и зацикливается, допускает фактологические ошибки, не всегда вставляет ссылки при цитировании и может упускать информацию, которая лежит в свободном доступе.

Журналист TechCrunch говорит, что у него опыт тоже не самый позитивный: Manus не смог заказать ему сэндвич с курицей из лучшего заведения на районе — сломался за десять минут. Со второй попытки он смог найти позицию, которая отвечала заданным критериям, но с процессом заказа не справился. Также агент не смог забронировать авиабилеты, хотя получил очень чёткие инструкции — лишь выдал ссылки на цены с сайтов нескольких перевозчиков, причём некоторые оказались битыми. Попытка забронировать столик в ближайшем ресторане и создать игру тоже потерпела фиаско.

Разработчики в комментарии изданию отметили, что их немногочисленная команда очень старается улучшить Manus и создать действительно полезного агента, а также что они благодарны за весь фидбэк.

Вопрос в том, почему вокруг совсем не идеального инструмента столько шума. Причина может быть в ограниченности доступа и в китайских медиа, которые поспешили назвать Manus прорывом и «гордостью» отечественной разработки. Также ложь о его технических возможностях распространили по соцсетям ИИ-инфлюенсеры. К примеру, в одном видео якобы Manus выполняет ряд действий на смартфоне. Разработчики Manus завили, что на видео не он.

Некоторые инфлюенсеры сравнили Manus с DeepSeek — но большая разница в том, что The Butterfly Effect, в отличие от DeepSeek, не занимается «домашней» разработкой моделей и не выкладывала их в открытый доступ.

Стоит отметить, что Manus пока работает в режиме очень раннего доступа, и компания работает над расширением вычислительных мощностей и исправлением ошибок. Но чего-то инновационного с точки зрения технологий в продукте нет, заключает TechCrunch.

Google: до конца года будут протестированы лекарства, созданные ИИ, а «миллиарды» ИИ-агентов заставят переосмыслить «Всемирную паутину»
По теме
Google: до конца года будут протестированы лекарства, созданные ИИ, а «миллиарды» ИИ-агентов заставят переосмыслить «Всемирную паутину»
СЕО Salesforce: нынешнее поколение гендиректоров — последние, чей штат будет состоять только из живых сотрудников
По теме
СЕО Salesforce: нынешнее поколение гендиректоров — последние, чей штат будет состоять только из живых сотрудников
OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
По теме
OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
Perplexity запустил ИИ-ассистента
По теме
Perplexity запустил ИИ-ассистента
Поляки запустили джобборд для ИИ-агентов
По теме
Поляки запустили джобборд для ИИ-агентов

Читать на dev.by