Project Mariner — ноу-хау Google в поиске: ИИ-агент ищет товары и покупает билеты за вас
Google представила исследовательский прототип Project Mariner, который может выполнять действия в интернете за пользователя. ИИ-агенты — новое направление поисковых технологий. Мы разобрались, с какими рисками могут столкнуться разработчики и пользователи.
ИИ-агент Project Mariner может брать под контроль браузер Chrome, перемещать курсор на экране, нажимать кнопки и заполнять формы. Это позволяет использовать сайты и перемещаться по ним так же, как это делает пользователь. Project Mariner работает как расширение Chrome.
У пользователя появляется специальное окно чата, в котором агенту можно поручить выполнение различных задач. Например, его можно попросить создать корзину покупок в продуктовом магазине на основе списка. Затем агент самостоятельно перейдет на страницу магазина, выполнит поиск товаров и добавит их в корзину.
Агент делает снимки экрана окна браузера, перед этим пользователи должны дать согласие на использование этой функции. Изображения отправляются для обработки в облачный сервис Gemini, затем чат-бот передает инструкции обратно на устройство пользователя для навигации по странице.
Кроме Project Mariner Google представила инструмент Deep Research для глубокого поиска и исследований в сети. Другой агент Jules предназначен для помощи разработчикам в написании кода. Он интегрируется в рабочие процессы GitHub, анализирует текущий уровень разработки и вносит изменения в репозитории. Jules будет доступен в 2025 году.
Ограничения
Сейчас Project Mariner проходит стадию тестирования группой отобранных пользователей (записаться в лист ожидания можно здесь). Журналисты, которые опробовали систему, заявили, что пока агент работает не так быстро, как хотелось бы. На каждое движение курсора уходит примерно пять секунд. Иногда агент прерывает выполнение задачи и возвращается к окну чата и запрашивает уточнения, например, о весе или количество товаров.
Также расширение не работает в фоновом режиме: за действиями агента необходимо следить в открытом окне. Таким образом, пользователям придется видеть страницу сайта, что выгодно владельцам ресурсов. Тем не менее применение агента снижает уровень непосредственного взаимодействия пользователей с функциями сайта.
Еще одно препятствие: агент не может оформить заказ, так как в его алгоритм не включены функции заполнения номеров банковских карт и другой платежной информации. Вероятно, разработчики пока не добавляют эту функцию из-за несовершенства алгоритма и рисков для конфиденциальности пользователей.
«Поскольку [Gemini] теперь выполняет действия от имени пользователя, важно делать это шаг за шагом. Это дополнительная функция. Вы, как человек, можете использовать веб-сайты, и теперь ваш агент может делать все, что вы делаете на веб-сайте», — заявил главный технический директор Google DeepMind Корая Кавукчуоглу.
Project Mariner не принимает файлы cookie и не подписывает соглашения об условиях использования от имени пользователей. Разработчики подчеркивают, что сделали это намеренно, чтобы у пользователей было больше контроля за действиями ИИ-агента.
Почему это прорывная технология
За разработку агента отвечает исследовательское подразделение компании DeepMind. Глава Google Labs Жаклин Конзельманн заявила, что Project Mariner — это принципиально новый подход в пользовательском интерфейсе. Проект предлагает отказаться от прямого взаимодействия с сайтами и отдать эти задачи генеративному ИИ.
Конзельманн считает, что такие изменения могут затронуть миллионы предприятий: от онлайн-изданий до ритейла, которые ранее полагались на поисковик Google как отправную точку для привлечения пользователей на свои ресурсы. Например, агента можно применять для поиска рейсов и отелей, покупок товаров для дома, поиска рецептов и других задач.
Project Mariner выглядит как один из путей развития поисковых систем на фоне развития ИИ-технологий. В перспективе использование ИИ-агента может вовсе исключить необходимость самостоятельного посещения сайтов.
«Project Mariner — это принципиально новый сдвиг в парадигме UX, который мы наблюдаем прямо сейчас. Нам нужно понять, как правильно всё это настроить, чтобы изменить принципы взаимодействия пользователей с интернетом, а также найти способы, которыми издатели смогут создавать собственные решения для пользователей на базе ИИ-агентов в будущем», — сообщила Жаклин Конзельманн.
Другое направление — это разработка агентов для помощи геймерам. Google уже сотрудничает с разработчиками игр, например, студией Supercell. DeepMind проверяет способность Gemini интерпретировать игровые миры. О сроках запуска прототипа игрового агента пока неизвестно. Google подчеркивает, что создание такого сервиса помогает разрабатывать агентов для навигации как в реальном, так и в виртуальном мирах.
Технологические компании считают, что ИИ-агенты могут стать следующим большим скачком вперед для технологии, при этом чат-боты все чаще берут на себя работу пользователей. В случае успеха агенты могут революционизировать использование ПК и мобильных устройств, регулярно бронируя рейсы, организовывая встречи, а также анализируя и организуя документы. Но технология автономных помощников остается проблемной, так как высок риск того, что ошибки агентов могут приводить к дорогостоящим и трудноисправимым ошибкам.
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.