OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
OpenAI представила ИИ-агента Operator, который способен самостоятельно выполнять поставленные пользователем задачи.
OpenAI представила ИИ-агента Operator, который способен самостоятельно выполнять поставленные пользователем задачи.
Пока вышла предварительная версия нового инструмента. Первыми доступ к нему получат обладатели подписки Pro на ChatGPT за $200 в США. В скором времени его раскатят на пользователей тарифов Plus, Team и Enterprise. Жителям Европы придётся подождать. В перспективе OpenAI хочет предоставить Operator всем юзерам ChatGPT.
В интерфейсе агента на выбор пользователя есть несколько категорий задач, включая шопинг, доставку, обед и путешествия, которые отличаются разной степенью автоматизации. ИИ-агент может, например, забронировать жильё для грядущей поездки или столик в ресторане, купить продукты в интернете.
При активации Operator открывается небольшое окно со специальным браузером, в котором агент выполняет задачи. Там же отображается описание конкретных действий, выполняемых агентом. Поскольку Operator работает через отдельный браузер, пользователь может параллельно заниматься своими делами.
В основе Operator лежит особая модель Computer-Using Agent, которая обладает «зрительными» способностями GPT-4o и способностями к «рассуждению» более продвинутых моделей OpenAI. CUA обучена взаимодействовать с фронтендом веб-сайтов и не нуждается в API для различных сервисов. То есть она подобно человеку умеет нажимать кнопки, листать меню, заполнять формы и т. д.
Перед тем, как завершить выполнение задачи (сделать заказ, отправить емейл и т. д.), модель запросит у пользователя подтверждение, чтобы тот всё перепроверил. OpenAI будет работать над повышением надёжности модели. Компания отмечает, что пока она лучше справляется с несложными и неспециализированными задачами — сделать подробную презентацию, управлять сложными календарями или работать с очень кастомизированными и другими нестандартными сайтами она пока не сможет. Также пользователей пока просят контролировать выполнение агентом таких операций, как банковские — например, самим вводить данные с карт. OpenAI утверждает, что Operator не собирает никакие данные и не делает скриншоты.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
А зачем?