🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Новая модель Anthropic умеет имитировать работу человека с компьютером

В Claude 3.5 Sonnet от Anthropic появилась функция, которая позволяет ИИ-модели самостоятельно управлять происходящим на экране монитора — например, двигать курсором, нажимать кнопки и набирать текст, пишет TechCrunch.

3 комментария

В Claude 3.5 Sonnet от Anthropic появилась функция, которая позволяет ИИ-модели самостоятельно управлять происходящим на экране монитора — например, двигать курсором, нажимать кнопки и набирать текст, пишет TechCrunch.

Функция называется Computer Use, вчера она стала доступна разработчикам через API в рамках открытого бета-тестирования. Она способна «видеть» экран и взаимодействовать с настольными приложениями для выполнения различных задач, полностью заменяя человека. Claude смотрит на скриншоты того, что видит пользователь, и подсчитывает, на сколько пикселей по вертикали или горизонтали нужно переместить курсор, чтобы щёлкнуть в правильном месте. Благодаря способности просматривать веб-страницы модель может использовать в работе любой сайт или приложение.

Чтобы она выполнила какую-то задачу, ей нужно дать команду — например, попросить заполнить форму, используя данные с компьютера и из сети. Пользователь разрешает и ограничивают доступ к ним по мере необходимости. Claude разбивает запрос пользователя на команды для выполнения задачи. Все действия будет видно в специальном окне.

Разработчики отмечают, что модель далеко не идеальна. Например, она плохо справляется такими базовыми операциями, как прокрутка и масштабирование, а также пропускает кратковременные события и уведомления из-за способа, которым она делает снимки экрана и объединяет их. Также модель медленна и допускает ошибки, поэтому ей не рекомендуется поручать ответственные задачи. Забронировать билеты ей удалось менее чем в половине случаев, а отменить их модель не смогла в трети случаев.

Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
По теме
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
Anthropic выпустила тариф Claude для корпоративных клиентов
Anthropic выпустила тариф Claude для корпоративных клиентов
По теме
Anthropic выпустила тариф Claude для корпоративных клиентов
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Китайская компания ищет ИИ-инженера на $1,5 млн в месяц. Вот что нужно делать
Китайская компания ищет ИИ-инженера на $1,5 млн в месяц. Вот что нужно делать
Китайская компания ищет ИИ-инженера на $1,5 млн в месяц. Вот что нужно делать
ИИ-агенты всё чаще выходят из-под контроля: число сбоев выросло в разы
ИИ-агенты всё чаще выходят из-под контроля: число сбоев выросло в разы
ИИ-агенты всё чаще выходят из-под контроля: число сбоев выросло в разы
Почти половину дата-центров в США не могут достроить в срок
Почти половину дата-центров в США не могут достроить в срок
Почти половину дата-центров в США не могут достроить в срок
«Это безумие»: ИИ помог построить бизнес на $1,8 млрд с двумя сотрудниками
«Это безумие»: ИИ помог построить бизнес на $1,8 млрд с двумя сотрудниками
«Это безумие»: ИИ помог построить бизнес на $1,8 млрд с двумя сотрудниками

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
1

Новая модель "Жужа-журналист" умеет генерировать модели про ИИ модели в реальном времени.

Anonymous
Anonymous
0

Скамеры и спамеры радостно потирают ручонки

0

Не всегда нужно перемещать курсор основываясь на скриншотах, да и не всегда возможно, дешевле было бы научить её пользоваться телеметрией.