У ChatGPT з'явіўся зрок: чат-бот разумее відэа з камеры і экрана
Кампанія паказала доўгачаканую функцыю камп’ютарнага зроку для свайго чат-бота. Цяпер карыстальнікі платных падпісак могуць выкарыстоўваць камеры сваіх смартфонаў і функцыю трансляцыі экрана, каб ChatGPT мог «бачыць» навакольны свет і ўзаемадзейнічаць з ім у рэжыме рэальнага часу.
Кампанія паказала доўгачаканую функцыю камп’ютарнага зроку для свайго чат-бота. Цяпер карыстальнікі платных падпісак могуць выкарыстоўваць камеры сваіх смартфонаў і функцыю трансляцыі экрана, каб ChatGPT мог «бачыць» навакольны свет і ўзаемадзейнічаць з ім у рэжыме рэальнага часу.
Новая функцыя, якая атрымала назву «Пашыраны галасавы рэжым» (Advanced Voice Mode), была анансаваная яшчэ ў маі, але яе запуск некалькі разоў адкладаўся. Рэжым даступны для абанентаў ChatGPT Plus, Team і Pro. Абаненты Chatgpt Enterprise і Edu атрымаюць доступ да гэтай функцыі толькі ў студзені 2025 года. Акрамя таго, пакуль няма інфармацыі пра тое, калі функцыя стане даступная ў ЕС, Швейцарыі, Ісландыі, Нарвегіі і Ліхтэнштэйне.
Рэжым з камп’ютарным зрокам дазваляе ідэнтыфікаваць аб’екты, якія знаходзяцца ў поле зроку камеры смартфона, і даваць інфармацыю пра іх. Бот здольны аналізаваць тое, што адбываецца на экране прылады, напрыклад, тлумачыць налады меню або прапаноўваць рашэнні матэматычных задач. Таксама ChatGPT можа даваць галасавыя інструкцыі, рэагуючы на дзеянні карыстальніка ў рэальным часе.
У праграме CNN «60 хвілін» прэзідэнт OpenAI Грэг Брокман паказаў, як ChatGPT распазнае часткі цела, намаляваныя вядоўцам на дошцы. У часе жывой трансляцыі OpenAI прадэманстравала, як ChatGPT, выкарыстоўваючы камеру смартфона, дае пакрокавыя інструкцыі па гатаванні кавы. Аднак, нягледзячы на ўражальныя магчымасці, рэжым з камп’ютарным зрокам усё яшчэ знаходзіцца ў стадыі распрацоўкі і мае некаторыя абмежаванні: бот схільны да «галюцынацый» і можа дапускаць памылкі.
Google і Meta таксама працуюць над аналагічнымі рашэннямі для сваіх прадуктаў. Напрыклад, Google ужо тэсціруе функцыю Project Astra, якая дазваляе аналізаваць відэа ў рэальным часе на прыладах Android.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
бот склонен к «галлюцинациям» и может допускать ошибки.
бот выдает галлюцинации и может допускать правильные решения иногда)))