OpenAI паказала мадэль GPT-4o — яна «разумнейшая» за папярэднюю і даступная бясплатна
OpenAI паказала мультымадальную АІ-мадэль GPT-4o. Літара «о» ў назве азначае «omni» — «усебаковы». Яна працуе з тэкстам, аўдыя і відэа ў рэальным часе, а дыялог з ChatGPT на яе аснове стаў значна больш натуральным — у адрозненне ад галасавога рэжыму старой версіі, дзе проста начытваўся тэкст адказу.
OpenAI паказала мультымадальную АІ-мадэль GPT-4o. Літара «о» ў назве азначае «omni» — «усебаковы». Яна працуе з тэкстам, аўдыя і відэа ў рэальным часе, а дыялог з ChatGPT на яе аснове стаў значна больш натуральным — у адрозненне ад галасавога рэжыму старой версіі, дзе проста начытваўся тэкст адказу.
Мадэль вывела на новы ўзровень галасавыя і размоўныя здольнасці чат-бота. Напрыклад, ён умее выказваць эмоцыі і мяняць тон. Выбар галасоў першапачаткова будзе абмежаваны, але ўжо цяпер яны гучаць амаль неадрозна ад чалавечых. Таксама чат-бот навучыўся разбаўляць маўленне ўласцівымі людзям рэчамі, напрыклад, хіхіканнем і жартамі, а таксама на просьбу мяняць інтанацыю або нават спяваць, улоўліваць эмоцыі карыстальніка і іншыя дэталі яго стану, напрыклад, пачашчанае дыханне. Чат-бота цяпер можна перабіваць — больш не трэба чакаць, пакуль бот скончыць фразу, каб задаць удакладняльнае пытанне або змяніць тэму. А рэагуе бот цяпер імгненна — хуткасць адказу параўнальная з чалавечай і ў сярэднім, паводле слоў распрацоўшчыкаў, складае 320 мілісекунд.
Акрамя гэтага, чат-бот можа аналізаваць відэа і выявы, якія карыстальнік паказвае на камеру, і хутка адказваць на пытанні па ўбачаным — напрыклад, апісваць код або называць брэнд адзення, а таксама распазнаваць прастору вакол карыстальніка — напрыклад, у што ён апрануты і якія прадметы ў поле зроку. Таксама ён здольны перакладаць з адной мовы на другую ў рэжыме анлайн. GPT-4o падтрымлівае больш моў — распрацоўшчыкі палепшылі прадукцыйнасць мадэлі на 50 мовах.
У цэлым чат-бот стаў нашмат «чалавечнейшым». Калі-нікалі ў часе прэзентацыі ён памыляўся. Аднойчы бот няправільна распазнаў карцінку, а ў іншым выпадку пачаў адказваць, не даслухаўшы пытання. Каб згладзіць канфуз, ён аджартаваўся. У некаторых выпадках ён спрабаваў праяўляць чалавечыя рэакцыі — напрыклад, сказаў, што чырванее, калі яго пахвалілі.
Палепшаныя магчымасці па апрацоўцы тэксту і выяў GPT-4o ўжо даступныя платным і бясплатным карыстальнікам праз ChatGPT. Альфа-версія галасавога рэжыму на базе GPT-4o з’явіцца ў падпісцы ChatGPT Plus найбліжэйшымі тыднямі.
Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот
Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале
Абмеркаванне
Каментуйце без абмежаванняў
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
Anonymous
14 мая 2024, 14:11
Каментарый скрыты за парушэнне правілаў каментавання. [censored - П. 4.1.2. Пользовательского соглашения — https://devby.io/pages/polzovatelskoe-soglashenie]
С видео никто не обещал работать, в приложении он делает скриншоты. Текст, аудио, изображения, и остальные плагины что были в 4-ке (браузинг, интерпретатор, и так далее )
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
Каментарый скрыты за парушэнне правілаў каментавання.
[censored - П. 4.1.2. Пользовательского соглашения — https://devby.io/pages/polzovatelskoe-soglashenie]
С видео никто не обещал работать, в приложении он делает скриншоты. Текст, аудио, изображения, и остальные плагины что были в 4-ке (браузинг, интерпретатор, и так далее )