Аддзел навін 14 мая 2024, 12:00

OpenAI паказала мадэль GPT-4o — яна «разумнейшая» за папярэднюю і даступная бясплатна

OpenAI паказала мультымадальную АІ-мадэль GPT-4o. Літара «о» ў назве азначае «omni» — «усебаковы». Яна працуе з тэкстам, аўдыя і відэа ў рэальным часе, а дыялог з ChatGPT на яе аснове стаў значна больш натуральным — у адрозненне ад галасавога рэжыму старой версіі, дзе проста начытваўся тэкст адказу.

2 каментарыя

OpenAI паказала мультымадальную АІ-мадэль GPT-4o. Літара «о» ў назве азначае «omni» — «усебаковы». Яна працуе з тэкстам, аўдыя і відэа ў рэальным часе, а дыялог з ChatGPT на яе аснове стаў значна больш натуральным — у адрозненне ад галасавога рэжыму старой версіі, дзе проста начытваўся тэкст адказу.

Мадэль вывела на новы ўзровень галасавыя і размоўныя здольнасці чат-бота. Напрыклад, ён умее выказваць эмоцыі і мяняць тон. Выбар галасоў першапачаткова будзе абмежаваны, але ўжо цяпер яны гучаць амаль неадрозна ад чалавечых. Таксама чат-бот навучыўся разбаўляць маўленне ўласцівымі людзям рэчамі, напрыклад, хіхіканнем і жартамі, а таксама на просьбу мяняць інтанацыю або нават спяваць, улоўліваць эмоцыі карыстальніка і іншыя дэталі яго стану, напрыклад, пачашчанае дыханне. Чат-бота цяпер можна перабіваць — больш не трэба чакаць, пакуль бот скончыць фразу, каб задаць удакладняльнае пытанне або змяніць тэму. А рэагуе бот цяпер імгненна — хуткасць адказу параўнальная з чалавечай і ў сярэднім, паводле слоў распрацоўшчыкаў, складае 320 мілісекунд.

Акрамя гэтага, чат-бот можа аналізаваць відэа і выявы, якія карыстальнік паказвае на камеру, і хутка адказваць на пытанні па ўбачаным — напрыклад, апісваць код або называць брэнд адзення, а таксама распазнаваць прастору вакол карыстальніка — напрыклад, у што ён апрануты і якія прадметы ў поле зроку. Таксама ён здольны перакладаць з адной мовы на другую ў рэжыме анлайн. GPT-4o падтрымлівае больш моў — распрацоўшчыкі палепшылі прадукцыйнасць мадэлі на 50 мовах.

У цэлым чат-бот стаў нашмат «чалавечнейшым». Калі-нікалі ў часе прэзентацыі ён памыляўся. Аднойчы бот няправільна распазнаў карцінку, а ў іншым выпадку пачаў адказваць, не даслухаўшы пытання. Каб згладзіць канфуз, ён аджартаваўся. У некаторых выпадках ён спрабаваў праяўляць чалавечыя рэакцыі — напрыклад, сказаў, што чырванее, калі яго пахвалілі.

Палепшаныя магчымасці па апрацоўцы тэксту і выяў GPT-4o ўжо даступныя платным і бясплатным карыстальнікам праз ChatGPT. Альфа-версія галасавога рэжыму на базе GPT-4o з’явіцца ў падпісцы ChatGPT Plus найбліжэйшымі тыднямі.

OpenAI анансавала GPT-4 Turbo — магутнейшую і таннейшую за GPT-4

2 каментарыя

Тэкст: Аддзел навін

Знайшлі памылку ў тэксце-вылучыце яе і націсніце Ctrl+Enter. Знайшлі памылку ў тэксце-вылучыце яе і націсніце кнопку «Паведаміць пра памылку».

Сайт компании Вакансии

Размяшчэнне рэкламы

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Anonymous

Каментарый скрыты за парушэнне правілаў каментавання.
[censored - П. 4.1.2. Пользовательского соглашения — https://devby.io/pages/polzovatelskoe-soglashenie]

Успешный Джавист счастлив в каменной норке

0

С видео никто не обещал работать, в приложении он делает скриншоты. Текст, аудио, изображения, и остальные плагины что были в 4-ке (браузинг, интерпретатор, и так далее )

Увайдзіце, каб пакінуць каментарый