OpenAI абнавіла галасавы ШІ для бізнесу: каштуе танней, гучыць больш натуральна

Кампанія прэзентавала сваю самую прасунутую галасавую мадэль GPT-Realtime, якая цяпер даступная ў абноўленым Realtime API. Новы інструмент прапануе распрацоўшчыкам больш хуткія і натуральныя рашэнні для стварэння галасавых асістэнтаў.

Пакінуць каментарый

Да гэтага моманту стварэнне такіх сістэм было досыць складаным: мова карыстальніка спачатку пераўтваралася ў тэкст, затым апрацоўвалася моўнай мадэллю і толькі пасля гэтага зноў ператваралася ў аўдыё. Падобны ланцужок выклікаў прыкметныя затрымкі ў адказах. GPT-Realtime змяняе падыход, апрацоўваючы аўдыё наўпрост, што дазваляе выдаваць водгукі практычна без паўз і робіць зносіны з ШІ больш плаўнымі і натуральнымі.

OpenAI сцвярджае, што новая мадэль здольная лепш спраўляцца са складанымі і шматкрокавымі запытамі, змяняць танальнасць мовы, пераключацца паміж мовамі нават у сярэдзіне сказу і распазнаваць невербальныя сігналы накшталт смеху. Акрамя таго, GPT-Realtime можа аналізаваць выявы і апісваць іх змест. У абнаўленні таксама з’явіліся два новыя галасавыя варыянты — Cedar і Marin, а існуючыя галасы сталі гучаць больш рэалістычна і выразна.

Значнай навацыяй стала падтрымка пратакола Model Context Protocol (MCP), які стандартызуе падключэнне ШІ да знешніх крыніц дадзеных. У OpenAI параўноўваюць MCP з USB-портам для мадэляў: бізнесу больш не трэба ствараць індывідуальныя інтэграцыі для падключэння сваіх баз дадзеных, што спрашчае ўкараненне тэхналогіі ў сферы электроннай камерцыі, турызму або кліенцкага сэрвісу.

Кампанія таксама перагледзела цэнаўтварэнне. Калі раней выкарыстанне Realtime API каштавала $40 за мільён уваходных аўдыётакенаў і $80 за мільён выходных, то цяпер цэны знізіліся на 20% — да $32 і $64 адпаведна. Па словах OpenAI, гэта робіць прадукт больш даступным для шырокай аўдыторыі распрацоўшчыкаў і кампаній.

Anthropic пачне навучаць ШІ на вашых чатах па змаўчанні
Па тэме
Anthropic пачне навучаць ШІ на вашых чатах па змаўчанні
Новая ШІ-мадэль Microsoft стварае 90-хвілінныя падкасты з тэксту
Па тэме
Новая ШІ-мадэль Microsoft стварае 90-хвілінныя падкасты з тэксту
Выяўлены першы ШІ-вірус на базе мадэлі OpenAI
Па тэме
Выяўлены першы ШІ-вірус на базе мадэлі OpenAI

Читать на dev.by