OpenAI абнавіла галасавы ШІ для бізнесу: каштуе танней, гучыць больш натуральна
Кампанія прэзентавала сваю самую прасунутую галасавую мадэль GPT-Realtime, якая цяпер даступная ў абноўленым Realtime API. Новы інструмент прапануе распрацоўшчыкам больш хуткія і натуральныя рашэнні для стварэння галасавых асістэнтаў.
Кампанія прэзентавала сваю самую прасунутую галасавую мадэль GPT-Realtime, якая цяпер даступная ў абноўленым Realtime API. Новы інструмент прапануе распрацоўшчыкам больш хуткія і натуральныя рашэнні для стварэння галасавых асістэнтаў.
Да гэтага моманту стварэнне такіх сістэм было досыць складаным: мова карыстальніка спачатку пераўтваралася ў тэкст, затым апрацоўвалася моўнай мадэллю і толькі пасля гэтага зноў ператваралася ў аўдыё. Падобны ланцужок выклікаў прыкметныя затрымкі ў адказах. GPT-Realtime змяняе падыход, апрацоўваючы аўдыё наўпрост, што дазваляе выдаваць водгукі практычна без паўз і робіць зносіны з ШІ больш плаўнымі і натуральнымі.
OpenAI сцвярджае, што новая мадэль здольная лепш спраўляцца са складанымі і шматкрокавымі запытамі, змяняць танальнасць мовы, пераключацца паміж мовамі нават у сярэдзіне сказу і распазнаваць невербальныя сігналы накшталт смеху. Акрамя таго, GPT-Realtime можа аналізаваць выявы і апісваць іх змест. У абнаўленні таксама з’явіліся два новыя галасавыя варыянты — Cedar і Marin, а існуючыя галасы сталі гучаць больш рэалістычна і выразна.
Значнай навацыяй стала падтрымка пратакола Model Context Protocol (MCP), які стандартызуе падключэнне ШІ да знешніх крыніц дадзеных. У OpenAI параўноўваюць MCP з USB-портам для мадэляў: бізнесу больш не трэба ствараць індывідуальныя інтэграцыі для падключэння сваіх баз дадзеных, што спрашчае ўкараненне тэхналогіі ў сферы электроннай камерцыі, турызму або кліенцкага сэрвісу.
Кампанія таксама перагледзела цэнаўтварэнне. Калі раней выкарыстанне Realtime API каштавала $40 за мільён уваходных аўдыётакенаў і $80 за мільён выходных, то цяпер цэны знізіліся на 20% — да $32 і $64 адпаведна. Па словах OpenAI, гэта робіць прадукт больш даступным для шырокай аўдыторыі распрацоўшчыкаў і кампаній.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.