200 инженеров в Варшаве обсуждают дыры в пайплайнах. Без вас?
Support us

OpenAI обновила голосовой ИИ для бизнеса: стоит дешевле, звучит естественнее

Компания представила свою самую продвинутую голосовую модель GPT-Realtime, которая теперь доступна в обновленном Realtime API. Новый инструмент предлагает разработчикам более быстрые и естественные решения для создания голосовых ассистентов.

Оставить комментарий
OpenAI обновила голосовой ИИ для бизнеса: стоит дешевле, звучит естественнее

Компания представила свою самую продвинутую голосовую модель GPT-Realtime, которая теперь доступна в обновленном Realtime API. Новый инструмент предлагает разработчикам более быстрые и естественные решения для создания голосовых ассистентов.

До этого момента создание таких систем было достаточно сложным: речь пользователя сначала преобразовывалась в текст, затем обрабатывалась языковой моделью и только после этого вновь превращалась в аудио. Подобная цепочка вызывала заметные задержки в ответах. GPT-Realtime меняет подход, обрабатывая аудиопоток напрямую, что позволяет выдавать отклики практически без пауз и делает общение с ИИ более плавным и естественным.

OpenAI утверждает, что новая модель способна лучше справляться со сложными и многошаговыми запросами, менять тональность речи, переключаться между языками даже в середине предложения и распознавать невербальные сигналы вроде смеха. Кроме того, GPT-Realtime может анализировать изображения и описывать их содержание. В обновлении также появились два новых голосовых варианта — Cedar и Marin, а существующие голоса стали звучать более реалистично и выразительно.

Значимой новацией стала поддержка протокола Model Context Protocol (MCP), который стандартизирует подключение ИИ к внешним источникам данных. В OpenAI сравнивают MCP с USB-портом для моделей: бизнесу больше не нужно создавать индивидуальные интеграции для подключения своих баз данных, что упрощает внедрение технологии в сферы электронной коммерции, туризма или клиентского сервиса.

Компания также пересмотрела ценообразование. Если раньше использование Realtime API стоило $40 за миллион входных аудиотокенов и $80 за миллион выходных, то теперь цены снижены на 20% — до $32 и $64 соответственно. По словам OpenAI, это делает продукт более доступным для широкой аудитории разработчиков и компаний.

Anthropic начнёт обучать ИИ на ваших чатах по умолчанию
Anthropic начнёт обучать ИИ на ваших чатах по умолчанию
По теме
Anthropic начнёт обучать ИИ на ваших чатах по умолчанию
Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста
Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста
По теме
Новая ИИ-модель Microsoft создаёт 90-минутные подкасты из текста
Обнаружен первый ИИ-вирус на базе модели OpenAI
Обнаружен первый ИИ-вирус на базе модели OpenAI
По теме
Обнаружен первый ИИ-вирус на базе модели OpenAI
Читайте также
«Мы упустили момент Оппенгеймера для ИИ» — мнение эксперта
«Мы упустили момент Оппенгеймера для ИИ» — мнение эксперта
«Мы упустили момент Оппенгеймера для ИИ» — мнение эксперта
В США школьный ИИ принял за пистолет пачку чипсов и вызвал полицию
В США школьный ИИ принял за пистолет пачку чипсов и вызвал полицию
В США школьный ИИ принял за пистолет пачку чипсов и вызвал полицию
Anthropic, OpenAI и Perplexity рвутся в Индию — она становится важным компонентом глобальной ИИ-гонки
Anthropic, OpenAI и Perplexity рвутся в Индию — она становится важным компонентом глобальной ИИ-гонки
Anthropic, OpenAI и Perplexity рвутся в Индию — она становится важным компонентом глобальной ИИ-гонки
CEO Airbnb: если не брать зумеров, руководить скоро будет некому
CEO Airbnb: если не брать зумеров, руководить скоро будет некому
CEO Airbnb: если не брать зумеров, руководить скоро будет некому

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.