🧑‍🎓 Бакалавриат, магистратура, MBA в Польше — подробный гайд
Support us

Стартап экс-CTO OpenAI показал ИИ, который говорит и слушает одновременно

Бывший технический директор OpenAI Мира Мурати впервые подробно показала разработку своего стартапа Thinking Machines Lab — TML-Interaction, модель нового типа для общения с ИИ в реальном времени.

Оставить комментарий
Стартап экс-CTO OpenAI показал ИИ, который говорит и слушает одновременно

Бывший технический директор OpenAI Мира Мурати впервые подробно показала разработку своего стартапа Thinking Machines Lab — TML-Interaction, модель нового типа для общения с ИИ в реальном времени.

Мурати ушла из OpenAI в сентябре 2024 года и вскоре основала Thinking Machines Lab. До сих пор о компании было известно немного, за исключением крупной сделки с Nvidia. Теперь стартап представил исследовательскую версию TML-Interaction-Small — модели, которая должна изменить сам принцип общения человека с ИИ.

Компания называет ее не языковой моделью, а «моделью взаимодействия»: она одновременно обрабатывает аудио, видео и текст, может говорить и слушать параллельно, реагировать на паузы и перебивания, а также выполнять фоновые задачи во время разговора.

В Thinking Machines Lab считают, что современные голосовые и текстовые ИИ-системы работают слишком жестко: пользователь говорит или пишет, модель ждет, затем обрабатывает запрос и отвечает. Такой подход создает искусственное ограничение: пока модель отвечает, она не воспринимает новую информацию, а пока пользователь говорит, она бездействует.

«Мы считаем, что можем решить это ограничение пропускной способности, сделав ИИ интерактивным в реальном времени и во всех модальностях. Это позволит ИИ-интерфейсам встречать людей там, где они находятся, а не заставлять людей адаптироваться к ИИ-интерфейсам», — заявили разработчики.

ИИ плохо работает на длинной дистанции — такого сотрудника уже уволили бы
ИИ плохо работает на длинной дистанции — такого сотрудника уже уволили бы
По теме
ИИ плохо работает на длинной дистанции — такого сотрудника уже уволили бы

Для более сложных задач модель может подключать асинхронную фоновую модель. Она берет на себя глубокое рассуждение, поиск в интернете или агентные рабочие процессы, пока основная interaction-модель продолжает поддерживать контакт с пользователем и затем встраивает результат в разговор.

Компания утверждает, что TML-Interaction-Small быстрее конкурентов в режиме реального времени. В опубликованном сравнении средняя задержка ответа составляет 0,40 секунды против 1,18 секунды у GPT-Realtime-2.0 в минимальном режиме, 0,59 секунды у GPT-Realtime-1.5 и 0,57 секунды у Gemini-3.1-Flash-Live.

Текущая версия модели — Mixture-of-Experts с 276 миллиардами параметров, из которых в каждый момент активны около 12 миллиардов. В компании признают, что более крупные модели пока слишком медленные для сценария синхронного взаимодействия, но обещают представить версии с большим числом параметров позднее.

У системы есть и ограничения. Длинные сессии с постоянным аудио- и видеопотоком быстро создают большой объем контекста, что усложняет управление. Кроме того, для стабильной работы нужна хорошая интернет-связь: при плохом соединении качество взаимодействия заметно падает.

Thinking Machines Lab планирует открыть доступ к TML-Interaction в режиме исследовательского превью в ближайшие месяцы. В течение 2026 года компания обещает выпустить модель в открытый доступ и запустить исследовательскую программу, чтобы вместе с научным сообществом разработать новые стандарты оценки таких моделей.

Кибератаки с использованием ИИ вышли на промышленный уровень — исследование
Кибератаки с использованием ИИ вышли на промышленный уровень — исследование
По теме
Кибератаки с использованием ИИ вышли на промышленный уровень — исследование
Android станет умнее: ИИ теперь выполняет действия за пользователя
Android станет умнее: ИИ теперь выполняет действия за пользователя
По теме
Android станет умнее: ИИ теперь выполняет действия за пользователя
5 мифов об ИИ-кодинге — мнение эксперта
5 мифов об ИИ-кодинге — мнение эксперта
По теме
5 мифов об ИИ-кодинге — мнение эксперта
Читайте также
Стартап экс-СТО OpenAI с оценкой в $12 млрд представил свой первый продукт
Стартап экс-СТО OpenAI с оценкой в $12 млрд представил свой первый продукт
Стартап экс-СТО OpenAI с оценкой в $12 млрд представил свой первый продукт
Два кофаундера стартапа, который через полгода после создания оценивали в $12 млрд, возвращаются в OpenAI
Два кофаундера стартапа, который через полгода после создания оценивали в $12 млрд, возвращаются в OpenAI
Два кофаундера стартапа, который через полгода после создания оценивали в $12 млрд, возвращаются в OpenAI
Топ OpenAI увела 20 сотрудников и основала свой стартап. Теперь он разваливается на глазах
Топ OpenAI увела 20 сотрудников и основала свой стартап. Теперь он разваливается на глазах
Топ OpenAI увела 20 сотрудников и основала свой стартап. Теперь он разваливается на глазах
OpenAI теряет ведущих специалистов
OpenAI теряет ведущих специалистов
OpenAI теряет ведущих специалистов

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.