Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

ElevenLabs запускает модель преобразования речи в текст Scribe на 99 языках

Компания представила свою первую автономную модель преобразования речи в текст под названием Scribe, которая поддерживает более 99 языков. Этот шаг позволит компании конкурировать с такими игроками, как Gladia, Speechmatics, AssemblyAI, Deepgram и Whisper от OpenAI.

Оставить комментарий
ElevenLabs запускает модель преобразования речи в текст Scribe на 99 языках

Компания представила свою первую автономную модель преобразования речи в текст под названием Scribe, которая поддерживает более 99 языков. Этот шаг позволит компании конкурировать с такими игроками, как Gladia, Speechmatics, AssemblyAI, Deepgram и Whisper от OpenAI.

Scribe от ElevenLabs оперирует более 25 языками с высокой точностью, включая английский, французский, немецкий, хинди, индонезийский, японский, каннада, малаялам, польский, португальский, испанский и вьетнамский.

По данным компании, частота ошибок составляет менее 5%. Для английского языка заявлена точность 97%. Другие языки ранжируются по категориям с высокой (5-10%), хорошей (10-20%) и умеренной (25-50%) частотой ошибок.

Источник: ElevenLabs.

В аудиотестах FLEURS и Common Voice модель Scribe показала результаты лучше, чем конкуренты Google Gemini 2.0 Flash и Whisper Large V3. Модель имеет ряд функций, включая выбор дикторского голоса, временные метки на уровне слов для создания точных субтитров и автоматическую разметку звуковых событий, таких как смех аудитории.

Сейчас Scribe работает только с предварительно записанными дорожками. ElevenLabs планирует в ближайшее время выпустить версию с низкой задержкой для работы в режиме реального времени. Это означает, что в текущем виде модель не подходит для транскрипции встреч или создания голосовых заметок.

Стоимость Scribe составляет $0,40 за час транскрибированного аудио. Компания также предоставляет пользователям инструменты для транскрибирования видеоконтента для добавления субтитров.

Функция диктовки iPhone заменяла слово «расист» на Трампа
Функция диктовки iPhone заменяла слово «расист» на Трампа
По теме
Функция диктовки iPhone заменяла слово «расист» на Трампа
Microsoft открыла неограниченный доступ к функциям Copilot Voice и Think Deeper
Microsoft открыла неограниченный доступ к функциям Copilot Voice и Think Deeper
По теме
Microsoft открыла неограниченный доступ к функциям Copilot Voice и Think Deeper
Adobe выпустила полнофункциональный Photoshop для iPhone
Adobe выпустила полнофункциональный Photoshop для iPhone
По теме
Adobe выпустила полнофункциональный Photoshop для iPhone
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.