Дапамажыце dev.by 🤍
Падтрымаць

ElevenLabs запускае мадэль пераўтварэння маўлення ў тэкст Scribe на 99 мовах

Кампанія паказала сваю першую аўтаномную мадэль пераўтварэння маўлення ў тэкст пад назвай Scribe, якая падтрымлівае больш за 99 моў. Гэты крок дазволіць кампаніі канкураваць з такімі гульцамі, як Gladia, Speechmatics, AssemblyAI, Deepgram і Whisper ад OpenAI.

Пакінуць каментарый
ElevenLabs запускае мадэль пераўтварэння маўлення ў тэкст Scribe на 99 мовах

Кампанія паказала сваю першую аўтаномную мадэль пераўтварэння маўлення ў тэкст пад назвай Scribe, якая падтрымлівае больш за 99 моў. Гэты крок дазволіць кампаніі канкураваць з такімі гульцамі, як Gladia, Speechmatics, AssemblyAI, Deepgram і Whisper ад OpenAI.

Scribe ад ElevenLabs аперуе больш як 25 мовамі з высокай дакладнасцю, уключаючы англійскую, французскую, нямецкую, хіндзі, інданезійскую, японскую, канада, малаялам, польскую, партугальскую, іспанскую і в’етнамскую.

Паводле даных кампаніі, частата памылак складае менш за 5%. Для англійскай мовы заяўленая дакладнасць 97%. Іншыя мовы ранжыруюцца па катэгорыях з высокай (5-10%), добрай (10-20%) і ўмеранай (25-50%) частатой памылак.

Крыніца: ElevenLabs.

У аўдыятэстах FLEURS і Common Voice мадэль Scribe паказала лепшыя вынікі, чым канкурэнты Google Gemini 2.0 Flash і Whisper Large V3. Мадэль мае шэраг функцый, уключаючы выбар дыктарскага голасу, часавыя пазнакі на ўзроўні слоў для стварэння дакладных субцітраў і аўтаматычную разметку гукавых падзей, такіх як смех аўдыторыі.

Цяпер Scribe працуе толькі з папярэдне запісанымі дарожкамі. ElevenLabs плануе найбліжэйшым часам выпусціць версію з нізкай затрымкай для працы ў рэжыме рэальнага часу. Гэта азначае, што ў бягучым выглядзе мадэль не падыходзіць для транскрыпцыі сустрэч або стварэння галасавых нататак.

Кошт Scribe складае $0,40 за гадзіну транскрыбаванага аўдыя. Кампанія таксама дае карыстальнікам інструменты для транскрыбавання відэакантэнту для дадання субцітраў.

Функцыя дыктоўкі iPhone замяняла слова «расіст» на Трампа
Функцыя дыктоўкі iPhone замяняла слова «расіст» на Трампа
Па тэме
Функцыя дыктоўкі iPhone замяняла слова «расіст» на Трампа
Microsoft адкрыла неабмежаваны доступ да функцый Copilot Voice і Think Deeper
Microsoft адкрыла неабмежаваны доступ да функцый Copilot Voice і Think Deeper
Па тэме
Microsoft адкрыла неабмежаваны доступ да функцый Copilot Voice і Think Deeper
Adobe выпусціла поўнафункцыянальны Photoshop для iPhone
Adobe выпусціла поўнафункцыянальны Photoshop для iPhone
Па тэме
Adobe выпусціла поўнафункцыянальны Photoshop для iPhone

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.