ElevenLabs запускае мадэль пераўтварэння маўлення ў тэкст Scribe на 99 мовах
Кампанія паказала сваю першую аўтаномную мадэль пераўтварэння маўлення ў тэкст пад назвай Scribe, якая падтрымлівае больш за 99 моў. Гэты крок дазволіць кампаніі канкураваць з такімі гульцамі, як Gladia, Speechmatics, AssemblyAI, Deepgram і Whisper ад OpenAI.
Кампанія паказала сваю першую аўтаномную мадэль пераўтварэння маўлення ў тэкст пад назвай Scribe, якая падтрымлівае больш за 99 моў. Гэты крок дазволіць кампаніі канкураваць з такімі гульцамі, як Gladia, Speechmatics, AssemblyAI, Deepgram і Whisper ад OpenAI.
Scribe ад ElevenLabs аперуе больш як 25 мовамі з высокай дакладнасцю, уключаючы англійскую, французскую, нямецкую, хіндзі, інданезійскую, японскую, канада, малаялам, польскую, партугальскую, іспанскую і в’етнамскую.
Паводле даных кампаніі, частата памылак складае менш за 5%. Для англійскай мовы заяўленая дакладнасць 97%. Іншыя мовы ранжыруюцца па катэгорыях з высокай (5-10%), добрай (10-20%) і ўмеранай (25-50%) частатой памылак.
Крыніца: ElevenLabs.
У аўдыятэстах FLEURS і Common Voice мадэль Scribe паказала лепшыя вынікі, чым канкурэнты Google Gemini 2.0 Flash і Whisper Large V3. Мадэль мае шэраг функцый, уключаючы выбар дыктарскага голасу, часавыя пазнакі на ўзроўні слоў для стварэння дакладных субцітраў і аўтаматычную разметку гукавых падзей, такіх як смех аўдыторыі.
Цяпер Scribe працуе толькі з папярэдне запісанымі дарожкамі. ElevenLabs плануе найбліжэйшым часам выпусціць версію з нізкай затрымкай для працы ў рэжыме рэальнага часу. Гэта азначае, што ў бягучым выглядзе мадэль не падыходзіць для транскрыпцыі сустрэч або стварэння галасавых нататак.
Кошт Scribe складае $0,40 за гадзіну транскрыбаванага аўдыя. Кампанія таксама дае карыстальнікам інструменты для транскрыбавання відэакантэнту для дадання субцітраў.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.