Французскі стартап прадставіў новую лінейку мадэляў для распазнавання і перакладу мовы. Распрацоўшчыкі сцвярджаюць, што навінка можа наблізіць індустрыю да «бясшоўнай» камунікацыі паміж людзьмі на розных мовах.
Французскі стартап прадставіў новую лінейку мадэляў для распазнавання і перакладу мовы. Распрацоўшчыкі сцвярджаюць, што навінка можа наблізіць індустрыю да «бясшоўнай» камунікацыі паміж людзьмі на розных мовах.
Кампанія выпусціла дзве мадэлі — Voxtral Mini Transcribe V2 і Voxtral Realtime. Першая прызначана для пакетнай расшыфроўкі аўдыя, другая — для амаль імгненнай транскрыпцыі з затрымкай каля 200 мілісекунд. Абедзве падтрымліваюць пераклад на 13 моў, а Voxtral Realtime распаўсюджваецца па open-source-ліцэнзіі.
Кампанія сцвярджае, што мадэлі дастаткова кампактныя (каля 4 мільярдаў параметраў), каб працаваць лакальна на смартфонах і ноўтбуках. Гэта дазваляе апрацоўваць прыватныя размовы без адпраўкі даных у воблака. Паводле звестак Mistral, рашэнні таксама таннейшыя ў эксплуатацыі і радзей дапускаюць памылкі ў параўнанні з альтэрнатывамі.
Віцэ-прэзідэнт кампаніі П’ер Сток назваў запуск крокам да вырашэння моўнага бар’еру. «Мы будуем сістэму, здольную забяспечваць бясшоўны пераклад. Гэтая мадэль закладвае аснову для гэтага. Думаю, праблема будзе вырашана ўжо ў 2026 годзе», — сказаў ён.
Паводле слоў топ-менеджара, стратэгія кампаніі адрозніваецца ад падыходу буйных канкурэнтаў. «Шчыра кажучы, залішняя колькасць GPU робіць вас лянівымі. Вы проста тэсціруеце ўсё запар, замест таго каб шукаць найкарацейшы шлях да поспеху», — адзначыў Сток.
Заснаваная ў 2023 годзе выхадцамі з Meta і Google DeepMind, Mistral застаецца адной з нешматлікіх еўрапейскіх кампаній, якія распрацоўваюць базавыя ШІ-мадэлі, суаднасныя па магчымасцях з рашэннямі OpenAI, Anthropic і Google. Не маючы параўнальных рэсурсаў, стартап робіць стаўку на аптымізацыю архітэктуры і датасэтаў, спрабуючы дасягнуць балансу паміж коштам і прадукцыйнасцю.
У адрозненне ад амерыканскіх гульцоў, якія інвестуюць сотні мільярдаў даляраў ва ўніверсальныя мадэлі, Mistral факусуецца на спецыялізаваных рашэннях, напрыклад, для пераўтварэння мовы ў тэкст. Такі падыход можа даць кампаніі нішу на фоне росту попыту на больш танныя і прыкладныя ШІ-інструменты.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
200 миллисекунд это много, вот если до 10 то даааа
Пользователь отредактировал комментарий 6 февраля 2026, 18:16
Там куча языков. Полагаю, что если затюнить под конкретную языковую пару, то можно и 10 мс получить
30-80мс - это нормальный пинг к API. вы же хотите быстрее света чтобы и нейронки работали