Исследователи из Microsoft опубликовали детали новой технологии распознавания речи. Учёные утверждают, что её эффективность сравнима с человеческой и называют достижение «историческим», сообщает The Verge.
Процент ошибок в распознавании речи, которые допускает технология, составляет 5,9%. По словам Microsoft, это «практически равнозначно» результатам, которые показывает профессиональный оператор по набору текста.
Технология использует языковые модели, которые объединяют похожие слова, делая возможной эффективную генерализацию. Microsoft планирует внедрить новинку в Cortana, персональный голосовой ассистент для Windows и Xbpx One, а также использовать её в ПО для распознавания голоса.
«Это сделает Cortana более мощной и поможет создать по-настоящему умного голосового ассистенту», — говорит Гарри Шум, исполнительный вице-президент отдела искусственного интеллекта и исследований в Microsoft.
Несмотря на впечатляющие результаты, говорить о решённой задаче распознавания голоса ещё очень рано. Технология должна быть доработана, чтобы научиться воспринимать более сложные диалоги и ситуации и понимать большее количество акцентов и голосов. Кроме этого, помимо правильного понимания слов, голосовые помощники наподобие Cortana должны и правильно реагировать на них, «понимая» разные оттенки значений.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.