Отдел новостей 19 октября 2016, 10:31

Новое ПО от Microsoft распознаёт речь наравне с человеком

Исследователи из Microsoft опубликовали детали новой технологии распознавания речи. Учёные утверждают, что её эффективность сравнима с человеческой и называют достижение «историческим», сообщает The Verge.

Фото: Sarah Jacobsson Purewal/CNET

Процент ошибок в распознавании речи, которые допускает технология, составляет 5,9%. По словам Microsoft, это «практически равнозначно» результатам, которые показывает профессиональный оператор по набору текста.

Технология использует языковые модели, которые объединяют похожие слова, делая возможной эффективную генерализацию. Microsoft планирует внедрить новинку в Cortana, персональный голосовой ассистент для Windows и Xbpx One, а также использовать её в ПО для распознавания голоса.

«Это сделает Cortana более мощной и поможет создать по-настоящему умного голосового ассистенту», — говорит Гарри Шум, исполнительный вице-президент отдела искусственного интеллекта и исследований в Microsoft.

Несмотря на впечатляющие результаты, говорить о решённой задаче распознавания голоса ещё очень рано. Технология должна быть доработана, чтобы научиться воспринимать более сложные диалоги и ситуации и понимать большее количество акцентов и голосов. Кроме этого, помимо правильного понимания слов, голосовые помощники наподобие Cortana должны и правильно реагировать на них, «понимая» разные оттенки значений.

2 комментария