17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Алгоритм распознавания речи набирает сообщения в 3 раза быстрее людей

1 комментарий
Алгоритм распознавания речи набирает сообщения в 3 раза быстрее людей

Алгоритм распознавания речи Deep Speech 2 преобразует голосовые сообщения в текст в три раза быстрее, чем люди. Испытание системы провели специалисты из Стэнфордского университета, Университета штата Вашингтон и сотрудники Baidu, сообщает apparat.cc со ссылкой на NPR.

Читать далее

Deep Speech 2 разработана в Лаборатории искусственного интеллекта SVAIL китайской компании Baidu. Тестирование технологии проводилось при распознавании устной речи на двух языках: английском и мандаринском.

Участники «соревнований» должны были воспринять на слух, а затем набрать на клавиатуре iPhone короткие фразы без контекста, например «пристегнуть ремень безопасности» или «носить корону с множеством драгоценных камней». Для текстинга использовали наиболее популярные раскладки: сенсорную стандартную QWERTY-клавиатуру для английского языка, а для китайском — специальную iOS-клавиатуру.

Оказалось, что скорость Deep Speech 2 значительно превышает скорость человеческого набора: с сообщениями на английском языке программа справляется в 3 раза быстрее, а на китайском — в 2,8 раз быстрее, чем люди. Кроме того, печатая фразы на английском языке, программа допускает на 20,4% меньше ошибок, чем люди, а на китайском — на 63,4% меньше.

«Речь всегда была гораздо более естественным способом общения между людьми», — говорит главный научный консультант Baidu Эндрю Ын.

Он надеется, что результаты исследования привлекут внимание пользователей к различным голосовым сервисам. Согласно опросу, в 2015 году только 65% владельцев смартфонов в США пользовалисьголосовыми помощниками.

В конце 2015 года Baidu усовершенствовала распознавание английского в шумных местах, а также создала новую аппаратную платформу на видеокартах, в семь раз увеличив производительность по сравнению с предыдущей версией сервера для Deep Speech.

Читайте также
Meta выпустила бесплатную модель, которая распознаёт 1600 языков
Meta выпустила бесплатную модель, которая распознаёт 1600 языков
Meta выпустила бесплатную модель, которая распознаёт 1600 языков
Дочь топ-менеджера Baidu сливала данные пользователей, которые критиковали корейскую поп-звезду
Дочь топ-менеджера Baidu сливала данные пользователей, которые критиковали корейскую поп-звезду
Дочь топ-менеджера Baidu сливала данные пользователей, которые критиковали корейскую поп-звезду
Baidu запустила модели, которые дешевле DeepSeek и не хуже OpenAI
Baidu запустила модели, которые дешевле DeepSeek и не хуже OpenAI
Baidu запустила модели, которые дешевле DeepSeek и не хуже OpenAI
3 комментария
СЕО «китайского Google»: ИИ-пузырь сметёт 99% игроков
СЕО «китайского Google»: ИИ-пузырь сметёт 99% игроков
СЕО «китайского Google»: ИИ-пузырь сметёт 99% игроков
3 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.