Дапамажыце dev.by 🤍
Падтрымаць

Як камп’ютар навучыўся размаўляць па-беларуску

2 каментарыя
Як камп’ютар навучыўся размаўляць па-беларуску
skitchedТэхналогіі распазванання тэкставай інфармацыі і пераводу яе ў маўленне распрацаваныя шмат для якіх моваў свету. Цяпер і беларуская не выключэнне. У нашай краіне распрацоўкай такой праграмы займаюцца ў Аб’яднаным інстытуце праблем інфарматыкі Нацыянальнай акадэміі навук, а таксама ў прыватнай кампаніі «Сакрамент». Пра сваю распрацоўку «Нашай Ніве«расказала кандыдат тэхнічных навук Лілія Цырульнік і малодшы навуковы супрацоўнік Юрась Гецэвіч, які непасрэдна займаецца беларускамоўным сегментам. У чым адметнасць вашай лабараторыі?
Лілія Цырульнік: Наша асаблівасць — гэта распрацоўка сістэмы сінтэзу маўлення для беларускай мовы. Акрамя гэтага, мы распрацавалі такія сістэмы для расейскай і польскай моваў, а таксама займаемся стварэннем сінтэзатара якуцкай мовы.
Дзе можа выкарыстоўвацца ваша праграма?
ЛЦ: Сфера прымянення даволі шырокая: стварэнне аўдыёкніг, чытанне электроннай пошты, дапамога сляпым людзям. Што яшчэ важна, сістэма сінтэзу беларускага маўлення будзе спрыяць захаванню мовы.
Колькі каштуе такая праграма?
ЛЦ: Пакуль няма камерцыйнай версіі праграмы для беларускай мовы, яна будзе створана цягам некалькіх месяцаў. Для канчатковага карыстальніка гэта будзе адзін кошт, для карпаратыўнага ўжытку ці для выкарыстоўвання ў сістэмах апавяшчэння абанентаў па тэлефоне — іншы. Напрыклад, створаная намі праграма для агучвання аўдыёкніг на расейскай мове «aBookForge» каштуе каля $7. На гэту лічбу можна арыентавацца.
Як даўно вы займаецеся распрацоўкамі сінтэзатараў маўлення?
ЛЦ: Лабараторыя існуе ўжо больш за 40 гадоў. Былы загадчык лабараторыі — Барыс Мяфодзевіч Лабанаў — вядомы вучоны, на рахунку якога шмат навуковых распрацовак. Дарэчы, яго голасам «размаўляе» праграма. А беларускамоўным сінтэзатарам пачалі займацца гадоў 10 таму.
skitchedЦі звяртаецеся вы да паслуг філолагаў?
ЛЦ: Вядома ж. Трэба ўлічваць асаблівасці і гукаў, і інтанацыі. Напрыклад, у польскай мове націск трапляе пераважна на перадапошні склад. Мовы пастаянна развіваюцца, з’яўляюцца новыя словы. А вось колькасць гукаў — абмежаваная. У беларускай мове ёсць 42 гукі. Такім чынам, з існуючай базы гукаў праграма ўтварае словы, сказы, тэксты… Акрамя таго, адзін і той жа гук можа быць вымаўлены з рознай інтанацыяй і тэмпам.
Ці можа праграмма «размаўляць» голасам іншага чалавека па жаданні заказчыка?
ЛЦ: Што тычыцца персанальнага голасу, у нас распрацавана тэхналогія, дзякуючы якой любы дыктар можа прачытаць пэўны тэкст, зрабіць яго аўдыёзапіс. Потым гэты запіс апрацоўваецца спецыяльным чынам і ствараецца маўленчая база дадзеных. Таму тэарэтычна праграма можа размаўляць любым голасам.
З якімі цяжкасцямі вы сутыкаліся пры распрацоўцы беларускай версіі?
Юрась Гецэвіч: Найбольшую складанасць выклікаюць розныя скарачэнні, абрэвіятуры, даты, а таксама пастаноўка націскаў у словах. Да таго ж, людзі часта робяць памылкі пры напісанні тэкстаў. Таму мая задача — рабіць лінгвістычны блок, які б мог распазнаваць «закадаваныя» выразы ў тэксце, затым пераводзіць іх у арфаграфічныя словы, знаходзіць гэтыя словы ў слоўніку і расстаўляць націскі. Напачатку слоўніка не было. Нам яго перадалі з Лабараторыі камп’ютарнай лінгвістыкі БДУ. Зразумела, што прыйшлося яго адаптаваць, дадаваць новыя словы, імёны.
Каб лепш зразумець, як працуе праграма, Юрась Гецэвіч надрукаваў некалькі словаў на клавіятуры — і камп’ютар прамовіў прыемным мужчынскім голасам з лёгкім металічным акцэнтам: «Прывітанне, газета «Наша Ніва»! Вы першая беларуская газета з малюнкамі. А мы першая лабараторыя, якая сінтэзуе беларускую мову». Крыніца: «Наша Ніва»
Чытайце таксама
«Думаюць, калі ўзяць «галоўнага», ён дасць пароль ад Wikipedia». Чаму прыходзяць па вікіпедыстаў — і чаму вікіпедысты працягваюць пісаць
«Думаюць, калі ўзяць «галоўнага», ён дасць пароль ад Wikipedia». Чаму прыходзяць па вікіпедыстаў — і чаму вікіпедысты працягваюць пісаць
«Думаюць, калі ўзяць «галоўнага», ён дасць пароль ад Wikipedia». Чаму прыходзяць па вікіпедыстаў — і чаму вікіпедысты працягваюць пісаць
Пагутарылі з камьюніці.
YouTube пачаў ствараць аўтаматычныя субтытры для беларускамоўных відэа. Гэта дапаможа распаўсюджванню кантэнту на мове
YouTube пачаў ствараць аўтаматычныя субтытры для беларускамоўных відэа. Гэта дапаможа распаўсюджванню кантэнту на мове
YouTube пачаў ствараць аўтаматычныя субтытры для беларускамоўных відэа. Гэта дапаможа распаўсюджванню кантэнту на мове
1 каментарый
Lingvanex выклаў у адкрыты доступ мадэль для перакладу з рускай мовы на беларускую
Lingvanex выклаў у адкрыты доступ мадэль для перакладу з рускай мовы на беларускую
Lingvanex выклаў у адкрыты доступ мадэль для перакладу з рускай мовы на беларускую
1 каментарый
Як айцішнік перакладае Psiphon, Ubuntu і гульні (вам захочацца перайсцi на беларускiя інтэрфейсы!)
Як айцішнік перакладае Psiphon, Ubuntu і гульні (вам захочацца перайсцi на беларускiя інтэрфейсы!)
Як айцішнік перакладае Psiphon, Ubuntu і гульні (вам захочацца перайсцi на беларускiя інтэрфейсы!)
Golang back-end распрацоўшчык Аляксандр Клюеў не мае профільнай лінгвістычнай адукацыі. Але ён адзін з тых, хто намагаецца перакласці ІТ-тэрміналогію на беларускую мову. Пагаварылі з ім, чаму трэба ставіць родную мову на сваіх прыладах i з якімі цяжкасцямі сутыкаюцца аматары-перакладчыкі.
9 каментарыяў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.