Марафон агучкi на мове. Распрацоўшчыкi просяць дапамогi
Стваральнiк Say.by, кiраўнiк IТ-аддзела адной з мiнскiх кампанiй Аляксандр Шастаковiч, кажа, што гэта пойдзе на карысць развіцця тэхналогіяў распазнавання беларускага маўлення, адкрые мноства выдатных сучасных магчымасцяў і дакажа, што ў мовы ёсць будучыня.
Працэс надзвычай просты:
- трэба зайсці на https://commonvoice.mozilla.org/be і націснуць на мікрафон;
- пачаць начытваць сказы (можна з тэлефону i нават без рэгістрацыі).
- таксама можна правяраць ужо начытаныя іншымі людзьмі сказы, што таксама важна.
Аляксандр адзначае, што падчас агучвання голас мусіць гучаць натуральна, нібы адбываецца звычайная размова. Але ж просiць памятаць пра беларускі акцэнт — цвёрдае ч, фрыкатыўнае г, «дзеканне» і «цеканне», «мяккасць» пры спалучэнні зычных, напрыклад, каб «свет» чытаўся як «сьвет», «насенне» — як «насеньне».
Паглядзець дадатковыя парады, а таксама апошнюю статыстыку па колькасці агучаных сказаў можна на сайце «Мовы прафесii». Вот якая статыстыка на сёння:
Да марафону агучвання тэкстаў ужо далучыліся супрацоўнікі кампаній ActiveCloud, Jet BI, TCP-Soft, Інстытут мовазнаўства імя Якуба Коласа i iншыя.
Напрацаванымi тэхналогіямі ў распазнаванні беларускага маўлення праекту дапамагае кампанiя «ТКП-Софт». Яе IT-дырэктар Аляксей Гур’янаў кажа: «Тэхналагічныя гіганты не інвестуюць у распазнаванне беларускай мовы і мы застаемся без істотнай тэхналогіі, без якой нашай мове будзе яшчэ складаней канкураваць. Калі мы не назбіраем дадзеныя самі, за нас гэта ніхто не зробіць».
Читать на dev.by