Блог

«Правяраем, ці гэта камусьці патрэбна». Георгій Качаноўскі запусціў беларускамоўнае GPT-радыё

Два гады таму я даведаўся, што штучны інтэлект здольны агучваць тэкст на ангельскай мове з натуральнымі інтанацыямі. Я адразу падумаў: «Калі гэта магчыма на ангельскай, то чаму б не на беларускай?». Тады мне прыйшла да галавы ідэя беларускамоўнага GPT-радыё. 

Аднак тады яшчэ не існавала дасяжных мадэляў для якаснай агучкі па-беларуску і праект быў адкладзены ў шуфлядку. Зараз тэхнічны прагрэс дазваляе на такія «шалёнасці», таму мы запусцілі прататып першага беларускамоўнага GPT-радыё. 


Хто піша:  Георгій Качаноўскі, фаундэр GPT-радыё і CEO ScooterAPI. 


Рыгор Качаноўскі

Навошта рабіць GPT-радыё па-беларуску?

Мне хацелася зрабіць праект, звязаны са штучным інтылектам. Я шмат чытаю пра ШІ, вывучаю тэхналогію. Прыйшоў час зрабіць нешта на практыцы! 

Прыкладна месяц таму на сустрэчы бізнес-клуба ў Кракаве я падзяліўся ідэяй і знайшоў аднадумцаў, гатовых увасобіць яе ў жыццё. Праект цалкам зроблены за ўласныя грошы, без інвестара. Мы рэгулярна сустракаліся ў гарбатнай кавярні Кракава, абмяркоўвалі дэталі, размяркоўвалі задачы і ўпэўнена ішлі да стварэння MVP.

Распрацоўка MVP (з улікам нашага часу) каштавала 2 тысячы долараў. У будучыні кошт праекту будзе вышэйшы. Калі радыё стане аўтаномным і пачне самастойна генераваць кантэнт паводле промтаў, тады трэба будзе плаціць за агучку і за АПІ да опен АІ і касты вырастуць. Але, у любым выпадку, GPT-радыё значна танней за звычайнае. Зазначу, што мы не плануем манетызаваць праект. 

Мы не плоцім выканаўцам, чые песні выкарыстоўваем у радыё — гэта некамерцыйны праект і мы не зарабляем на іх творчасці. Аднак мы скантактаваліся з артыстамі і большасць пагадзілася, каб іх песні гучалі ў эфіры. Толькі адныя артысты папрасілі прыбраць іх творы (не праз фінансавыя прычыны). 

Як зрабіць GPT-радыё 

Першы крок — напісаць тэкст эфіру на беларускай мове. Мы паспрабавалі розныя мадэлі, самай лепшай аказалася GPT 4o.

Далей трэба было стварыць голас вядучага. Большасць мадэляў агучваюць як падпіты паляк або як амерыканскі турыст, які вучыцца беларускай мове. Пасля праверкі розных TTS (Text-to-Speech) мадэляў, мы спыніліся на Donar.by. 

Яна адна з нешматлікіх, здольная карэктна вымаўляць беларускія словы з правільным націскам. Donar.by збіраюць беларускамоўныя сэмплы і вучаць беларускамоўную мадэль. Чым больш галасоў беларусаў будзе ў мадэлі, тым лепей будзе якасць агучкі. І нам будзе прасцей захаваць беларускую мову, дзякуючы сучасным тэхналогіям.

Мы выпусцілі MVP — эфір працягласцю паўтары гадзіны. Першы фідбэк — заўважна, што голас належыць ШІ. Аднак праект атрымаў станоўчыя водгукі. Мы змянілі голас з мужчынскага на больш мяккі жаночы. Гэта дапамагло зрабіць эфір больш падобным на «жывое» радыё.

Што далей?

Зараз мы спрабуем адказаць сабе на пытанне: ці ёсць патрэба щ беларускамоўным GPT-радыё? Калі інтарэс аўдыторыі пацвердзіцца, мы плануем аўтаматызаваць працэс, зрабіць эфіры ўнікальнымі. Цяпер мы маем каля двух гадзін эфіру, якія паўтараюцца цягам дня.

Таксама хочам пашырыць эфір і дадаць праграмы для вывучэння беларускай мовы, а таксама вечаровыя казкі для дзяцей. У мяне дзве дачкі і было бы класна ўключаць ім казкі на фоне. Плануем дадаць і гістарычныя, гумарыстычныя праграмы. Нашае радыё можа быць месцам, дзе вывучаюць беларускую мову. 

Так, ёсць процьма падобнага кантэнту і на YouTube, і на Soundcloud. Але мая мэта — выпусціць прадукт і паглядзець, як людзі ім карыстаюцца. Дзякуючы фідбэку мы зразумеем, чым мы адрозніваемся ад іншых плафтормаў, як мы можам стаць больш зручнымі. Або такі праект і ўвогуле не варты. Можа быць і такое. 

Зараз мы шукаем таленавітага рэдактара для складання праграмы эфіру і праграміста, каб падтрымліваць інфраструктуру. Выдаткі ў нашым радыё значна ніжэйшыя, чым у традыцыйнай радыёстанцыі. 

Мы адкрытыя для новых ідэй і супрацоўніцы з аднадумцамі. На сайце вы можаце пакінуць сваю ідэю і кантактную інфармацыю, мы з вамі звяжамся. 

Меркаванне аўтараў можа не адлюстроўваць пазіцыю рэдакцыі. 

Што яшчэ пачытаць пра беларускамоўныя праекты: 

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Anonymous
Anonymous
0

было б цікава паслухаць, як (галоўнае, калі) той джыпіці-дзядзька гаманіць
бо, колькі не ўключаў, заўсёды музыка грае

capslock
capslock HR в НИИ Бацца

Комментарий скрыт за нарушение правил комментирования.

Правила тут, их всего 5