Выручка стартапа Lingvanex праграміста з Наваполацка Аляксея Рудака у 2024 годзе склала $940 000.
Пагутарылі з Аляксеем пра яго дасягненні і планы.
Праект Selfmade in Belarus вырашыў натхніць маладых прадпрымальнікаў, якія толькі пачынаюць.
Распавядаем няпростую і захапляльную гісторыю поспеху праграміста-бізнесмена з Наваполацка, які 20+ гадоў прыдумляе свае прадукты, нон-стоп укладваецца ў развіццё — і не пасуе ў крызісныя моманты.
У канцы — рэкамендацыі «сабе 25-гадоваму»: спадзяёмся, будзе карысна!
Аляксею Рудаку 39 гадоў. Ён нарадзіўся ў Наваполацку, з дзяцінства хацеў быць прадпрымальнікам. Яго кар’ера распрацоўшчыка пачалася са стварэння простых мабільных аплікацый для iPhone.
Доўгі час паралельна з працай у ІТ-кампаніях ён спрабаваў займацца ўласнымі праектамі — рабіў адукацыйныя і турыстычныя сайты, праграму для бухгалтэрыі, гульні для мабільных тэлефонаў. Але ніводзін праект не ўзляцеў.
Выявіўшы, што сярод лідараў у AppStore па запампоўках — праграмы-перакладчыкі, Аляксей вырашыў заняцца імі. Засяродзіўся на нейронным перакладзе — і дасягнуў прыкметных поспехаў. Зараз сэрвісам машыннага перакладу ад Lingvanex карыстаюцца 80 кампаній, уключаючы Rolls Royce, Liebherr і Opera.
«Дзяцінства ў Наваполацку навучыла дамаўляцца з неадэкватнымі і адбітымі на галаву падлеткамі. У Мінску я даведаўся, што ёсць іншы свет»
— Вы нарадзіліся ў Наваполацку. Гэты незвычайны горад складана назваць «правінцыйным», але геаграфічна гэта ўсё-такі глыбінка. Дзяцінства неяк адбілася на кар’еры?
— З плюсаў: дзяцінства ў Наваполацку навучыла дамаўляцца з неадэкватнымі і адбітымі на галаву падлеткамі, якіх хапала ў двары. Гэтае ўменне спатрэбілася ў жыцці для вядзення перамоваў.
Жывучы ў Наваполацку, я не разумеў, наколькі важна для поспеху ў бізнесе знаходзіцца ў правільным асяроддзі, у правільным коле зносін. Не ведаў, дзе можна навучыцца чамусьці карыснаму ці ў каго спытаць парады. Гэта стала зразумела пазней, калі паступіў вучыцца ў Мінск.
Што яшчэ карыснага было падчас жыцця ў Наваполацку? Бацька браў мяне ў камандзіроўкі і на іх прыкладзе тлумачыў, як працуе бізнес. Ён тады працаваў у камерцыйнай фірме.
— Гэтыя размовы сфарміравалі ваша стаўленне да бізнесу?
— Уплыў бацькі быў моцным у гэтым плане і гэта сапраўды сфармавала правільнае стаўленне да бізнесу. Ён падкрэсліваў важнасць сувязяў для рашэнняў задач, хацеў, каб я замест сядзення за кампом быў больш камунікабельным і заводзіў больш сяброў. У яго самога было вялікае кола зносін, і я бачыў, як гэта працуе.
— Вы распавядалі, што вам было 12 гадоў, калі ў сям'і з’явіўся ноўтбук. Знаёмства з гэтай рэдкай для 90-х прыладай, напэўна, таксама паўплывала?
— Тады, пасля першай сустрэчы з ноўтбукам, я моцна захацеў уласны камп’ютар. Ноўтбук быў вельмі дарагі, і я пачаў збіраць грошы на звычайны ПК. За год назбіраў на Pentium 1. Ён ужо тады быў састарэлы, затое свой.
Добрыя гульні ён не цягнуў, таму я думаў над тым, як яго разганяць і мадыфікаваць. І з часам у гэтым паспяхова дасягнуў вынікаў. Калі разагнаў і праапгрэйдзіў, нейкі час гуляў у гульні і планаваў стаць кіберспартсменам. Але бацька казаў, што вялікія грошы гэтым не заробіш, і ўсё гэта поўная лухта. Потым гульні самі па сабе надакучылі.
Да 11 класа я вырашыў сабраць каманду і зрабіць сваю гульню, каб потым на ёй зарабіць. Але з гэтага нічога не атрымалася: з васьмі ўдзельнікаў каманды праграмаванне ведаў толькі адзін.
Падобныя пачуцці я перажыў яшчэ раз пазней, калі ўпершыню ўбачыў iPhone 3G. Я быў настолькі здзіўлены гэтай прыладай, што адразу вырашыў перайсці на звязаны з ім праект і вывучыць новую мову праграмавання. Ён уразіў мяне, як ноўтбук у дзяцінстве. У мяне ў галаве адразу з’явілася шмат ідэй для гульняў і аплікацый.
— Мінск пасля невялікага горада — у чым быў асноўны кантраст, на ваш погляд?
— Калі ў 18 гадоў я прыехаў у Мінск і схадзіў на сустрэчу карыстальнікаў Linux («Лінуксоўку»), я даведаўся, што ёсць нейкі іншы свет. Свет разумных і цікавых людзей. Што ёсць начны кніжны кірмаш, дзе можна нядорага купіць кнігі па ІT. І там вялікі выбар гэтых кніг. Радыёрынак у Ждановічах моцна мяне здзівіў, калі ўбачыў такі вялікі выбар камплектуючых для ПК. Яшчэ раней у выставачным цэнтры па вуліцы Купалы праводзілася выстава камп’ютарных тэхналогій PTS — яна мяне вельмі моцна ўразіла.
Ну і асаблівае ўражанне пакінула 1 верасня 2003 года, калі загадчык ІТ-кафедры БДТУ сабраў нашу плынь і распавядаў, якім тэхналогіям нас будуць вучыць. Гэта мяне моцна натхніла.
«Прыходзілі думкі, што трэба было працягваць рабіць мабільныя аплікацыі, а не лезці ў Data Science»
— У свой час за пяць-шэсць гадоў вы некалькі разоў запар прайшлі праз складаны цыкл: праца ў найме → свой праект → няўдача → вяртанне ў найм. Памятаеце, якім быў самы балючы момант?
— Цяжка, калі застаецца мала зберажэнняў і разумееш, што хутка прыйдзецца шукаць працу, каб жыць. Тады з’яўляецца разуменне, што ідэя не спрацавала.
— Вы стварылі каля 500 мабільных аплікацый за два гады. На першы погляд гучыць неверагодна. Як выглядаў ваш звычайны дзень? Як атрымалася не «ўскіпець»?
— У дзень я працаваў 8-10 гадзін плюс выходныя. Мне вельмі падабаўся гэты занятак, бо я адразу бачыў вынік працы. За пару дзён зрабіў аплікацыю — праз некалькі дзён яна трапіла у краму і адразу пачала прыносіць грошы на рэкламе. Гэта зусім не напружвае, калі бачыш што атрымліваецца.
А вось калі не атрымліваецца — нават праца пару гадзін у дзень моцна стамляе.
— Карыстальнікі пісалі наконт вашых ранніх аплікацый, што вы засмечваеце AppStore.
— Так, я чытаў гэтыя водгукі. І дагэтуль чытаю водгукі пра бягучыя прадукты. Прынамсі на мяне гэта ўплывае. І прымушае пастаянна паляпшаць якасць.
— Памятаеце момант, калі вашы аплікацыі-перакладчыкі набралі першы мільён запамповак за месяц?
— У сам гэты момант я нічога асаблівага не адчуў.
Але добра памятаю момант, калі пасіўны даход з аплікацый перавысіў 600 даляраў у месяц. Прыйшло ўсведамленне таго, што цяпер не трэба шукаць працу, бо грошай ужо хапае на арэнду жылля і ежу.
І цяпер можна сфакусавацца на развіцці гэтых аплікацый, каб зарабляць больш.
— Вы распавядалі пра асабісты крызіс у 2019. За два з паловай гады вы ўклалі ў распрацоўку 600 тысяч даляраў, грошы заканчваліся, вы былі ў паніцы. І вось камп’ютар усю ноч «смажыў» мадэль англа-рускага перакладчыка, а раніцай вы ўбачылі якасны вынік.
— Пастаянна прыходзілі думкі, што трэба было працягваць рабіць старыя мабільныя аплікацыі, а не лезці ў Data Science, спрабуючы зрабіць нешта маштабнае і крутое. І што ўсё аказалася нашмат складаней, чым я думаў.
У свой час я расказаў пра заробак з простых мабільных аплікацый знаёмаму. У яго атрымалася, яго заробак з простых аплікацый перавысіў мой ужо больш чым у 10 разоў.
Але я працягваў. Таму што хацеў давесці пачатае да канца, а не кідаць на паўдарозе.
— Ваш дадатак Phone Call Translator стаў прадуктам дня на ProductHunt у кастрычніку 2019 года. Гэты сэрвіс — камбінацыя распазнання маўлення, нейроннага перакладу, сінтэзу маўлення і VoIP тэлефаніі. Нават зараз гэта выглядае крута.
— Гэта была доўгая і руплівая праца нашай каманды. Мы тады папрасілі Крыса Месіну, каб ён запосціў прадукт ад свайго імя. Гэта самы папулярны чалавек на Product Hunt. Такое рашэнне дало нам шмат аўдыторыі і галасоў. Акрамя таго, на Product Hunt праекты адзін аднаго падтрымлівае беларуская супольнасць стартапераў.
Галоўнай праблемай там было прымусіць працаваць аплікацыю у два каналы адначасова. На перадачу і прыём, як тэлефон. Тэхнічна зрабіць гэта тады было доўга і складана. У 2020 годзе мы яе так і не вырашылі, таму аплікацыя працуе па прынцыпе рацыі [як сістэма сімплекснай сувязі, калі інфармацыя перадаецца толькі ў адным напрамку]. У 2021 годзе гэты праект мы паставілі на паўзу і перайшлі на рынак B2B.
«Зараз жа мы сфакусаваны на карпаратыўных рашэннях, якія могуць перакладаць вялікія аб’ёмы без доступу ў інтэрнэт і па фіксаванай цане»
— Колькі зараз людзей у вашай камандзе? Як змянілася кампанія і яе культура ў працэсе росту?
— Зараз каля 40 чалавек. Усё як звычайна. Калі кампанія вырасла, мы падзялілі людзей на аддзелы і замацавалі за камандамі менеджараў. Вядзём фінансавае планаванне. Стараемся ўсё што можна аўтаматызаваць і дадаць ва ўсе прадукты аналітыку, каб прымаць правільныя рашэнні.
— Што складаней — прадаваць аплікацыі звычайным карыстальнікам ці пераконваць Rolls Royce выкарыстоўваць ваш перакладчык? Як праходзілі першыя перамовы з буйнымі кліентамі?
— Пераконваць Rolls Royce складаней! Цыкл угоды можа расцягнуцца на год і больш.
Першаму кліенту, Vivaldi, мы далі серверную версію перакладчыка бясплатна, проста каб абкатаць мадэль продажу і інтэграцыі ў іх прадукт. І нават гэта заняло больш за год.
— А паўтара года перамоваў і працэсу інтэграцыі вашага прадукту з Opera аказаліся вялікім стрэсам для вашай невялікай каманды?
— Калі мы заключылі ўгоду з Vivaldi, то з Opera было лёгка дамовіцца. Бо заснавальнік Opera Ён Стэфенсан фон Тэчнер з’яўляецца і заснавальнікам Vivaldi. У Opera бачылі, што ў Vivaldi ўсё паспяхова працуе, і сталі нам давяраць.
— Неяк вы сказалі: «Я ў 5 тысяч разоў адстаю ад Google — ну і што?» ІT-гігант усё яшчэ ваш прамы канкурэнт?
— Калі мы адкрылі фірму і рабілі толькі мабільныя аплікацыі, Google сапраўды быў нашым прамым канкурэнтам.
Зараз жа мы сфакусаваны на карпаратыўных рашэннях, якія могуць перакладаць вялікія аб’ёмы тэксту, аўдыё, файлаў без доступу ў інтэрнэт, каб ніхто не ведаў, што вы перакладаеце. Калі вы перакладаеце праз Google або ChatGPT, то ўсе свае дадзеныя вы перадаяце ім. І незразумела куды вашы дадзеныя потым трапяць.
Для вялікага бізнесу крытычна, каб дадзеныя не выходзілі за межы кампаніі. Асабліва для банкаў, страхавых кампаній, заводаў, медыцынскіх устаноў і гэтак далей. Перакладчык Lingvanex працуе без доступу ў інтэрнэт, усталёўваецца на вашым камп’ютары.
Акрамя таго кошт перакладу праз Google залежыць ад аб’ёму перакладзенага тэксту, а наша рашэнне можа перакласці неабмежаваны аб’ём інфармацыі па фіксаванай цане на хуткасці 100 тысяч сімвалаў у секунду. У Google пераклад 1 мільёна сімвалаў каштуе 20 даляраў. У нас можа каштаваць 10 цэнтаў. Напрыклад, можам перакласці за пару дзён мільён вэб-старонак/файлаў за $100.
— А якія-небудзь прадукты акрамя перакладу ў вас ёсць?
— Мы пачыналі з перакладчыка, але цяпер у нас ёсць транскрыпцыя маўлення на 90 моў. Яна таксама працуе без інтэрнэту і можа транскрыбаваць некалькі чалавек адначасова, а таксама рабіць субтытры. Выкарыстоўваецца ў кол-цэнтрах для маўленчай аналітыкі.
— Якімі вы бачыце ідэальных пакупнікоў Lingvanex?
— Прадуктовая кампанія, якая займаецца Natural language Processing. Толькі буйнейшая за нас. Каб пасля продажу атрымалася сінэргія кампаній.
«Я вельмі ўдзячны свайму ўніверсітэцкаму выкладчыку беларускай мовы»: пра філасофію і матывацыю
— У 2016 годзе вы зараблялі $25 000 у месяц, падарожнічалі па 15+ краінах, а потым сказалі: «Усё надакучыла, гарады падобныя». Гэта быў нейкі экзістэнцыяльны крызіс?
— Ніякага крызісу не было. Проста хацелася стварыць сур’ёзны, якасны праект. Пра які будзе ведаць увесь свет і які прыносіць карысць.
Моё кола зносін — гэта ў асноўным стартаперы. Гледзячы на іх, я бачыў якія класныя прадукты яны робяць. Я раўняўся на іх. У 2016 годзе я паехаў першы раз на вялікую міжнародную выставу стартапаў Slash у Фінляндыю (нас тады паехаў цэлы аўтобус стартапераў, 40 чалавек). Па шляху мы яшчэ заехалі на стартап-канферэнцыю ў Рыгу. Там я ўбачыў узровень праектаў і захацеў рабіць нешта такое ж па маштабе.
— Ці прыйшлося вам нешта прынесці ў ахвяру дзеля Lingvanex? Як змянілася ваша асабістае жыццё за гады пастаяннага развіцця праекта?
— Нейкай вялікай праблемы не было. Я стараюся захоўваць баланс паміж працай і адпачынкам, інакш можна выгарэць, і мая прадуктыўнасць пацерпіць. Калі правільна расстаўляць прыярытэты і планаваць час, можна знайсці час на сям’ю і сяброў. Таксама важна сачыць за здароўем.
— Вы часта вяртаецеся ў родны горад? Можа быць, заўважылі нейкую змену ў стаўленні землякоў да паспяховага мясцовага ІT-прадпрымальніка?
— У Наваполацк езджу рэдка, бо ў Мінску ўжо правёў большую частку жыцця. З тымі, з кім сябраваў у школе і ВНУ, зносімся, як і раней.
А поспех — гэта ўсё адносна.
У дадзены момант я не лічу, што дасягнуў таго, чаго хацеў.
— Чаму вы вырашылі выкласці сваю мадэль перакладу на беларускую мову ў адкрыты доступ?
— Я вельмі ўдзячны свайму ўніверсітэцкаму выкладчыку беларускай мовы, які настолькі добра і цікава яе выкладаў, што натхніў мяне вывучаць беларускую мову самастойна. А потым ён яшчэ і натхніў мяне зрабіць вялікую навуковую працу па беларускіх арнаментах і выйграць з ёй конкурс.
Таксама я назіраю, за тым, як людзі робяць youtube-каналы на беларускай. А знаёмы праграміст удзельнічае ў праекце Corpus.by. Я таксама захацеў зрабіць свой унёсак у папулярызацыю беларускай мовы. Зараз у яе не лепшыя часы.
«Мяне гэта драйвіць»: планы на будучыню
— Ваша зп — €5000 пры гадавой выручцы амаль у мільён. Не хочацца больш траціць на сябе пасля столькіх гадоў намаганняў?
— Тут варта адзначыць, што выручка не роўная прыбытку. Мільён зарабляе ўся кампанія за год. А ў нас у штаце каля сарака чалавек. З улікам выдаткаў на зарплаты, арэнду сервераў, розныя сэрвісы, рэкламу застаецца нямнога. А тое, што застаецца, мы ўкладваем у паляпшэнне якасці прадуктаў.
З іншага боку, €5000 — гэта выдатныя грошы для камфортнага жыцця. Мая мэта зараз — развіццё бізнесу. Каб расла выручка, а разам з ёй і прыбытак, з якога потым можна выплачваць дывідэнды.
— Вы казалі, што пасля продажу кампаніі хочаце «з’ехаць у лес, лавіць рыбу». Гэта метафара ці канкрэтны план?
— Пра «лавіць рыбу» я пажартаваў, калі даваў інтэрв’ю Forbes. Ведаючы сябе, думаю, што я дакладна не захачу адпачываць пасля продажу кампаніі. Мой план — гэта працягваць працаваць над тэхналогіямі апрацоўкі мовы і маўлення з дапамогай AI. Мяне гэта драйвіць, мне гэта цікава.
— Што б сказалі сабе 25-гадоваму, які толькі пачынаў шлях у бізнесе? Якіх памылак дакладна варта было б пазбегнуць?
— Першае. На заробленыя з аплікацый грошы трэба спачатку забяспечыць крыніцы пасіўнага даходу. Зрабіць інвестыцыі ў розныя актывы (акцыі, аблігацыі, нерухомасць, купіць долю ў іншым бізнесе і гэтак далей). А не ўкладваць усё ў развіццё аднаго бізнесу па машынным перакладзе.
Другое. Быць больш публічным, выкарыстоўваць усе магчымасці для піяру свайго праекта.
— Вам хацелася б чымсьці запомніцца ў ІT-індустрыі? Які след хацеў бы пакінуць у ёй праграміст з Наваполацка?
— Хацеў бы зрабіць лепшы ў свеце перакладчык хаця б на некалькі моў, вынікі працы якога потым не трэба правіць чалавеку. Каб пра яго пісалі сусветныя СМІ.
Яшчэ хацеў бы сабраць вялікае партфоліа кліентаў з сусветных кампаній. Стаць прызнаным экспертам у сваёй індустрыі, пісаць навуковыя працы па тэме, абараніць доктарскую ў вядомым сусветным універсітэце.
У ідэале хачу стаць навукоўцам у галіне Natural Language Processing з выкарыстаннем AI. Накшталт навукоўцаў з каманды, якая стварыла ChatGPT.
Як беларускія выпускнікі паступаюць у Польшчу і Расію — і ці паўплывала вайна. 4 гісторыі
dev.by шукаў маладых людзей, якія паступілі сёлета ў ВНУ за мяжу, — адгукнуліся 4 чалавекі. Двое выбралі Польшчу, яшчэ двое Расію (для аднаго гэта часовы варыянт, ён плануе перапаступіць налета).
Спыталі ў хлопцаў, як яны выбіралі ВНУ, куды паступалі аднакласнікі і як на выбар паўплывала поўнамаштабнае ўварванне Расіі ва Украіну (і ўчорашнія навіны пра мабілізацыю).
EnCata будзе штампаваць заводы, якія штампуюць дамы
«Будаўнічая галіна цалкам дысфункцыянальная», — кажа СЕО EnCata Алег Кандрашоў. І прапануе «рэанімаваць будаўніцтва»: паўтарыць поспех Генры Форда і запусціць канвеер, які будзе штампаваць модульныя дамы. А яшчэ — запусціць мабільныя заводы з гэтымі канвеерамі.
Першы тэставы дом з жалезнымі сценамі і вокнамі ў падлогу ўжо пабудаваны — у ім 2 гады як жыве СЕО. А зараз у Вялікім камені дабудоўваюць тэставы завод.
Ці ёсць будучыня ў праекта і якая, расказвае dev.by Алег Кандрашоў.
Кампанія тэлефануе — кліча ў ІТ без навыкаў і англійскай. У айцішнікаў пытанні
Айцішнікі (і не толькі) скардзяцца, што ім тэлефануюць са школы IT Overone і прапануюць курсы для ўваходжання ў ІТ без першапачатковых навыкаў і англійскай.
— Ваша зп — €5000 при годовой выручке почти в миллион. Не хочется больше тратить на себя после стольких лет усилий?
— Тут стоить отметить, что выручка не равна прибыли. Миллион зарабатывает вся компания за год. А у нас в штате около сорока человек. C учетом расходов на зарплаты, аренду серверов, различные сервисы, рекламу остается немного. А то, что остаётся, мы вкладываем в улучшение качества продуктов.
Простые расчеты говорят, что работники в его компании получают менее 2000 долларов в месяц.
Это очевидно. Вопрос в том, что данная зарплата не высокая. С другой стороны. Примерно средняя по отрасли. С другой стороны ты и не можешь платить больше. Да и зачем. Средняя зарплата, средние работники. Всех все устраивает.
Любая LLM выдаст результат хуже специализированной SLM, обученной на базах переводов, сделанных профессиональными переводчиками — потому что она не сможет в контекст и кодифицированную терминологию.
На данный момент сильнее всего DeepL Pro, но нужен тариф не ниже Team, а лучше Business, чтобы иметь возможность подкидывать свои глоссарии или глоссарии заказчика. Возможно, у Lingvanex со временем получится их догнать.
Ну и само собой, идеальный машинный перевод без последующего MTPE (постредактирование машинного перевода) — на данный момент влажные мечты бизнеса. Но цель достойная, да.
(Для контекста: я выпускник переводческого факультета МГЛУ (тогда еще МГЛУ, 96-й год) и более 20 лет зарабатывал техпереводом/локализацией.
Потом рынок письменных переводов развернулся в сторону машинных переводов и заказов на их постредактирование, и поскольку ковыряться в нейроблевотине мне и профессионально не интересно, и невыгодно — профессию поменял).
Он не может отдавать стабильно и той же скорости по REST API например 10 миллиардов символов в день на перевод. А наш переводчик - может, на сервере 4 x RTX 5090, например.
Даже если бы ChatGPT мог переводить такие объемы, то это были бы десятки тысяч долларов. У нас такой объем будет стоить $100 (с учетом цены сервера для деплоя)
У нашего клиента Opera 400 миллионов пользователей в месяц и требование, чтобы данные не передавались на сторону. Поэтому - выбрали нас
Все данные, что вы переводите ChatGPT потенциально могут быть переданы третьим лицам или выложены в сеть по ошибке. Как например тут - https://www.cnews.ru/news/top/2025-07-31_v_internet_utekli_milliony
Для больших компаний компаний типа Rolls-Royce, им в первую очередь важна безопасность. Им надо чтобы работало офлайн, на их серверах.
Любая приличная LLM:
У нас качество перевода лучше чем у топовых open-source LLM, на тестовых датасетах из десятка тысяч строк. На маленьком объем может быть другой результат.
Цена за GPU сервер, чтобы перевести тот же объем текста на приличной LLM будет в 50+ раз больше, чем с нашими моделями. К тому же есть галлюцинации. На маленьком объеме текста - можно взять opensource LLM
Алексей, из чистого любопытства — примерно какой объём ТМ (в сегментах, а лучше в словах) и какие тематики были на входе для обучения моделей в паре английский-русский, и (если это не коммерческая тайна, само собой) — происхождение этих TM?
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
Простые расчеты говорят, что работники в его компании получают менее 2000 долларов в месяц.
Кто-то больше, кто-то меньше в зависимости от опыта, квалификации и должности.
Это очевидно. Вопрос в том, что данная зарплата не высокая. С другой стороны. Примерно средняя по отрасли. С другой стороны ты и не можешь платить больше. Да и зачем. Средняя зарплата, средние работники. Всех все устраивает.
ChatGPT? Да и в целом любая приличная LLM?
Любая LLM выдаст результат хуже специализированной SLM, обученной на базах переводов, сделанных профессиональными переводчиками — потому что она не сможет в контекст и кодифицированную терминологию.
На данный момент сильнее всего DeepL Pro, но нужен тариф не ниже Team, а лучше Business, чтобы иметь возможность подкидывать свои глоссарии или глоссарии заказчика. Возможно, у Lingvanex со временем получится их догнать.
Ну и само собой, идеальный машинный перевод без последующего MTPE (постредактирование машинного перевода) — на данный момент влажные мечты бизнеса. Но цель достойная, да.
(Для контекста: я выпускник переводческого факультета МГЛУ (тогда еще МГЛУ, 96-й год) и более 20 лет зарабатывал техпереводом/локализацией.
Потом рынок письменных переводов развернулся в сторону машинных переводов и заказов на их постредактирование, и поскольку ковыряться в нейроблевотине мне и профессионально не интересно, и невыгодно — профессию поменял).
Про ChatGPT:
Он не может отдавать стабильно и той же скорости по REST API например 10 миллиардов символов в день на перевод. А наш переводчик - может, на сервере 4 x RTX 5090, например.
Даже если бы ChatGPT мог переводить такие объемы, то это были бы десятки тысяч долларов. У нас такой объем будет стоить $100 (с учетом цены сервера для деплоя)
У нашего клиента Opera 400 миллионов пользователей в месяц и требование, чтобы данные не передавались на сторону. Поэтому - выбрали нас
Все данные, что вы переводите ChatGPT потенциально могут быть переданы третьим лицам или выложены в сеть по ошибке. Как например тут - https://www.cnews.ru/news/top/2025-07-31_v_internet_utekli_milliony
Для больших компаний компаний типа Rolls-Royce, им в первую очередь важна безопасность. Им надо чтобы работало офлайн, на их серверах.
Любая приличная LLM:
У нас качество перевода лучше чем у топовых open-source LLM, на тестовых датасетах из десятка тысяч строк. На маленьком объем может быть другой результат. Цена за GPU сервер, чтобы перевести тот же объем текста на приличной LLM будет в 50+ раз больше, чем с нашими моделями. К тому же есть галлюцинации. На маленьком объеме текста - можно взять opensource LLM
супер. Не думал что тут такой глубокий домен :) Респект
Алексей, из чистого любопытства — примерно какой объём ТМ (в сегментах, а лучше в словах) и какие тематики были на входе для обучения моделей в паре английский-русский, и (если это не коммерческая тайна, само собой) — происхождение этих TM?
Для общей тематики у нас на языковую пару (например англ-русский) идет от 10 до 70 миллионов параллельных строк.
90% данных мы взяли с https://opus.nlpl.eu/ 10% парсим с интернета
Для TM мы берем от 5 до 50 тыс параллельных строк на домен (медицина, строительство, финансы и др)
В большинстве случаев их нам дают клиенты, для которых делается модель. Иногда делают наши лингвисты (если знают этот язык) Заказываем у фрилансеров