Алексей Рудак — инженер-программист родом из Новополоцка. Долгое время параллельно с работой в ИТ-компаниях он пытался заниматься собственными проектами — делал образовательные и туристические сайты, программу для бухгалтерии, игры для мобильных телефонов. Но ни один стартап не взлетел. Тогда он провёл масштабное тестирование рынка и выбрал новое направление — программы-переводчики. Как из этого вырос стартап Lingvanex, Алексей рассказал dev.by.
«Через три-четыре месяца тестирования я понял, что в переводчиках что-то есть»
— В конце нулевых, окончив БГТУ, я был молодой и наивный: бросался воплощать разные идеи в надежде, что рано или поздно заработаю много денег. Но ни одна из идей не была подтверждена рынком, и каждый раз у меня заканчивались ресурсы на их воплощение. Сценарий был такой: я работаю в какой-то компании, зарабатываю деньги, вкладываю их в проект, он не взлетает, я ради экономии еду в Новополоцк, там полгода пытаюсь проект запустить, деньги заканчиваются, я опять еду в Минск и устраиваюсь на работу. Так было раза три в течение пяти-шести лет.
Третий раз совпал с кризисом: меня никуда не брали, я разбил машину, взятую в кредит, плюс нужно было платить аренду за квартиру. Дальше так продолжаться не могло — нужно было честно признаться себе, что не знаю, какие ниши выбрать. Делать проекты, которые просто нравятся, — путь в никуда. Я закрыл все старые проекты и придумал вот что.
Большую часть карьеры я работал iOS-программистом, и всё, что я умел делать, это приложения для iPhone. Решил сделать 500 простейших программ на всевозможные темы: игры, ЗОЖ, музыка, рисование, изучение языков — и посмотреть, на каких из них можно заработать.
Программы были очень простые: красивая картинка и пара кнопок. Например, приложение для бега просто отслеживало скорость человека, расстояние и подсчитывало сожжёные калории. Целью было протестировать рынок. За месяц у меня было готово 20 программ, за три месяца — около 100, потом работа пошла ещё быстрее.
Я купил аккаунт в AppStore (всего 99 долларов в год), залил приложения и увидел, что определённые программы скачиваются чаще: статистика одних была в 50 раз лучше, чем других. В лидерах оказались музыкальные программы и переводчики.
Приложений-переводчиков у меня было около 40: под каждую языковую пару — отдельный. Пары выстраивал, оценивая специфику стран: например, во Франции много эмигрантов из арабских стран, значит сделаю арабско-французский переводчик; или Индонезия и Малайзия — две большие страны, находятся рядом, значит, должны друг к другу в гости ездить.
По сути, это был просто гугл-переводчик в моих обёртках: ты платишь «гуглу» и подключаешь Google API к своей программе. Но несмотря на это, они пользовались популярностью: буквально за первый месяц набрался миллион скачиваний.
Сначала приложения были бесплатные, потом я начал подключать рекламу и увидел хорошую прибыль. Бизнес строится на разнице между тем, сколько ты заплатил, чтобы привлечь клиента, и тем, сколько денег он тебе принёс. Скачивания приложений-переводчиков ничего мне не стоили, кроме моего времени. Времени у меня было много, так как я нигде не работал, а прибыль с рекламы и покупок была большой.
Через три-четыре месяца тестирования я понял, что в переводчиках что-то есть. Даже находясь на 100-й позиции после Google, Microsoft и кучи других конкурентов, ты имеешь большое количество скачиваний. А сколько же их будет, если попадёшь в первую десятку?!
«Я понимал, что в нишу музыкальных приложений рано или поздно придут такие игроки, как Gismart»
В то время я оказался на распутье: идти в музыкальное направление или переводческое. Музыкальных инструментов много, но чтобы заработать в этой нише, надо привлекать пользователей по этим ключевым словам, а их немного. Допустим, гитара — это «гитара», пианино — это «пианино», ну или «фортепиано». Получается, заплатил доллар за привлечение клиента по слову «гитара», человек скачал твоё приложение и за год принес тебе 1,5 доллара прибыли, в итоге ты заработал всего 50 центов.
А языковых пар — тысячи, и значит, люди ищут решение своей проблемы тысячами разных способов. Получается, тебе не нужно покупать платных пользователей по какому-то одному запросу, поисковики покажут твоё приложение безо всякой рекламы. Даже если в отдельных нишах и есть конкуренция, то из-за множества языковых пар переводчики всё равно не так сильно конкурируют.
На рынке музыкальных приложений в то время тоже ещё не было большой конкуренции. Но я понимал, что в эту нишу рано или поздно придут такие игроки, как Gismart, которые будут тратить огромные бюджеты на рекламу, и я не смогу с ними конкурировать. Таким образом, 4,5 года назад я принял решение делать программы-переводчики, а все остальные отложил в сторону.
Вторые версии моих переводчиков были уже более функциональны: в них была и реклама, и встроенные покупки, и перевод голоса. Статистика стала ещё лучше, я ввёл плату за скачивания: одно приложение стоило примерно семь евро.
Шёл 2015 год. Появились деньги. Их было достаточно, чтобы переехать в Минск, купить здесь квартиру и машину и чувствовать себя комфортно.
Период роста продолжался около года. На то время у меня было 50-70 приложений (две языковые пары плюс один универсальный, более дорогой, переводчик) и 5 млн скачиваний. Все они были без названия и бренда.
Статистика всё росла, но росли и расходы на перевод от Google. Корпорация берёт плату за количество переведенных знаков: миллион символов стоит 20 долларов. Если человек купил твоё приложение за 7 евро и перевёл 200 тысяч символов, ты уже ушёл в минус. Вначале это было не очевидно: больше половины запросов клиентов приходилось на перевод одного слова. Но когда пользователей становится много, ты вдруг обнаруживаешь, что часть из них пользуется твоим приложением регулярно и таким образом загоняет тебя в долги. Если сначала мне оставалось 90% всех платежей, то постепенно прибыль сократилась до 30%. Надо было принимать какое-то решение, чтобы не зависеть от «гугла» и двигаться на новые рынки — Android, MacOS и Windows Desktop.
В открытом доступе не было проектов, на базе которых можно было создать свой переводчик. Я начал совещаться с людьми, которые занимаются мобильными приложениями, посетил несколько стартап-мероприятий, показал, что на одних тестах рынка получилось заработать 250 тысяч долларов, но интереса не встретил — никто не понимал, зачем лезть на этот рынок, когда есть Google.
Обратился к нескольким большим компаниям с просьбой продать мне лицензии на их решения. Мне нужно было 40 языков, я готов был заплатить за них 30 тысяч долларов. Мне отвечали, что для переводчика это смешные цифры и выставляли счета в 60-100 тысяч евро. Даже тогда для меня это было много.
«Сначала удивлялся: как же так, зачем компания сама растит себе конкурентов? Потом понял»
Я рассказал о своём проекте знакомому, у которого в Минске своя аутсорс-компания, и он предложил проверить, можно ли сделать такой переводчик самостоятельно. Он собрал для меня команду из семи сильных ребят, и мы стали делать тесты. Это был конец 2016 года.
Нашли несколько опенсорсных проектов в зачаточном состоянии — Joshua и Moses («Иисус» и «Моисей»). Joshua сделали и выложили в открытый доступ пара ребят из Канады и США. Это был просто статистический перевод, качество — примитивное, но хоть что-то. Подключили его — люди стали жаловаться, что качество плохое, и мы от него отказались. Moses был более навороченным, его поддерживали человек 30-40. Но для его работы требовалось супер-железо, плюс качество перевода никуда не годилось, поэтому от «Моисея» тоже отказались.
Перепробовали несколько ресурсов, но хороших результатов не добились. К началу 2017 года мы поняли, что сделать качественный переводчик на базе какого-то открытого проекта мы не можем. А Google и Microsoft свои наработки не раскрывают.
Тем не менее работа продолжалась. Я упорно искал крутых специалистов в области машинного перевода, чтобы они развили опенсорс-проекты для моих целей. Таких специалистов в мире немного, они все друг друга знают и стоят дорого: 250 долларов в час при почасовой оплате (когда неясно, сколько времени понадобится) или 90 тысяч долларов за улучшение качества перевода на пяти языках (только лицензия за языковую модель). На тот момент это казалось дорого, поэтому мы искали другие варианты. Через несколько месяцев стало ясно, что дешевле специалистов не найти, а лишних денег «на попробовать, без гарантий результата» не было.
В то же время двое наших ребят занимались разработкой переводчика, а пятеро других улучшали приложения, которые пользовались Google API. Моей задачей было расширить функционал программ, чтобы они переводили не только текст, но также картинки, сайты, файлы, голос — всё. Я был полон энтузиазма. Я был уверен, что к тому моменту, как мы улучшим программы, у нас уже будет свой переводчик.
В марте 2017 года мы наткнулись на проект под названием Оpen NMT. Это совместная разработка компании Systran, одного из лидеров на рынке машинного перевода, и университета Гарварда. Systran тоже столкнулась с дефицитом энтузиастов на рынке перевода. Современные технологии машинного перевода принадлежат большим компаниям, они закрыты. Мелкие игроки, понимая, как сложно внедриться в этот мир, таких попыток не предпринимают. Это тормозит развитие технологий.
Поэтому Systran сделала принципиально новый манёвр: выложила свои наработки в опенсорс, чтобы такие энтузиасты, как я, могли включиться в эту работу. Они создали форум, где специалисты стали бесплатно помогать новичкам, и канал в Gitter для оперативной помощи. И это дало хорошую отдачу: начали появляться новые маленькие компании, научные работы.
В то время ещё не было повсеместного нейронного перевода, а Оpen NMT предлагал наработки в этой области. Я и другие ребята по всему миру могли взять новейшие технологии и спросить совета у лучших специалистов. Они охотно делились опытом, это позволило мне понять, в каком направлении двигаться. В марте 2018 года Systran пригласила всё сообщество в Париж, где устроила бесплатный мастер-класс. Сначала удивлялся: как же так, зачем компания сама растит себе конкурентов? Потом понял: даже если у тебя на руках все датасеты, алгоритмы и тебе подсказывают, это ещё не значит, что ты сделаешь переводчик.
«Обновлённые программы были почти готовы, а качественного перевода всё нет. Деньги заканчивались»
Весь 2018 год я потратил на решение проблемы перевода. Думал, ещё полгода — и всё получится. Но светлый момент всё не наступал, я не был доволен качеством перевода даже в тех языках, где тренировал нейросети.
Что делать? Чтобы не распускать всю команду и сэкономить бюджет на рекламу, принимаю решение начать внутренний подпроект — Backenster, который рекламирует одни приложения в других. Через эту систему я собираюсь в нужный момент перенаправить пользователей своих старых приложений-переводчиков в новое.
Время шло, деньги расходовались… За 2,5 года я вложил в разработку 600 тысяч долларов. Старые приложения, на Google API, ещё приносили доход, но теперь нужно было содержать команду из 10 человек. Обновлённые программы были почти готовы, а качественного перевода всё нет.
Деньги заканчивались. В конце 2018 — начале 2019 года я был уже в панике.
В это время я заметил, что все начали говорить про новую архитектуру для нейросетей Transformer от Google, которую та выложила в открытый доступ. Все бросились тренировать нейронные сети на базе этой трансформер-модели и стали переходить со старой Lua (Torch) на Tensorflow. Я тоже решил попробовать.
Для обучения нейронной сети нужен был хороший компьютер. Сначала мы арендовали 20 обычных компьютеров (с GTX 1080) и одновременно запускали на них 20 простых тестов — на каждый тест уходило по неделе. Потом мы решили взять в аренду облачный сервис Аmazon. Он быстрый, но очень дорогой. Запустили на ночь тест, а утром — счёт на 1 200 долларов. Пришлось отказаться от этой идеи. Может, купить свой компьютер?
В Минске никто не занимается такими мощными машинами. Попытались купить в Москве — наткнулись на какую-то подозрительную фирму. Стали совещаться с командой и решили, что можно самостоятельно собрать компьютер из нескольких мощных GPU ценой до 10 тысяч долларов, который будет решать наши задачи. Комплектующие скребли по сусекам: звонили в Москву, что-то заказывали в Китае, что-то — в Амстердаме.
В марте у себя дома я наконец собрал этот компьютер и стал делать тесты. Тесты проходили быстро. С случае с испанским я начал замечать, что перевод близок к Google. По метрике BLEU выходило 70 относительно перевода «гугла». Но я не понимал этот язык. На ночь поставил тренироваться модель англо-русского переводчика. Компьютер всю ночь гудел и жарил — спать было невозможно. Утром запускаю тест на перевод 100 предложений и смотрю — хороший перевод получился. Эта ночь изменила всё. Я увидел свет в конце туннеля.
Конечно, дело не в трансформер-модели. На самом деле, там было много мелких нюансов: мы взяли новый токенизатор, сделали новый токенизатор, по-другому стали фильтровать и размечать данные, иначе обрабатывать текст после перевода. Сработало правило 10 тысяч часов: было много шажков к цели, и в определённый момент я понял, что качество перевода уже достаточно для того, чтобы продавать людям мой API для перевода. Трансформер-модель не была волшебной таблеткой, она просто добавила 10-20% качества, которых не хватало для критической массы.
Потом мы начали подключать разные инструменты, которые позволяли и дальше улучшать качество перевода: определитель именованных сущностей, транслитерацию, тематические словари, систему исправления ошибок в словах. За пять месяцев этой работы качество переводах на некоторых языках стало приближаться к качеству «гугла». Теперь, когда мы заменяем Google API для нескольких языков своим, люди в целом не жалуются. Это был переломный момент. Ты уже можешь продать программу, и из-за того, что это твой собственный переводчик, он — дешёвый. Можно наращивать продажи, а расходы будут только на серверы.
«Я в 5 тысяч раз отстаю от Google — ну и что?»
На сегодня готовы переводчики для шести языков — испанского, португальского, французского, немецкого, итальянского и русского, все — в паре с английским. В будущем планируем делать прямые модели, без участия английского, например, арабо-французский. (Вот тестовый вариант переводчика).
Мы сделали не только переводчик, но и большую платформу под него, чтобы можно было фильтровать данные, парсить их, обрабатывать, тренировать нейронные модели и выкладывать их на серверах — как сервис «гугла». Запустили три языка в тестовом режиме на 10 тысяч пользователей в день — всё легло.
Сейчас два человека переделывают платформу, чтобы она не развалилась под наплывом пользователей. Ещё месяца два уйдёт на это, потом планируем полностью уйти от «гугла».
Пока же клиенты пользуются старыми приложениями. Чтобы сократить расходы на Google API, я урезал его использование до минимума — специально ограничил функции, чтобы приложения не переводили большие тексты, в результате в месяц трачу две тысячи долларов. Когда же у меня будет свой API, я резко начну масштабировать проект.
Правда сейчас команда не успевает за проектом. Когда доходы упали, я вынужден был сократить число сотрудников с десяти до шести. А прямо сейчас нам снова нужны люди — с горящими глазами. Нужен хороший компьютерный лингвист, который понимает язык программирования, знает TensorFlow и в идеале — трансформер-модель. Ещё нужен хороший пиарщик, бэкенд-разработчик со знанием JavaScript и MacOs-разработчик.
До недавних пор я привлекал людей как ИП, но недавно зарегистрировал ООО «Лингванекс» и сейчас буду переводить ребят туда. Готовим документы для вступления в ПВТ.
Моя цель — через три года заработать 350 млн долларов, заняв 0,5% мирового рынка переводов. Выручка должна составить 35 млн долларов в год на команду из 40 человек.
Это не такая большая сумма. К 2023 году мировой рынок переводов, по данным сервисов аналитики, составит 70 млрд долларов. Тут учитываются все виды переводов, и прежде всего те, которые делает человек. Доля машинного перевода сейчас невелика, так как машина ещё не может выполнить его идеально. Но нейронный перевод совершенствуется, его качество всё ближе подходит к уровню человеческого. И когда большие компании добьются хороших результатов, случится огромный скачок. В этой статье, например, прогнозируют, что к 2024 году рынок машинного перевода будет оцениваться в 1,5 млрд долларов. Я думаю, что на самом деле цифры будут гораздо больше, и это произойдет в ближайшие 2-3 года. Благодаря тому, что наработки выкладываются в открытый доступ, маленькие компании тоже смогут участвовать в этом процессе. Очень важно к этому моменту иметь технологии, которые будут переводить как человек. Возможно, и я в тот самый момент окажусь в эпицентре событий.
У Google — 500 млн пользователей в месяц, а у itranslate.com, второго по популярности переводчика, — 5 млн, он отстаёт от лидера в 100 раз. Я в 5 тысяч раз отстаю от Google — ну и что? У меня нет цели победить корпорацию и захватить большой объём.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.