Беларус создал собственное языковое приложение и выучил литовский за 5 месяцев

Приложение WRD началось не с бизнес-идеи, а с личной истории. Павел Агафонов, один из его разработчиков, проживая в Литве, столкнулся с необходимостью сдать экзамен по литовскому языку для получения постоянного вида на жительство в стране. 

Сперва обратился к продуктам, которые уже были на рынке. Но ни один из них не предлагал удобного формата обучения, который бы подошёл человеку с работой и молодому отцу, и обещал быстрый результат. 

Тогда разработчику пришла в голову идея сделать свой инструмент, который бы сочетался с его темпом жизни. 

Так появилось WRD — приложение, которое использует статистику употребления языков в разговорах, книгах и фильмах для оптимизации пути обучения.

Рассказываем, как собственная игра помогла разработчику освоить литовский и почему на первом месте не максимумальная выручка от пользователей, а максимально быстрый результат для них.

9 комментариев

Павел — известный беларусский разработчик, амбассадор пет-проектов и основатель Happymagenta — компании, которая издаёт приложения для AppStore: аркадные игры, сервисы outdoor-навигации, security & network решения. О его карьерном пути редакция рассказала в недавнем материале. 

«От 10К — это если ты лучше, чем всего лишь 200 средних программистов в App Store». Павел Агафонов о том, как делать продукты самому и заработать миллионы долларов
По теме
«От 10К — это если ты лучше, чем всего лишь 200 средних программистов в App Store». Павел Агафонов о том, как делать продукты самому и заработать миллионы долларов

Когда разработчик столкнулся с необходимостью сдавать экзамен по литовскому, он понял, что на изучение языка у него почти нет времени.

— Когда у тебя есть маленькие дети, но нет бабушек и дедушек, которые могут помогать, время на изучение языка сложно найти, — вспоминает Павел. — Я уже забыл, когда в последний раз читал книгу или смотрел кино.

Потребность в быстром результате стала стимулом для разработки собственного продукта — образовательного приложения WRD.

В его — технология обработки естественного языка (NLP), которую сперва использовали в словесной игре Under a spell, где участникам предлагают найти слова в наборе букв.  

Павел Агафонов

Система автоматически формирует обширный словарь более чем для 50 языков, используя открытые публичные данные. Она может отфильтровывать неприемлемые слова, группировать слова по форме и части речи, распознавать идиоматические выражения.

Система определяет кодировку разных типов текста: веб-страниц, электронных книг, PDF-файлов, субтитров — и автоматически преобразует их в unicode для корректной обработки другими языковыми инструментами. 

— Словари и базы, которые мы собрали, после вычитывали переводчики, преподаватели и лингвисты, — рассказывает Евгений, первый присоеднившийся к проекту член команды, который стал директором по продукту. — Мы всё перепроверяли много раз. На разработку первого прототипа ушло полтора года. (Он вышел в 2022 году — прим.)

С первым прототипом Павел и готовился к экзамену — и успешно его сдал. За пять месяцев ему удалось освоить нужный уровень литовского языка.

Вообще WRD — нестандартное приложение, говорят разработчики. Приоритет не удержание пользователей, а быстрый результат. 

— Мы хотим ускорить обучение пользователя в то время, когда другие приложения, наоборот, хотят замедлить процесс, чтобы максимизировать выручку. Мы в этом плане более честные, — поясняет Евгений.

В 2024-м в проекте, помимо собственных ИИ моделей, стали использовать коммерческие. Сейчас в WRD постоянно обновляют словарь и определяют наиболее популярные в употреблении слова, чтобы затем предлагать их пользователям для изучения; приложение также подбирает для юзеров индивидуальную программу и может оценить уровень владения иностранным языком. 

— Данные стали суперточными. Если система говорит, что вы знаете 30% языка, значит так и есть, — говорит Павел. 

WRD поддерживает больше 20 языков. Для каждого сформирован огромный словарь. Система распознёт разные формы слов и анализирует массивы текста. 

На момент разработки WRD существовали различные инструменты NLP и приложения для изучения языков, но ни одно из них не объединяло все элементы, реализованные в этом проекте. 

Google Translate и DeepL предоставляли качественный перевод, но не предлагали анализа структурированного словаря или адаптивного обучения. Duolingo предлагал уроки, но не использовали ИИ для персонализированного обучения, классические NLP-библиотеки (например, NLTK, Spacy, FastText) проводили лингвистический анализ, но не были оптимизированы для генерации словарей на множестве языков.

Евгений Мороз
Наш технология, которая легла в основу алгоритмов обучения, уникальная тем, что она конструирует взаимосвязанный словарь, группирует слова по значению, контексту использования и грамматическим правилам, определяет язык текста, даже если он содержит несколько, разбивает предложения на слова, идиомы и фразы, анализирует структуру и грамматику.

Хотя WRD, говорят создатели, не конкурируют с другими языковыми программами. Приложение, наоборот, может быть дополнительным инструментом, который поможет быстро выучить слова. 

WRD предлагает персонализированное обучение. Искусственный интеллект отслеживает прогресс пользователя и динамически регулирует уровень сложности, использует алгоритмы интервального повторения, определяет слабые места и предлагает индивидуальный словарь для улучшения. Приложение работает на увеличение лингвистического запаса пользователя. Юзер выполняет разные упражнения: дописывает часть слова, вводит перевод целиком самостоятельно, подбирает пары, слушает слова и их перевод на нативный язык.

Самые популярные языки в WRD — английский, испанский, немецкий французский. Многие пользователи учат азиатские. Хотя, признаются разработчики, в этой нише есть продукты сильнее, которые, в том числе, учат писать иероглифы.

— Поэтому мы концентрируется на европейский языках, — говорит Павел.

Интересно, что у русскоязычных пользователей в WRD самый популярный язык для изучения — польский. Всего у приложения около 700 тысяч скачиваний. Из них 30 тысяч — платные пользователи.

— Мы считаем, что завершили первый этап разработки. Ко второму уже приступили: теперь с помощью нейросетей мы работаем с произношением пользователей, — рассказывает Павел. — Мы анализируем голос юзеров и подсвечиваем моменты, которые нужно поправить. 

На очереди — ещё большее погружение пользователя: тренировка диалогов, разыгрывание ситуаций с использованием слов, выученных игроком. 

— WRD кажется очень простым приложением. Вроде нажал одну кнопку — и просто слушаешь пока нарезаешь лук или едешь в машине. Создаётся впечатление, что совсем не тратишь усилий. Но уже через два месяца начинаешь понимать таблички на улице, имейлы от государственных служб и так далее, — говорит Павел.

— Получется, ты абсолютно легко двигаешься, но эти слова впечатываются тебе в голову, — добавляет Евгений. — Вот этот эффект мы и считаем важным и хотим развивать. Думаем, у нас это получится. 

Попробовать WRD


Читать на dev.by