Одна из причин упадка платформы — широкое распространение LLM, которые, к тому же, обучаются на коде, размещённом на StackOverflow. Продажа этой информации нейросетям может стать новой финансовой моделью. Один из комментаторов предложил, что из-за спада популярности StackOverflow стартапы, не добившиеся успеха, могли бы продавать свою кодовую базу для обучения LLM.
Насколько жизнеспособна такая модель монетизации? Попробую разобраться.
Одна из причин упадка платформы — широкое распространение LLM, которые, к тому же, обучаются на коде, размещённом на StackOverflow. Продажа этой информации нейросетям может стать новой финансовой моделью. Один из комментаторов предложил, что из-за спада популярности StackOverflow стартапы, не добившиеся успеха, могли бы продавать свою кодовую базу для обучения LLM.
Насколько жизнеспособна такая модель монетизации? Попробую разобраться.
Тот самый комментарий
Кто пишет: Артур Исаенко, айтишник с большим опытом, CTO в Adaptive Clinical Systems, с 2008 года живёт и работает в Канаде.
Могут ли стартапы продавать свой код LLM’кам?
Эта идея вызывает у меня некоторый скептицизм.
Как определить, что такое хороший код? Успех или неуспех стартапа не могут определять качество кода. С точки зрения разработчика, если проект работает — значит, код хороший. Но коммерчески прибыльный проект может быть написан и «на коленке». Главное, чтобы он вовремя вышел и принёс деньги инвесторам. Да, технический долг будет забирать деньги, но если бы проект не появился своевременно, то вообще никакой прибыли бы и не было.
Сложно оценить, сколько действительно стоит только исходный код в закрытом проекте.
Покупать код для обучения LLM на фоне огромного количества open source — так себе идея.
Если ваш стартап не взлетел, можно найти более надёжные способы монетизации. Например, если он решает научную проблему, можно податься на правительственную программу поддержки. В Канаде есть Scientific Research and Experimental Development (SR&ED) tax incentives, который позволяет возместить до 40% затрат на разработку.
А что с правами на интеллектуальную собственность?
Сейчас с точки зрения закона нет серьёзных препятствий, чтобы продавать код для обучения ИИ. Код считается интеллектуальной собственностью, которую можно продать, как и любую другую. Новый владелец может распоряжаться кодом по своему усмотрению. Можно продавать код по лицензионному соглашению (EULA), которое определяет, что можно делать с кодом.
Или кейс Atlassian — они продавали лицензии на скачивание кода для ознакомления. Такие лицензии не запрещают использовать код для обучения ИИ. Они лишь ограничивают создание новых продуктов на его основе.
Это значит, если у вас есть легальный код, вы можете обучать на нём ИИ. Например, LLM, RAG (это способ, при котором модель ищет нужную информацию в базе данных и использует её для более точного ответа на вопрос) или для до-обучения модели.
Однако в будущем могут появиться ограничения, запрещающие использовать код для обучения LLM.
Когда такая модель может сработать?
Я считаю, что код невыстреливших проектов лучше всего использовать для вышеупомянутого RAG или fine tuning — процесс обучения уже готовой модели на новых данных, чтобы она лучше справлялась с конкретной задачей — в определенной нишевой области.
Например, на основе полученной модели можно сделать продукт, который будет практически полностью генерировать казуальные игры и зарабатывать на этом деньги.
Возможно, появятся компании-рисайклеры, которые будут покупать неудачный код для определённой ниши. Но необязательно использовать код, чтобы тренировать LLM.
Кроме него остаются данные. Например, вы производили фитнес-браслеты. Работали несколько лет, но более успешные конкуренты вытеснили вас с рынка. И кроме кода в облачном хранилище остались пользовательские данные, количество шагов за день, частота сердечных сокращений, насыщение кислородом, частота дыхания, режим сна и многое другое. И эти данные могут быть проданы, например, компаниям, занимающимся клиническими исследованиями.
***
В общем, продавать кода стартапов для обучения ИИ — идея сомнительная. Сложно оценить качество и ценность. Особенно, когда в интернете хватает open source. Код прогоревших стартапов может подойти для дообучения моделей или решения узких задач, но, возможно, более выгодно будет продать данные, собранные стартапом.
Мнение автора может не совпадать с позицией редакции.
Город или деревня — где лучше жить программисту? Рассуждает техлид из Амстердама
ИТ давно ассоциируется с удалёнкой. Кажется, что раз можно работать из деревни или маленького города, то и карьеру можно сделать так же, как люди из больших городов. Но я с этим не согласен.
На мой взгляд, айтишникам лучше жить в больших городах (или хотя бы в ИТ-хабах). Расскажу, почему.
Считали каждую копейку. Беларуска за 2 года выплатила ипотеку в Англии — рассказывает, как ей это удалось
Я закрыла свою ипотеку — за два года, в 31 год, живя в Великобритании. Без стартовых преимуществ, без «правильного» бэкграунда. Это был непростой путь, по дороге пришлось расстаться с несколькими иллюзиями. Расскажу, как строгая финансовая дисциплина и отказ от навязанного образа «дома мечты» сделали это возможным.
Уберите личную информацию и поменяйте дизайн. Карьерная консультантка разбирает CV читательницы
Вы отправляете десятки резюме, но отклика всё нет — и начинаете думать, что рынок против вас. Но чаще всего проблема не в навыках.
Карьерная консультантка Алина Бондаренко даёт новой героине рубрики «Разбор резюме» совет, объясняя на примере Java-разработчицы Полины Сидоренко, какие правки в CV повышают шанс пройти скрининг и попасть на собеседование.
Говори по-новому. Как перестроить рабочее общение, если был разрабом, а стал менеджером
Вчера вы писали код и закрывали тикеты. Сегодня вас повысили, и вам нужно ставить задачи и давать сложный фидбек. Но говорить вы всё ещё привыкли как инженеры. Если не освоить новый стиль общения, повышение легко превратится выгорание.
Эта инструкция пригодится тем, кто делает первые шаги в лидерстве, а разработчикам поможет лучше понять своих руководителей.
Спасибо за мнение. Действительно, для тюнинга под определённую нишу - это более конкретная точка приложения. Если команда использует модель, как ассистента в написании кода в какой-нибудь нише, то логичным будет доучить этого ассистента на коде именно для этого направления.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Спасибо за мнение. Действительно, для тюнинга под определённую нишу - это более конкретная точка приложения. Если команда использует модель, как ассистента в написании кода в какой-нибудь нише, то логичным будет доучить этого ассистента на коде именно для этого направления.