«Безлимит» в ИИ-кодинге невозможен: стартапы срочно закрывают дыры в тарифах
Крупные коммерческие пользователи ИИ-редакторов кода потребляют аномальные вычислительные мощности и ломают подписки с «безлимитом», вынуждая стартапы срочно пересматривать тарифы и продукт.
Крупные коммерческие пользователи ИИ-редакторов кода потребляют аномальные вычислительные мощности и ломают подписки с «безлимитом», вынуждая стартапы срочно пересматривать тарифы и продукт.
В индустрии для таких клиентов появилось прозвище inference whales — тех, кто запускают длительные агентные задачи и разбивают запросы на множество шагов. У рассуждающих моделей это резко повышает стоимость инференса. Когда такой пользователь платит фиксированные $20–$200 в месяц, сервис остается в минусе, поскольку ему приходится оплачивать намного большие счета за обслуживание модели.
Показательный пример — Claude Code от Anthropic. По максимальному тарифу за $200 часть клиентов за недели «сжигала» вычислений на тысячи долларов. Неформальный лидерборд показал разработчика с почти 11 миллиардами токенов — ориентировочно на $35 тысяч инференса против $200 в месяц. Anthropic пытается исправить ситуацию: компания с 28 августа вводит недельные лимиты и доплату за превышение.
Похожий разворот произошёл у Cursor: бывший «безлимитный» Pro-тариф за $20 превратился в ступенчатую схему с оплатой «быстрых» запросов сверх квоты. Внедрение новых, более дорогих моделей и нехватка ясной коммуникации вызвали у части пользователей путаницу и раздражение. Сам стартап объясняет это тем, что «дальнобойные» задачи тратят на порядок больше токенов, чем простые.
Надежда, что стоимость инференса резко упадет, на практике не оправдывается: как только появляется более сильная модель, сервисы интегрируют ее вместе с более высокой ценой. «Спрос — на лучшую модель, точка… И она почти всегда стоит примерно одинаково — это край сегодняшних издержек инференса», — пишет основатель TextQL Итан Дин. Даже если цена за токен снижается, цепочки шагов ИИ-агентов растят общий объем до десятков и сотен миллионов токенов, возвращая итоговую стоимость на высокий уровень.
Вывод рынка становится очевидным: «безлимит» в кодинге при современных ИИ невозможен. Стартапам приходится балансировать между качеством топовых моделей, предсказуемостью расходов и справедливым доступом для большинства. В ближайшей перспективе сектор, вероятно, перейдет на гибридные схемы: базовая подписка + четкие недельные/месячные квоты, дополнительные пакеты мощности, приоритизация очередей и ограничения на длительные агентные запуски.
Для разработчиков это значит изменение привычных процессов: оптимизацию промптов, дробление проектов, локальную проверку гипотез перед «глубокими» прогонами и более осознанный выбор задач, которые действительно стоит отдавать агентам. Для провайдеров — инвестиции в прозрачные метрики потребления и понятные лимиты, иначе следующая волна «китов» снова перевернет лодку.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.