17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

«Безлимит» в ИИ-кодинге невозможен: стартапы срочно закрывают дыры в тарифах

Крупные коммерческие пользователи ИИ-редакторов кода потребляют аномальные вычислительные мощности и ломают подписки с «безлимитом», вынуждая стартапы срочно пересматривать тарифы и продукт.

Оставить комментарий
«Безлимит» в ИИ-кодинге невозможен: стартапы срочно закрывают дыры в тарифах

Крупные коммерческие пользователи ИИ-редакторов кода потребляют аномальные вычислительные мощности и ломают подписки с «безлимитом», вынуждая стартапы срочно пересматривать тарифы и продукт.

В индустрии для таких клиентов появилось прозвище inference whales — тех, кто запускают длительные агентные задачи и разбивают запросы на множество шагов. У рассуждающих моделей это резко повышает стоимость инференса. Когда такой пользователь платит фиксированные $20–$200 в месяц, сервис остается в минусе, поскольку ему приходится оплачивать намного большие счета за обслуживание модели.

Показательный пример — Claude Code от Anthropic. По максимальному тарифу за $200 часть клиентов за недели «сжигала» вычислений на тысячи долларов. Неформальный лидерборд показал разработчика с почти 11 миллиардами токенов — ориентировочно на $35 тысяч инференса против $200 в месяц. Anthropic пытается исправить ситуацию: компания с 28 августа вводит недельные лимиты и доплату за превышение.

Похожий разворот произошёл у Cursor: бывший «безлимитный» Pro-тариф за $20 превратился в ступенчатую схему с оплатой «быстрых» запросов сверх квоты. Внедрение новых, более дорогих моделей и нехватка ясной коммуникации вызвали у части пользователей путаницу и раздражение. Сам стартап объясняет это тем, что «дальнобойные» задачи тратят на порядок больше токенов, чем простые.

Надежда, что стоимость инференса резко упадет, на практике не оправдывается: как только появляется более сильная модель, сервисы интегрируют ее вместе с более высокой ценой. «Спрос — на лучшую модель, точка… И она почти всегда стоит примерно одинаково — это край сегодняшних издержек инференса», — пишет основатель TextQL Итан Дин. Даже если цена за токен снижается, цепочки шагов ИИ-агентов растят общий объем до десятков и сотен миллионов токенов, возвращая итоговую стоимость на высокий уровень.

Вывод рынка становится очевидным: «безлимит» в кодинге при современных ИИ невозможен. Стартапам приходится балансировать между качеством топовых моделей, предсказуемостью расходов и справедливым доступом для большинства. В ближайшей перспективе сектор, вероятно, перейдет на гибридные схемы: базовая подписка + четкие недельные/месячные квоты, дополнительные пакеты мощности, приоритизация очередей и ограничения на длительные агентные запуски.

Для разработчиков это значит изменение привычных процессов: оптимизацию промптов, дробление проектов, локальную проверку гипотез перед «глубокими» прогонами и более осознанный выбор задач, которые действительно стоит отдавать агентам. Для провайдеров — инвестиции в прозрачные метрики потребления и понятные лимиты, иначе следующая волна «китов» снова перевернет лодку.

CEO OpenAI признал что ИИ — пузырь
CEO OpenAI признал, что ИИ — пузырь
По теме
CEO OpenAI признал, что ИИ — пузырь
CEO OpenAI говорит что мы волнуемся не за тех работников в контексте ИИ-автоматизации
CEO OpenAI говорит, что мы волнуемся не за тех работников в контексте ИИ-автоматизации
По теме
CEO OpenAI говорит, что мы волнуемся не за тех работников в контексте ИИ-автоматизации
Полная чушь: экс-топ Google про идею о том что ИИ создаст новые рабочие места. Говорит СЕО тоже отправятся вон
Полная чушь: экс-топ Google про идею о том, что ИИ создаст новые рабочие места. Говорит, СЕО тоже отправятся вон
По теме
Полная чушь: экс-топ Google про идею о том, что ИИ создаст новые рабочие места. Говорит, СЕО тоже отправятся вон
Читайте также
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn — исследование
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn — исследование
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn — исследование
«Эти чувства для меня настоящие»: японка «вышла замуж» за ChatGPT
«Эти чувства для меня настоящие»: японка «вышла замуж» за ChatGPT
«Эти чувства для меня настоящие»: японка «вышла замуж» за ChatGPT
Инвесторов пугают расходы OpenAI: $1,4 трлн трат при $20 млрд дохода
Инвесторов пугают расходы OpenAI: $1,4 трлн трат при $20 млрд дохода
Инвесторов пугают расходы OpenAI: $1,4 трлн трат при $20 млрд дохода
В Следственном комитете рассказали, как используют ИИ и вычисляют криптовзяточников
В Следственном комитете рассказали, как используют ИИ и вычисляют криптовзяточников
В Следственном комитете рассказали, как используют ИИ и вычисляют криптовзяточников
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.