«Мы тратим слишком много»: компании учатся контролировать расходы на ИИ-токены
Компании, которые еще недавно призывали сотрудников активнее пользоваться ИИ, теперь пытаются взять расходы под контроль. Бизнес все чаще сталкивается с резким ростом счетов за токены из-за массового внедрения ИИ-агентов и кодинг-инструментов.
Компании, которые еще недавно призывали сотрудников активнее пользоваться ИИ, теперь пытаются взять расходы под контроль. Бизнес все чаще сталкивается с резким ростом счетов за токены из-за массового внедрения ИИ-агентов и кодинг-инструментов.
Опрошенные TechCrunch эксперты указывают, что при снижении стоимости токенов их общее потребление значительно растет. Чем больше компании внедряют ИИ в разработку, аналитику, поддержку и другие процессы, тем больше запросов делают сотрудники и автономные агенты. В итоге расходы могут быстро выходить за пределы бюджета.
Например, Uber израсходовала годовой бюджет на ИИ-инструменты для программирования уже к апрелю. Microsoft через несколько месяцев после выдачи разработчикам лицензий Claude Code начала их отзывать. Сотрудник Priceline рассказал, что продление контракта с Cursor оказалось в 4–5 раз дороже, чем раньше.
«Шесть месяцев назад разговоры с клиентами были о том, что ИИ может делать и достаточно ли он хорош. Сейчас разговоры уже не об этом. Теперь спрашивают: мы тратим так много, какую видимость расходов вы даете, какие есть механизмы аудита, контроля токенов и эффективности моделей?» — рассказал глава enterprise-направления OpenAI Александр Эмбирикос.
На этом фоне Linux Foundation объявила о создании Tokenomics Foundation — организации, которая должна разработать стандарты для учета и управления расходами на ИИ-токены. Идея в том, чтобы к токенам применить похожую метрику, какую применяют к облачным расходам.
По данным FinOps Foundation, некоммерческой организациипри Linux Foundation, еще весной компании начали жаловаться, что уже в апреле превышают годовой бюджет на токены в несколько раз. Разговор резко сменился с «используйте ИИ быстрее и больше» на «нам нужны ограничения и правила контроля».
«Вы обязаны использовать ИИ? У нас такого нет»: президент Anthropic — о токенмаксинге
Реальная отдача от таких расходов пока не всегда очевидна. Исследование Faros AI среди 20 тысяч разработчиков показало, что продуктивность растет, но вместе с ней увеличивается число багов и исправлений. Jellyfish также обнаружила, что инженеры, которые активнее всего используют ИИ, примерно вдвое продуктивнее остальных, но тратят в 10 раз больше токенов.
По словам главы исследований платформы для анализа работы разработчиков Jellyfish Николаса Арколано, главный вопрос в том, окупается ли экстремальное потребление ИИ через реальную бизнес-ценность написанного кода. Большинство компаний пока не умеют это точно измерять.
На рынке уже появляются инструменты для контроля таких расходов. Стартапы вроде Pay-i и Paid помогают отслеживать стоимость и эффективность ИИ-инвестиций. Jellyfish, Waydev и Faros AI предлагают мониторинг ИИ-агентов и оценку ROI для таких инструментов. Datadog, New Relic и Ramp также добавляют функции для наблюдения за расходами на токены, GPU и ИИ-инфраструктуру.
Один из возможных трендов — автоматический выбор более дешевой модели для конкретной задачи. Вместо того чтобы всегда использовать самый мощный и дорогой вариант, системы смогут направлять часть запросов к более дешевым моделям, если их возможностей достаточно.
Почасовые рейты скоро всё? Топ-менеджер предсказал судьбу аутсорса
ИИ меняет примерно всё, и экономику сервисных компаний тоже. Как именно? Недавно эту тему довольно горячо обсуждали топы и инвесторы EPAM. А мы решили узнать мнение руководства другого крупного — но непубличного — аутсорсера.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале
Обсуждение
Комментируйте без ограничений
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.