«Миру не хватает токенов»: в ИИ-индустрии острый дефицит мощностей
Разработчики искусственного интеллекта сталкиваются с острой нехваткой вычислительных мощностей. Резкий рост спроса на ИИ-сервисы, особенно автономные агентные системы, привел к дефициту ресурсов, сбоям в работе и даже остановке некоторых продуктов.
Разработчики искусственного интеллекта сталкиваются с острой нехваткой вычислительных мощностей. Резкий рост спроса на ИИ-сервисы, особенно автономные агентные системы, привел к дефициту ресурсов, сбоям в работе и даже остановке некоторых продуктов.
The Wall Street Journal сообщает, что за последние месяцы спрос на агентные системы резко вырос. Это увеличило нагрузку на инфраструктуру и обострило конкуренцию за вычислительные ресурсы. Компании вынуждены буквально «охотиться» за мощностями, чтобы обслуживать растущую аудиторию.
«Все говорят о нефти, но на самом деле миру не хватает токенов», — отметил инженер и инвестор Бен Пуладиан. По его словам, ИИ уже вышел за рамки простых чат-ботов и стал полноценным инструментом, который выполняет сложные задачи и требует значительно больше ресурсов.
Сбои в работе API Claude по месяцам и уровень доступности сервиса: в феврале–марте перебои участились, а аптайм снизился. Источник: The Wall Street Journal.
Нехватка мощностей уже влияет на рынок. Стоимость аренды GPU — ключевых чипов для работы ИИ — резко выросла. Например, аренда одного из новейших ускорителей Nvidia Blackwell подорожала почти на 50% всего за два месяца — с $2,75 до $4,08 в час. Крупные облачные провайдеры повышают цены и ужесточают условия для клиентов: компания CoreWeave подняла тарифы более чем на 20% и увеличила минимальные сроки контрактов.
Дефицит ресурсов вынуждает компании пересматривать свои планы. OpenAI отказалась от развития видеосервиса Sora, чтобы высвободить мощности для более приоритетных продуктов. При этом нагрузка на API компании стремительно растет: использование токенов увеличилось с 6 до 15 миллиардов в минуту всего за несколько месяцев.
На рынке не досчитались 500 000 программистов из-за ИИ
«Я трачу много времени, пытаясь найти любые доступные вычислительные ресурсы в последний момент, — призналась финансовый директор компании Сара Фрайар. — Нам приходится принимать очень сложные решения о том, от каких проектов отказаться, потому что нам не хватает вычислительных мощностей».
Проблемы затронули и Anthropic. Компания столкнулась с частыми сбоями и начала ограничивать использование ресурсов в часы пик. Пользователи жалуются, что лимиты достигаются слишком быстро, а стабильность сервиса остается ниже привычных стандартов: доступность API Claude за последние 90 дней составила около 98,95%, что заметно ниже типичных для индустрии 99,99%.
«Это не норма, — подчеркнул технический директор стартапа Baseten Амир Хагигат. — Это не тот уровень надежности, который вы ожидаете от компании, предоставляющей „интеллект“ для ваших приложений».
Причина дефицита — не только спрос, но и ограничения на стороне инфраструктуры. Строительство дата-центров занимает годы, а доступные энергетические мощности уже распределены вплоть до 2026 года. «Мы сталкиваемся с колоссальной нехваткой мощностей — такого я не видел за все годы работы», — заявил глава облачной компании Vultr Джей Кардвелл.
Ситуация напоминает классические кризисы роста в технологических отраслях — от железных дорог XIX века до интернет-бума 2000-х годов, когда спрос значительно опережал развитие инфраструктуры. В краткосрочной перспективе это может ограничить распространение ИИ-инструментов, несмотря на их растущую популярность, заключают эксперты.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.