«Міру не хапае токенаў»: у ШІ-індустрыі востры дэфіцыт магутнасцей
Распрацоўшчыкі штучнага інтэлекту сутыкаюцца з вострай нястачай вылічальных магутнасцей. Рэзкі рост попыту на ШІ-сэрвісы, асабліва аўтаномныя агентныя сістэмы, прывёў да дэфіцыту рэсурсаў, збояў у працы і нават спынення некаторых прадуктаў.
Распрацоўшчыкі штучнага інтэлекту сутыкаюцца з вострай нястачай вылічальных магутнасцей. Рэзкі рост попыту на ШІ-сэрвісы, асабліва аўтаномныя агентныя сістэмы, прывёў да дэфіцыту рэсурсаў, збояў у працы і нават спынення некаторых прадуктаў.
The Wall Street Journal паведамляе, што за апошнія месяцы попыт на агентныя сістэмы рэзка вырас. Гэта павялічыла нагрузку на інфраструктуру і абвастрыла канкурэнцыю за вылічальныя рэсурсы. Кампаніі вымушаныя літаральна «паляваць» за магутнасцямі, каб абслугоўваць аўдыторыю, якая расце.
«Усе гавораць пра нафту, але насамрэч свету не хапае токенаў», — адзначыў інжынер і інвестар Бэн Пуладзіян. Паводле яго, ШІ ўжо выйшаў за межы простых чат-ботаў і стаў паўнавартасным інструментам, які выконвае складаныя задачы і патрабуе значна больш рэсурсаў.
Нястача магутнасцяў ужо ўплывае на рынак. Кошт арэнды GPU — ключавых чыпаў для працы ШІ — рэзка вырас. Напрыклад, арэнда аднаго з найноўшых паскаральнікаў Nvidia Blackwell падаражэла амаль на 50% усяго за два месяцы — з $2,75 да $4,08 за гадзіну. Буйныя воблачныя правайдэры павышаюць цэны і ўзмацняюць умовы для кліентаў: кампанія CoreWeave падняла тарыфы больш чым на 20% і павялічыла мінімальныя тэрміны кантрактаў.
Дэфіцыт рэсурсаў вымушае кампаніі перагледжваць свае планы. OpenAI адмовілася ад развіцця відэасэрвісу Sora, каб вызваліць магутнасці для больш прыярытэтных прадуктаў. Пры гэтым нагрузка на API кампаніі імкліва расце: выкарыстанне токенаў павялічылася з 6 да 15 мільярдаў за хвіліну ўсяго за некалькі месяцаў.
На рынку не далічыліся 500 000 праграмістаў з-за ШІ
«Я выдаю шмат часу, спрабуючы знайсці любыя даступныя вылічальныя рэсурсы ў апошні момант, — прызналася фінансавы дырэктар кампаніі Сара Фраяр. — Нам даводзіцца прымаць вельмі складаныя рашэнні пра тое, ад якіх праектаў адмовіцца, таму што нам не хапае вылічальных магутнасцей».
Праблемы закранулі і Anthropic. Кампанія сутыкнулася з частымі збоямі і пачала абмяжоўваць выкарыстанне рэсурсаў у гадзіны пік. Карыстальнікі скардзяцца, што ліміты дасягаюцца занадта хутка, а стабільнасць сервісу застаецца ніжэй звычайных стандартаў: даступнасць API Claude за апошнія 90 дзён склала каля 98,95%, што прыкметна ніжэй тыповых для індустрыі 99,99%.
«Гэта не норма, — падкрэсліў тэхнічны дырэктар стартапа Baseten Амір Хагігат. — Гэта не той узровень надзейнасці, які вы чакаеце ад кампаніі, якая прадстаўляе „інтэлект“ для вашых прыкладанняў».
Прычына дэфіцыту — не толькі попыт, але і абмежаванні на баку інфраструктуры. Будаўніцтва дата-цэнтраў займае гады, а даступныя энергетычныя магутнасці ўжо размеркаваны аж да 2026 года. «Мы сутыкаемся з каласальнай нястачай магутнасцей — такога я не бачыў за ўсе гады працы», — заявіў кіраўнік воблачнай кампаніі Vultr Джэй Кардвел.
Сітуацыя нагадвае класічныя крызісы росту ў тэхналагічных галінах — ад чыгунак XIX стагоддзя да інтэрнэт-бума 2000-х гадоў, калі попыт значна апераджаў развіццё інфраструктуры. У кароткатэрміновай перспектыве гэта можа абмежаваць распаўсюджванне ШІ-інструментаў, нягледзячы на іх папулярнасць, якая расце, заключаюць эксперты.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.