Глава Coinbase рассказал, как сдерживает расходы на ИИ при взрывном росте трафика
Волна бездумного хвастовства огромными счетами за ИИ-токены подходит к концу: на смену тренду на токенмаксинг приходит строгая оптимизация. Гендиректор Coinbase Брайан Армстронг поделился стратегией, которая позволяет криптобирже наращивать использование нейросетей, не раздувая ИТ-бюджеты за счёт умной маршрутизации запросов.
Волна бездумного хвастовства огромными счетами за ИИ-токены подходит к концу: на смену тренду на токенмаксинг приходит строгая оптимизация. Гендиректор Coinbase Брайан Армстронг поделился стратегией, которая позволяет криптобирже наращивать использование нейросетей, не раздувая ИТ-бюджеты за счёт умной маршрутизации запросов.
«Мы перенаправляем промпты на более дешёвые модели там, где это уместно. В некоторых случаях нам удаётся удерживать расходы примерно на одном уровне, в то время как использование токенов продолжает расти в геометрической прогрессии», — отметил он.
Новейшие флагманские нейросети вроде Opus 4.8 или GPT-5.5 предлагают передовые возможности, но пожирают колоссальное количество токенов и быстро упираются в лимиты. Армстронг уверен, что в ближайшем будущем индустрию ждёт жёсткое разделение труда.
«80% рабочих нагрузок будут выполняться на моделях, которые на 99% дешевле, уже в течение 12-18 месяцев», — прогнозирует глава Coinbase.
По его мнению, использовать самые дорогие и продвинутые модели пользователи будут только тогда, когда им потребуется экстремальный «IQ-максинг» — например, для совершения научных прорывов или оркестровки сложных автономных ИИ-агентов.
«Это наводит меня на мысль, что ограничивающим фактором станут энергия и вычислительные мощности, а не создание более совершенных моделей», — добавил Армстронг.
Мнения ИТ-лидеров касательно предсказания Армстронга разделились. Венчурный капиталист Марк Андриссен назвал идею интересной, а сооснователь Hugging Face Жюльен Шомон подтвердил, что «маршрутизация моделей сейчас стремительно набирает обороты». Гендиректор Box Аарон Леви назвал цифры коллеги «несколько экстремальными», хотя согласился с тем, что ИИ-нагрузки распределятся: высококлассная работа останется за лидерами рынка, а массовая и объёмная уйдёт дешёвым аналогам.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.