Coinbase перевела часть ИИ-задач на китайские модели и снизила расходы в 2 раза
Компания задумалась об экономии и начала использовать китайские ИИ-модели GLM 5.2 и Kimi 2.7 в качестве стандартного варианта для части внутренних задач.
Компания задумалась об экономии и начала использовать китайские ИИ-модели GLM 5.2 и Kimi 2.7 в качестве стандартного варианта для части внутренних задач.
Компания задумалась об экономии и начала использовать китайские ИИ-модели GLM 5.2 и Kimi 2.7 в качестве стандартного варианта для части внутренних задач.
По словам гендиректора криптобиржи Брайана Армстронга, такой подход позволил компании почти вдвое сократить расходы на ИИ, хотя потребление токенов продолжает быстро расти.
Разработчики Coinbase по-прежнему могут самостоятельно выбирать модель для работы. Однако, как утверждает Армстронг, 91% из них и раньше не расходовали прежние лимиты, поэтому компания решила сделать более дешевые модели стандартным вариантом, не вводя дополнительных ограничений.
How to keep AI spend flat while token usage grows exponentially: Not with friction and spend alerts. With better defaults, routing, and caching.
— Brian Armstrong (@brian_armstrong) June 27, 2026
Better Defaults (not Usage Caps) — Engineers can choose any model they want, but defaults matter. We’re experimenting with defaulting… pic.twitter.com/PUV9uQHGO0
«Как удерживать расходы на ИИ на прежнем уровне, пока потребление токенов растет экспоненциально? Не с помощью ограничений и предупреждений о тратах, а благодаря лучшим настройкам по умолчанию, маршрутизации и кешированию», — написал Армстронг в X.
В Coinbase также запустили автоматическую маршрутизацию запросов. Система выбирает модель в зависимости от сложности задачи, цены и возможности повторно использовать уже обработанный контекст. Например, более мощную модель можно задействовать для планирования, а более дешевую — для выполнения типовых операций.

Отдельную роль играет кеширование. По словам Армстронга, после оптимизации кеширования доля запросов, для которых система смогла повторно использовать уже обработанный контекст, выросла с 5% до 60%. Это позволяет не отправлять модели одни и те же данные заново и снижает стоимость запросов.
Coinbase не ограничивает сотрудников в расходовании токенов, но делает эти расходы прозрачными внутри компании. При этом действует правило: чем больше разработчик тратит на ИИ, тем большего результата от него ожидают.
Переход крупных компаний на более доступные китайские модели усиливает давление на OpenAI и Anthropic, чьи передовые системы заметно дороже. Помимо Coinbase, китайские модели тестирует Snowflake, а стартап Lindy недавно перешел на DeepSeek V4. На этом фоне западные лаборатории вынуждены доказывать, что более дорогие модели оправдывают цену за счет качества, надежности и эффективности в сложных агентных задачах.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.