Дапамажыце dev.by 🤍
Падтрымаць

«Безліміт» у ШІ-кадаванні немагчымы: стартапы тэрмінова закрываюць дзіркі ў тарыфах

Буйныя камерцыйныя карыстальнікі ШІ-рэдактараў кода спажываюць анамальныя вылічальныя магутнасці і ламаюць падпіскі з «безлімітам», вымушаючы стартапы тэрмінова перагледжваць тарыфы і прадукт.

Пакінуць каментарый
«Безліміт» у ШІ-кадаванні немагчымы: стартапы тэрмінова закрываюць дзіркі ў тарыфах

Буйныя камерцыйныя карыстальнікі ШІ-рэдактараў кода спажываюць анамальныя вылічальныя магутнасці і ламаюць падпіскі з «безлімітам», вымушаючы стартапы тэрмінова перагледжваць тарыфы і прадукт.

У індустрыі для такіх кліентаў з’явілася мянушка inference whales — тых, хто запускаюць доўгія агентныя задачы і разбіваюць запыты на мноства крокаў. У разважаючых мадэляў гэта рэзка павышае кошт інферэнса. Калі такі карыстальнік плаціць фіксаваныя $20–$200 у месяц, сэрвіс застаецца ў мінусе, паколькі яму прыходзіцца аплачваць намнога большыя рахункі за абслугоўванне мадэлі.

Паказальны прыклад — Claude Code ад Anthropic. Па максімальным тарыфе за $200 частка кліентаў за тыдні «спальвала» вылічэнняў на тысячы даляраў. Нефармальны лідэрборд паказаў распрацоўшчыка з амаль 11 мільярдамі токенаў — прыкладна на $35 тысяч інферэнса супраць $200 у месяц. Anthropic спрабуе выправіць сітуацыю: кампанія з 28 жніўня ўводзіць тыднёвыя ліміты і даплату за перавышэнне.

Падобны разварот адбыўся ў Cursor: былы «безлімітны» Pro-тарыф за $20 ператварыўся ў ступеньчатую схему з аплатай «хуткіх» запытаў звыш квоты. Укараненне новых, больш дарагіх мадэляў і недахоп яснай камунікацыі выклікалі ў часткі карыстальнікаў блытаніну і раздражненне. Сам стартап тлумачыць гэта тым, што «далёкабойныя» задачы выдаткоўваюць на парадак больш токенаў, чым простыя.

Надзея, што кошт інферэнса рэзка ўпадзе, на практыцы не апраўдваецца: як толькі з’яўляецца больш моцная мадэль, сэрвісы інтэгруюць яе разам з больш высокім коштам. «Попыт — на лепшую мадэль, кропка… І яна амаль заўсёды каштуе прыкладна аднолькава — гэта край сённяшніх выдаткаў інферэнса», — піша заснавальнік TextQL Ітан Дзін. Нават калі цана за токен зніжаецца, ланцужкі крокаў ШІ-агентаў павялічваюць агульны аб’ём да дзясяткаў і соцень мільёнаў токенаў, вяртаючы выніковы кошт на высокі ўзровень.

Выснова рынку робіцца відавочнай: «безліміт» у кодзінгу пры сучасных ШІ немагчымы. Стартапам прыходзіцца балансаваць паміж якасцю топавых мадэляў, прадказальнасцю выдаткаў і справядлівым доступам для большасці. У бліжэйшай перспектыве сектар, верагодна, пяройдзе на гібрыдныя схемы: базавая падпіска + выразныя тыднёвыя/месячныя квоты, дадатковыя пакеты магутнасці, прыярытызацыя чэргаў і абмежаванні на доўгія агентныя запускі.

Для распрацоўшчыкаў гэта значыць змену звыклых працэсаў: аптымізацыю промптаў, драбленне праектаў, лакальную праверку гіпотэз перад «глыбокімі» прагонамі і больш усвядомлены выбар задач, якія сапраўды варта аддаваць агентам. Для правайдэраў — інвестыцыі ў празрыстыя метрыкі спажывання і зразумелыя ліміты, інакш наступная хваля «кітоў» зноў перакуліць човен.

CEO OpenAI прызнаў што ШІ — бурбалка
CEO OpenAI прызнаў, што ШІ — бурбалка
Па тэме
CEO OpenAI прызнаў, што ШІ — бурбалка
Поўная лухта: экс-топ Google пра ідэю аб тым што ШІ створыць новыя працоўныя месцы. Кажа СЕО таксама выправяцца прэч
Поўная лухта: экс-топ Google пра ідэю аб тым, што ШІ створыць новыя працоўныя месцы. Кажа, СЕО таксама выправяцца прэч
Па тэме
Поўная лухта: экс-топ Google пра ідэю аб тым, што ШІ створыць новыя працоўныя месцы. Кажа, СЕО таксама выправяцца прэч
Чытайце таксама
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.