Дапамажыце dev.by 🤍
Падтрымаць

«Безліміт» у ШІ-кадаванні немагчымы: стартапы тэрмінова закрываюць дзіркі ў тарыфах

Буйныя камерцыйныя карыстальнікі ШІ-рэдактараў кода спажываюць анамальныя вылічальныя магутнасці і ламаюць падпіскі з «безлімітам», вымушаючы стартапы тэрмінова перагледжваць тарыфы і прадукт.

Пакінуць каментарый
«Безліміт» у ШІ-кадаванні немагчымы: стартапы тэрмінова закрываюць дзіркі ў тарыфах

Буйныя камерцыйныя карыстальнікі ШІ-рэдактараў кода спажываюць анамальныя вылічальныя магутнасці і ламаюць падпіскі з «безлімітам», вымушаючы стартапы тэрмінова перагледжваць тарыфы і прадукт.

У індустрыі для такіх кліентаў з’явілася мянушка inference whales — тых, хто запускаюць доўгія агентныя задачы і разбіваюць запыты на мноства крокаў. У разважаючых мадэляў гэта рэзка павышае кошт інферэнса. Калі такі карыстальнік плаціць фіксаваныя $20–$200 у месяц, сэрвіс застаецца ў мінусе, паколькі яму прыходзіцца аплачваць намнога большыя рахункі за абслугоўванне мадэлі.

Паказальны прыклад — Claude Code ад Anthropic. Па максімальным тарыфе за $200 частка кліентаў за тыдні «спальвала» вылічэнняў на тысячы даляраў. Нефармальны лідэрборд паказаў распрацоўшчыка з амаль 11 мільярдамі токенаў — прыкладна на $35 тысяч інферэнса супраць $200 у месяц. Anthropic спрабуе выправіць сітуацыю: кампанія з 28 жніўня ўводзіць тыднёвыя ліміты і даплату за перавышэнне.

Падобны разварот адбыўся ў Cursor: былы «безлімітны» Pro-тарыф за $20 ператварыўся ў ступеньчатую схему з аплатай «хуткіх» запытаў звыш квоты. Укараненне новых, больш дарагіх мадэляў і недахоп яснай камунікацыі выклікалі ў часткі карыстальнікаў блытаніну і раздражненне. Сам стартап тлумачыць гэта тым, што «далёкабойныя» задачы выдаткоўваюць на парадак больш токенаў, чым простыя.

Надзея, што кошт інферэнса рэзка ўпадзе, на практыцы не апраўдваецца: як толькі з’яўляецца больш моцная мадэль, сэрвісы інтэгруюць яе разам з больш высокім коштам. «Попыт — на лепшую мадэль, кропка… І яна амаль заўсёды каштуе прыкладна аднолькава — гэта край сённяшніх выдаткаў інферэнса», — піша заснавальнік TextQL Ітан Дзін. Нават калі цана за токен зніжаецца, ланцужкі крокаў ШІ-агентаў павялічваюць агульны аб’ём да дзясяткаў і соцень мільёнаў токенаў, вяртаючы выніковы кошт на высокі ўзровень.

Выснова рынку робіцца відавочнай: «безліміт» у кодзінгу пры сучасных ШІ немагчымы. Стартапам прыходзіцца балансаваць паміж якасцю топавых мадэляў, прадказальнасцю выдаткаў і справядлівым доступам для большасці. У бліжэйшай перспектыве сектар, верагодна, пяройдзе на гібрыдныя схемы: базавая падпіска + выразныя тыднёвыя/месячныя квоты, дадатковыя пакеты магутнасці, прыярытызацыя чэргаў і абмежаванні на доўгія агентныя запускі.

Для распрацоўшчыкаў гэта значыць змену звыклых працэсаў: аптымізацыю промптаў, драбленне праектаў, лакальную праверку гіпотэз перад «глыбокімі» прагонамі і больш усвядомлены выбар задач, якія сапраўды варта аддаваць агентам. Для правайдэраў — інвестыцыі ў празрыстыя метрыкі спажывання і зразумелыя ліміты, інакш наступная хваля «кітоў» зноў перакуліць човен.

CEO OpenAI прызнаў што ШІ — бурбалка
CEO OpenAI прызнаў, што ШІ — бурбалка
Па тэме
CEO OpenAI прызнаў, што ШІ — бурбалка
Поўная лухта: экс-топ Google пра ідэю аб тым што ШІ створыць новыя працоўныя месцы. Кажа СЕО таксама выправяцца прэч
Поўная лухта: экс-топ Google пра ідэю аб тым, што ШІ створыць новыя працоўныя месцы. Кажа, СЕО таксама выправяцца прэч
Па тэме
Поўная лухта: экс-топ Google пра ідэю аб тым, што ШІ створыць новыя працоўныя месцы. Кажа, СЕО таксама выправяцца прэч
Чытайце таксама
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
Авторы фильма с помощью дипфейков убрали 30 фраз со словом «f*ck», чтобы смягчить возрастной рейтинг
1 каментарый
Tencent разработала нейросеть для восстановления старых фотографий
Tencent разработала нейросеть для восстановления старых фотографий
Tencent разработала нейросеть для восстановления старых фотографий

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.