Николай Чикишев world 1 чэрвеня 2026, 14:36

Праграмісты прызвычаіліся да ШІ настолькі, што адмаўляюцца пісаць код без яго

ШІ-інструменты для праграмавання сталі настолькі звычайнымі, што частка распрацоўшчыкаў ужо не гатова часова адмовіцца ад іх нават дзеля даследавання.

Пакінуць каментарый

Праграмісты прызвычаіліся да ШІ настолькі, што адмаўляюцца пісаць код без яго

ШІ-інструменты для праграмавання сталі настолькі звычайнымі, што частка распрацоўшчыкаў ужо не гатова часова адмовіцца ад іх нават дзеля даследавання.

У 2025 годзе даследчая лабараторыя METR правяла эксперымент, у якім удзельнічалі 16 вопытных open source-распрацоўшчыкаў. Яны выканалі 246 рэальных задач у праектах, дзе ў сярэднім працавалі каля пяці гадоў. Задачы выпадкова размяркоўваліся на дзве групы: з дазволам выкарыстоўваць ШІ і без яго. У дазволенай групе распрацоўшчыкі ў асноўным выкарыстоўвалі Cursor Pro і Claude 3.5/3.7 Sonnet.

Вынік аказаўся нечаканым. Да пачатку задач распрацоўшчыкі прагназавалі, што ШІ скароціць час выканання на 24%. Пасля эксперыменту яны ацанілі эфект амаль гэтак жа — як паскарэнне на 20%. Але фактычна задачы з ШІ займалі ў сярэднім на 19% больш часу. Эксперты таксама памыліліся ў прагнозах: эканамісты чакалі паскарэння на 39%, спецыялісты па машынным навучанні — на 38%.

METR тлумачыла гэта некалькімі фактарамі. Удзельнікі добра ведалі свае рэпазіторыі: у сярэднім у іх было каля 1500 камітаў у праектах, над якімі яны працавалі. Самі рэпазіторыі былі вялікімі і складанымі — у сярэднім каля 1,1 мільёна радкоў кода. У такіх умовах ШІ горш улічваў няяўны кантэкст праекта, прапаноўваў не заўсёды надзейныя рашэнні, а распрацоўшчыкі тарацілі час на праверку, выпраўленне і адкат згенераванага кода.

Паводле даных даследчыкаў, распрацоўшчыкі прымалі менш за 44% ШІ-генерацый. Пры гэтым 75% удзельнікаў чыталі кожны радок кода, прапанаванага мадэллю, а 56% часта ўносілі буйныя праўкі, каб прывесці яго ў парадак. Аналіз відэазапісаў экрана паказаў, што пры працы з ШІ каля 9% часу сыходзіла на праверку і ачыстку ягоных вывадаў.

Canva дала 5000 сотрудникам неделю на изучение ИИ — и пришла к неожиданным выводам

У 2026 годзе METR запусціла новы эксперымент з больш шырокай групай: 10 удзельнікаў з першага даследавання і 47 новых распрацоўшчыкаў з розных open source-праектаў. Усяго арганізацыя сабрала дадзеныя па 57 распрацоўшчыках, 143 рэпазіторыях і больш чым 800 задачах. Але даследчыкі прызналі, што новыя дадзеныя даюць ненадзейны сігнал: занадта многія ўдзельнікі пачалі пазбягаць задач, якія маглі выпадкова трапіць у групу «без ШІ».

Паводле апытанняў METR, 30–50% распрацоўшчыкаў прызнаваліся, што не адпраўлялі ў эксперымент некаторыя задачы, таму што не хацелі выконваць іх без ШІ. Частка ўдзельнікаў наўпрост казала, што ім цяжка вяртацца да «старога» спосабу працы. Адзін распрацоўшчык параўнаў гэта з спробай прайсці пешшу праз увесь горад пасля таго, як звык карыстацца Uber.

Сырыя вынікі новага эксперыменту ўжо паказвалі больш спрыяльную карціну для ШІ: у групы старых удзельнікаў METR ацэньвала паскарэнне прыкладна на 18%, у новых распрацоўшчыкаў — каля 4%. Але праз паводзіны удзельнікаў і змены задач даследчыкі лічаць гэтыя ацэнкі слабым доказам рэальнага эфекту.

Асобнае апытанне METR у лютым–красавіку 2026 года паказала, што тэхнічныя спецыялісты самі ацэньваюць карысць ШІ значна вышэй. У ім удзельнічалі 349 чалавек. У сярэднім у рэспандэнтаў было 12 гадоў вопыту праграмавання, 19 месяцаў вопыту выкарыстання ШІ для кодынгу і 7 месяцаў вопыту працы з агентнымі ШІ-інструментамі. Палова рэгулярна выкарыстоўвала Claude Code.

Компания случайно потратила $500 млн на Claude за месяц — СМИ

Удзельнікі апытання заявілі, што ШІ павялічыў каштоўнасць іх працы ў 1,4–2 разы. Па хуткасці эфект ацэньваўся яшчэ вышэй — медыянная самаацэнка склала 3-кратнае паскарэнне. Рэспандэнты таксама лічылі, што ў 2025 годзе ШІ павышаў каштоўнасць іх працы прыкладна ў 1,3 разы, у 2026 годзе — ужо ў 2 разы, а да 2027 года эфект вырасце да 2,5 разу.

Аднак METR папярэджвае, што да такіх самаацэнак трэба ставіцца асцярожна. У раннім эксперыменце 2025 года распрацоўшчыкі таксама былі ўпэўнены, што ШІ паскарае іх працу, але фактычныя вымярэнні паказалі адваротнае. Паводле ацэнкі METR, удзельнікі тады ў сярэднім пераацанілі ўплыў ШІ на час выканання задач прыкладна на 40 працэнтных пунктаў.

На гэтым фоне растуць сумневы ў тым, што актыўнае выкарыстанне ШІ аўтаматычна азначае рост прадукцыйнасці. У 2026 годзе ў кампаніях распаўсюдзілася практыка токенмаксінгу, калі расход токенаў фактычна ператвараецца ў паказчык выкарыстання ШІ. Але вялікі расход не заўсёды азначае карысную працу. Паводле даных Financial Times, Amazon закрыла ўнутраны рэйтынг пасля таго, як супрацоўнікі пачалі празмерна выкарыстоўваць ШІ-агентаў і выконваць непатрэбныя задачы, каб падняцца ў табліцы.

Падобная праблема ўзнікла ў Uber. Паводле даных The Information, кампанія выдаткавала бюджэт на ШІ на ўвесь 2026 год ужо за першыя чатыры месяцы. Аперацыйны дырэктар Uber Эндру Макдональд пазней казаў, што такія расходы не прывялі да заўважнага росту колькасці праектаў або прадукцыйнасці.

Галоўная рызыка — у тым, што ШІ паскарае напісанне кода, але не абавязкова зніжае кошт яго падтрымкі. Праграміст Джэймс Шор сфармуляваў гэта так: «Вы цяпер пішаце код у два разы хутчэй? Тады лепш спадзявайцеся, што вы ўдвая скарацілі расходы на яго абслугоўванне. Інакш вы трапілі ў пастку. Вы мяняеце часовы прырост хуткасці на пастаянную залежнасць».

Выснова METR і іншых даследчыкаў сыходзіцца ў адным: ШІ ужо стаў часткай штодзённай працы праграмістаў, але яго эфект нельга вымяраць толькі адчуваннямі распрацоўшчыкаў або колькасцю патрачаных токенаў. ШІ можа дапамагаць, асабліва ў новых або незнаёмых задачах, але ў складаных сталых праектах ён патрабуе кантролю, праверкі і інжынернага меркавання.