Аўтар вайб-кодынгу: софт перажывае пераломны момант
Праграмнае забеспячэнне зноў змяняецца — на нашых вачах адбываюцца глыбокія зрухі ў індустрыі, справакаваныя ШІ. А таму зараз неверагодна цікавы і ўнікальны час у свеце тэхналогій. Пра гэта ў сваім нядаўнім выступленні на канферэнцыі AI Startup School казаў сузаснавальнік OpenAI, навуковец у сферы машыннага навучання і аўтар паняцця «вайб-кодынг» Андрэй Карпаты.
Праграмнае забеспячэнне зноў змяняецца — на нашых вачах адбываюцца глыбокія зрухі ў індустрыі, справакаваныя ШІ. А таму зараз неверагодна цікавы і ўнікальны час у свеце тэхналогій. Пра гэта ў сваім нядаўнім выступленні на канферэнцыі AI Startup School казаў сузаснавальнік OpenAI, навуковец у сферы машыннага навучання і аўтар паняцця «вайб-кодынг» Андрэй Карпаты.
Карпаты вылучае тры ключавыя парадыгмы развіцця софта:
Software 1.0 — традыцыйны код, напісаны чалавекам для кампутара (напрыклад, на C++). Гэта інструкцыі, якія ствараюцца ўручную, для выканання задач у лічбавым асяроддзі.
Software 2.0 — нейронныя сеткі, у якіх ролю кода іграюць вагі мадэлі. Такія праграмы «пішуцца» не радкамі кода, а з дапамогай дадзеных і аптымізатараў (напрыклад, сістэмы распазнавання выяў). Платформы кшталту Hugging Face робяцца накшалт GitHub’а для такога софта.
Software 3.0 — найноўшая парадыгма, аснова якой — вялікія моўныя мадэлі (LLM). Тут праграмы пішуцца на натуральнай мове (напрыклад, на англійскай) і кіруюць паводзінамі LLM, ператвараючы яе ў «кампутар новага тыпу».
Карпаты прыводзіць некалькі навочных аналогій, якія тлумачаць прыроду моўных мадэляў:
Інфраструктура: LLM — як пастаўшчыкі электрычнасці: з тарыфікацыяй па выкарыстанні, з патрабаваннямі да высокай даступнасці і нізкай затрымкі. Ён адзначае, што калі топавыя LLM перастаюць працаваць, гэта супастаўна з «адключэннем інтэлекту» (intelligence brownout) па ўсім свеце.
Аперацыйныя сістэмы: бадай, самая дакладная метафара. LLM — гэта складаныя праграмныя экасістэмы, аналагічныя Windows, macOS ці Linux (дзе Llama, мадэль Meta, можа стаць опенсорснай альтэрнатывай). LLM — гэта «эквівалент працэсара», дзе акно кантэксту грае ролю аператыўнай памяці. Зараз мы, па яго словах, знаходзімся ў «1960-х» — на этапе дарагіх і цэнтралізаваных вылічэнняў, з мадэллю сумеснага выкарыстання рэсурсаў (time-sharing).
«Ду́хі чалавека»: LLM можна ўспрымаць як стахастычныя сімуляцыі людзей, з пэўнай формай чалавечай псіхалогіі, якая ўзнікла з-за іх навучання на велізарных масівах тэкстаў. У іх ёсць звышздольнасці (энцыклапедычныя веды, ідэальная памяць), але і «кагнітыўныя дэфекты»: галюцынацыі, «рваны інтэлект» (у чымсьці яны звышлюдзі, у чымсьці робяць дурныя памылкі), і «энтраградная амнезія» — яны не запамінаюць веды з цягам часу, а залежаць ад прамога кантэксту.
Будучыню распрацоўкі праграм Карпаты бачыць у дадатках з частковай аўтаноміяй і праграмаванне з удзелам ШІ:
Чалавек і ШІ працуюць разам — цяпер чалавек не піша код, а правярае, што згенераваў ШІ. Галоўнае — паскорыць цыкл «генерацыя → верыфікацыя».
Спецыялізаваныя GUI — візуальныя інтэрфейсы дапамагаюць правяраць працу ШІ значна хутчэй, чым чытаць «сырыя» тэкставыя вывады.
Паўзунок аўтаноміі — прадукты павінны даваць карыстальніку кантроль: ад найпрасцейшых да цалкам аўтаномных дзеянняў ШІ ў кодавай базе.
«ШІ на павадку» — гэта важна: фармулёўка промптаў павінна быць канкрэтнай, каб мінімізаваць памылкі, а прамежкавыя артэфакты (напрыклад, структура курса, створаная ШІ) — паддавацца аўдыту. Гэта дапамагае ўтрымаць мадэль у рамках і павысіць яе эфектыўнасць.
Таксама Карпаты згадаў пра «вайб-кодынг» — праграмаванне з дапамогай ШІ праз промпты на натуральнай мове. Цяпер праграмістам можа быць кожны, таму што натуральная мова стала ўніверсальным інтэрфейсам. Гэта сапраўды беспрэцэдэнтная з’ява, якая можа стаць «уваходнай кропкай» у свет распрацоўкі для мільёнаў.
Але генерацыя кода — гэта толькі пачатак. Самае складанае — увасобіць яго ў рэальнасць: разгортванне, DevOps, аўтэнтыфікацыя ўсё яшчэ застаюцца глыбока «чалавечымі» задачамі.
Карпаты лічыць, што настаў час улічваць асаблівасці агентаў-распрацоўшчыкаў. Напрыклад, у дакументацыі час адыходзіць ад інструкцый накшталт чалавечых «націсніце тут» у бок API-запытаў, якія лёгка інтэрпрэтуюцца LLM. Што датычыцца інструментаў для скармлівання дадзеных ШІ, патрэбны ўтыліты, якія будуць пераўтвараць «чалавекаарыентаваны» лічбавы кантэнт (напрыклад, рэпазіторыі на GitHub) у фармат, зразумелы моўным мадэлям.
Як кажа Карпаты, мы ствараем «касцюмы Жалезнага чалавека» — прадукты, якія пашыраюць магчымасці чалавека, але ў той жа час валодаюць аўтаномнымі функцыямі. І гэты «паўзунок аўтаноміі» будзе няўхільна зрушвацца ў бок большай самастойнасці ШІ ў бліжэйшае дзесяцігоддзе.
Зараз — ідэальны час, каб эксперыментаваць, вынаходзіць і перапісаць будучыню праграмнага забеспячэння, падводзіць рысу даследчык.
Модели на текущий момент - игрушки или подсказчики с глюками.
Миллиарды применений классического софта куда модели непригодны. В частности управление любой техникой.
А то что модели будут код писать - нет он то о другом, что модель и будет собственно софтом.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
окрою "секрет" - язык программирования это логический язык
нет. человек пишет все тоже самое и еще больше на (английском) языке или еще каком-нибудь "сделай мне большую красную кнопку чтобы все было красиво"
это чушь - без модульного тестирования программа распадается от изменений со временем потому что неизвестно что "там" тестируется на самом деле
ну и самый цимес - для чего еще одна надстройка если все равно нужно вникать в потроха программ?
бла-бла-бла. дорого энергозатратно неэффективно, но в их карман
Модели на текущий момент - игрушки или подсказчики с глюками.
Миллиарды применений классического софта куда модели непригодны. В частности управление любой техникой.
А то что модели будут код писать - нет он то о другом, что модель и будет собственно софтом.