Як Anthropic удалося стаць лідарам у ШІ-кодынгу

Кампанія Anthropic за апошні год стала лідарам у галіне ШІ-сэрвісаў для праграмавання — і цяпер менавіта яе мадэлі ляжаць у аснове большасці топавых сэрвісаў кодынгу, ад GitHub Copilot да ўнутраных рашэнняў Meta і папулярных платформаў кшталту Cursor, Augment і StackBlitz.

3 каментарыя

Апытаныя Business Insider эксперты адзначаюць, што вырашальным момантам стаў выпуск мадэлі Claude Sonnet 3.5 у чэрвені 2024 года, якую адразу прызналі найлепшай па якасці і даўжыні згенераванага кода. Многія кампаніі імгненна перайшлі на новы ШІ, а распрацоўшчыкі Sourcegraph нават надалі бясплатны доступ да Claude Sonnet 3.5, прызнаўшы яе ўнікальныя магчымасці. З таго часу Anthropic не здае лідарскіх пазіцый: Claude Sonnet 4 і наступныя версіі па-ранейшаму лічацца найлепшымі для кодынгу, нягледзячы на бурнае развіццё галіны.

Галоўны сакрэт поспеху Anthropic заключаецца ў інавацыйным падыходзе да навучання мадэляў, лічаць спецыялісты. Спачатку распрацоўшчыкі выкарыстоўвалі класічнае навучанне з падмацаваннем на чалавечай зваротнай сувязі (RLHF), калі эксперты выбіраюць найлепшы варыянт сярод прапанаваных ШІ рашэнняў. Пазней каманда ўкараніла Reinforcement Learning from AI Feedback (RLAIF): цяпер самі ШІ-мадэлі ацэньваюць, наколькі іх уласныя адказы адпавядаюць загадзя прапісаным прынцыпам. Гэта дазволіла аўтаматызаваць адбор якасных рашэнняў і паскорыла паляпшэнне мадэляў.

Важную ролю адыграў і націск на практычную карыснасць: Anthropic навучылі ШІ не толькі пісаць код, але і эфектыўна выкарыстоўваць пабочныя інструменты і API, вырашаць комплексныя задачы па этапах, весці чарнавікі праекта, каб не губляць важныя дэталі пры працы над вялікімі прадуктамі. Такі «віртуальны супрацоўнік» не толькі вырашае задачы па інструкцыі, але і памятае, што рабіў на мінулых этапах, каб наступныя праўкі былі лагічнымі і звязанымі.

Кампанія таксама інвеставала ў развіццё Claude Code — інструмента, які інтэгруецца з тэрміналамі праграмістаў і дазваляе збіраць дадзеныя аб рэальнай працы прафесіяналаў. Дзякуючы гэтаму Anthropic атрымлівае каштоўную зваротную сувязь і можа хутчэй паляпшаць свае мадэлі для жывога праграмавання. Эксперты адзначаюць, што поспех Anthropic — вынік не толькі масіўных дадзеных і маштабных вылічэнняў, але і паслядоўнага ўкаранення новых ідэй, эксперыментаў і блізкага кантакту з распрацоўшчыкамі.

«Спрабаваў не памерці»: польскі праграміст перамог мадэль OpenAI на турніры па кодынгу
Па тэме
«Спрабаваў не памерці»: польскі праграміст перамог мадэль OpenAI на турніры па кодынгу
Новы ШІ-агент Reflection не толькі піша код, але і разумее яго
Па тэме
Новы ШІ-агент Reflection не толькі піша код, але і разумее яго
Новы трэнд у праграмаванні: ШІ-кодынг пераходзіць з рэдактараў у тэрмінал
Па тэме
Новы трэнд у праграмаванні: ШІ-кодынг пераходзіць з рэдактараў у тэрмінал

Читать на dev.by