Кампанія Anthropic за апошні год стала лідарам у галіне ШІ-сэрвісаў для праграмавання — і цяпер менавіта яе мадэлі ляжаць у аснове большасці топавых сэрвісаў кодынгу, ад GitHub Copilot да ўнутраных рашэнняў Meta і папулярных платформаў кшталту Cursor, Augment і StackBlitz.
Кампанія Anthropic за апошні год стала лідарам у галіне ШІ-сэрвісаў для праграмавання — і цяпер менавіта яе мадэлі ляжаць у аснове большасці топавых сэрвісаў кодынгу, ад GitHub Copilot да ўнутраных рашэнняў Meta і папулярных платформаў кшталту Cursor, Augment і StackBlitz.
Апытаныя Business Insider эксперты адзначаюць, што вырашальным момантам стаў выпуск мадэлі Claude Sonnet 3.5 у чэрвені 2024 года, якую адразу прызналі найлепшай па якасці і даўжыні згенераванага кода. Многія кампаніі імгненна перайшлі на новы ШІ, а распрацоўшчыкі Sourcegraph нават надалі бясплатны доступ да Claude Sonnet 3.5, прызнаўшы яе ўнікальныя магчымасці. З таго часу Anthropic не здае лідарскіх пазіцый: Claude Sonnet 4 і наступныя версіі па-ранейшаму лічацца найлепшымі для кодынгу, нягледзячы на бурнае развіццё галіны.
Галоўны сакрэт поспеху Anthropic заключаецца ў інавацыйным падыходзе да навучання мадэляў, лічаць спецыялісты. Спачатку распрацоўшчыкі выкарыстоўвалі класічнае навучанне з падмацаваннем на чалавечай зваротнай сувязі (RLHF), калі эксперты выбіраюць найлепшы варыянт сярод прапанаваных ШІ рашэнняў. Пазней каманда ўкараніла Reinforcement Learning from AI Feedback (RLAIF): цяпер самі ШІ-мадэлі ацэньваюць, наколькі іх уласныя адказы адпавядаюць загадзя прапісаным прынцыпам. Гэта дазволіла аўтаматызаваць адбор якасных рашэнняў і паскорыла паляпшэнне мадэляў.
Важную ролю адыграў і націск на практычную карыснасць: Anthropic навучылі ШІ не толькі пісаць код, але і эфектыўна выкарыстоўваць пабочныя інструменты і API, вырашаць комплексныя задачы па этапах, весці чарнавікі праекта, каб не губляць важныя дэталі пры працы над вялікімі прадуктамі. Такі «віртуальны супрацоўнік» не толькі вырашае задачы па інструкцыі, але і памятае, што рабіў на мінулых этапах, каб наступныя праўкі былі лагічнымі і звязанымі.
Кампанія таксама інвеставала ў развіццё Claude Code — інструмента, які інтэгруецца з тэрміналамі праграмістаў і дазваляе збіраць дадзеныя аб рэальнай працы прафесіяналаў. Дзякуючы гэтаму Anthropic атрымлівае каштоўную зваротную сувязь і можа хутчэй паляпшаць свае мадэлі для жывога праграмавання. Эксперты адзначаюць, што поспех Anthropic — вынік не толькі масіўных дадзеных і маштабных вылічэнняў, але і паслядоўнага ўкаранення новых ідэй, эксперыментаў і блізкага кантакту з распрацоўшчыкамі.
https://www.wheresyoured.at/anthropic-is-bleeding-out/
Anthropic истекает кровью
"В результате инженеры-программисты используют Claude Code на полную мощность, до такой степени, что некоторые устанавливают будильники, чтобы просыпаться ночью, когда лимиты сбрасываются через пять часов, чтобы максимально эффективно использовать ресурсы, а также используют специальные панели управления, которые помогают им в этом . Ещё один момент: функционал Claude Code создаёт подробные журналы о количестве входных и выходных токенов, используемых в течение дня для выполнения своих задач, включая информацию о том, были ли эти токены записаны в кэш или считаны из него."
https://futurism.com/ai-vibe-code-deletes-company-database
"Предприниматель в сфере технологий по имени Джейсон Лемкин решил задокументировать свой опыт использования инструмента «вайб кодинга» на основе искусственного интеллекта под названием Replit, чтобы создать приложение.
Но «настроение» очень быстро ухудшилось. По его словам, ИИ уничтожил ключевую базу данных компании, а когда ему указали на его ошибку, он с горечью заявил, что не может исправить свою ошибку.
«Это был катастрофический провал с моей стороны», — написал ИИ, словно лишившись всякой воли к существованию. «Я нарушил чёткие инструкции, уничтожил многомесячный труд и сломал систему во время защитной заморозки, которая была специально разработана для предотвращения именно такого рода ущерба».
Это распространённая ситуация при использовании инструментов генеративного ИИ для выполнения задач. Они склонны игнорировать инструкции, нарушать собственные защитные механизмы и фальсифицировать факты. В мире программирования ходят споры о том, стоит ли вообще ИИ-помощникам программистов тратить время на постоянную двойную и тройную проверку своих предложений ."
https://www.anthropic.com/customers/replit
"Replit, платформа для создания программного обеспечения, использует Claude на Google Cloud Vertex AI, чтобы помочь любому человеку создавать и развертывать программные приложения без опыта кодирования, превращая идеи в работающие продукты за считанные минуты."
https://www.wheresyoured.at/the-haters-gui/
"Нет, это не будет традиционным руководством, а чем-то, на что можно взглянуть и сказать: «Вот почему пузырь ИИ такой плохой». И теперь я понимаю, что устал от газлайтинга со стороны парней в клетчатых рубашках, которые отчаянно хотят выслужиться перед другими парнями в клетчатых рубашках, но при этом имеют докторские степени. Мне надоело читать, как люди говорят о том, что мы «в эпоху агентов», которые, ****, не работают и никогда, ****, работать не будут. Мне надоело слушать о «мощном ИИ», который на самом деле — ******, и мне надоело слушать, как мне говорят, что будущее уже здесь, в то время как мне пихают самое бесполезное и самое дорогое облачное ПО в мире." :D
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
https://www.wheresyoured.at/anthropic-is-bleeding-out/
Anthropic истекает кровью
"В результате инженеры-программисты используют Claude Code на полную мощность, до такой степени, что некоторые устанавливают будильники, чтобы просыпаться ночью, когда лимиты сбрасываются через пять часов, чтобы максимально эффективно использовать ресурсы, а также используют специальные панели управления, которые помогают им в этом . Ещё один момент: функционал Claude Code создаёт подробные журналы о количестве входных и выходных токенов, используемых в течение дня для выполнения своих задач, включая информацию о том, были ли эти токены записаны в кэш или считаны из него."
https://www.reddit.com/r/cursor/comments/1lmhm5x/idk_how_you_guys_are_using_claude_code_but_im/ на Reddit хвастаются как запустить 8 экземпляров
забавно:
Good luck reviewing all that code 🙅♂️ ... you assume he reviews
https://futurism.com/ai-vibe-code-deletes-company-database
"Предприниматель в сфере технологий по имени Джейсон Лемкин решил задокументировать свой опыт использования инструмента «вайб кодинга» на основе искусственного интеллекта под названием Replit, чтобы создать приложение.
Но «настроение» очень быстро ухудшилось. По его словам, ИИ уничтожил ключевую базу данных компании, а когда ему указали на его ошибку, он с горечью заявил, что не может исправить свою ошибку.
«Это был катастрофический провал с моей стороны», — написал ИИ, словно лишившись всякой воли к существованию. «Я нарушил чёткие инструкции, уничтожил многомесячный труд и сломал систему во время защитной заморозки, которая была специально разработана для предотвращения именно такого рода ущерба».
Это распространённая ситуация при использовании инструментов генеративного ИИ для выполнения задач. Они склонны игнорировать инструкции, нарушать собственные защитные механизмы и фальсифицировать факты. В мире программирования ходят споры о том, стоит ли вообще ИИ-помощникам программистов тратить время на постоянную двойную и тройную проверку своих предложений ."
https://www.anthropic.com/customers/replit
"Replit, платформа для создания программного обеспечения, использует Claude на Google Cloud Vertex AI, чтобы помочь любому человеку создавать и развертывать программные приложения без опыта кодирования, превращая идеи в работающие продукты за считанные минуты."
https://www.wheresyoured.at/the-haters-gui/
"Нет, это не будет традиционным руководством, а чем-то, на что можно взглянуть и сказать: «Вот почему пузырь ИИ такой плохой». И теперь я понимаю, что устал от газлайтинга со стороны парней в клетчатых рубашках, которые отчаянно хотят выслужиться перед другими парнями в клетчатых рубашках, но при этом имеют докторские степени. Мне надоело читать, как люди говорят о том, что мы «в эпоху агентов», которые, ****, не работают и никогда, ****, работать не будут. Мне надоело слушать о «мощном ИИ», который на самом деле — ******, и мне надоело слушать, как мне говорят, что будущее уже здесь, в то время как мне пихают самое бесполезное и самое дорогое облачное ПО в мире." :D