Дапамажыце dev.by 🤍
Падтрымаць

16 ШІ-агентаў стварылі C-кампілятар на Rust за 2 тыдні

Anthropic правяла незвычайны эксперымент: адразу 16 версій мадэлі Claude Opus 4.6 працавалі разам над стварэннем паўнавартаснага C-кампілятара. Праект заняў каля двух тыдняў і запатрабаваў амаль 2 000 сесій, а выдаткі на API склалі прыкладна $20 000.

2 каментарыя
16 ШІ-агентаў стварылі C-кампілятар на Rust за 2 тыдні

Anthropic правяла незвычайны эксперымент: адразу 16 версій мадэлі Claude Opus 4.6 працавалі разам над стварэннем паўнавартаснага C-кампілятара. Праект заняў каля двух тыдняў і запатрабаваў амаль 2 000 сесій, а выдаткі на API склалі прыкладна $20 000.

Кіраваў эксперыментам даследчык Нікалас Карліні. Ён размясціў кожнага ШІ-агента ў асобным Docker-кантэйнеры і падключыў іх да агульнага Git-рэпазіторыя. Мадэлі самастойна выбіралі задачы, фіксавалі іх праз lock-файлы, адпраўлялі гатовы код і нават вырашалі merge-канфлікты — без цэнтральнага кіруючага агента.

У выніку сістэма згенеравала каля 100 000 радкоў кода на Rust. Атрыманы кампілятар здольны збіраць ядро Linux 6.9 для архітэктур x86, ARM і RISC-V, а таксама кампіляваць буйныя open-source-праекты кшталту PostgreSQL, SQLite, Redis і FFmpeg. У наборы стрэс-тэстаў GCC ён паказаў 99-працэнтную паспяховасць і нават змог запусціць культавую гульню Doom — нефармальны «краш-тэст» для падобных інструментаў.

Аднак цалкам аўтаномным гэты праект назваць складана. Карліні давялося стварыць складаную інфраструктуру (тэставыя асяроддзі, CI-пайплайны і сістэмы зваротнай сувязі), каб кампенсаваць тыповыя слабасці моўных мадэляў. Напрыклад, занадта падрабязныя логі «засмечвалі» кантэкст і перашкаджалі агентам разумець уласныя задачы, а адсутнасць пачуцця часу прыводзіла да шматгадзінных бескарысных прагонаў тэстаў.

У кампілятара ўсё яшчэ ёсць сур’ёзныя абмежаванні. Ён генеруе менш эфектыўны код, чым GCC, у ім застаюцца памылкі ў асемблеры і лінкеры, а таксама няма падтрымкі 16-бітнага рэжыму, які патрэбны для загрузкі Linux. Па меры павелічэння аб’ёму праекта ШІ-агенты ўсё часцей парушалі працу ўжо гатовых функцый — гэта паказвае, што сучасным мадэлям пакуль складана стабільна працаваць з вялікімі кодавымі базамі. У гэтым эксперыменце мяжа больш-менш аўтаномнай распрацоўкі аказалася на ўзроўні каля 100 000 радкоў кода.

Асобныя пытанні выклікала і вызначэнне «clean room». Хаця агенты не мелі доступу да інтэрнэту падчас распрацоўкі, сама мадэль навучалася на велізарных масівах публічнага кода, уключаючы існуючыя кампілятары. Акрамя таго, $20 000 — толькі кошт токенаў: у яго не ўваходзяць мільярды, выдаткаваныя на навучанне мадэлі, і чалавечая праца па праектаванні асяроддзя.

Тым не менш эксперымент дэманструе заўважны прагрэс. Яшчэ год таму моўныя мадэлі не маглі стварыць функцыянальны мультыархітэктурны кампілятар нават пры сур’ёзнай падтрымцы чалавека. Падыход з паралельнымі агентамі, якія каардынуюцца праз Git, можа стаць новым патэрнам для агентнай распрацоўкі.

«Пристегнитесь»: техлидеры спорят убьёт ли ИИ рынок софта
«Пристегнитесь»: техлидеры спорят, убьёт ли ИИ рынок софта
Па тэме
«Пристегнитесь»: техлидеры спорят, убьёт ли ИИ рынок софта
«Занадта шмат ведаў — гэта дрэнна»: CEO ШІ-стартапа ў першую чаргу наймае зумераў
«Занадта шмат ведаў — гэта дрэнна»: CEO ШІ-стартапа ў першую чаргу наймае зумераў
Па тэме
«Занадта шмат ведаў — гэта дрэнна»: CEO ШІ-стартапа ў першую чаргу наймае зумераў
Чытайце таксама
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Калі вы стаміліся ад ШІ — вам не здаецца»: інжынер пра выгаранне, пра якое не кажуць у ІТ
«Калі вы стаміліся ад ШІ — вам не здаецца»: інжынер пра выгаранне, пра якое не кажуць у ІТ
«Калі вы стаміліся ад ШІ — вам не здаецца»: інжынер пра выгаранне, пра якое не кажуць у ІТ
1 каментарый
Nvidia перавяла 30 000 распрацоўшчыкаў на ШІ-кодынг — аб'ём кода патроіўся
Nvidia перавяла 30 000 распрацоўшчыкаў на ШІ-кодынг — аб'ём кода патроіўся
Nvidia перавяла 30 000 распрацоўшчыкаў на ШІ-кодынг — аб'ём кода патроіўся
3 каментарыя
Больш за 40 000 ШІ-агентаў OpenClaw выявіліся адкрытымі для ўзлому
Больш за 40 000 ШІ-агентаў OpenClaw выявіліся адкрытымі для ўзлому
Больш за 40 000 ШІ-агентаў OpenClaw выявіліся адкрытымі для ўзлому

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Bobik Gavkalo
Bobik Gavkalo Грызу кости в БУДКА_У_ЗАБОРА
0

Подождите еще немного. Надо всеголишь пару миллиардова инвестиций и миллионы ват энергии и оно сможет

Anton Abrosov
Anton Abrosov hqd'шка в iqos
0

ai slop