«Он вроде бы работает»: 20 ИИ-агентов создали браузер с нуля за неделю
Компания Cursor провела эксперимент, чтобы проверить, насколько далеко можно продвинуть автономное программирование с помощью ИИ-агентов. В течение одной недели 20 ИИ-агентов на базе модели GPT-5.2 совместно написали код веб-браузера.
Компания Cursor провела эксперимент, чтобы проверить, насколько далеко можно продвинуть автономное программирование с помощью ИИ-агентов. В течение одной недели 20 ИИ-агентов на базе модели GPT-5.2 совместно написали код веб-браузера.
Об эксперименте рассказал сооснователь и гендиректор Cursor Майкл Труэлл. По его словам, агенты сгенерировали более миллиона строк кода в тысячах файлов (в отдельных сообщениях фигурирует оценка свыше 1 миллионов строк). Движок браузера был написан с нуля на языке Rust, а исходный код выложен в открытый доступ на GitHub.
We built a browser with GPT-5.2 in Cursor. It ran uninterrupted for one week.
It’s 3M+ lines of code across thousands of files. The rendering engine is from-scratch in Rust with HTML parsing, CSS cascade, layout, text shaping, paint, and a custom JS VM.
Результат далек от зрелых движков вроде WebKit или Chromium, однако браузер «вроде бы работает»: простые сайты отображаются быстро и в целом корректно. В Cursor отмечают, что сам факт работоспособности такого проекта, созданного автономными агентами за столь короткое время, стал неожиданностью даже для команды.
Изначально исследователи пробовали «плоскую» модель координации, где все 20 агентов были равны и самостоятельно выбирали задачи, ориентируясь на общий документ. Этот подход провалился: эффективно работали лишь 2–3 агента, а остальные простаивали, ожидая освобождения задач.
После этого Cursor перешла к иерархической системе с разделением ролей. Часть агентов стала «планировщиками»: они изучали кодовую базу, формировали задачи и разбивали их на подзадачи. Остальные выступали в роли «исполнителей», которые брали конкретные задания и доводили их до конца, не думая о проекте в целом. Такая схема позволила масштабировать работу и избежать узких мест.
По итогам эксперимента в Cursor сделали вывод, что выбор модели критически важен для долгих автономных задач. GPT-5.2 показала себя лучше конкурентов: она устойчивее удерживала контекст, точнее следовала инструкциям и эффективнее справлялась с планированием.
Claude Opus 4.5, по наблюдениям исследователей, чаще преждевременно завершала задачи и искала упрощенные пути решения. Интересно, что GPT-5.2 оказалась сильнее в роли планировщика, чем GPT-5.1-Codex, несмотря на то что последняя специально оптимизирована под программирование.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.