Автор «вайб-кодинга» запустил open source-проект, где ИИ сам проводит эксперименты
Бывший руководитель ИИ-направления Tesla и один из сооснователей OpenAI Андрей Карпатый представил open-source-проект autoresearch — систему, которая позволяет ИИ-агентам самостоятельно проводить сотни исследовательских экспериментов без участия человека.
Бывший руководитель ИИ-направления Tesla и один из сооснователей OpenAI Андрей Карпатый представил open-source-проект autoresearch — систему, которая позволяет ИИ-агентам самостоятельно проводить сотни исследовательских экспериментов без участия человека.
Проект опубликован на GitHub в виде относительно простого скрипта примерно из 630 строк кода. Несмотря на минималистичную реализацию, идея амбициозна: автоматизировать научный метод и ускорить развитие машинного обучения. По задумке Карпатого, агент получает тренировочный скрипт и ограниченный вычислительный бюджет, после чего самостоятельно формулирует гипотезы, изменяет параметры модели, запускает эксперименты и оценивает результаты.
I packaged up the «autoresearch» project into a new self-contained minimal repo if people would like to play over the weekend. It’s basically nanochat LLM training core stripped down to a single-GPU, one file version of ~630 lines of code, then:
В одном из ночных запусков агент выполнил 126 экспериментов, снизив показатель ошибки модели с 0,9979 до 0,9697. В более длительном тесте за два дня система провела около 700 автономных изменений, выявив около 20 улучшений, которые можно было перенести на более крупные модели. В результате эффективность обучения выросла примерно на 11%.
Карпатый отметил, что наблюдать полный цикл исследований, выполненный ИИ «от начала до конца и без участия человека», оказалось неожиданно впечатляющим. По его словам, агент обнаружил ошибки в настройке архитектуры и регуляризации, которые могли ускользать от исследователей годами.
Эксперимент вызвал широкий резонанс в технологическом сообществе. Некоторые разработчики начали масштабировать идею, распределяя «исследовательские агенты» по сетям из десятков узлов. В одном из таких тестов 35 автономных агентов провели более 300 экспериментов за одну ночь, обмениваясь найденными решениями в реальном времени.
Бизнес-сообщество также увидело практические перспективы технологии. Например, маркетинговые команды теоретически смогут запускать тысячи A/B-экспериментов, тестируя рекламные креативы, тексты писем или посадочные страницы в полностью автоматическом режиме.
В то же время часть исследователей предупреждает о рисках чрезмерной автоматизации, в частности, о возможной «переоптимизации» моделей под конкретные тестовые данные и снижении роли человеческой экспертизы.
Сам Карпатый считает, что подобные системы меняют саму логику научной работы: человек становится не столько экспериментатором, сколько архитектором поискового процесса. По его словам, ключевым ограничением развития ИИ в будущем может стать уже не вычислительная мощность, а способность людей правильно формулировать задачи и ограничения для автономных агентов.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.