«Суперагент» Google создаёт тысячи вариантов кода, чтобы выбрать лучший
Подразделение DeepMind объявило о запуске AlphaEvolve — эволюционного «суперагента» на базе семейства языковых моделей Gemini 2.0. Сервис способен генерировать и проверять десятки тысяч вариантов кода, пока не найдет алгоритм, превосходящий человеческие решения.
AlphaEvolve объединяет две версии Gemini: быструю Flash для массовой генерации идей и более «глубокую» Pro для точечных улучшений. Каждый фрагмент кода автоматически компилируется, запускается и оценивается по метрикам точности, скорости и ресурсопотребления; лучшие варианты «скрещиваются» и дорабатываются в следующих поколениях.
За год внутреннего тестирования AlphaEvolve уже выдал эвристический планировщик для Borg, который непрерывно «освобождает» в среднем 0,7% общей вычислительной мощности Google-облака. Он также переписал участок схемы TPU-чипа, убрав лишние биты, и ускорил ключевое ядро матричного умножения в обучении Gemini на 23%, что сократило общее время тренировки моделей на 1%.
AlphaEvolve сумел сократить число действий при умножении двух 4 × 4 комплексных матриц с 49 до 48, побив рекорд, державшийся 56 лет, и нашла еще более быстрые алгоритмы для тринадцати других размеров матриц. В целом, проверив свыше 50 классических головоломок, AlphaEvolve воспроизвела лучшие известные решения примерно в трех четвертях случаев и улучшила их в одной пятой, причем подготовка тестовой среды занимала часы, а не недели.
Новый сервис строит целые кодовые базы, тогда как AlphaTensor (2022) и FunSearch (2023) генерировали отдельные функции. Эксперты считают, что комбинирование эволюционного поиска с LLM-творчеством выводит алгоритмическое проектирование на новый уровень.
Команда Google готовит интерфейс совместно с People + AI Research и запускает также отдельную программу для академических групп. Потенциальные применения агента широко — от оптимизации GPU-инструкций и энергетики до материаловедения и фармдизайна. Ограничение для задач одно: задача должна иметь формализуемый критерий оценки, иначе агенту не с чем «сравнивать» мутации.
Читать на dev.by