«Суперагент» Google создаёт тысячи вариантов кода, чтобы выбрать лучший

Подразделение DeepMind объявило о запуске AlphaEvolve — эволюционного «суперагента» на базе семейства языковых моделей Gemini 2.0. Сервис способен генерировать и проверять десятки тысяч вариантов кода, пока не найдет алгоритм, превосходящий человеческие решения.

Оставить комментарий

AlphaEvolve объединяет две версии Gemini: быструю Flash для массовой генерации идей и более «глубокую» Pro для точечных улучшений. Каждый фрагмент кода автоматически компилируется, запускается и оценивается по метрикам точности, скорости и ресурсопотребления; лучшие варианты «скрещиваются» и дорабатываются в следующих поколениях.

За год внутреннего тестирования AlphaEvolve уже выдал эвристический планировщик для Borg, который непрерывно «освобождает» в среднем 0,7% общей вычислительной мощности Google-облака. Он также переписал участок схемы TPU-чипа, убрав лишние биты, и ускорил ключевое ядро матричного умножения в обучении Gemini на 23%, что сократило общее время тренировки моделей на 1%.

AlphaEvolve сумел сократить число действий при умножении двух 4 × 4 комплексных матриц с 49 до 48, побив рекорд, державшийся 56 лет, и нашла еще более быстрые алгоритмы для тринадцати других размеров матриц. В целом, проверив свыше 50 классических головоломок, AlphaEvolve воспроизвела лучшие известные решения примерно в трех четвертях случаев и улучшила их в одной пятой, причем подготовка тестовой среды занимала часы, а не недели.

Новый сервис строит целые кодовые базы, тогда как AlphaTensor (2022) и FunSearch (2023) генерировали отдельные функции. Эксперты считают, что комбинирование эволюционного поиска с LLM-творчеством выводит алгоритмическое проектирование на новый уровень.

Команда Google готовит интерфейс совместно с People + AI Research и запускает также отдельную программу для академических групп. Потенциальные применения агента широко — от оптимизации GPU-инструкций и энергетики до материаловедения и фармдизайна. Ограничение для задач одно: задача должна иметь формализуемый критерий оценки, иначе агенту не с чем «сравнивать» мутации.

Google прокачала Gemini в кодинге и веб-разработке
По теме
Google прокачала Gemini в кодинге и веб-разработке
Amazon готовит ИИ-помощника для сверхбыстрого кодинга
По теме
Amazon готовит ИИ-помощника для сверхбыстрого кодинга
Больше, чем код: дни «разработчиков» в старом понимании сочтены
По теме
Больше, чем код: дни «разработчиков» в старом понимании сочтены

Читать на dev.by