DeepMind, исследовательская лаборатория Google в области ИИ, представила новую систему под названием «AlphaEvolve», которая помогает решать задачи с так называемыми «машинно-оцениваемыми» ответами. По словам компании, система уже продемонстрировала эффективность при оптимизации инфраструктуры, которую Google использует для обучения собственных моделей ИИ. В настоящее время команда разрабатывает интерфейс для взаимодействия с «AlphaEvolve» и планирует запустить программу раннего доступа для отдельных ученых, прежде чем расширить доступ для широкой аудитории.
Ключевая особенность «AlphaEvolve» — автоматическая система оценки ответов, которая позволяет уменьшить количество ошибочных ответов, часто встречающихся в современных ИИ-моделях. Система генерирует несколько вариантов ответов, самостоятельно их анализирует и отбирает наиболее точные. Для работы пользователь должен сформулировать задачу и предоставить механизм автоматической проверки решений, например формулу.
«AlphaEvolve» лучше всего подходит для задач, которые можно оценить автоматически — в частности в областях компьютерных наук и оптимизации систем. В то же время, система может описывать решения только в виде алгоритмов, поэтому не подходит для задач, которые не имеют числового характера.
В тестах DeepMind система решила около пятидесяти математических задач, воспроизведя лучшие известные решения в трех четвертях случаев и предложив улучшения в каждой пятой задаче. На практике «AlphaEvolve» помогла повысить эффективность дата-центров Google, восстанавливая в среднем ноль целых семь десятых процента вычислительных ресурсов, а также сократила время обучения моделей Gemini на один процент.