Google DeepMind представила SIMA 2 — новое поколение универсального ИИ-агента, который объединяет языковые и логические возможности модели Gemini. SIMA 2 обучается не только выполнять команды, но и понимать окружение и взаимодействовать с ним в виртуальных мирах. В отличие от первой версии, которая могла выполнять простые задачи в видеоиграх, SIMA 2 демонстрирует вдвое лучшие результаты в сложных задачах и самостоятельно совершенствует свои навыки на основе собственного опыта.
Модель SIMA 2 работает на базе Gemini 2.5 flash-lite и может выполнять задачи в новых игровых средах, даже если ранее с ними не сталкивалась. Во время демонстрации в игре «No Man’s Sky» агент описывал окружающий мир, определял следующие действия и находил объекты для взаимодействия. Кроме того, SIMA 2 способна понимать абстрактные подсказки, например, с помощью эмодзи, и объяснять свои решения во время выполнения задач.
Среди новых возможностей — самообучение без большого количества человеческих данных. SIMA 2 получает начальные знания из игровых данных, а затем создает для себя новые задачи и оценивает результаты с помощью дополнительных моделей Gemini. Это позволяет агенту учиться на собственных ошибках и постепенно улучшать поведение в виртуальных мирах.
DeepMind рассматривает SIMA 2 как шаг к созданию универсальных роботов и систем, которые смогут выполнять разнообразные задачи в реальном мире. Хотя компания пока не назвала сроки внедрения SIMA 2 в физическую робототехнику, сейчас эта модель доступна для исследователей и разработчиков в формате ограниченного предварительного просмотра.

