Google DeepMind представила Genie 3 , новую систему ИИ, которая превращает короткое текстовое описание или изображение в интерактивную 3D или 2D игровую среду с графикой 720p при 24 кадрах в секунду. Пользователь может исследовать сгенерированную сцену несколько минут подряд, что значительно превышает ограничения предыдущей версии Genie 2. Система позволяет программировать «события по запросу», благодаря чему можно изменять погоду или добавлять новые объекты во время игры без перезапуска среды.
Используя клавиатуру, пользователь управляет персонажем в симулированном пространстве, а модель поддерживает стабильность и детализацию визуальной памяти в течение примерно минуты. Genie 3 работает на основе наработок предыдущих моделей и использует современные методы видеогенерации из семейства Veo. Платформа уже служит испытательным полигоном для тренировки агентов ИИ, которые могут выполнять многократные задачи в сложных виртуальных пространствах.
Доступ к Genie 3 открыт в формате исследовательского предварительного просмотра по приглашениям. К тестированию привлекают ученых и цифровых творцов, чтобы собрать отзывы и предложения по безопасности перед более широким запуском. Первые участники отмечают значительно более длительное время игры и стабильную геометрию, но обращают внимание на упрощенную физику и ограниченное меню действий по сравнению с классическими игровыми движками.
DeepMind позиционирует Genie 3 как часть стратегии «мир как симулятор», которая дополняет другие продукты компании, в частности AlphaZero и Gemini. По словам разработчиков, генерация сред на запрос без ручного создания активов может уменьшить затраты на данные и оборудование, а также ускорить развитие общего искусственного интеллекта.