Tencent представила упрощенную версию своей генеративной ИИ Hunyuan World Model 1.0 под названием «1.0-Lite». Новая модель работает быстрее и потребляет примерно на 35 процентов меньше видеопамяти, чем оригинальная версия. Для запуска «1.0-Lite» требуется менее 17 гигабайт графической памяти, что позволяет использовать её на обычных потребительских видеокартах.
Как и основная версия, «1.0-Lite» доступна с открытым кодом и распространяется через GitHub, Hugging Face и интерактивную демоверсию sceneTo3D. Пользователи могут ознакомиться с техническим описанием модели на arxiv.org. Модель предназначена для создания 3D-сцен из текстовых или визуальных подсказок, поддерживает панорамное изображение и иерархическую 3D-реконструкцию.
Hunyuan World Model 1.0 позволяет отдельно редактировать объекты в сцене, например, перемещать транспорт, деревья или мебель. Отдельно выделена «небесная сфера», которую можно использовать как источник динамического освещения для реалистичного рендеринга. Модель поддерживает два основных типа ввода — «text-to-world» и «image-to-world», а созданные сцены можно экспортировать в формате mesh для дальнейшей работы в стандартных 3D-средах.
Готовые сцены — это интерактивные 360-градусные панорамы, в которых можно осматриваться и перемещаться в определенных пределах. Для более широких возможностей камерного движения или более длительных 3D-видео требуется дополнительный модуль Voyager. Разработчики отмечают, что модель подходит для работы с игровыми движками, VR-платформами и другими инструментами создания виртуального контента.
Кроме Hunyuan World Model 1.0, Tencent открыла доступ к Hunyuan3D 2.0 для генерации текстурированных 3D-моделей, HunyuanVideo для создания видео с помощью ИИ, а также языковой модели Hunyuan-A13B с динамическим мышлением.