Google DeepMind представила новую версию генеративного ИИ для создания видео — Veo 2. Эта версия является преемником Veo и может создавать видеоролики продолжительностью более двух минут в разрешении до 4k. Это в четыре раза больше разрешение и в шесть раз длиннее, чем у Sora от OpenAI. Однако в экспериментальном инструменте VideoFX, где Veo 2 в настоящее время доступен, видео ограничены 720p и девятью секундами.
По словам вице-президента по продуктам DeepMind Эли Коллинза, компания планирует постепенно расширять доступ к VideoFX и интегрировать Veo 2 в платформу разработчиков Vertex AI. «В ближайшие месяцы мы продолжим совершенствовать модель на основе отзывов пользователей», — отметил Коллинз.
Veo 2 может создавать видео на основе текстовых подсказок или комбинации текста и изображений. В новой версии улучшено понимание физики и управление камерой, а также повышена четкость изображений. Veo 2 способен реалистично моделировать движение, динамику жидкостей и свойства света. Однако модель все еще имеет проблемы с согласованностью персонажей и деталями.
DeepMind продолжает сотрудничать с художниками и продюсерами, включая Дональда Гловера и The Weeknd, для совершенствования моделей генерации видео. «Мы с нетерпением ждем работы с проверенными тестировщиками и творцами, чтобы получить обратную связь», — заявил Коллинз.
Для повышения безопасности DeepMind использует технологию водяных знаков SynthID, чтобы встраивать невидимые маркеры в кадры, сгенерированные Veo 2. В то же время Google объявила об обновлении модели генерации изображений Imagen 3, которая теперь может создавать более яркие и детализированные изображения в различных стилях.