Google представила обновление для своей ИИ-модели Veo 3, которое позволяет создавать видео продолжительностью до восьми секунд из одного статичного изображения. Теперь пользователи могут генерировать видеоклипы с добавлением ИИ-сгенерированного аудио, включая фоновые звуки и даже фразы, которые произносит персонаж в видео. Функция уже доступна в режиме «preview offering» через Google Cloud и работает для всех клиентов и партнеров в Vertex AI Media Studio в 159 странах.
Новую возможность можно использовать для создания коротких видеороликов из изображений людей или продуктов, в частности для соцсетей или рекламы. Например, инфлюенсер может загрузить собственное фото и получить клип, где её ИИ-копия шагает по подиуму в брендовой одежде. Бренды могут отправить изображение товара и получить ролик, который демонстрирует продукт с разных ракурсов и с сопровождающим аудио.
Veo 3 презентовали в мае на конференции Google I/O. Модель сразу привлекла внимание благодаря сочетанию видео и аудио, а также способности воспроизводить реалистичную физику движения. Google продолжает активно развивать это направление, и недавно Демис Хассабис из Google DeepMind намекнул, что Veo 3 могут использовать для создания виртуальных миров в видеоиграх.
Вместе с новыми возможностями Veo 3 появились вопросы о источниках учебных данных модели, поскольку Хассабис заявил, что для этого могли использоваться видео с YouTube. Некоторые представители индустрии обеспокоены риском распространения дезинформации и нарушением авторских прав.