Google готовится представить новые генеративные модели для создания изображений и видео — Veo 3 и Imagen 4. Их выход ожидается в конце мая, вероятно, во время ежегодной конференции разработчиков I/O. Появились упоминания о версиях «veo-3.0-generate-preview», «imagen-4.0-generate-preview-05-20» и «imagen-4.0-ultra-generate-exp-05-20», что свидетельствует о постепенном внедрении и нескольких уровнях возможностей для различных задач.
Veo останется направлением для генерации видео, а Imagen — для создания фотореалистичных и стилизованных изображений. Обозначения «preview» и «ultra» в названиях моделей указывают на различные варианты производительности, которые могут быть ориентированы на творческие, коммерческие или исследовательские нужды пользователей.
Ожидается, что Imagen 3.5 и Veo 3 также станут доступными для раннего тестирования через Google Labs. Предыдущие версии этих моделей уже использовались для генерации медиаконтента в таких продуктах, как NotebookLM и Gemini, что позволяет пользователям легко переходить от текста к изображениям и видео в единой среде.
Официальные подробности о новых функциях пока ограничены, но переход к четвертой версии Imagen и третьей версии Veo свидетельствует о росте качества, лучшей целостности генерируемых последовательностей и расширении возможностей для работы с различными типами контента.