Google представила новый инструмент генеративного ИИ под названием Whisk, который позволяет создавать изображения с помощью визуальных подсказок вместо текстовых описаний. Пользователи могут загружать изображения, определяющие сюжет, сцену или стиль, а Whisk комбинирует эти элементы для создания уникальных визуализаций.
Whisk работает на основе модели генерации изображений Imagen 3, что позволяет быстро создавать изображения. Google подчеркивает, что Whisk предназначен для «быстрого визуального исследования, а не для точного редактирования пикселей». Пользователи могут модифицировать начальные подсказки, если результаты не соответствуют их ожиданиям.
В блоге Google подчеркивается, что Whisk не всегда может точно воспроизводить желаемые характеристики, поэтому пользователи имеют возможность просматривать и редактировать подсказки для улучшения результатов. В настоящее время инструмент доступен только в США через Google Labs, что позволяет компании собирать отзывы пользователей для совершенствования технологий генеративного ИИ.