Alibaba представила новую ИИ-модель для работы с изображениями под названием Z-Image. Она имеет размер шесть миллиардов параметров и подходит для запуска на локальных устройствах. Модель поддерживает создание изображений с разрешением до 2K, а также позволяет выполнять сложное редактирование с помощью текстовых команд. Протестировать новую модель можно здесь .

Одной из ключевых возможностей Z-Image является функция «Prompt Enhancer», которая помогает модели лучше понимать сложные или нечеткие инструкции пользователя. Модель демонстрирует фотореализм, хорошо передает естественное освещение, текстуру кожи, глубину резкости и баланс цветов. Она может одновременно изменять выражение лица, окружающую среду и освещение, сохраняя целостность изображения.
Z-Image имеет глубокое семантическое и культурное понимание. Модель знает о достопримечательностях, людях, праздниках, поэзии и других понятиях, что позволяет ей создавать изображения с учетом культурного контекста. Для редактирования изображений доступна функция «Z-Image-Edit», которая поддерживает сложные текстовые команды.
По результатам оценки Elo Human Preference Assessment на платформе AI Arena, Z-Image показывает высокую конкурентоспособность среди открытых моделей изображений. Модель потребляет лишь треть вычислительных ресурсов, по сравнению с международными бизнес-моделями, и обеспечивает схожее качество визуального контента.

