Лаборатория Tongyi от Alibaba представила Z-Image-Turbo — новую открытую модель генерации изображений, которая работает без ограничений и создает реалистичные картинки уже на видеокартах с 6 ГБ памяти. Пользователи могут запускать ее локально даже на ноутбуках с RTX 2060 и получать изображения за полминуты. Модель не имеет цензуры, поэтому способна генерировать любой контент, включая портреты известных людей и вымышленных персонажей.

Z-Image-Turbo имеет 6 миллиардов параметров и использует архитектуру S3-DiT, что позволяет объединять текстовые и визуальные данные для максимальной эффективности. Она точно воспроизводит сложные сцены, детализирует кожу, волосы и пропорции тел, а также демонстрирует высокий уровень понимания стиля и пространственных отношений. Модель выполняет инструкции пользователей и почти не допускает ошибок в сложных композициях.
Отдельным преимуществом является качество генерации текста на изображениях на английском и китайском языках. Z-Image-Turbo уверенно работает с надписями, что ранее было проблемой для других открытых моделей. Пользователи отмечают, что подсказки на китайском языке дают еще лучшие результаты, а функция «prompt enhancer» помогает получить желаемое изображение.
Модель быстро набрала популярность среди сообщества: на платформе Civitai уже доступно более 200 дополнительных ресурсов и тысячи положительных отзывов. Разработчики также анонсировали две новые версии — Z-Image-Base для доработки и Z-Image-Edit для редактирования изображений по текстовым инструкциям, которые появятся в ближайшее время.
Z-Image-Turbo уже доступна для загрузки и использования , и многие энтузиасты ИИ отмечают ее как лучшее решение для генерации реалистичных изображений на обычных домашних компьютерах.

