Компания Alibaba представила обновлённую открытую ИИ-модель Qwen-Image версии 2512. По результатам слепых тестирований на платформе AI Arena, эта модель стала лидером среди открытых решений в своём классе. Qwen-Image получила улучшения в воспроизведении фотореалистичных лиц, а также в создании текста и данных без заметных артефактов.
Модель умеет рисовать сложные диаграммы, постеры и презентационные слайды, точно воспроизводя буквы. Она распознаёт детально сформулированные запросы с множеством параметров и точно выполняет указанную композицию. Пользователи могут бесплатно протестировать Qwen-Image в чате с Qwen .
Для запуска модели в графическом интерфейсе ComfyUI теперь требуется всего 14 ГБ видеопамяти. Разработчики подготовили подробный гайд и предоставили GGUF-веса для работы с моделью. Демо-версия модели доступна на платформе HuggingFace.

