Как мы уже сообщали, кажется, OpenAI готовит к выпуску новые модели генерации изображений.
Честно говоря, несмотря на то что текущая модель, используемая в ChatGPT, появилась совсем недавно и быстро стала популярной, сегодня она уже выглядит немного устаревшей. Конкуренты не спят и чуть ли не каждую неделю выпускают что-то новенькое — с новыми фичами, улучшенной передачей цветов и общей качеством визуала.
Поэтому потенциальное появление следующего поколения моделей — безусловно хорошая новость. Если, конечно, информация подтвердится. Сейчас нет точных данных, являются ли эти неизвестные модели именно Image-2 и Image-2-mini, но все указывает именно на это.
Пока что протестировать их можно только на онлайн-аренах. И это не слишком удобно — приходится запускать сравнение с другими моделями снова и снова, надеясь, что среди кандидатов выпадут именно новые. Однако я попробовал.
И вот что получилось:






Первые впечатления такие:
Визуал стал заметно разнообразнее. Текущая модель часто добавляет всем известный желтоватый «старый» оттенок и узнаваемый стиль. Вместо этого новые результаты выглядят гораздо разнообразнее — словно модель отказалась от шаблонности и позволяет больше вариативности.
Также изменилась детализация. Буквально все утопает в мелких элементах, текстурах и нюансах — иногда даже перебор, но это лучше, чем обратное.
Часто встречается размытый фон или легкое смазывание объекта в движении. Возможно, таким образом модель пытается добавить реалистичности и «камерности» кадру.
Еще одна интересная деталь — некоторые изображения напоминают доработанный DALL-E с более зрелым рендерингом и более чистой структурой.
Конечно, до официального релиза многое может измениться, так что будем следить, как будет развиваться ситуация. Но уже сейчас видно, что это потенциально большой шаг вперед. И, возможно, именно тот апгрейд, который OpenAI давно был должен своей экосистеме.

