OpenAI объявила о запуске возможности генерации изображений на базе модели «gpt-image-1» через API, что позволяет разработчикам интегрировать функцию в собственные приложения и сервисы. Эта же модель уже доступна в ChatGPT и получила популярность благодаря созданию изображений в стиле Studio Ghibli и разнообразных «AI action figures». По данным компании, более ста тридцати миллионов пользователей ChatGPT создали более семисот миллионов изображений всего за первую неделю работы этой функции.
Модель «gpt-image-1» позволяет создавать изображения в различных стилях, следовать заданным инструкциям, использовать знания о мире и точно воспроизводить текст. Разработчики могут генерировать сразу несколько изображений, выбирать качество, а соответственно — и скорость получения результата. Модель использует те же самые средства безопасности, что и в ChatGPT, включая защиту от создания нежелательного контента. Можно настроить чувствительность модерации — стандартный фильтр или менее строгий режим для ограниченного круга категорий контента.
Все изображения, созданные с помощью этой модели, содержат водяные знаки в виде C2PA-метаданных, что позволяет платформам и приложениям определять, что изображение сгенерировано ИИ. Стоимость использования модели составляет пять долларов за миллион входных токенов для текста, десять долларов — для изображений, и сорок долларов за миллион выходных токенов для изображений. По подсчетам OpenAI, это примерно два, семь и девятнадцать центов за одно изображение низкого, среднего и высокого качества соответственно.
Уже сейчас такие компании, как Adobe, Figma, Canva, Wix, Instacart и GoDaddy, используют или тестируют интеграцию «gpt-image-1» в своих продуктах. Например, в Figma Design пользователи могут генерировать и редактировать изображения с помощью простых подсказок, изменять стили, добавлять или удалять объекты, расширять фоны и т.д. Adobe предоставляет доступ к этой функции в своих приложениях Firefly и Express, что позволяет пользователям экспериментировать с различными стилями для создания креативных идей.