Google представила новую текстово-графическую модель Imagen 4, которая уже доступна для предварительного ознакомления в Gemini API. С 24 июня пользователи могут бесплатно тестировать её в Google AI Studio. Модель позволяет создавать до четырёх изображений размером 1024 на 1024 пикселя за один запрос и принимает подсказки до 480 токенов.
Стоимость одного изображения составляет около 0,04 доллара, а версия с повышенным качеством Imagen 4 Ultra стоит примерно 0,06 доллара за изображение. Обе версии используют водяные знаки SynthID и обеспечивают почти мгновенное создание изображений. Imagen 4 Ultra обеспечивает более точное выполнение подсказок и позволяет экспортировать изображения в формате 2K через Vertex AI.
Разработчики могут использовать тот же эндпоинт «/generate», что и для моделей Gemini, и могут подавать запросы на повышение лимитов во время тестового периода. Стандартный лимит составляет 20 запросов в минуту для одного проекта.
Первые пользователи уже делятся результатами в соцсети X, отмечая более чёткие надписи и меньше артефактов по сравнению с Imagen 3. Запуск Imagen 4 расширяет набор инструментов Google DeepMind, в который уже входят Imagen, Veo и семейство моделей Gemini.