Google представила новую модель ИИ для редактирования изображений «Gemini 2.5 Flash Image», которая уже доступна пользователям в приложении Gemini, а также разработчикам через Gemini API, Google AI Studio и Vertex AI. Эта модель позволяет гораздо точнее изменять фото по текстовым запросам, сохраняя при этом узнаваемость людей, животных и деталей, что часто вызывает трудности у конкурентов. Например, пользователи могут изменять цвета одежды или комбинировать несколько объектов на фото, и результат выглядит естественно — без искаженных лиц или фона.
Уникальной особенностью «Gemini 2.5 Flash Image» стала стабильность персонажей: модель способна сохранять одинаковый вид человека или предмета в разных сценах, независимо от изменения поз, освещения или окружения. Это открывает возможности для создания серий изображений или каталогов товаров, где важна последовательность и узнаваемость.
Google подчеркивает, что модель работает с «многоуровневыми» диалогами, позволяя пользователям поэтапно вносить изменения и уточнять запросы к ИИ. Среди других функций — комбинирование нескольких фото, перенос стиля или текстуры с одного объекта на другой, а также создание сложных композиций на основе текстовых подсказок.
Для безопасности Google добавила к каждому сгенерированному изображению как видимый водяной знак, так и цифровой маркер SynthID в метаданных, чтобы усложнить распространение фейковых фото. В компании подчеркивают, что модели ограничивают создание запрещенных изображений, и пользователи получают больше контроля над творческим процессом, но не могут нарушать правила платформы.