Google запускает Gemini 2.5 Flash Image для точного редактирования фото

Google представила новую модель ИИ для редактирования изображений «Gemini 2.5 Flash Image», которая уже доступна пользователям в приложении Gemini, а также разработчикам через Gemini API, Google AI Studio и Vertex AI. Эта модель позволяет гораздо точнее изменять фото по текстовым запросам, сохраняя при этом узнаваемость людей, животных и деталей, что часто вызывает трудности у конкурентов. Например, пользователи могут изменять цвета одежды или комбинировать несколько объектов на фото, и результат выглядит естественно — без искаженных лиц или фона.

Уникальной особенностью «Gemini 2.5 Flash Image» стала стабильность персонажей: модель способна сохранять одинаковый вид человека или предмета в разных сценах, независимо от изменения поз, освещения или окружения. Это открывает возможности для создания серий изображений или каталогов товаров, где важна последовательность и узнаваемость.

Google подчеркивает, что модель работает с «многоуровневыми» диалогами, позволяя пользователям поэтапно вносить изменения и уточнять запросы к ИИ. Среди других функций — комбинирование нескольких фото, перенос стиля или текстуры с одного объекта на другой, а также создание сложных композиций на основе текстовых подсказок.

Для безопасности Google добавила к каждому сгенерированному изображению как видимый водяной знак, так и цифровой маркер SynthID в метаданных, чтобы усложнить распространение фейковых фото. В компании подчеркивают, что модели ограничивают создание запрещенных изображений, и пользователи получают больше контроля над творческим процессом, но не могут нарушать правила платформы.

Google запускает Gemini 2.5 Flash Image для точного редактирования фото

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Навигация

Полезное

Читайте также

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Читайте также

OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования

Adobe Firefly получил текстовый видеоредактор и новые модели ИИ

Google Gemini добавляет визуальные материалы к Deep Research

Прокачайся с AI!