ByteDance анонсировала SeedEdit — новую модель для редактирования изображений по текстовым запросам. Она позволяет проводить высококачественные изменения, включая локальные замены, геометрические трансформации и стилистические коррекции.
SeedEdit создано на основе диффузионной модели, которая объединяет генерацию изображений с их точным редактированием. В ByteDance отмечают, что новый подход к редактированию обеспечивает «стабильное редактирование высококачественных изображений даже без предварительной подготовки». Технология поддерживает последовательные ревизии изображений, сохраняя их эстетическую привлекательность.
Основная сложность разработки заключалась в отсутствии парных данных для обучения. Команда решила эту проблему, интегрировав текстово-изображательные модели как базовый уровень редактирования. Далее модели были адаптированы для точного выполнения инструкций по редактированию.
SeedEdit демонстрирует способность выполнять задачи любой сложности — от изменения стиля до добавления фантастических элементов. Среди примеров: замена объектов, настройка освещения, трансформация пейзажей.