Компания ByteDance, известная как владелец TikTok, представила новую систему генеративного ИИ под названием OmniHuman-1, способную создавать невероятно реалистичные видео-дипфейки. В отличие от многих других систем, которые часто оставляют очевидные следы вмешательства ИИ, OmniHuman-1 поражает своей способностью избегать моторошной долины. В демонстрационных видео, опубликованных командой ByteDance, можно увидеть вымышленные выступления известных личностей, таких как Тейлор Свифт или Альберт Эйнштейн.
OmniHuman-1 требует всего одного изображения и аудио, чтобы создать видео любой продолжительности. Можно настроить соотношение сторон видео, а также пропорции тела субъекта. Модель была обучена на 19 тысячах часов видеоконтента из неизвестных источников. Она даже может редактировать существующие видео, изменяя движения конечностей людей. Это впечатляющий шаг вперед в мире дипфейков.
Однако система не лишена недостатков. ByteDance отмечает, что «низкокачественные» изображения не дают лучших результатов, а некоторые позы могут быть проблематичными для модели.
Быстрое развитие дипфейков вызывает беспокойство. В прошлом году политические дипфейки распространялись по всему миру, включая случаи в Тайване, Молдове и Южной Африке. Дипфейки также используются для финансовых преступлений, обманывая потребителей и компании. По данным Deloitte, в 2023 году ИИ сгенерировал более 12 миллиардов долларов убытков из-за мошенничества, и эта сумма может вырасти до 40 миллиардов долларов в США к 2027 году.
Увеличение количества дипфейков усложняет их выявление, и большинство людей беспокоятся о возможности быть обманутыми. Хотя некоторые социальные сети и поисковые системы пытаются ограничить их распространение, объем контента, созданного ИИ, продолжает расти.