В начале апреля один из пользователей Hugging Face, под ником nyuuzyou, выложил на платформе массив из 12,6 миллиона фанфиков, которые были собраны с платформы Archive of Our Own (AO3) без ведома и разрешения авторов. Это вызвало волну возмущения в фанатском сообществе, которое быстро создало специальный поисковик для выявления украденных произведений.
Фанфикшен давно живет по принципу подарочной экономики — авторы не получают прибыли и делятся своими произведениями лишь для удовольствия читателей. Многие из них видят в использовании их историй для обучения ИИ нарушение этических норм и прямую кражу. Возмущение усилили и предыдущие попытки компаний заработать на фанфиках — например, когда Speechify загрузил тысячи фанфиков на свой сайт без разрешения, или когда приложение Lore.fm рекламировалось как «Audible для AO3» и было вынуждено закрыться после протестов.
После выявления большого утечки фанфиков фанаты организовали онлайн-кампанию по подаче жалоб по DMCA, к которой присоединилась и некоммерческая организация Organization for Transformative Works, управляющая AO3. 9 апреля Hugging Face удалил датасет, а AO3 усилил защиту от автоматического сбора данных, хотя и признал, что идеального решения пока нет. Однако nyuuzyou остался непоколебимым и повторно выложил датасет на зарубежных серверах, несмотря на возмущение сообщества.
Сам nyuuzyou заявил, что действовал с исследовательской целью и не интересуется фанфиком, а его цель — поддержка разработки инструментов для модерации контента и сохранения архивов. Однако многие авторы и эксперты сомневаются в искренности таких объяснений и считают, что подобные массивы неизбежно используют для обучения языковых моделей без согласия создателей контента.
Фанфик-авторы не сдаются и продолжают бороться с проникновением ИИ в их сообщество. Они убеждены, что их творчество не должно становиться ресурсом для автоматических систем и используют любые доступные способы, чтобы защитить свои работы от несанкционированного использования.