Отчеты Surfshark привлекают внимание к тому, сколько личной информации собирают современные генеративные ИИ-чат-боты. Эксперты компании проанализировали десять самых популярных приложений, среди которых ChatGPT, Meta AI, Google Gemini, Copilot, DeepSeek, Poe, Claude, Jasper, Perplexity и Pi, и обнаружили — каждая модель аккумулирует определенный объем данных пользователей.
Абсолютным лидером по объему собранной информации стала модель Meta AI — она фиксирует тридцать два из тридцати пяти возможных типов данных. В список попали даже такие чувствительные категории, как финансовая информация, данные о здоровье и личные убеждения. Именно Meta AI и Copilot используют данные, связанные с идентификацией пользователя, для демонстрации рекламы третьих сторон, при этом Meta AI может привлекать к этому до двадцати четырех разновидностей данных.

Google Gemini оказалась на втором месте — она собирает двадцать два типа данных, включая точное местоположение, контактную информацию, историю поисков и список контактов пользователя. Poe, Claude и Copilot также вошли в пятерку, но их аппетиты заметно скромнее — от двенадцати до четырнадцати типов данных. При этом Poe и Copilot находятся среди тех моделей, которые могут отслеживать пользователя через идентификаторы устройств и передавать эти данные брокерам или использовать для таргетированной рекламы.
Стоит отметить DeepSeek — эту китайскую модель часто хвалят за производительность, но Surfshark обращает внимание на риски: данные пользователей хранятся на серверах в Китае и могут быть переданы China Mobile, компании под контролем правительства. К тому же DeepSeek уже сталкивалась с утечкой более миллиона записей истории чатов и ключей API.
ChatGPT собирает десять типов данных, но не отслеживает пользователей и не использует рекламу третьих сторон. Для тех, кто ценит конфиденциальность, модель предлагает временные чаты с автоматическим удалением информации через тридцать дней и возможность запретить использование личных данных для обучения. Другие модели, такие как Grok, Pi и Jasper, собирают от пяти до семи типов данных, но даже они могут привлекать информацию для рекламы или передачи брокерам.