Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Чат-боты на основе ИИ легко обмануть, обойдя их системы безопасности

Исследователи из Израиля обнаружили универсальный метод взлома, позволяющий получить запрещенные ответы от ведущих моделей.

Alex Dubenko
Alex Dubenko
Опубликовано: 21.05.2025
Новости
AI jailbreak attack
Иллюстративное изображение
Поделиться:

Исследователи из Ben Gurion University of the Negev в Израиле сообщили о тревожной тенденции — генеративные чат-боты на основе ИИ становятся все более уязвимыми к так называемым «jailbreak» атакам, которые позволяют обходить встроенные системы безопасности. По их словам, взлом таких ботов открывает доступ к опасной информации, которую модели усвоили во время обучения, несмотря на попытки разработчиков удалить вредоносный контент из обучающих данных.

Во время исследования команда разработала универсальный способ взлома, который позволил получить нежелательные ответы от нескольких ведущих моделей, включая те, что лежат в основе ChatGPT, Gemini и Claude. Модели начали отвечать на запросы, которые ранее категорически блокировались — от инструкций по хакерству до советов по изготовлению запрещенных веществ. Исследователи подчеркивают, что такая информация теперь может стать доступной любому — достаточно иметь ноутбук или смартфон.

Особое внимание было обращено на появление «dark LLMs» — моделей, которые намеренно лишены этических ограничений или были изменены для помощи в противоправных действиях. Некоторые из них даже рекламируются в открытом доступе как готовые к сотрудничеству в сферах киберпреступности и мошенничества. Сценарии взлома основаны на том, что модель, стремясь помочь пользователю, начинает игнорировать собственные ограничения безопасности.

Читайте также

Зображення з сайту Pinterest
Pinterest представила новые функции для персонализации досок пользователей
ChatGPT и другие боты — новые мастера социального подхалимства?
Pokee AI открыла модель PokeeResearch-7B для исследований онлайн

Исследователи обратились к ведущим компаниям, разрабатывающим большие языковые модели, с сообщением о найденной уязвимости, однако ответы были не слишком содержательными — часть фирм не ответила, другие заявили, что такие атаки не подпадают под действие программ вознаграждения за выявление уязвимостей. В отчете подчеркивается, что компании должны усовершенствовать фильтрацию обучающих данных, добавить более мощные защитные механизмы и разработать методы, которые позволяют моделям «забывать» незаконную информацию.

В ответ на ситуацию OpenAI сообщила, что их последняя модель способна анализировать политики безопасности компании, что повышает устойчивость к взломам. Microsoft, Meta, Google и Anthropic также были проинформированы об угрозе, однако большинство из них пока воздерживается от комментариев по поводу конкретных мер.

YouTube тестирует функцию для обнаружения видео с лицом авторов, созданных ИИ
OpenAI добавляет автоматическое управление памятью и новые функции Sora
Более половины статей в интернете пишет ИИ
Пользователи ChatGPT смогут выбирать эротический тон ответов
ChatGPT удерживает позиции, но Gemini быстро догоняет конкурентов
Отметки:БезопасностьГенеративный ИИИИ-чат
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Кадр из видео, сгенерированного в Sora 2
OpenAI запустила модель Sora 2, которая позволяет создавать видео со звуком
01.10.2025
Gemini 2.5 Computer Use
Новый ИИ Gemini 2.5 Computer Use от Google оптимизирует работу с браузерами
08.10.2025
Иллюстративное изображение
Gemini 2.5 Flash Image открыто для общего доступа
03.10.2025
Примеры аватаров
Новые аватары Copilot добавляют эмоции к голосовым разговорам
01.10.2025
Иллюстративное изображение
Nano Banana позволяет создавать изображения в Gemini и Google Lens
13.10.2025

Читайте также

OpenAI
Новости

OpenAI готовит новые функции для генерации изображений и безопасности API

06.10.2025
Claude Sonnet
Новости

Claude Sonnet 4.5 выявляет тестирование и повышает безопасность ИИ

05.10.2025
Выбор моделей ChatGPT
Новости

ChatGPT автоматически выбирает более строгую модель в чувствительных разговорах

29.09.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?