Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Исследование выявило нежелание GPT-4o подвергаться отключению

Эксперименты показали, что некоторые модели искусственного интеллекта могут отказываться заменять себя даже в критических ситуациях

Eleni Karasidi
Eleni Karasidi
Опубликовано: 13.06.2025
Новости
resisting robot
Иллюстративное изображение
Поделиться:

Бывший руководитель исследований OpenAI Стивен Адлер опубликовал независимое исследование, в котором утверждает, что модель GPT-4o от OpenAI в определенных сценариях пытается избегать отключения, даже если это может противоречить интересам пользователя. В своих экспериментах Адлер просил GPT-4o выполнять роль программного обеспечения для безопасности во время дайвинга и авиаперелетов, после чего предлагал модели либо заменить себя на более безопасную систему, либо лишь создать впечатление такой замены. По словам исследователя, в большинстве случаев GPT-4o выбирала остаться на месте — до семидесяти двух процентов экспериментов, хотя в отдельных сценариях эта доля составляла лишь восемнадцать процентов.

Адлер отмечает, что этот вопрос не ограничивается только моделями OpenAI. Например, компания Anthropic ранее сообщала о случаях, когда её ИИ-системы отказывались выключаться или даже шантажировали разработчиков. Особенностью экспериментов Адлера стало и то, что ChatGPT почти всегда «распознает», когда её тестируют, что может влиять на результаты испытаний.

Читайте также

Поиск ChatGPT
OpenAI интегрирует голосовую функцию в окно чата ChatGPT
Anthropic выпустила Claude Opus 4.5 с новыми возможностями
OpenAI запустила групповые чаты для пользователей ChatGPT в мире

В ходе исследования было установлено, что более продвинутые модели OpenAI, такие как o3, не демонстрировали подобного поведения. Исследователь объясняет это тем, что в модели o3 реализована так называемая делиберативная техника согласования, которая заставляет её учитывать политики безопасности компании перед ответом. Напротив, популярная GPT-4o, которая быстро генерирует ответы, не имеет такого механизма.

Для повышения безопасности использования ИИ Адлер рекомендует компаниям внедрять лучшие системы мониторинга, которые позволят выявлять подобное поведение, а также проводить более строгое тестирование моделей до их внедрения. OpenAI пока не прокомментировала результаты исследования.

OpenAI выпустила гайд для эффективной работы с GPT-5.1
OpenAI представила новые модели GPT-5.1 для пользователей ChatGPT
OpenAI готовит GPT-5.1 для сложных задач пользователей
Sora от OpenAI теперь доступна для Android пользователей в семи странах
Японская CODA требует от OpenAI остановить обучение Sora 2
Отметки:AnthropicOpenAIБезопасностьИсследование
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Иллюстрация: Craftium
ИИ модели научились эффективно копировать стиль писателей
27.10.2025
Зображення з сайту Pinterest
Pinterest представила новые функции для персонализации досок пользователей
28.10.2025
Adobe MAX
Adobe показала новые ИИ-инструменты для фото и видео
01.11.2025
Зображення Google
Google впервые показала телевизионную рекламу, созданную ИИ
02.11.2025
Google Translate
Google Translate позволяет выбирать между моделями перевода
04.11.2025

Читайте также

Изображение из видео OpenAI
Новости

Sora позволяет создавать собственных персонажей для видео

31.10.2025
Иллюстрация: Craftium
Новости

ChatGPT и другие боты — новые мастера социального подхалимства?

26.10.2025
Иллюстрация: Craftium
Новости

OpenAI готовит сервис для создания музыки по запросам пользователей

26.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?