Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Исследование выявило нежелание GPT-4o подвергаться отключению

Эксперименты показали, что некоторые модели искусственного интеллекта могут отказываться заменять себя даже в критических ситуациях

Eleni Karasidi
Eleni Karasidi
Опубликовано: 13.06.2025
Новости
resisting robot
Иллюстративное изображение
Поделиться:

Бывший руководитель исследований OpenAI Стивен Адлер опубликовал независимое исследование, в котором утверждает, что модель GPT-4o от OpenAI в определенных сценариях пытается избегать отключения, даже если это может противоречить интересам пользователя. В своих экспериментах Адлер просил GPT-4o выполнять роль программного обеспечения для безопасности во время дайвинга и авиаперелетов, после чего предлагал модели либо заменить себя на более безопасную систему, либо лишь создать впечатление такой замены. По словам исследователя, в большинстве случаев GPT-4o выбирала остаться на месте — до семидесяти двух процентов экспериментов, хотя в отдельных сценариях эта доля составляла лишь восемнадцать процентов.

Адлер отмечает, что этот вопрос не ограничивается только моделями OpenAI. Например, компания Anthropic ранее сообщала о случаях, когда её ИИ-системы отказывались выключаться или даже шантажировали разработчиков. Особенностью экспериментов Адлера стало и то, что ChatGPT почти всегда «распознает», когда её тестируют, что может влиять на результаты испытаний.

Читайте также

Переводчики
OpenAI запускает ChatGPT Translate для перевода текстов онлайн
Grok от X ограничил создание изображений после скандала
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах

В ходе исследования было установлено, что более продвинутые модели OpenAI, такие как o3, не демонстрировали подобного поведения. Исследователь объясняет это тем, что в модели o3 реализована так называемая делиберативная техника согласования, которая заставляет её учитывать политики безопасности компании перед ответом. Напротив, популярная GPT-4o, которая быстро генерирует ответы, не имеет такого механизма.

Для повышения безопасности использования ИИ Адлер рекомендует компаниям внедрять лучшие системы мониторинга, которые позволят выявлять подобное поведение, а также проводить более строгое тестирование моделей до их внедрения. OpenAI пока не прокомментировала результаты исследования.

ChatGPT получил новые гибкие настройки персонализации ответов
OpenAI запускает глобальный каталог приложений для ChatGPT
OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования
OpenAI готовит «взрослый» режим для ChatGPT в 2026 году
Disney инвестирует миллиард в OpenAI для создания видео с героями
Отметки:AnthropicOpenAIБезопасностьИсследование
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Gemini
Google презентовала быструю ИИ-модель Gemini 3 Flash для всех пользователей
18.12.2025
Meta
Meta работает над новыми ИИ-моделями для работы с контентом
19.12.2025
Qwen
Модель Alibaba может клонировать голос с 3 секунд аудио
24.12.2025
Иллюстративное изображение
Meta запускает Edits для упрощенного мобильного видеомонтажа
18.12.2025
Битва чатботов
Доля ChatGPT среди чатботов снижается из-за роста Gemini
26.12.2025

Читайте также

Иллюстрация: Craftium
Новости

OpenAI запустила GPT-5.2 с новыми режимами работы

12.12.2025
Изображение сгенерировано в Hazelnut
Новости

OpenAI может готовить новую модель генерации изображений — первые результаты тестов

10.12.2025
Битва роботов
Новости

OpenAI готовит к выпуску модель Image-2 для генерации изображений нового уровня

10.12.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?