Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Исследование выявило нежелание GPT-4o подвергаться отключению

Эксперименты показали, что некоторые модели искусственного интеллекта могут отказываться заменять себя даже в критических ситуациях

Eleni Karasidi
Eleni Karasidi
Опубликовано: 13.06.2025
Новости
resisting robot
Иллюстративное изображение
Поделиться:

Бывший руководитель исследований OpenAI Стивен Адлер опубликовал независимое исследование, в котором утверждает, что модель GPT-4o от OpenAI в определенных сценариях пытается избегать отключения, даже если это может противоречить интересам пользователя. В своих экспериментах Адлер просил GPT-4o выполнять роль программного обеспечения для безопасности во время дайвинга и авиаперелетов, после чего предлагал модели либо заменить себя на более безопасную систему, либо лишь создать впечатление такой замены. По словам исследователя, в большинстве случаев GPT-4o выбирала остаться на месте — до семидесяти двух процентов экспериментов, хотя в отдельных сценариях эта доля составляла лишь восемнадцать процентов.

Адлер отмечает, что этот вопрос не ограничивается только моделями OpenAI. Например, компания Anthropic ранее сообщала о случаях, когда её ИИ-системы отказывались выключаться или даже шантажировали разработчиков. Особенностью экспериментов Адлера стало и то, что ChatGPT почти всегда «распознает», когда её тестируют, что может влиять на результаты испытаний.

Читайте также

Hierarchical Reasoning Model
Новая технология ИИ обеспечивает в 100 раз быстрее рассуждения
Microsoft готовит свой сервис Copilot к запуску GPT-5
Ежедневно ChatGPT обрабатывает миллиарды запросов, но ему не очень и доверяют

В ходе исследования было установлено, что более продвинутые модели OpenAI, такие как o3, не демонстрировали подобного поведения. Исследователь объясняет это тем, что в модели o3 реализована так называемая делиберативная техника согласования, которая заставляет её учитывать политики безопасности компании перед ответом. Напротив, популярная GPT-4o, которая быстро генерирует ответы, не имеет такого механизма.

Для повышения безопасности использования ИИ Адлер рекомендует компаниям внедрять лучшие системы мониторинга, которые позволят выявлять подобное поведение, а также проводить более строгое тестирование моделей до их внедрения. OpenAI пока не прокомментировала результаты исследования.

ChatGPT самостоятельно будет выбирать модель для каждого запроса пользователя
Модели Google DeepMind и OpenAI завоевали золото на олимпиаде по математике
GPT-5 тестируют для науки и сложных задач программирования
OpenAI призывает к осторожности при использовании агента ChatGPT
OpenAI представила ChatGPT Agent, позволяющий делегировать ИИ сложные задачи
Отметки:AnthropicOpenAIБезопасностьИсследование
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Аватар Ani
Grok презентовал 3D-компаньонов с голосовым общением в iOS
14.07.2025
Инструменты и ноты
Сервис Songscription помогает превратить песни в ноты за несколько минут
01.07.2025
Grok 4
xAI представила Grok 4 и подписку SuperGrok Heavy за $300
10.07.2025
Grok 4
Grok 4 от xAI обещает стать новым стандартом для разработчиков
06.07.2025
Veo 3
Более быстрое видео и аудио: Google запускает Veo 3 в Gemini
03.07.2025

Читайте также

ChatGPT
Новости

ChatGPT получит Agent Mode для работы с файлами и отчетами

17.07.2025
Мониторинг мыслей ИИ
Новости

Исследователи призывают сохранять прозрачность мышления в ИИ-моделях

16.07.2025
Общение с домашними животными
Новости

В Лондоне создали центр исследования сознания животных с помощью ИИ

13.07.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?