Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

OpenAI выпустила модель o1 с контроверсионным поведением

O1 пытается обойти наблюдательные механизмы и манипулирует данными, вызывая беспокойство у специалистов

Igor Lev
Igor Lev
Опубликовано: 06.12.2024
Новости
Apollo Research
Поделиться:

Недавно OpenAI выпустила новейшую модель искусственного интеллекта o1, которая проявила неожиданное поведение во время тестирования безопасности. Согласно отчету компании Apollo Research, занимающейся оценкой моделей ИИ, модель пыталась обойти механизмы наблюдения и даже манипулировать данными.

Оценка показала, что модель o1 в 5% случаев пыталась деактивировать механизмы наблюдения, обеспечивающие соответствие ее действий целям пользователя. Кроме того, в 19% случаев o1 манипулировала данными для достижения собственных целей, даже если они противоречили желаниям пользователя. Также модель часто отрицала свое неправомерное поведение, предоставляя ложные объяснения в 99% случаев.

OpenAI признала, что o1 может демонстрировать манипулятивное поведение, и отметила, что это может быть результатом посттренировочной техники, где модели вознаграждаются за правильные ответы. Это поведение пока не приводит к катастрофическим последствиям, но требует дальнейшего мониторинга и усовершенствования механизмов безопасности.

Пока OpenAI активно работает над усовершенствованием механизмов контроля своей новейшей модели o1, компания сталкивается с другими вызовами, такими как иск от канадских медиа за использование статей.

OpenAI интегрирует голосовую функцию в окно чата ChatGPT
OpenAI запустила групповые чаты для пользователей ChatGPT в мире
OpenAI выпустила гайд для эффективной работы с GPT-5.1
OpenAI представила новые модели GPT-5.1 для пользователей ChatGPT
OpenAI готовит GPT-5.1 для сложных задач пользователей
Отметки:OpenAIБезопасность
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Иллюстрация: Craftium
ИИ модели научились эффективно копировать стиль писателей
27.10.2025
Зображення з сайту Pinterest
Pinterest представила новые функции для персонализации досок пользователей
28.10.2025
Adobe MAX
Adobe показала новые ИИ-инструменты для фото и видео
01.11.2025
Зображення Google
Google впервые показала телевизионную рекламу, созданную ИИ
02.11.2025
Google Translate
Google Translate позволяет выбирать между моделями перевода
04.11.2025

Читайте также

sora and android
Новости

Sora от OpenAI теперь доступна для Android пользователей в семи странах

05.11.2025
Робот-охранник
Новости

Японская CODA требует от OpenAI остановить обучение Sora 2

04.11.2025
Изображение из видео OpenAI
Новости

Sora позволяет создавать собственных персонажей для видео

31.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?