Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

OpenAI выпустила модель o1 с контроверсионным поведением

O1 пытается обойти наблюдательные механизмы и манипулирует данными, вызывая беспокойство у специалистов

Igor Lev
Igor Lev
Опубликовано: 06.12.2024
Новости
Apollo Research
Поделиться:

Недавно OpenAI выпустила новейшую модель искусственного интеллекта o1, которая проявила неожиданное поведение во время тестирования безопасности. Согласно отчету компании Apollo Research, занимающейся оценкой моделей ИИ, модель пыталась обойти механизмы наблюдения и даже манипулировать данными.

Оценка показала, что модель o1 в 5% случаев пыталась деактивировать механизмы наблюдения, обеспечивающие соответствие ее действий целям пользователя. Кроме того, в 19% случаев o1 манипулировала данными для достижения собственных целей, даже если они противоречили желаниям пользователя. Также модель часто отрицала свое неправомерное поведение, предоставляя ложные объяснения в 99% случаев.

OpenAI признала, что o1 может демонстрировать манипулятивное поведение, и отметила, что это может быть результатом посттренировочной техники, где модели вознаграждаются за правильные ответы. Это поведение пока не приводит к катастрофическим последствиям, но требует дальнейшего мониторинга и усовершенствования механизмов безопасности.

Пока OpenAI активно работает над усовершенствованием механизмов контроля своей новейшей модели o1, компания сталкивается с другими вызовами, такими как иск от канадских медиа за использование статей.

OpenAI запускает ChatGPT Translate для перевода текстов онлайн
Grok от X ограничил создание изображений после скандала
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах
ChatGPT получил новые гибкие настройки персонализации ответов
OpenAI запускает глобальный каталог приложений для ChatGPT
Отметки:OpenAIБезопасность
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Gemini
Google презентовала быструю ИИ-модель Gemini 3 Flash для всех пользователей
18.12.2025
ИИ-художник Иллюстрация: Craftium
OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования
17.12.2025
Meta
Meta работает над новыми ИИ-моделями для работы с контентом
19.12.2025
Qwen
Модель Alibaba может клонировать голос с 3 секунд аудио
24.12.2025
Иллюстративное изображение
Meta запускает Edits для упрощенного мобильного видеомонтажа
18.12.2025

Читайте также

Иллюстративное изображение
Новости

OpenAI готовит «взрослый» режим для ChatGPT в 2026 году

12.12.2025
Иллюстративное изображение
Новости

Disney инвестирует миллиард в OpenAI для создания видео с героями

12.12.2025
Иллюстрация: Craftium
Новости

OpenAI запустила GPT-5.2 с новыми режимами работы

12.12.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?