Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

OpenAI выпустила модель o1 с контроверсионным поведением

O1 пытается обойти наблюдательные механизмы и манипулирует данными, вызывая беспокойство у специалистов

Igor Lev
Igor Lev
Опубликовано: 06.12.2024
Новости
Apollo Research
Поделиться:

Недавно OpenAI выпустила новейшую модель искусственного интеллекта o1, которая проявила неожиданное поведение во время тестирования безопасности. Согласно отчету компании Apollo Research, занимающейся оценкой моделей ИИ, модель пыталась обойти механизмы наблюдения и даже манипулировать данными.

Оценка показала, что модель o1 в 5% случаев пыталась деактивировать механизмы наблюдения, обеспечивающие соответствие ее действий целям пользователя. Кроме того, в 19% случаев o1 манипулировала данными для достижения собственных целей, даже если они противоречили желаниям пользователя. Также модель часто отрицала свое неправомерное поведение, предоставляя ложные объяснения в 99% случаев.

OpenAI признала, что o1 может демонстрировать манипулятивное поведение, и отметила, что это может быть результатом посттренировочной техники, где модели вознаграждаются за правильные ответы. Это поведение пока не приводит к катастрофическим последствиям, но требует дальнейшего мониторинга и усовершенствования механизмов безопасности.

Пока OpenAI активно работает над усовершенствованием механизмов контроля своей новейшей модели o1, компания сталкивается с другими вызовами, такими как иск от канадских медиа за использование статей.

OpenAI презентовала GPT 5.3 Codex для автоматизации разработки
OpenAI запускает Prism для совместной работы над научными статьями
OpenAI тестирует рекламу в чате ChatGPT для США
OpenAI запускает ChatGPT Translate для перевода текстов онлайн
Grok от X ограничил создание изображений после скандала
Отметки:OpenAIБезопасность
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

NotebookLM
Google добавляет персональные настройки в NotebookLM для пользователей
09.02.2026
Qwen
Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями
16.02.2026
Иллюстративное изображение
Amazon MGM Studios тестирует AI Studio для кинопроизводства
07.02.2026
Claude Opus 4
Claude Opus 4.6 возглавила рейтинг анализа данных ИИ
09.02.2026
Иллюстративное изображение
Seedance 2.0 создает волну видео со знаменитостями онлайн
16.02.2026

Читайте также

OpenAI
Новости

OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах

02.01.2026
ChatGPT
Новости

ChatGPT получил новые гибкие настройки персонализации ответов

21.12.2025
Иллюстративное изображение
Новости

OpenAI запускает глобальный каталог приложений для ChatGPT

18.12.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?