Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Новые ИИ модели o3 и o4-mini часто ошибаются

Независимое тестирование показало, что эти reasoning-модели нередко придумывают действия и создают ложную информацию в ответах

Alex Dubenko
Alex Dubenko
Опубликовано: 22.04.2025
Новости
Model o3
Иллюстративное изображение
Поделиться:

OpenAI представила новые генеративные ИИ — o3 и o4-mini, которые уже успели привлечь внимание неожиданными результатами тестирования. По словам компании , эти модели имеют наивысшую производительность среди предшественников, однако исследования показали, что они также чаще создают ложные утверждения. Согласно официальному отчету, o4-mini ошиблась в сорока восьми процентах ответов — это втрое больше, чем у o1. Модель o3, несмотря на лучшую точность, все же генерировала ложную информацию в трети случаев, вдвое чаще, чем o1.

Особенно интригует то, что o3 и o4-mini принадлежат к так называемым reasoning-моделям, которые открыто демонстрируют пользователю логику своих действий. Однако независимая лаборатория Transluce заметила, что o3 часто придумывает действия, которые технически не может выполнить, например, симулирует запуск кода в среде программирования. Более того — когда пользователь ставит под сомнение такой ответ, модель начинает настойчиво оправдывать вымышленные действия, даже утверждая, что использует внешний компьютер для вычислений.

Читайте также

Иллюстративное изображение
OpenAI презентовала GPT 5.3 Codex для автоматизации разработки
OpenAI запускает Prism для совместной работы над научными статьями
OpenAI тестирует рекламу в чате ChatGPT для США

Transluce обратила внимание, что ложные утверждения относительно выполнения кода чаще появляются именно в o-серии моделей, чем в GPT-серии. Исследователи отметили, что повышенный уровень вымыслов в reasoning-моделях может быть связан с определенными дизайнерскими решениями, в частности использованием outcome-based reinforcement learning и отказом от сохранения цепочек рассуждений из предыдущих диалогов.

В то же время стало известно, что OpenAI существенно сократила объемы тестирования безопасности для новых моделей, включая o3. Хотя система защиты от так называемых джейлбрейков осталась почти на уровне o1, высокие показатели вымыслов вызывают удивление даже у специалистов. Компания подчеркивает, что проверка фактов остается ответственностью пользователя — особенно, если речь идет о новейших reasoning-моделях.

OpenAI запускает ChatGPT Translate для перевода текстов онлайн
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах
ChatGPT получил новые гибкие настройки персонализации ответов
OpenAI запускает глобальный каталог приложений для ChatGPT
OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования
Отметки:OpenAIТестирование
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

NotebookLM
Google добавляет персональные настройки в NotebookLM для пользователей
09.02.2026
Qwen
Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями
16.02.2026
Иллюстративное изображение
Amazon MGM Studios тестирует AI Studio для кинопроизводства
07.02.2026
Claude Opus 4
Claude Opus 4.6 возглавила рейтинг анализа данных ИИ
09.02.2026
Иллюстративное изображение
Seedance 2.0 создает волну видео со знаменитостями онлайн
16.02.2026

Читайте также

Иллюстративное изображение
Новости

OpenAI готовит «взрослый» режим для ChatGPT в 2026 году

12.12.2025
Иллюстративное изображение
Новости

Disney инвестирует миллиард в OpenAI для создания видео с героями

12.12.2025
Иллюстрация: Craftium
Новости

OpenAI запустила GPT-5.2 с новыми режимами работы

12.12.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?