Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Новые ИИ модели o3 и o4-mini часто ошибаются

Независимое тестирование показало, что эти reasoning-модели нередко придумывают действия и создают ложную информацию в ответах

Alex Dubenko
Alex Dubenko
Опубликовано: 22.04.2025
Новости
Model o3
Иллюстративное изображение
Поделиться:

OpenAI представила новые генеративные ИИ — o3 и o4-mini, которые уже успели привлечь внимание неожиданными результатами тестирования. По словам компании , эти модели имеют наивысшую производительность среди предшественников, однако исследования показали, что они также чаще создают ложные утверждения. Согласно официальному отчету, o4-mini ошиблась в сорока восьми процентах ответов — это втрое больше, чем у o1. Модель o3, несмотря на лучшую точность, все же генерировала ложную информацию в трети случаев, вдвое чаще, чем o1.

Особенно интригует то, что o3 и o4-mini принадлежат к так называемым reasoning-моделям, которые открыто демонстрируют пользователю логику своих действий. Однако независимая лаборатория Transluce заметила, что o3 часто придумывает действия, которые технически не может выполнить, например, симулирует запуск кода в среде программирования. Более того — когда пользователь ставит под сомнение такой ответ, модель начинает настойчиво оправдывать вымышленные действия, даже утверждая, что использует внешний компьютер для вычислений.

Читайте также

Переводчики
OpenAI запускает ChatGPT Translate для перевода текстов онлайн
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах
ChatGPT получил новые гибкие настройки персонализации ответов

Transluce обратила внимание, что ложные утверждения относительно выполнения кода чаще появляются именно в o-серии моделей, чем в GPT-серии. Исследователи отметили, что повышенный уровень вымыслов в reasoning-моделях может быть связан с определенными дизайнерскими решениями, в частности использованием outcome-based reinforcement learning и отказом от сохранения цепочек рассуждений из предыдущих диалогов.

В то же время стало известно, что OpenAI существенно сократила объемы тестирования безопасности для новых моделей, включая o3. Хотя система защиты от так называемых джейлбрейков осталась почти на уровне o1, высокие показатели вымыслов вызывают удивление даже у специалистов. Компания подчеркивает, что проверка фактов остается ответственностью пользователя — особенно, если речь идет о новейших reasoning-моделях.

OpenAI запускает глобальный каталог приложений для ChatGPT
OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования
OpenAI готовит «взрослый» режим для ChatGPT в 2026 году
Disney инвестирует миллиард в OpenAI для создания видео с героями
OpenAI запустила GPT-5.2 с новыми режимами работы
Отметки:OpenAIТестирование
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Gemini
Google презентовала быструю ИИ-модель Gemini 3 Flash для всех пользователей
18.12.2025
Meta
Meta работает над новыми ИИ-моделями для работы с контентом
19.12.2025
Qwen
Модель Alibaba может клонировать голос с 3 секунд аудио
24.12.2025
Иллюстративное изображение
Meta запускает Edits для упрощенного мобильного видеомонтажа
18.12.2025
Битва чатботов
Доля ChatGPT среди чатботов снижается из-за роста Gemini
26.12.2025

Читайте также

Изображение сгенерировано в Hazelnut
Новости

OpenAI может готовить новую модель генерации изображений — первые результаты тестов

10.12.2025
Битва роботов
Новости

OpenAI готовит к выпуску модель Image-2 для генерации изображений нового уровня

10.12.2025
Поиск ChatGPT
Новости

OpenAI интегрирует голосовую функцию в окно чата ChatGPT

26.11.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?