Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

OpenAI представила новые модели ИИ o3 и o3-mini

Модель o3 приближается к AGI, демонстрируя высокие результаты в тестах, но имеет проблемы с простыми задачами

Igor Lev
Igor Lev
Опубликовано: 22.12.2024
Новости
OpenAI
Поделиться:

В финальный день своего 12-дневного события компания OpenAI представила новую модель ИИ для когнитивных задач — o3, которая является преемницей модели o1. Вместе с ней был представлен компактный вариант — o3-mini, разработанный для выполнения специфических задач. Этот релиз обещает значительный прорыв в возможностях моделирования когнитивных процессов.

o3, наша последняя модель рассуждения, является прорывом, с значительным улучшением наших самых сложных бенчмарков. Мы начинаем тестирование на безопасность и работу красной команды сейчас. https://t.co/4XlK1iHxFK

— Грег Брокман (@gdb) 20 декабря 2024 г.

OpenAI заявляет, что o3, при определенных условиях, приближается к AGI — системе, способной выполнять большинство экономически важных задач, обычно выполняемых человеком. Хотя компания подчеркивает, что это еще не окончательный прорыв, результаты тестов модели o3 значительно превосходят предыдущие модели OpenAI. В тесте ARC-AGI, который оценивает способность ИИ осваивать новые навыки за пределами учебных данных, o3 получила 87,5% в режиме высоких вычислений, втрое превзойдя производительность o1 в самом низком режиме.

Модель достигла значительных результатов в различных тестах: 96,7% на Американском математическом экзамене 2024 года, 87,7% в GPQA Diamond, отвечая на вопросы уровня магистратуры по биологии, физике и химии, а также установила новый рекорд 25,2% в тесте Frontier Math от EpochAI. Несмотря на эти достижения, эксперты, такие как соавтор ARC-AGI Франсуа Шолле, предостерегают от переоценки этих результатов, указывая на проблемы o3 с выполнением простых задач и высокие затраты на использование ее передовых режимов.

Еще одним значительным улучшением в o3 является возможность настройки времени вычислений, что позволяет пользователям выбирать низкие, средние или высокие режимы в зависимости от сложности задачи. Модель использует процесс «приватной цепи мышления», что позволяет ей внутренне анализировать задачу, объяснять свой процесс и предоставлять более надежные результаты в таких областях, как физика, математика и программирование.

OpenAI признает потенциальные риски, связанные с o3, в связи с проблемами, выявленными в предыдущей модели. Команды OpenAI в настоящее время применяют методику «дискриминационного согласования» для обеспечения соответствия o3 принципам безопасности. Чтобы минимизировать риски, OpenAI сначала сделает доступной o3-mini для тестирования исследователями безопасности, в то время как o3 станет доступной позже в 2025 году. Генеральный директор Сэм Альтман также выступает за создание федеральной системы тестирования для оценки потенциального влияния таких моделей.

Использование ИИ студентами в британских вузах быстро растет
Новые функции Projects в ChatGPT расширяют возможности инструмента
Исследование выявило нежелание GPT-4o подвергаться отключению
Сэм Альтман: ИИ приближается к генерации идей
Модель o3-pro от OpenAI поднимает планку для ИИ-сервисов
Отметки:AGIOpenAI
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Jules
ШИ-агент для кодирования Jules открыл глобальный доступ
20.05.2025
YouTube
Эмоции в фокусе: YouTube меняет логику показа рекламы
17.05.2025
Flow
Создание видео за считанные минуты: Google запускает Flow
21.05.2025
Gemini
Gemini выходит за пределы смартфонов: новые сценарии использования от Google
18.05.2025
windsurf
Windsurf объявила о запуске своей линейки ИИ-моделей
16.05.2025

Читайте также

speaking bubble
Новости

Более естественное звучание голоса и новые возможности в ChatGPT

11.06.2025
Google Cloud
Новости

OpenAI выбирает Google Cloud для расширения мощностей ChatGPT

11.06.2025
lawyers searching
Новости

Удаленные чаты ChatGPT остаются на серверах из-за суда

07.06.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на наш еженедельный дайджест новостей, гайдов и обзоров об ИИ.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?