Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Новый тест для ИИ выявил неожиданные особенности моделей

Исследователи использовали загадки из радиопередачи для оценки интуитивных возможностей искусственного интеллекта без специальных знаний

Alex Dubenko
Alex Dubenko
Опубликовано: 06.02.2025
Новости
Sunday Puzzle
Sunday Puzzle (npr.org)
Поделиться:

Исследователи из нескольких университетов США и стартапа Cursor разработали новый тест для проверки возможностей генеративных моделей ИИ. Они использовали загадки из радиопередачи «Sunday Puzzle », которая транслируется на NPR. Этот тест выявил неожиданные особенности работы моделей, такие как то, что некоторые из них, например, модели OpenAI, иногда «подводят» и дают неправильные ответы.

Интересно, что тест включает загадки, понятные без специальных знаний, что делает его доступным для широкой публики. «Sunday Puzzle» не требует от моделей специфических знаний, а проблемы формулируются так, чтобы модели не могли полагаться на «механическую память». Это делает тест привлекательным для исследователей, которые стремятся понять, как модели ИИ решают задачи, требующие интуиции и процесса исключения.

Читайте также

Sora
Sora от OpenAI набирает миллион загрузок за пять дней
ChatGPT достиг 800 миллионов еженедельных пользователей
OpenAI добавила поддержку приложений непосредственно в ChatGPT

На данный момент лучшие результаты на тесте показала модель o1 с результатом 59%, в то время как новая модель o3-mini, настроенная на высокие усилия мышления, получила 47%. Исследователи планируют расширить тестирование на другие модели, чтобы определить, как можно улучшить их производительность. Это может помочь понять, какие аспекты работы моделей требуют усовершенствования.

Однако тест «Sunday Puzzle» имеет свои ограничения, поскольку он ориентирован на англоязычную аудиторию. Тем не менее исследователи считают, что регулярные обновления вопросов помогут сохранить актуальность теста и помогут отслеживать, как меняется производительность моделей со временем.

Sora 2 от OpenAI генерирует видео с ответами на вопросы
OpenAI готовит новые функции для генерации изображений и безопасности API
OpenAI улучшает свои приложения, добавляя в них социальные функции
OpenAI запустила модель Sora 2, которая позволяет создавать видео со звуком
ChatGPT автоматически выбирает более строгую модель в чувствительных разговорах
Отметки:OpenAIТестирование
Источник:techcrunch.com
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Claude can now create and edit files
Claude научился создавать и редактировать файлы прямо в интерфейсе
10.09.2025
Логотип Genspark
Genspark выпустил браузер с бесплатным встроенным ИИ
14.09.2025
Изображение с сайта Anthropic
Claude научился автоматически запоминать детали разговоров пользователей
15.09.2025
Suno v5
Suno v5: еще более естественное звучание и полный контроль над треком
26.09.2025
Кадр из видео Luma AI
Новый «reasoning» Ray3 от Luma AI генерирует видео в 4K HDR качестве
19.09.2025

Читайте также

ChatGPT Pulse
Новости

ChatGPT Pulse предлагает персонализированные ежедневные сводки на смартфоне

26.09.2025
Зображення з сайту NVIDIA
Новости

OpenAI и Nvidia создадут масштабную инфраструктуру для ИИ будущего

23.09.2025
ИИ примеряет маски
Новости

ChatGPT получил новые опции персонализации для пользователей

18.09.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?