Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Новый тест для ИИ выявил неожиданные особенности моделей

Исследователи использовали загадки из радиопередачи для оценки интуитивных возможностей искусственного интеллекта без специальных знаний

Alex Dubenko
Alex Dubenko
Опубликовано: 06.02.2025
Новости
Sunday Puzzle
Sunday Puzzle (npr.org)
Поделиться:

Исследователи из нескольких университетов США и стартапа Cursor разработали новый тест для проверки возможностей генеративных моделей ИИ. Они использовали загадки из радиопередачи «Sunday Puzzle», которая транслируется на NPR. Этот тест выявил неожиданные особенности работы моделей, такие как то, что некоторые из них, например, модели OpenAI, иногда «подводят» и дают неправильные ответы.

Интересно, что тест включает загадки, понятные без специальных знаний, что делает его доступным для широкой публики. «Sunday Puzzle» не требует от моделей специфических знаний, а проблемы формулируются так, чтобы модели не могли полагаться на «механическую память». Это делает тест привлекательным для исследователей, которые стремятся понять, как модели ИИ решают задачи, требующие интуиции и процесса исключения.

Читайте также

digital folder
Новые функции Projects в ChatGPT расширяют возможности инструмента
Исследование выявило нежелание GPT-4o подвергаться отключению
Сэм Альтман: ИИ приближается к генерации идей

На данный момент лучшие результаты на тесте показала модель o1 с результатом 59%, в то время как новая модель o3-mini, настроенная на высокие усилия мышления, получила 47%. Исследователи планируют расширить тестирование на другие модели, чтобы определить, как можно улучшить их производительность. Это может помочь понять, какие аспекты работы моделей требуют усовершенствования.

Однако тест «Sunday Puzzle» имеет свои ограничения, поскольку он ориентирован на англоязычную аудиторию. Тем не менее исследователи считают, что регулярные обновления вопросов помогут сохранить актуальность теста и помогут отслеживать, как меняется производительность моделей со временем.

Модель o3-pro от OpenAI поднимает планку для ИИ-сервисов
Более естественное звучание голоса и новые возможности в ChatGPT
OpenAI выбирает Google Cloud для расширения мощностей ChatGPT
Удаленные чаты ChatGPT остаются на серверах из-за суда
Новые возможности ChatGPT: интеграция с популярными сервисами и запись встреч
Отметки:OpenAIТестирование
Источник:techcrunch.com
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

GPT-4.1
ChatGPT получил более быстрые модели GPT-4.1 и Mini от OpenAI
15.05.2025
Codex
Новый агент Codex от OpenAI расширяет возможности ChatGPT
16.05.2025
AI worker stress
Генеративный ИИ негативно влияет на мотивацию сотрудников
15.05.2025
Jules
ШИ-агент для кодирования Jules открыл глобальный доступ
20.05.2025
Flow
Создание видео за считанные минуты: Google запускает Flow
21.05.2025

Читайте также

AI stores facts
Новости

ChatGPT предоставляет новую память для бесплатных пользователей

04.06.2025
Sora Bing
Новости

Sora от OpenAI появляется в Bing: видео из текста для всех

03.06.2025
robot assistant chaos
Новости

ChatGPT стремится стать супер-ассистентом с глубоким пониманием пользователя

31.05.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на наш еженедельный дайджест новостей, гайдов и обзоров об ИИ.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?