Китайская лаборатория DeepSeek представила новый «модуль мышления» ИИ, который может конкурировать с OpenAI o1. DeepSeek-R1, как утверждают разработчики, способен эффективно проверять себя, тратя больше времени на обдумывание запросов. Это помогает избежать типичных ошибок, которые возникают у моделей.
🚀 DeepSeek-R1-Lite-Preview теперь доступен: разблокировка усиленной силы рассуждения!
— DeepSeek (@deepseek_ai) 20 ноября 2024 г.
🔍 Производительность на уровне o1-preview на бенчмарках AIME и MATH.
💡 Прозрачный процесс мышления в реальном времени.
🛠️ Модели с открытым исходным кодом и API скоро будут доступны!
🌐 Попробуйте сейчас на https://t.co/v1TFy7LHNy#DeepSeek pic.twitter.com/saslkq4a1s
Подобно o1, DeepSeek-R1 выполняет задачу путем планирования и выполнения действий, которые помогают прийти к ответу. В зависимости от сложности вопроса, DeepSeek-R1 может «думать» в течение нескольких десятков секунд. DeepSeek утверждает, что их модель по показателям на двух популярных тестах — AIME и MATH — соответствует OpenAI o1.
Пользователи, которые уже воспользовались возможностью протестировать новую модель, отмечают, что DeepSeek-R1 может быть легко обманут, игнорируя защитные механизмы. Один из пользователей получил от модели рецепт запрещенных вещей. Кроме того, DeepSeek-R1 блокирует запросы, которые считаются политически чувствительными, как вопросы о китайском лидере Си Цзиньпине или площади Тяньаньмень. Это, вероятно, следствие давления со стороны китайского правительства, которое требует, чтобы модели соответствовали «основным социалистическим ценностям».
DeepSeek планирует открыть исходный код DeepSeek-R1 и выпустить API. Это поддерживается High-Flyer Capital Management, китайским хедж-фондом, который использует ИИ для принятия торговых решений.