Китайская лаборатория DeepSeek представила новую открытую версию своей модели DeepSeek-R1, которая, по их словам, может конкурировать с OpenAI o1 на определенных тестах ИИ. Модель R1 доступна на платформе Hugging Face под лицензией MIT, что позволяет ее коммерческое использование без ограничений. DeepSeek заявляет, что R1 превосходит o1 на тестах AIME, MATH-500 и SWE-bench Verified. Модель R1 эффективно проверяет свои результаты, что помогает избежать ошибок, которые часто возникают у других моделей.
🚀 DeepSeek-R1 is here!
— DeepSeek (@deepseek_ai) 20 января 2025 г.
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!
🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
DeepSeek-R1 содержит 671 миллиард параметров, что делает ее одной из крупнейших моделей в мире. В то же время DeepSeek выпустила «дистиллированные» версии R1, которые варьируются от 1,5 миллиарда до 70 миллиардов параметров, что позволяет запускать самые маленькие из них на обычных ноутбуках. Полная версия R1 требует более мощного оборудования, однако доступна через API DeepSeek по ценам на 90-95% ниже, чем у OpenAI o1.
Модель R1 подвергается регулированию со стороны китайских интернет-органов, что означает, что она не будет отвечать на запросы, которые могут вызвать недовольство регуляторов, такие как вопросы о событиях на площади Тяньаньмень или автономии Тайваня. Это ограничение распространено среди многих китайских моделей ИИ, которые избегают ответов на чувствительные темы.