Китайская DeepSeek выпустила новую мыслящую ИИ-модель

DeepSeek-R1 доступна на платформе Hugging Face, имеет 671 миллиард параметров и конкурирует с OpenAI o1 на тестах

Опубликовано: 21.01.2025

Иллюстративное изображение

Китайская лаборатория DeepSeek представила новую открытую версию своей модели DeepSeek-R1, которая, по их словам, может конкурировать с OpenAI o1 на определенных тестах ИИ. Модель R1 доступна на платформе Hugging Face под лицензией MIT, что позволяет ее коммерческое использование без ограничений. DeepSeek заявляет, что R1 превосходит o1 на тестах AIME, MATH-500 и SWE-bench Verified. Модель R1 эффективно проверяет свои результаты, что помогает избежать ошибок, которые часто возникают у других моделей.

🚀 DeepSeek-R1 is here!

⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!

🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!

🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) 20 января 2025 г.

DeepSeek-R1 содержит 671 миллиард параметров, что делает ее одной из крупнейших моделей в мире. В то же время DeepSeek выпустила «дистиллированные» версии R1, которые варьируются от 1,5 миллиарда до 70 миллиардов параметров, что позволяет запускать самые маленькие из них на обычных ноутбуках. Полная версия R1 требует более мощного оборудования, однако доступна через API DeepSeek по ценам на 90-95% ниже, чем у OpenAI o1.

Модель R1 подвергается регулированию со стороны китайских интернет-органов, что означает, что она не будет отвечать на запросы, которые могут вызвать недовольство регуляторов, такие как вопросы о событиях на площади Тяньаньмень или автономии Тайваня. Это ограничение распространено среди многих китайских моделей ИИ, которые избегают ответов на чувствительные темы.

Отметки:DeepSeek Hugging Face

Комментариев нет

Китайская DeepSeek выпустила новую мыслящую ИИ-модель

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Google добавляет персональные настройки в NotebookLM для пользователей

Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями

Amazon MGM Studios тестирует AI Studio для кинопроизводства

Claude Opus 4.6 возглавила рейтинг анализа данных ИИ

OpenAI презентовала GPT 5.3 Codex для автоматизации разработки

Навигация

Полезное

Читайте также

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Читайте также

Прокачайся с AI!