Китайская компания DeepSeek тестирует ИИ-конкурента OpenAI o1

DeepSeek-R1 проверяет себя, избегает ошибок, но имеет трудности с логикой и политическими запросами.

Опубликовано: 20.11.2024

Китайская лаборатория DeepSeek представила новый «модуль мышления» ИИ, который может конкурировать с OpenAI o1. DeepSeek-R1, как утверждают разработчики, способен эффективно проверять себя, тратя больше времени на обдумывание запросов. Это помогает избежать типичных ошибок, которые возникают у моделей.

🚀 DeepSeek-R1-Lite-Preview теперь доступен: разблокировка усиленной силы рассуждения!

🔍 Производительность на уровне o1-preview на бенчмарках AIME и MATH.
💡 Прозрачный процесс мышления в реальном времени.
🛠️ Модели с открытым исходным кодом и API скоро будут доступны!

🌐 Попробуйте сейчас на https://t.co/v1TFy7LHNy #DeepSeek pic.twitter.com/saslkq4a1s
— DeepSeek (@deepseek_ai) 20 ноября 2024 г.

Подобно o1, DeepSeek-R1 выполняет задачу путем планирования и выполнения действий, которые помогают прийти к ответу. В зависимости от сложности вопроса, DeepSeek-R1 может «думать» в течение нескольких десятков секунд. DeepSeek утверждает, что их модель по показателям на двух популярных тестах — AIME и MATH — соответствует OpenAI o1.

Пользователи, которые уже воспользовались возможностью протестировать новую модель, отмечают, что DeepSeek-R1 может быть легко обманут, игнорируя защитные механизмы. Один из пользователей получил от модели рецепт запрещенных вещей. Кроме того, DeepSeek-R1 блокирует запросы, которые считаются политически чувствительными, как вопросы о китайском лидере Си Цзиньпине или площади Тяньаньмень. Это, вероятно, следствие давления со стороны китайского правительства, которое требует, чтобы модели соответствовали «основным социалистическим ценностям».

DeepSeek планирует открыть исходный код DeepSeek-R1 и выпустить API. Это поддерживается High-Flyer Capital Management, китайским хедж-фондом, который использует ИИ для принятия торговых решений.

Отметки:DeepSeek ИИ-чат

Источник:techcrunch.com

Комментариев нет

Китайская компания DeepSeek тестирует ИИ-конкурента OpenAI o1

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Google добавляет персональные настройки в NotebookLM для пользователей

Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями

Amazon MGM Studios тестирует AI Studio для кинопроизводства

Claude Opus 4.6 возглавила рейтинг анализа данных ИИ

OpenAI презентовала GPT 5.3 Codex для автоматизации разработки

Навигация

Полезное

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Читайте также

Прокачайся с AI!