Команда Qwen из Alibaba презентовала QwQ-32B-Preview — новую «логическую» модель ИИ, которая доступна для загрузки под открытой лицензией Apache 2.0. Эта модель содержит 32,5 миллиарда параметров и может обрабатывать контекст длиной до 32 тысяч слов. В некоторых тестах, таких как AIME и MATH, она превосходит OpenAI o1-preview и o1-mini.
QwQ-32B-Preview разработана для решения сложных логических задач и математических примеров. По словам разработчиков, ее ключевое преимущество — способность «проверять» свои ответы, улучшая точность. Однако этот подход требует больше времени для вычислений. Модель также может выполнять многошаговые задачи, планируя решение.
Модель имеет определенные ограничения. Она может переключаться между языками или допускать циклическое мышление, из-за чего ответ иногда оказывается слишком длинным. В то же время QwQ-32B-Preview избегает дискуссий на политические темы, что является типичным для моделей китайских компаний.
Хотя модель можно загрузить с платформы Hugging Face, некоторые ее компоненты остаются недоступными. Это ограничивает возможность полного изучения или воспроизведения QwQ-32B-Preview.