Tencent представила Hunyuan-A13B с открытым кодом и гибким мышлением

Tencent открыла исходный код новой языковой модели Hunyuan-A13B, которая умеет динамически переключаться между быстрым и глубоким «мышлением» в зависимости от сложности задачи. Модель позволяет пользователям изменять глубину рассуждения в реальном времени: для простых запросов используется быстрый режим, а для сложных активируется многократная обработка. Управлять этим можно с помощью специальных команд — «/think» для глубокого мышления и «/no_think» для обычного режима.

🚀 Introducing Hunyuan-A13B, our latest open-source LLM.

As an MoE model, it leverages 80B total parameters with just 13B active, delivering powerful performance that scores on par with o1 and DeepSeek across multiple mainstream benchmarks.

Hunyuan-A13B features a hybrid… pic.twitter.com/8QTT547fcC
— Hunyuan (@TencentHunyuan) June 27, 2025

Hunyuan-A13B построена на архитектуре Mixture of Experts с общим количеством параметров 80 миллиардов, но во время работы задействовано только 13 миллиардов. Модель поддерживает большие контекстные окна — до 256 000 токенов, что позволяет работать с объемными текстами и задачами. Для обучения использовали 20 триллионов токенов, из которых 250 миллиардов были собраны из STEM-областей, включая учебники по математике, тесты, открытый код из GitHub и научные тексты разных уровней.

Модель хорошо показывает себя в научных и математических задачах. На конкурсе по математике AIME 2024 она достигла точности 87,3 процента, что выше, чем у OpenAI o1 в том же раунде. Внутренние тесты Tencent засвидетельствовали, что Hunyuan-A13B удерживает высокие результаты на многих задачах для агентов и демонстрирует стабильность даже при работе с большими контекстами, хотя уступает Gemini 2.5 Pro в некоторых тестах.

Hunyuan-A13B уже доступна под лицензией Apache 2.0 на Hugging Face и GitHub. Для быстрого развертывания подготовлены Docker-образы, а также есть доступ через API в Tencent Cloud и браузерную демо-версию. Также Tencent добавила два новых набора данных для тестирования: ArtifactsBench для генерации кода и C3-Bench для оценки агентных задач.

Tencent представила Hunyuan-A13B с открытым кодом и гибким мышлением

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Google добавляет персональные настройки в NotebookLM для пользователей

Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями

Amazon MGM Studios тестирует AI Studio для кинопроизводства

Claude Opus 4.6 возглавила рейтинг анализа данных ИИ

OpenAI презентовала GPT 5.3 Codex для автоматизации разработки

Навигация

Полезное