Китайская компания Moonshot AI представила открытую языковую модель Kimi-K2, которая имеет один триллион параметров и создана для выполнения сложных задач без специального модуля логического мышления. Модель построена по принципу «mixture-of-experts», активируя 32 миллиарда параметров для каждого запроса. Kimi-K2 доступна в двух версиях: «Kimi-K2-Base» для исследований и настройки, и «Kimi-K2-Instruct» для общения и агентских сценариев.
На стандартных тестах для языковых моделей Kimi-K2-Instruct показала результаты, которые равны или превышают показатели закрытых продуктов. Например, на SWE-bench Verified модель достигла 65,8% в режиме агента, обойдя GPT-4.1 и приблизившись к Claude Sonnet 4. Kimi-K2 также лидирует в тестах LiveCodeBench и OJBench, оценивающих способность решать программные задачи.
Модель демонстрирует сильные результаты в математике и естественных науках, превосходя конкурентов на таких испытаниях, как AIME, GPQA-Diamond и MATH-500. В неофициальном тесте Kimi-K2 смогла создать детализированный SVG-рисунок, справившись с задачей, которая часто становится сложной для других ИИ.
Moonshot AI заявляет, что Kimi-K2 оптимизирована для агентских сценариев: она может выполнять команды, вызывать внешние инструменты, писать и отлаживать код, а также решать комплексные многошаговые задачи без вмешательства человека. Модель доказала свою эффективность во время демонстраций, где самостоятельно анализировала данные, проводила статистические расчеты и формировала интерактивные страницы.
Модель доступна через API, совместимый с OpenAI, а также для локального запуска с использованием популярных движков. Стоимость использования стартует от $0,15 за обработку миллиона входных токенов для кешированных запросов. Для развертывания Kimi-K2 требуется мощное оборудование, но для исследовательских целей доступны инструкции для локального запуска. Лицензия основана на MIT и содержит требование об отображении названия «Kimi K2» для очень больших проектов.