Moonshot AI представила Kimi K2.5 — открытую многомодальную языковую модель, которая уже доступна пользователям на платформах Kimi.com, в приложении Kimi, через API и Kimi Code. Основное внимание разработчиков сосредоточено на создании уникальной системы «роя агентов»: модель способна одновременно координировать до 100 подагентов, которые выполняют до 1500 инструментальных вызовов параллельно. Это позволяет сократить время выполнения сложных рабочих процессов в 4,5 раза по сравнению с предыдущими моделями с одним агентом.
Moonshot AI подчеркивает, что Kimi K2.5 обучали на массивном наборе из 15 триллионов текстовых и визуальных токенов. Такое масштабное обучение обеспечило модели высокие результаты в создании документов, моделировании электронных таблиц и комплексной работе с офисными задачами. Модель демонстрирует стабильный рост эффективности во многих направлениях — от генерации кода на нескольких языках до визуального дебагинга.
Особого внимания заслуживает возможность Kimi K2.5 преобразовывать видеозаписи интерфейсов сайтов в полноценный код с сохранением всех элементов дизайна и взаимодействий. Для этого достаточно предоставить скринкаст и дать простую инструкцию. Эта функция уже вызвала оживленное обсуждение среди разработчиков и пользователей, которые тестируют новые возможности модели.
Разработчики внедрили метод Parallel-Agent Reinforcement Learning, который позволяет динамически создавать и координировать подагентов для распределенного выполнения задач. Kimi K2.5 уже интегрируют в популярные среды разработки, а функция «роя агентов» доступна в бета-версии для пользователей с высоким уровнем подписки, с постепенным расширением доступа через API.

