Сингапурская компания Sapient Intelligence представила новую архитектуру ИИ под названием Hierarchical Reasoning Model, которая достигает результатов, сравнимых или даже превосходящих крупные языковые модели в сложных задачах рассуждения. Модель HRM использует подход, вдохновленный работой человеческого мозга, сочетая два рекуррентных модуля для медленного планирования и быстрых вычислений. Такая структура позволяет системе выполнять глубокое многоступенчатое рассуждение с существенно меньшим количеством данных и памяти, чем требуют другие современные модели.
HRM показала высокую эффективность на сложных задачах, в частности на бенчмарках ARC-AGI, экстремальных судоку и задачах с лабиринтами. Например, на тесте «Sudoku-Extreme» и «Maze-Hard» современные CoT-модели не решили ни одной задачи, тогда как HRM достигла почти идеальной точности, обучаясь лишь на тысяче примеров для каждой задачи. На бенчмарке ARC-AGI HRM с 27 миллионами параметров набрала 40,3%, что превышает показатели более крупных моделей, таких как o3-mini-high и Claude 3.7 Sonnet.
По словам основателя компании Гуань Вана, HRM обеспечивает не только точность, но и значительно более быструю обработку задач. Архитектура позволяет сократить задержки при выполнении задач и уменьшить затраты, так как для обучения модели на профессиональном уровне в судоку достаточно двух часов работы GPU, а для ARC-AGI — до 200 часов. Это делает модель пригодной для использования в условиях ограниченных вычислительных ресурсов и нехватки данных.
HRM рекомендовано применять для сложных и детерминированных задач, где требуется последовательное принятие решений или долгосрочное планирование, в частности в робототехнике или научных исследованиях. Модель постепенно сокращает количество необходимых шагов для решения задачи в процессе обучения, что позволяет достигать экспертного уровня.
Компания Sapient Intelligence уже работает над развитием HRM в направлении универсальных модулей рассуждения, которые могут использоваться в медицине, климатическом прогнозировании и робототехнике. Разработчики планируют внедрить функции самокоррекции, что отличит эти модели от современных текстовых систем.