Стартап Nous Research представил новую линейку языковых моделей Hermes 4, которые ориентированы на максимально открытую взаимодействие с пользователем и минимальные ограничения контента. Hermes 4 поддерживает функцию «hybrid reasoning», которая позволяет переключаться между быстрыми ответами и детальным пошаговым рассуждением. Когда активирован этот режим, модель показывает свой ход мыслей в специальных тегах перед финальным ответом, обеспечивая прозрачность процесса.
В тестах самая большая модель Hermes 4 на 405 миллиардов параметров набрала 96,3% в математическом бенчмарке MATH-500 и 81,9% в конкурсе AIME’24, достигая уровня закрытых систем. На новом тесте RefusalBench, который оценивает, как часто ИИ отказывается отвечать на запросы, Hermes 4 показала результат 57,1% в reasoning-режиме, значительно опередив GPT-4o и Claude Sonnet 4.
Модель обучали с помощью двух собственных систем: DataForge, которая генерирует сложные обучающие примеры, и Atropos — открытой платформы для подкрепляющего обучения с тысячами специализированных сред. Для тренировки самой большой версии Hermes 4 использовали 192 графических процессора Nvidia B200 и более 70 тысяч часов вычислений.
Hermes 4 доступна для загрузки на Hugging Face, а также через API и новый интерфейс Nous Chat с поддержкой параллельных диалогов и системой памяти. Пользователи могут применять модель для задач, где требуется гибкость, отсутствие жестких ограничений и работа с чувствительным контентом.
Nous Research подчеркивает максимальный контроль пользователя и прозрачность, предоставляя подробный технический отчет с результатами тестов и примерами ответов. Такой подход делает Hermes 4 популярной среди разработчиков и исследователей, которые ценят открытость и возможность самостоятельной настройки ИИ под собственные нужды.