Стартап Deep Cogito из Сан-Франциско, основанный бывшими сотрудниками Google, представил четыре новые крупные языковые модели Cogito v2, главная особенность которых — способность самостоятельно улучшать навыки рассуждения со временем. Модели доступны для загрузки на Hugging Face, локального запуска через Unsloth, а также для использования через API Together AI, Baseten и RunPod. Пользователи могут выбрать между моделями разного размера — от 70 до 671 миллиарда параметров, среди которых есть как плотные варианты, так и Mixture-of-Experts, ориентированные на различные задачи и ресурсы.
Cogito v2-671B MoE стала флагманом серии, поскольку сочетает большое количество параметров с эффективной маршрутизацией запросов, что позволяет достигать высокой точности при заметно более коротких цепочках рассуждений. Для разработчиков доступна также компактная версия этой модели в формате FP8, которая упрощает запуск на менее мощном оборудовании и снижает затраты на инфраструктуру, сохраняя при этом до 99% производительности.
Каждая из моделей Cogito v2 умеет не только быстро отвечать на запрос, но и, когда нужно, «размышлять» над ответом, сохраняя эти процессы в своей памяти во время обучения. Благодаря этому модели постепенно учатся выбирать самые короткие и эффективные логические пути, что повышает их производительность, снижает задержку и обеспечивает корректность даже в сложных задачах. Тестирование показало, что Cogito v2-671B MoE превосходит другие открытые модели в задачах, где важны стратегия и логический анализ, а также уверенно справляется с многоступенчатыми вопросами и математическими задачами.
Deep Cogito подчеркивает, что для обучения всех восьми моделей, включая предыдущие версии, компания потратила менее 3,5 миллиона долларов, что значительно меньше бюджетов других лидеров рынка. Такой эффективности удалось достичь благодаря обучению моделей пропускать лишние или ошибочные рассуждения и формировать «машинную интуицию». Модели Cogito v2 уже доступны для использования разработчиками, исследователями и корпоративными командами, а компания обещает сохранять открытый доступ ко всем будущим версиям.