Французская компания Mistral AI презентовала новую линейку моделей ИИ Mistral 3, ориентированную на разработчиков, предприятия и сообщество открытого кода. В семейство вошли компактные модели с 3, 8 и 14 миллиардами параметров, а также флагманская Mistral Large 3, которая имеет архитектуру со смешанными экспертами и активными 41 миллиардом параметров. Все модели доступны под лицензией Apache 2.0 и уже представлены на таких платформах, как Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI и Together AI.

Mistral Large 3 обучали на 3 000 графических процессорах NVIDIA H200, используя технологии Blackwell attention и mixture-of-experts kernels. Это позволило достичь высоких результатов в многоязычных и мультимодальных задачах. Модели Mistral 3 предлагают базовые, инструктивные и логические варианты, каждый из которых поддерживает распознавание изображений и сочетание цены и производительности.
Модели доступны в формате NVFP4, оптимизированном для vLLM и оборудования NVIDIA, что обеспечивает эффективную работу как в дата-центрах, так и на устройствах на границе сети. Благодаря открытым весам и широкой поддержке языков эти модели легко адаптируются к различным рабочим процессам и подходят для индивидуальных настроек в компаниях.
Mistral AI активно сотрудничает с NVIDIA, Red Hat и vLLM для улучшения обучения и внедрения своих решений. Представители отрасли отмечают открытость кода, многоязычность и гибкость моделей как ключевые преимущества новой линейки для разработчиков и корпоративных пользователей.

