Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2025 Craftium.AI.

Mistral предлагает открытую языковую модель Voxtral для распознавания речи

Распознавание восьми языков, низкая цена API и интеграция с Le Chat делают решение доступным для различных сфер

Eleni Karasidi
Eleni Karasidi
Опубликовано: 17.07.2025
Новости
Mistral AI
Иллюстративное изображение.
Поделиться:

Французская компания Mistral представила Voxtral — открытую языковую модель для распознавания и понимания речи. Она доступна в двух версиях: Voxtral Small 24B для производственных применений и компактная Voxtral 3B для локального или edge-использования. Обе поддерживают окно контекста на 32 тысячи токенов, что позволяет обрабатывать аудиофайлы до 30 минут для транскрипции и до 40 минут для задач понимания.

Модель распознает английский, испанский, французский, португальский, хинди, немецкий, нидерландский и итальянский языки. Она сочетает транскрипцию, ответы на вопросы и суммирование без необходимости в дополнительных языковых или распознавательных модулях. Пользователи могут запускать функции в бэкенде через голосовые команды, так как модель автоматически преобразует запросы в вызовы API.

По результатам тестов Mistral, Voxtral Small превосходит Whisper large-v3, GPT-4o mini Transcribe и Gemini 2.5 Flash в большинстве задач, в частности на англоязычных коротких фрагментах и в многоязычных тестах FLEURS. Модель также показала конкурентные результаты в понимании аудио и переводе речи, а Voxtral Mini Transcribe работает точнее и дешевле, чем OpenAI Whisper.

Читайте также

ИИ синтезирует звуки
Новые возможности для создания звуковых эффектов от ElevenLabs
Le Chat получил интеграции с платформами и функцию памяти
Более быстрое видео и аудио: Google запускает Veo 3 в Gemini

API Voxtral предлагает цену от 0,001 доллара за минуту, а для корпоративных клиентов доступна приватная установка и тонкая настройка под отраслевые нужды. В ближайших обновлениях появятся сегментация по голосам, разметка эмоций и возраста, а также таймкоды на уровне слов.

Модели уже доступны для загрузки на Hugging Face под лицензией Apache-2.0 и через API. В ближайшие недели Voxtral станет основой голосового режима в Le Chat, что позволит пользователям диктовать сообщения и взаимодействовать с платформой голосом как на веб-версии, так и на мобильных устройствах.

Сервис Songscription помогает превратить песни в ноты за несколько минут
Mistral AI представила улучшенную открытую модель Small 3.2
Mistral представляет линейку моделей Magistral для бизнеса и разработчиков
Mistral AI запустила Libraries для создания библиотек файлов
Стартап Krisp изменяет языковой акцент пользователей во время звонков
Отметки:Mistral AIАудио
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Изображение с сайта Google
Gemini будет запоминать предпочтения пользователей в чатах Google
14.08.2025
Кадр из видео, сгенерированного в Veo 3
Google Flow предлагает выбор между быстрыми и стандартными бесплатными Veo 3
28.08.2025
Изображение от Nous Research
Hermes 4 от Nous Research предлагает открытую языковую модель нового поколения
29.08.2025
DeepSeek 3
DeepSeek открывает доступ к мощной ИИ-модели V3.1
20.08.2025
ChatGPT
Пользователи ChatGPT получили расширенные настройки выбора моделей ИИ
13.08.2025

Читайте также

Новости

Google представляет Canvas и Audio Overview для ассистента Gemini

18.03.2025
Tavus
Новости

Tavus представила три новые модели генеративного ИИ

08.03.2025
Prime Video
Новости

Prime Video тестирует дублирование фильмов с помощью генеративного ИИ

07.03.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2025 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?