Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Qwen представила новые модели для голоса, редактирования изображений и модерации контента

Новая модель способна мгновенно транскрибировать аудио, распознавать языки и интегрируется с различными сервисами для сложных задач

Eleni Karasidi
Eleni Karasidi
Опубликовано: 24.09.2025
Новости
Qwen Chat
Qwen
Поделиться:

Группа Qwen AI компании Alibaba представила новую ИИ-модель Qwen3-Omni, которая работает с текстом, изображениями, аудио и видео в реальном времени. Qwen3-Omni обрабатывает текст на 119 языках, распознает речь на 19 языках и отвечает на десяти. Модель может транскрибировать до 30 минут аудио, а её задержка ответа составляет всего 234 миллисекунды. Для удобного использования архитектура разделена на две части: «Thinker» анализирует входные данные и создает текст, а «Talker» сразу преобразует его в речь, что обеспечивает быстрое озвучивание результата.

Qwen3-Omni показала высокие результаты в 32 из 36 тестов на аудио- и видеозадачи, опережая модели Gemini 2.5 Flash и GPT-4o в распознавании речи и генерации голоса. Модель использует архитектуру mixture-of-experts с активацией трех миллиардов параметров во время каждого запроса, что позволяет достичь быстрой обработки и стабильной производительности даже при работе с несколькими типами данных одновременно.

Читайте также

Grok
Grok от X ограничил создание изображений после скандала
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах
Модель Alibaba может клонировать голос с 3 секунд аудио

Пользователи могут настраивать поведение Qwen3-Omni через специальные инструкции, например, изменять стиль или «личность» ответов. Модель интегрируется с другими инструментами и сервисами для выполнения сложных задач. Она доступна в Qwen Chat , как демо на Hugging Face, а разработчики могут подключить её к своим приложениям через API от Alibaba.

Кроме базовой версии, Alibaba выпустила специализированную модель Qwen3-Omni-30B-A3B-Captioner для детального описания аудио, например, музыки или звуковых эффектов. В открытом доступе также появились версии Qwen3-Omni-30B-A3B-Instruct для выполнения инструкций и Qwen3-Omni-30B-A3B-Thinking для сложных задач с рассуждением.

Google обновила Gemini 2.5 для перевода аудио в Translate
OpenAI готовит «взрослый» режим для ChatGPT в 2026 году
Google представила обновленные модели Gemini 2.5 для синтеза голоса
Исследование: ИИ не признает ошибки, выдумывая вместо этого фейковые факты
Deepseek V3.2 достигает уровня GPT-5 и Gemini 3 Pro
Отметки:Qwen ChatБезопасностьГенерация голосаГенерация текста
Источник:qwen.ai
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

Gemini
Google презентовала быструю ИИ-модель Gemini 3 Flash для всех пользователей
18.12.2025
ИИ-художник Иллюстрация: Craftium
OpenAI обновила GPT Image 1.5 для ChatGPT с новыми возможностями редактирования
17.12.2025
Firefly
Adobe Firefly получил текстовый видеоредактор и новые модели ИИ
16.12.2025
Иллюстративное изображение
Google Gemini добавляет визуальные материалы к Deep Research
16.12.2025
ChatGPT
ChatGPT получил новые гибкие настройки персонализации ответов
21.12.2025

Читайте также

Изображение из видео ElevenLabs
Новости

ElevenLabs открыла платформу для лицензированных знаменитых голосов

13.11.2025
Озвучка c ChatGPT
Гайды

Бесплатное озвучивание текста голосом с помощью ChatGPT

04.11.2025
Иллюстрация: Craftium
Новости

ИИ модели научились эффективно копировать стиль писателей

27.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?