Используя этот сайт, вы соглашаетесь с нашей политикой конфиденциальности и условиями использования.
Accept
Craftium.AICraftium.AICraftium.AI
  • Главная
  • Новости
  • База знаний
  • Каталог
  • Блог
Font ResizerAa
Craftium.AICraftium.AI
Font ResizerAa
Поиск
  • Главная
  • Новости
  • Каталог
  • Подборки
  • Блог
Следите за нами:
  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь
© 2024-2026 Craftium.AI.

Qwen представила новые модели для голоса, редактирования изображений и модерации контента

Новая модель способна мгновенно транскрибировать аудио, распознавать языки и интегрируется с различными сервисами для сложных задач

Eleni Karasidi
Eleni Karasidi
Опубликовано: 24.09.2025
Новости
Qwen Chat
Qwen
Поделиться:

Группа Qwen AI компании Alibaba представила новую ИИ-модель Qwen3-Omni, которая работает с текстом, изображениями, аудио и видео в реальном времени. Qwen3-Omni обрабатывает текст на 119 языках, распознает речь на 19 языках и отвечает на десяти. Модель может транскрибировать до 30 минут аудио, а её задержка ответа составляет всего 234 миллисекунды. Для удобного использования архитектура разделена на две части: «Thinker» анализирует входные данные и создает текст, а «Talker» сразу преобразует его в речь, что обеспечивает быстрое озвучивание результата.

Qwen3-Omni показала высокие результаты в 32 из 36 тестов на аудио- и видеозадачи, опережая модели Gemini 2.5 Flash и GPT-4o в распознавании речи и генерации голоса. Модель использует архитектуру mixture-of-experts с активацией трех миллиардов параметров во время каждого запроса, что позволяет достичь быстрой обработки и стабильной производительности даже при работе с несколькими типами данных одновременно.

Читайте также

Grok
Grok от X ограничил создание изображений после скандала
OpenAI улучшает голосовые возможности ChatGPT для расширения использования в новых устройствах
Модель Alibaba может клонировать голос с 3 секунд аудио

Пользователи могут настраивать поведение Qwen3-Omni через специальные инструкции, например, изменять стиль или «личность» ответов. Модель интегрируется с другими инструментами и сервисами для выполнения сложных задач. Она доступна в Qwen Chat , как демо на Hugging Face, а разработчики могут подключить её к своим приложениям через API от Alibaba.

Кроме базовой версии, Alibaba выпустила специализированную модель Qwen3-Omni-30B-A3B-Captioner для детального описания аудио, например, музыки или звуковых эффектов. В открытом доступе также появились версии Qwen3-Omni-30B-A3B-Instruct для выполнения инструкций и Qwen3-Omni-30B-A3B-Thinking для сложных задач с рассуждением.

Google обновила Gemini 2.5 для перевода аудио в Translate
OpenAI готовит «взрослый» режим для ChatGPT в 2026 году
Google представила обновленные модели Gemini 2.5 для синтеза голоса
Исследование: ИИ не признает ошибки, выдумывая вместо этого фейковые факты
Deepseek V3.2 достигает уровня GPT-5 и Gemini 3 Pro
Отметки:Qwen ChatБезопасностьГенерация голосаГенерация текста
Источник:qwen.ai
Комментариев нет

Добавить комментарий Отменить ответ

Следи за нами

XСледовать
InstagramСледовать
YoutubeПодписаться
TelegramСледовать

Популярные новости

NotebookLM
Google добавляет персональные настройки в NotebookLM для пользователей
09.02.2026
Иллюстративное изображение
Amazon MGM Studios тестирует AI Studio для кинопроизводства
07.02.2026
Qwen
Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями
16.02.2026
Claude Opus 4
Claude Opus 4.6 возглавила рейтинг анализа данных ИИ
09.02.2026
Иллюстративное изображение
OpenAI презентовала GPT 5.3 Codex для автоматизации разработки
06.02.2026

Читайте также

Изображение из видео ElevenLabs
Новости

ElevenLabs открыла платформу для лицензированных знаменитых голосов

13.11.2025
Озвучка c ChatGPT
Гайды

Бесплатное озвучивание текста голосом с помощью ChatGPT

04.11.2025
Иллюстрация: Craftium
Новости

ИИ модели научились эффективно копировать стиль писателей

27.10.2025

Craftium AI — команда, которая пристально следит за развитием генеративного ИИ, применяет его в своем творчестве и охотно делится собственными открытиями.

Навигация

  • Новости
  • Обзоры
  • Подборки
  • Блог

Полезное

  • Правила пользования
  • Политика конфиденциальности
  • Авторские права
  • Обратная связь

Подписывайся на последние новости, полезные советы и гайды по ИИ.

Подписываясь, вы принимаете нашу политику конфиденциальности и условия использования.

Craftium.AICraftium.AI
Следите за нами:
© 2024-2026 Craftium.AI
Подписка
Прокачайся с AI!
Вдохновляйся важными новостями, полезными советами и детальными гайдами получая их прямо на свою почту.

Подписываясь, вы принимаете нашу Политику конфиденциальности и Условия использования.

Welcome Back!

Sign in to your account

Имя пользователя или eMail
Пароль

Забыли пароль?