Qwen представила новые модели для голоса, редактирования изображений и модерации контента

Новая модель способна мгновенно транскрибировать аудио, распознавать языки и интегрируется с различными сервисами для сложных задач

Eleni Karasidi

Опубликовано: 24.09.2025

Новости

Qwen

Группа Qwen AI компании Alibaba представила новую ИИ-модель Qwen3-Omni, которая работает с текстом, изображениями, аудио и видео в реальном времени. Qwen3-Omni обрабатывает текст на 119 языках, распознает речь на 19 языках и отвечает на десяти. Модель может транскрибировать до 30 минут аудио, а её задержка ответа составляет всего 234 миллисекунды. Для удобного использования архитектура разделена на две части: «Thinker» анализирует входные данные и создает текст, а «Talker» сразу преобразует его в речь, что обеспечивает быстрое озвучивание результата.

Qwen3-Omni показала высокие результаты в 32 из 36 тестов на аудио- и видеозадачи, опережая модели Gemini 2.5 Flash и GPT-4o в распознавании речи и генерации голоса. Модель использует архитектуру mixture-of-experts с активацией трех миллиардов параметров во время каждого запроса, что позволяет достичь быстрой обработки и стабильной производительности даже при работе с несколькими типами данных одновременно.

Пользователи могут настраивать поведение Qwen3-Omni через специальные инструкции, например, изменять стиль или «личность» ответов. Модель интегрируется с другими инструментами и сервисами для выполнения сложных задач. Она доступна в Qwen Chat , как демо на Hugging Face, а разработчики могут подключить её к своим приложениям через API от Alibaba.

Кроме базовой версии, Alibaba выпустила специализированную модель Qwen3-Omni-30B-A3B-Captioner для детального описания аудио, например, музыки или звуковых эффектов. В открытом доступе также появились версии Qwen3-Omni-30B-A3B-Instruct для выполнения инструкций и Qwen3-Omni-30B-A3B-Thinking для сложных задач с рассуждением.

Источник:qwen.ai

Комментариев нет

Qwen представила новые модели для голоса, редактирования изображений и модерации контента

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Google добавляет персональные настройки в NotebookLM для пользователей

Amazon MGM Studios тестирует AI Studio для кинопроизводства

Alibaba выпустила Qwen 3.5 для автоматизации работы с приложениями

Claude Opus 4.6 возглавила рейтинг анализа данных ИИ

OpenAI презентовала GPT 5.3 Codex для автоматизации разработки

Навигация

Полезное

Читайте также

Добавить комментарий Отменить ответ

Следи за нами

Популярные новости

Читайте также

Прокачайся с AI!