Alibaba добавила новые функции в чат-бот Qwen Chat — теперь он умеет говорить и видеть. В голосовом режиме можно общаться с ИИ в реальном времени. Одновременно бот может работать с камерой: видеть предметы и реагировать на них, описывая их. Все это доступно бесплатно, прямо из браузера.

Сессия голосового чата длится до трех минут. Можно выбрать один из нескольких голосов, включая голос «Виртуальная подруга» — интонация которого намекает, что общение может быть не только информативным. Система работает быстро, ответы звучат естественно, без задержек.
Функции доступны на английском и китайском языках. Если начать говорить на другом языке — виртуальный собеседник переключается на китайский. Если выключить микрофон, можно перейти в текстовый режим. Но основная фишка — сочетание голоса, визуального анализа и живой реакции.
Вместе с обновлением Qwen Chat компания презентовала новую визуальную модель QVQ-Max. Она анализирует изображения и видео, умеет распознавать лица и дает комментарии к увиденному.