Amazon представила новую генеративную модель ИИ под названием Nova Sonic, которая способна обрабатывать голос и генерировать естественное звучание речи. По утверждению компании, производительность Nova Sonic может конкурировать с ведущими голосовыми моделями от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество диалога. Эта модель является ответом Amazon на новые голосовые модели ИИ, которые обеспечивают более естественное взаимодействие по сравнению со старыми моделями, такими как Alexa.
Nova Sonic доступна через платформу Bedrock, которая предназначена для разработки корпоративных приложений ИИ. Amazon называет Nova Sonic «наиболее экономически выгодной» моделью на рынке, которая на восемьдесят процентов дешевле GPT-4o от OpenAI. Компоненты Nova Sonic уже используются в обновленном голосовом ассистенте Alexa+.
Nova Sonic отличается высокой точностью распознавания речи, даже в шумных условиях или при нечетком произношении, достигнув уровня ошибок в словах всего 4,2 процента на многоязычном тесте. Модель также демонстрирует скорость в ответах со средней задержкой 1,09 секунды, что быстрее модели GPT-4o от OpenAI.
Эта технология может быть использована для создания ботов обслуживания клиентов или агентов ИИ для различных отраслей, таких как путешествия, образование и здравоохранение. Nova Sonic уже активно интегрируется в новый ассистент Alexa Plus, что свидетельствует о растущей роли отдела AGI Amazon в стратегии компании.