Компания Meta готовится к выпуску новой версии своей генеративной модели искусственного интеллекта Llama 4, которая, по сообщениям, будет сосредоточена на голосовых функциях. Ожидается, что новая модель появится уже через несколько недель. Основной особенностью Llama 4 станет возможность пользователей прерывать модель во время её речи, что похоже на функции Voice Mode от OpenAI для ChatGPT и Gemini Live от Google.
На конференции Morgan Stanley главный директор по продуктам Meta, Крис Кокс, отметил, что Llama 4 будет «омни» моделью, способной не только к обработке текста, но и к интерпретации и генерации речи, а также других типов данных. Это открывает новые возможности для пользователей, которые смогут взаимодействовать с моделью более естественным образом.
Разработка Llama 4 активизировалась на фоне успеха открытых моделей от китайской лаборатории искусственного интеллекта DeepSeek, которые демонстрируют производительность на уровне или даже лучше, чем модели от Meta. В ответ на это компания Meta приложила усилия для изучения методов, которые позволили DeepSeek снизить стоимость запуска и развертывания моделей.
Новая модель Llama 4 от Meta обещает значительно расширить возможности для пользователей благодаря улучшенным голосовым функциям, что может стать важным шагом в развитии технологий искусственного интеллекта.