Компания xAI Илона Маска интегрировала функцию понимания изображений в свою модель Grok. Теперь пользователи с платной подпиской на социальной платформе X могут загружать изображения и задавать ИИ вопросы о их содержании. Представитель xAI подтвердил новые возможности в своем посте на X.
Новая функция позволяет Grok объяснять шутки на изображениях, когда кому-то это нужно. Хотя сейчас этот функционал находится на этапе беты, разработчики обещают дальнейшее его улучшение.

Первые пользователи новой функции активно уже сообщают, что ИИ не всегда может «понять» базовые мемы. Другие сообщают о трудностях с загрузкой изображений — иногда их приходится загружать несколько раз. Также Grok пока не умеет создавать изображения в ответ на анализ других изображений.
Это обновление соответствует стратегии компании по созданию мультимодальных возможностей своих моделей. В августе этого года был выпущен Grok-2 с поддержкой генерации изображений благодаря технологии FLUX.1.
Владелец социальной сети X, Илон Маск намекнул, что следующие обновления позволят Grok обрабатывать документы в форматах, как, например, PDF. По словам Маска, команда достигает тех целей, на которые другим понадобились бы годы, всего за несколько месяцев.