В сети набирает обороты новая тенденция — пользователи активно используют ChatGPT для определения местоположения, изображенного на снимках. После запуска OpenAI новых моделей ИИ — o3 и o4-mini — сообщество удивилось их возможностям: эти модели умеют тщательно анализировать фото, даже если они размыты или обрезаны, и способны находить мельчайшие подсказки для идентификации городов, заведений и даже конкретных ресторанов или баров.
The geoguessing power of o3 is a really good sample of its agentic abilities. Between its smart guessing and its ability to zoom into images, to do web searches, and read text, the results can be very freaky.
— Ethan Mollick (@emollick) April 17, 2025
I stripped location info from the photo & prompted “geoguess this” pic.twitter.com/KaQiXHUvYL
Платформу X заполонили примеры, где пользователи загружают в ChatGPT меню ресторанов, снимки фасадов или случайные фото с прогулок и просят модель сыграть в «GeoGuessr» — игру, где нужно угадать локацию по изображению. Впечатляющие результаты породили волну восхищения, ведь o3 иногда распознает места за считанные секунды, даже если на фото — всего лишь интерьер библиотеки или необычный предмет в баре.
Тестирование показало, что даже предыдущая модель GPT-4o, которая не имела расширенных «визуальных» способностей, во многих случаях справлялась с задачами не хуже o3. Однако o3 все же смогла справиться с некоторыми снимками, которые GPT-4o не распознала — например, определить известную закладку в Вильямсбурге по фиолетовой голове носорога на стене.
Вместе с восхищением в сообществе появились и беспокойства по поводу приватности — модели способны анализировать фото, не используя метаданные или историю предыдущих разговоров, что открывает новые риски для пользователей. Представители OpenAI заявили, что добавили механизмы отказа в случае запросов, связанных с приватной информацией, и активно следят за соблюдением политик по конфиденциальности, но имеющиеся случаи демонстрируют, что вопросы безопасности остаются открытыми.