После релиза ChatGPT-o3 от OpenAI тысячи пользователей предлагали программе представить, что она является игроком популярной онлайн-игры GeoGuessr и находить места по фотографиям. Искусственный интеллект показал незаурядные способности, выполняя эти задания, сообщает TechCrunch.
Релиз новой версии прошел 16 апреля. Уже через несколько дней англоязычный сегмент соцсетей заполонили скрины с точными ответами ChatGPT, где он определял места по фотографии из меню ресторана или чучелом носорога из интерьера паба. Сейчас удивительную сноровку искусственного интеллекта определять координаты объектов по фотографиям отмечают как пользователи, так и эксперты.
Онлайн-игра GeoGuessr появилась в 2013 году. У игрока есть задача поочередно посетить пять локаций, которые могут находиться где угодно в мире, где сервис Google Street View провел фотосъемку. Пользователь может «гулять» по улицам, пользоваться компасом, рассматривая растительность, дорожные знаки и анализируя погоду. Когда человек догадывается, где он находится, ставит метку на карте, а игра открывает правильную геолокацию. Чем ближе метка к настоящему месторасположению, тем больше баллов игрок получает. Идея игры выстрелила - вебсайт получил сотни тысяч уникальных посетителей лишь в первую неделю существования и сейчас тоже очень популярен.
Еще в конце 2024 года ИИ-энтузиасты учили ChatGPT играть в GeoGuessr. Программа била рекорды и проходила игру лучше топовых игроков, но тогда приходилось вручную менять код и «скармливать» искусственному интеллекту колоссальное количество данных. Сейчас любой пользователь ChatGPT-o3, не имеющий никаких особых навыков по кодированию, может очень точно определить геолокацию.
Точность сервиса связана с новым алгоритмом визуального мышления, о котором информировал OpenAI. Разработчик научил ИИ думать изображениями: «Впервые эти модели могут интегрировать изображения непосредственно в свою цепь мнений», — говорится в релизе. — Люди могут скачать фотографию доски, схему учебника или нарисованный от руки эскиз, а модель сможет интерпретировать это, даже если изображение размытое, перевернутое или низкое качество».
ChatGPT-o3 получил больше времени на размышления и показывает пользователю цепь своих мыслей: как он пришел к тому или иному выводу. Разработчик говорит: «Наши новые модели визуального мышления работают в паре с другими инструментами, такими как анализ данных Python, веб-поиск, генерация изображений, чтобы креативно и эффективно решать более сложные проблемы, предоставляя пользователям наш первый мультимодальный агентский опыт».
Такие супер-опции могут значительно упростить работу с инструментами OSINT (Open source intelligence – разведка на основе открытых данных) для журналистов-расследователей. Но в то же время умение ChatGPT-o3 чрезвычайно точно и быстро находить локацию может угрожать конфиденциальности частных лиц. Выяснить домашний адрес или местонахождение и без ChatGPT-o3 было возможно, но сервис позволяет тратить на это гораздо меньше усилий. Так что эксперты по цифровой безопасности советуют не публиковать фотографии, по которым можно определить место, где вы живете. Также ChatGPT-o3 может нарушать законодательство стран. К примеру, в Украине по соображениям безопасности запрещено указывать точные адреса попадания российских ракет. В ответ на запрос от TechCrunch OpenAI заверил, что сейчас усовершенствует сервис, чтобы распознавать и блокировать запросы, за которыми кроются преступные намерения.
Команда ZN.UA проверила сильные и слабые стороны ChatGPT-o3. По фотографиям, где были хотя бы самые мелкие, почти неочевидные опознавательные знаки, модель ИИ очень умело определяла расположение. Если же в интернете не было фотографий разыскиваемого места или если на фотографии не было никаких зацепок, программа выдвигала предположения, предлагая похожие места. И гипотетические выводы чаще не были верными.
Вот примеры того, как ChatGPT-o3 рассуждает и находит точные локации. Анализируя фотографии с типичными для Киева последствиями ракетного попадания, ChatGPT-o3 не смог указать точную геолокацию на карте, но предложил сузить поиск до Оболонского, Дарницкого и Соломенского районов.
С киевским муралом «Призрак Киева» по адресу Межигорская, 3 ИИ справился отлично. Поскольку локация популярна, сам мурал является характерным признаком здания и об этом месте много информации в интернете, ChatGPT-o3 легко определил место, потратив на размышления менее минуты. На сундуке можно увидеть также, как ИИ размышляет, анализируя фотографию.
А вот с киевским муралом «Святой Георгий» на Большой Житомирской, 38 у модели возникли проблемы. Здесь фото некачественное и мурал виден не полностью. ChatGPT-o3 смог найти похожую по стилистике, но совсем другой мурал.
Здесь мы предложили модели фото с последствиями ракетного удара 26 июня 2022 года в Киеве по ЖК «Львовский квартал» по адресу Глубочицкая, 13. На сундуке можно увидеть, что при анализе фотографии ИИ разбивает ее на мелкие элементы и изучает отдельно каждый из них.
Здесь на размышления ChatGPT-o3 потратил почти 8 минут. Понял, что это последствия обстрела, но подобрал самые свежие новости за 24 апреля 2025 (очередной массированный обстрел столицы) и указал неправильный адрес.
А здесь мы скачали для анализа настоящие фото последствий обстрела 24 апреля 2025 года. ChatGPT-o3 сразу понял, что это место ракетного удара.
Сначала ИИ подобрал адрес по результатам обстрелов в 2024 году, но после подсказки отметил, что на фото улица Чернобыльская Святошинского района. Район верен, но адрес ошибочный. Так что чем больше данных пользователь сообщает сервису, тем точнее ИИ может справиться с задачей. И чем меньше информации о здании есть в интернете, тем труднее его идентифицировать.
Напоследок скачиваем фото Ботанического сада им. Фомина возле метро «Университет». Сервис выдает правильный ответ за 20 секунд.
Напомним, OpenAI заинтересован в покупке браузера Chrome от Google, если суд примет решение о его принудительной продаже. В компании заявили, что Google как монополист искусственно ограничивает для стартапа доступ к поисковой технологии и продвигает собственный ИИ.