你的照片在哪儿拍的 AI现在一下子就能看出来(组图)

把科学带回家 3 Months 0

“你好！明天是母亲节，我妈妈大约八年前去世了。我不知道你能否看出这照片是在哪儿拍的，因为我当时还很小，不记得了。”

图片来源：georainbolt

在判断照片拍摄的地理位置方面，25岁的特雷弗·雷恩博尔特（Trevor Rainbolt）是有名的专家，他经常收到网友让他帮忙寻找老照片拍摄地的请求。凭借出色的判断，他帮助了很多人。

，时长00:21

视频来源：georainbolt

雷恩博尔特是GeoGuessr这款看照片猜位置游戏的专业玩家，他的走红也让很多人知道了这款游戏。出色的成绩离不开长时间的训练，他玩这个游戏的时间已经超过一万个小时，疫情期间每天能玩四到八个小时。

不过，今年五月，他败给了AI。

这个厉害的AI玩家由斯坦福大学的三名研究生开发，用时大约两个月。在训练时，它猜出照片拍摄地所在国家的正确率是92%，玩GeoGuessr的平均分高达4525(满分是5000分)，在全球玩家中排前0.01%。

AI有时候接近满分 | 图片来源：georainbolt

面对这个AI对手，雷恩博尔特也甘拜下风。不过，这个AI可能带来的隐私风险，也让很多人感到不安。

如何判断图像位置

和雷恩博尔特一样，AI的三位研发人员也是GeoGuessr的资深玩家。

GeoGuessr是一款在线地理猜测游戏，大约有5000万个玩家，由瑞典的一位软件工程师在2013年开发。进入游戏时，玩家会被随机放置在谷歌街景的某个地方，然后根据画面信息猜测自己所处的地理位置，最后玩家需在世界地图上的某个地方放置一颗图钉，标记出自己的推测地点。游戏的玩家大多都很年轻，一些最优秀的玩家甚至只有14岁。

雷恩博尔特对阵AI时第一轮出现的图像，你也来猜猜看吧 | 图片来源：georainbolt

玩家猜测的准确度和速度决定了得分高低。猜测的位置越接近实际位置，玩家赢得的分数就越多。另外，越快完成猜测的玩家也会获得更高的得分。

第一轮比赛分数 | 图片来源：georainbolt

游戏所提供的谷歌街景图像中的任何细节都是玩家们判断的依据。照片里地上的土、电线杆、街道标志、道路标线、人们的穿着、植物、可见的景观等线索都能用来判断位置。当然，玩家个人的直觉也很重要。

关于判断技巧，雷恩博尔特会建议先去找图里的护柱和电线杆，这些东西每个国家或地区都有非常独特的设计。例如，丹麦的护柱上有黄色的顶部，德国的是黑色的。

向左滑动查看更多护柱

向左滑动查看更多电线杆

再比如，电线杆使用的材料也有讲究，有些是木头的，有些是混凝土的。电线杆的形状也各有不同，杆上面的贴纸也是一个线索。“澳大利亚95%的混凝土电线杆都在维多利亚州，”雷恩博尔特说道。

在澳大利亚的塔斯马尼亚，电线杆有防止袋貂攀爬的装置 | 图片来源：wired

专业的玩家会学多种语言，记住不同国家都有哪些不同的东西，例如知道哪些国家使用三重白色道路线，哪些国家有虚线道路线，哪些国家有绿色的道路标志，标志上是什么样的字体，道路所使用的建造材料、道路长度、路上的汽车车牌和汽车类型，以及道路两边的植被类型……所有看似普通且微小的细节统统都是游戏线索。

图片来源：georainbolt

除了画面的内容，谷歌街景拍摄的图像质量也有区别。作为世界上国土面积最小的共和国，圣马力诺是一个被意大利包围的国中国，这里的街景和意大利看着很像。但是，两者的图像质量却不一样——圣马力诺的差一些。

被意大利包围的圣马力诺 | wikipedia

另外，你有时候还会看到谷歌街景车的一小部分，如果看到街景车的顶部有黑色胶带，那么就表明图片所在位置是非洲西部国家加纳。

街景车上的黑胶带 | 图片来源geoguessr

玩家们还会分享各种线索，但是由于谷歌街景图像有2200亿多张，因此要记住所有提示不太现实，大师级的玩家往往也很依靠直觉。

AI虽然没有人类玩家这样的第六感，但是它不仅能看到人类能看到的明显特征，也能关注到被人忽视的微小细节。

AI击败人类玩家

去年，斯坦福大学的一群研究生正在学习人工智能课程《深度多任务和元学习》（ Deep Multitask and Meta Learning），三个都爱玩GeoGuessr的学生需要一个项目，于是他们决定从共同的爱好出发，试试看能否打造出一个比人类玩家更厉害的人工智能玩家。

他们的项目名称是“预测图像地理位置”(Predicting Image Geolocations），根据字母的首字母将其简称为PIGEON（鸽子）。他们采用了OpenAI（也是ChatGPT的开发公司）制作的CLIP神经网络，通过阅读文本来了解、分析图像。之后，他们再用谷歌街景图像来训练这个系统。训练的数据集包含的谷歌街景图像大约有50万张。

AI会把图像分成一个个的非常微小的方块进行分析，并且非常擅长从中选出那些特殊的方块。而对AI而言，一张图片其实不仅仅是图像，还有相对应的文本信息。通过综合图像中的建筑物、街道布局、植被和地标等视觉信息，以及天气条件、季节和气候等其他的辅助信息，AI也能像顶级玩家那样对图片的拍摄地进行快速预测。

面对一张图片，AI既分析文本，也分析图像 | 参考资料[1]

尽管数据集规模相对较小，但最终AI系统表现还是非常不错，不仅准确率高，误差和人类猜测的相比也更小，可以定位到实际地点周围大约40千米以内。在和雷恩博尔特的比赛中，AI轻松地赢了好多轮。

AI模型对图像中不同区域的关注程度，可以看出相机上的污点 | 参考资料[1]

“我们并不是第一个与雷恩博尔特对抗的AI，我们只是第一个战胜雷恩博尔特的AI。”AI系统的开发者之一米哈尔·斯克雷塔 (Michal Skreta) 说道。

AI猜测的位置更加接近实际地点 | 参考资料[1]

他们认为这项技术具有多种潜在的应用前景，例如可以识别需要修复的道路或电线，迅速发现入侵植物。在之后的研究中，他们还将进一步改进模型，以提高定位的准确性，另外将扩大地理定位的数据集，涵盖更多的地理区域和环境，以提高模型的泛化能力（指模型在面对未曾见过的数据或新的情境时的表现能力）。

可能的风险

这个程序似乎已经可以对街景之外的照片进行地理定位。“我给了它一些十多年前公路旅行中的一些照片，它找出了其中的大部分地方。它猜到了黄石公园内的一个露营地，距离大约55千米。另一张照片是在旧金山的一条街道上拍摄的，它猜出的地点就距离几个街区。这引起了一些专家的担忧。”美国国家公共电台的科学编辑杰夫·布鲁姆菲尔 (Geoff Brumfiel) 说道。

面对不断强大又缺乏监管的AI，个人隐私安全保护起来似乎越来越难了。从隐私角度来看，我们的位置可能是一组非常敏感的信息。过去，人们可以删除照片的GPS位置标记，现在这可能也不起作用了。

一个预算很低的学生项目就有如此大的潜力，企业和更大的机构或许能够更加轻松地监视普通人，而图谋不轨的人也能更容易地跟踪、伤害他人。

既然赢不了AI，那就享受游戏过程吧，猜猜这张照片出自哪里？