色彩迷惑:从地图到真相,你也能当数据专家

『请判断这是一张讲述什么故事的地图?』

截图来自纽约时报

请不要用手指向下滑,先猜一猜,除了你一眼就知道这是一张美国地图之外,红色和蓝色代表什么?

一时兴起,我就检测一下几个AI,考考Ta们的『眼力』。

GPT-4说:

很抱歉,由于该图片中包含的信息量较大,且没有提供具体的图例或上下文,我无法准确判断这张地图讲述的具体故事。
然而,根据颜色的分布模式,这张地图可能是一张热图,用于表示某种统计数据在美国不同地区的分布情况。通常,这类地图上的红色和蓝色可能代表不同的数据极值或分类,例如政治选举结果、人口密度、经济活动、气候变化影响等。

Claude-3说:

这张美国地图上每个州用不同的红色深浅来表示各州人口密度的高低。从整体上看,人口密度呈现出东密西疏的格局,东部沿海各州如纽约、佛罗里达、加州等地人口密集,中西部大平原和山地的人口相对稀疏。这反映了美国人口分布受地形、气候、资源禀赋等自然条件的影响,同时也与东部沿海地区开发较早、工商业发达有关。这张人口密度分布图直观地展示了美国人口在空间上的不均衡分布特征,蕴含着丰富的自然和人文地理信息。

Gemini也说是人口密度:

让我非常意外的是一个不知名的小AI——RekaFlash——居然判断的最为准确:

RekaFlash甚至还点到了,可能是2016年的大选。

去查了一下资料,发现RekaFlash 21B的模型评分果然不俗,在这一次读图测试中,甚至胜过GPT-4!

政治素人特朗普『意外』击败希拉里,全球震惊!一晃8年过去了。现在回头看看这张选举结果的地图,也很抓眼球。好像全美国都是支持共和党和特朗普的一片红。

那2020年的结果呢?继续用纽约时报的地图:

是不是仍然觉得全美是红色的海洋,特朗普才应该赢啊!特朗普当年也是用类似的地图在讲故事:说他是受害者,民主党舞弊。但美国人不应该对Ta们的选举规则不熟悉呀。我们这边有这样的疑问很正常。原来还得靠搜索引擎,多看几篇文章,现在直接问,任何一个AI都不会辜负你的:

从地图上看,大部分地区都是红色的,无论是2020还是2016,为什么2020年是拜登获胜呢?

从地图上看,虽然大部分地区都被标记为红色,但这并不意味着共和党候选人特朗普在2020年大选中获得了更多选票。这种视觉上的"红色优势"存在一些误导性,主要原因在于:
美国总统选举实行"选举人团"制度,各州选举人票的数量与其人口规模挂钩,而非国土面积大小。许多面积大但人口稀疏的州虽在地图上"一片红",但其选举人票数量相对较少。
民主党候选人拜登赢得了加利福尼亚、纽约等人口大州,这些州选举人票数量多,在地图上却只是一小片蓝色。反观共和党赢得的许多州虽然面积大,但人口较少,选举人票数量有限。
摇摆州的转向对大选结果影响巨大。2020年,亚利桑那、乔治亚、密歇根、宾夕法尼亚、威斯康星等关键摇摆州从支持特朗普转为支持拜登,让拜登在选举人票方面大幅领先。
特朗普虽在许多传统的保守"红州"获胜,但这些州历来倾向共和党,对选举结果的实质影响有限。而拜登则成功促使关键摇摆州"由红转蓝",扭转了局面。
因此,大选的胜负取决于候选人赢得的选举人票数量,而非获胜州的国土面积大小。尽管2020年地图上"红色面积"占优,但拜登赢得的关键州份为其积累了多数选举人票,最终以306:232的选举人票优势击败特朗普,赢得大选。这也提示我们,对于复杂的政治现象,需要全面、辩证地分析,避免被表象所迷惑。

纽约时报后来还在GitHub上放出来了2020年的选举数据(纽约时报的编辑说,这是可以找到的最可靠的最小行政级别的投票数据)。有数据了,我们自己都可以做一张这样的地图。不知道怎么操作?那就问呗。

根据如下的数据说明,我怎样在QGIS中用这里下载的数据制作成纽约时报地图的样式?

一步步操作下来,就出来结果了。唯一需要补充的,是要将每个小行政单元多边形的描边设为透明,否则地图就会看起来黑乎乎的。(图中有空洞的地方,是纽约时报认为收集到的该选区数据不可靠)

用极海上图免费应用制作一个在线的地图,也没有问题。146596个多边形,制作地图、显示效率,绝对算是佼佼者。而且还能将你的地图故事分享出去。现在你就是专家了!

鼠标点在每个多边形上,都会弹出来该选区的具体数值

鼠标点在每个多边形上,都会弹出来该选区的具体数值

今年的大选年,可能是改变世界未来走向的一年。去查一下最新的民调,拜登对特朗普,目前是226:235。我还以为拜登老爷子一点机会都没有呢。等我做好了地图,觉得也不是没机会。还是这几个黄色的摇摆州是关键吧。这次不用GIS了,直接让Claude 200k做成SVG。因为SVG是个编码的文本格式,对于AI来说,都是文字,容易处理。

在自己制作地图的过程中,我体会到由AI辅助着,多问问这个助手,还能让我们少一点感性,多一丝理性。对了,AI都在提示我们:

对于复杂的政治现象,需要全面、辩证地分析,避免被表象所迷惑。

在这个信息爆炸的时代,能阅读信息图表比以往任何时候都更具有意义。包括地图在内的图表不仅仅是一种数据的视觉展现,它们是信息传递的桥梁,能够跨越语言和文化的障碍,直观地呈现复杂的概念和数据。正如我们所见,即便是AI在分析来自不同来源的地图时,也会有不同的解读和结论,这恰恰说明了信息图表本身就是一种语言,需要精确和谨慎地使用。

地图上的红蓝分布,一眼看去,似乎简单明了,但实际上承载了深刻的社会政治含义。2016年和2020年选举地图的对比展示了,同样的颜色分布下,可能隐藏着截然不同的选举结果。这不仅说明了视觉呈现的局限性,也强调了深入分析和理解背后数据的重要性。

如同RekaFlash 21B所提醒的那样,我们在解读任何信息图表时,必须避免表象的迷惑,追求更深层次的理解。而自己动手制作地图的过程,正是这种深入分析的体现。它要求我们关注每个数据点背后的真实情况,挑战我们的先入为主的观念,并引导我们建立更加客观和全面的世界观。

正因为此,我们可以说,即便AI能给你提供的信息越来越多,信息图表不仅仍然有其意义,而且在帮助我们理解这个纷繁复杂世界的过程中,它们扮演了一个至关重要的角色。信息图表的力量不在于其颜色的鲜艳或设计的美观,而在于它们传递真相的能力。正如一张简单的地图可能揭示一个国家的政治动态,好的信息图表能够透过数字和颜色,让我们触摸到事实的脉络。

因此,让我们不仅要学会阅读图表,更要学会质疑和探究它们所基于的数据。通过提问、验证和创造,我们可以更好地利用这些强大的工具,为自己和Ta人揭示真实世界的多维度面貌。