读美国2020年总统大选地图提升你的“数商”

数据不是一切,但一切都将变成数据。
                                                                                                      ——————涂子沛

题目中的“数商”是我从涂子沛老师的新书——《数商,如何用数据思考和行动,并在智能时代胜出》——中借来的概念。在科学界,当用“商(quotient)”这个词来表达特定能力的量度时,明确被认可的只有智商,大众还广泛接受的是情商。其它什么财商、德商还有逆商,都不算是很容易量化的概念,肯定也都没有一个科学的定义。

但我很喜欢涂子沛老师定义的数商这一概念。他说数商是用来衡量数据能力、数据实力、数据优势的。我们极海创业也是很想修炼这个能力,也有在一个特定领域内做到数商天下第一的理想。而作为个人,怎么提升这个时代急需的能力?尤其是年轻的一代?数学看似是数商的基础,而数学又很枯燥。我倒是有个办法,就是从有趣的和数据又相关的故事中,从感性的认知刺激进入理性一点的进步。美国总统大选的地图,正好是应景的一个素材,让我们从大选地图中获取一些地理数商的小乐趣吧。

图片整理@Alan McConchie

美国人有太多的老百姓其实是根本不关心政治的,谁当总统都无所谓。但每一次选举季,地图和图表都会占据主要新闻媒体和社交媒体的中心位置。在今年,也许是数字化时代的趋势更加明确,也许是两位参选者都有太多的话题,各大媒体似乎也感受到了公众对数字化结果以及如何理解该结果的热情,数据可视化工作者和制图技术人竞相在紧迫的时间内制作出Ta们能拿得出手的最好作品。

一、选举前

在选举前夜,FiveThirtyEight做了40000次模拟,认为拜登获胜的概率非常大。具体模拟的算法我没有去研究,但做出来的模拟实例非常有意思。而且该网站用可交互的地图,让读者看到各个州红蓝深浅(对特朗普和拜登支持的程度)以及选举人票是多少清晰的表达。另外这个网站对地图的用色也很柔和,看起来并不是那么重的饱和度。对两位候选人的形象做了卡通化处理,增加了地图的趣味性。

将各种可能的结果用地图集聚的形式展出
两个卡通人物非常传神。蒙大拿地方很大,但选举人票只有3张,淡红的色彩意味着倾向于特朗普,但并不那么确定

如果说预测是一种模拟,那模拟发生的各种情况,也会让读者进一步理解有各种的可能。对若干可能性进行探索是提升自己数商的一个好方法。2012年奥巴马对战罗姆尼的时候,纽约时报的“通往白宫之路”,就很形象的用决策树的形式,探索两位竞争者在各个州的胜负对最终结果可能的影响。从这个决策树中,你会明显的理解到,摇摆州是多么的重要,尤其是选举人票多的摇摆州,一定是候选人必争的战略要地。

奥巴马只要赢下佛罗里达州和俄亥俄州,就可以以最短路径获胜,而罗姆尼的最短路径还要加上北卡、弗吉尼亚和威斯康星,难度要大一些(Shan Carter and Mike Bostock制作)
2020年,Kerry Rodden制作的版本是圆形的树状图,不如上图容易理解,但也可以读懂每种可能的路线图。该作品基于D3制作,源代码在此

二、选举中

在选举当天,一些可视化牛人们开始出动,用各类新闻资源数据展示Ta们的地图秀。Ian Johnson和 EJ Fox 两位大神甚至在Twitch中直播了他俩如何在当晚连夜协同创作可视化作品的进展。

用纽约时报的API制作实时状态地图
清晰的显示各个州的各个县尚未统计的选票占总票数的百分比以及与2016年大选的差距,代码在此

三、选举后

在投票结束后的第一个晚上,大部分州的竞选结果都已经出来了。本来按照惯例,北京时间的中午,即可以明确知道到底谁将会是第46届总统,但今年因为有邮寄选票的幺蛾子,恰巧在几个关键的摇摆州还需要几天的计票工作(直到今天,整个计票工作也没有完全搞定)。后来的剧情全世界都知道了,但不是本文的主题,我们略过不表。到结束投票后一天完全不用全国地图就可以更好地解释剩下的选举结果。英国广播公司(BBC)的这张简单的信息图出色地告诉了读者需要知道的一切:

给我的启发是:大地图有大地图的用途,小地图有小地图的场景

此后几天,所有的眼睛都注视着这五个州,注意着最后的选票以令人痛苦的缓慢速度被清点。全世界对政治感兴趣的人,可能是头一次认真的研究宾夕法尼亚州各个县的分布和人口情况。

彭博为这五个州分别制作了专题,用更柔和的颜色来显示各个县的选票数、领先情况
彭博的最后结果地图是这样的。各州的相对位置、选举人票数、获胜情况,一目了然

今年的一个新动态是,可视化爱好者们和程序员使用来自纽约时报的数据(API)来开发自己的作品。这使得人们能够能根据自己的兴趣或者读者的兴趣,回答关于数据的特定问题。一个基于纽约时报信息流的网站提供了实时更新的电子表格,精确的做了数据的“结构化”。

有人分享数据,有人负责整理,有人提供API,程序员们美的不行不行(谷歌翻译将特朗普翻译成“王牌”,谷歌翻译的水平是。。故意的吧?)

到底怎么解释这种红蓝转变的过程,FiveThirtyEight制作了一张很好的图表来解释“红移”和“蓝移”在各州的表现。我特别喜欢这张图表上的注解:

地图、投票数、时间的迁移都放到一起表达,非常棒的创意!

探求投票人的地域与选举结果的因果联系以及对其进行解释,哪怕就是相关性研究,一定还会在相当长的一段时间内延续。到底精英阶层、红脖子、黑人、拉美裔、亚裔及其它少数裔有没有一个普遍的观念,住在城市、近郊、远郊 、农村哪儿的人更有什么样的倾向性,我们将会看到更多的资料和文章。华尔街日报的解释配置成地图,非常有故事性。

华尔街日报的红蓝变化

用流向图来表达本次选举和上次的不同,也就是说选民倾向的变化,几大媒体都有自己的样式。

纽约时报的箭头图
华盛顿邮报做了酷酷的动画,除了蓝红的“左右”,还用“风力”大小表示人数,黄色框的州从上次支持特朗普投向了拜登
华盛顿邮报风向图。2020年选举与2016年选举的对比

四、用地图误导大众

说个特朗普的笑话,他在去年10月1日即将被众议院弹劾的时候,发了一条推文,意思说“你们试试看,要弹劾美国人的民意吗?”。配合该推文的地图疑似是用了2016年选举的结果。这条推文激起一众图表专家和数据可视化工作者的嘲讽。所以,在互联网的时代,不要随意用带有误导性的数据图表,容易被指摘要么是居心叵测要么是愚蠢到家。Karim Douïeb制作了一个动画来说明,不是“地”在投票,而是“人”才投票。

这也是好事儿,特朗普的笑话也让大家更知道美国的选举人地图该如何表达为好。

法国世界报的版本
纽约时报的版本
半岛电视台的版本
金融时报的版本
经济学人的版本(哦,居然看起来还是红分布更广啊!这张图非常清晰的显示了美国人不同地域政治倾向的分化)

媒体出的选举地图实在是太多了,不再轰炸大家的视觉细胞。今年,大家都看到了传统风格的不断改进,以及随着选举后计票可视化而形成的一个令人兴奋的新领域。数据可视化的实践者正在努力应对如何表现不确定性,而且还要同时保持可视化的清晰性和易于理解性。显然,地图很容易成为“伪造事实”的工具,但最终还是因为有各方视角的存在和表达,而趋向于表现客观事实。所谓道理越辩越明吧。我们可以说美国的政治离我们很远,但用地图看数据、做数据、讲数据这样的数商探索离我们很近,在这方面美国的小伙伴比我们有探索精神,这种差距鼓舞我们也奋力前行。我感受到极海的小伙伴就是提升数商最努力的一群年轻人。

最后,我还是引用涂子沛老师书中的文字来划重点:

未来的文明将以数据为中心,未来竞争就是数据竞争。数商就是记录数据、组织数据、保存数据、搜索数据、分析数据、控制数据等以数据为对象的能力水平高低的一种衡量体系。

“读数”的技能就像“读字”的技能一样重要,而“读图”的技能是我们在孩童时代就有的本事,比读字还要容易。让我们从地图入手,一起修炼面向未来的数据技能。

本文内容参考快公司、纽约时报、华尔街邮报、华盛顿邮报、经济学人等媒体网站以及各位Twitter博主、大神。