别让数据大屏成为大数据的全部
如果你有一个机会,给一位“很大很大的领导”汇报你辛辛苦苦做了一年的数据成果,这个成果会决定你未来职场的前途命运(过分夸张的想法)。你会选择用什么样的方式展示?你会阐述你最最得意的数据精髓——用了极大量的数据破解了一个长久以来困扰专家已久的公式吗?而这个公式涉及到大量的概率统计、信息论的知识,需要至少半个小时还未必让人听得懂?还是请领导参观一下机房,看看你的数据已经占据了多少硬盘和光盘?
你心知肚明,用讲解大数据分析原理(你甚至都不敢解释一下什么叫做卷积)的方式汇报风险很大,除非这个领导是个迥异常人的数理理论学究,而碰到这样领导的基础概率之低,堪比中彩票。更为稳妥的方式,是将你的数据内容项,编纂成一个看板,看板里面的数据是活是死不那么重要,但看板的酷炫与否,新奇与否,是你重点要关注的核心。
这个看板有人叫做仪表盘,有人叫做驾驶舱,有人叫做数据大屏,英文原词儿是Dashboard。自从2020年初新冠疫情席卷肆虐全人类,据我的观察,全球各个国家地区与疾控监测防护相关的机构,是扎堆涌现Dashboard最多的领域。
这其中当属约翰霍普金斯大学的数据网站最具影响力。不过你能说这个仪表盘做的最好看吗?访问速度最快吗?图表能产生最特殊的洞察吗?都不是。而这里最让公共卫生工作者心仪的地方是:
1、数据覆盖最多最广;
2、数据更新最快且方便下载;
3、仪表盘的提供者不算最权威也是顶级权威了。
在约翰霍普金斯大学的Covid-19案例中,仪表盘是数据的加分项,但绝不是最重要的部分。这个为全球公共卫生的数据建设做出了重大贡献的成果,在人所看不见的背后有众多的数据工程师的辛劳。冰山理论在数据领域也一样适用。全球公共卫生的各级领导的双眼,能一下子看到仪表盘背后的价值,而不是仪表盘的模样。
在国家一级的政府中,普遍会用仪表盘来呈现各国自己的疫情数据,也会有一些更有“内涵的”专题来解读数据,而不只是简单的图表堆砌。人的大脑对于缺少对比的数字,几乎没有任何概念。就像你在出国旅游(已经两年了,出国旅游好像已经遥不可及了)的时候,每次消费你都习惯的将当地货币换算成人民币才对消费物的贵贱水平有个判断。图表上,常见的柱图、折线图往往包含了时间上的对比,而地图是最容易理解的空间上的对比。
几乎在所有的和疫情相关的数据仪表盘中,地图都是处在核心的一个组件。数据开发者们倒不是想通过地图来秀数据的“好看”,而是和人有关的数据,总是逃不开人所处的地理位置,关注人就不能不关注地,况且探究相对位置的远近关系,从哪儿来到哪儿去的路线关系,好像是蚀刻在人的基因中。极海与医渡云合作,给中国CDC制作的全球数据看板,该有的图表一样也不缺。相比其它机构常见的主题内容,还增加了一个准实时的航班、航线和航站仪表盘。
讽刺的是将仪表组合在一起形成一个看板集合,其初衷并不是给领导看的。相反,是给最基层的操作者(Operator)使用,以快速判断系统运行情况的。在系统还不那么智能的时代,经过长期训练的飞行员,瞟一眼仪表板的指针,即便没有什么对比,Ta们也能秒懂系统是正常还是发生了什么状况。现代飞行员可能已经更多依赖智能系统自动决策,当真发生了什么意外,也许还得翻阅手册看注释吧。如果不是从一线工作升职、没有经过专业训练的领导对这些仪表的组合,和你我这样的普通人一样,满头的雾水流不尽。
在一个监测城市方方面面的指挥中心里,飞机驾驶室的放大版仪表盘——数据大屏,意义显著。因为这里面:
1、数据鲜活:大家对着真实的、正在发生的数据做判断,而不是空谈数据模型;
2、语言一致:在此处,从接线员到主管,都看得懂大屏上的数字,也都明白这些数字意味着什么,大家没有沟通的障碍,不需要解释铺垫;
3、简单实效:大屏中的数据讲究的是如何最容易表达、最容易引发警觉、最容易帮助决策,花哨、低效的玩意儿很快会被摒弃。
参观访问的领导被迫看大屏,那紧张布置命令的决策者喜欢看什么?我们在影视节目中,无论战争年代还是和平时期,领导们凑在一起要是面前的桌上、墙上有点什么的话,大概率就是地图。除了地图在宏观视角上具有众所周知的优势,借着下图我还想到了传统地图沙盘满足了一个决策者的需求,就是方便决策者参与探究决策的过程——每个人面前都有一个“笔刷”,可以尽情的绘制地图表达Ta们的想法。领导自己可以发挥想象力,探索出来各种可能。技术进步了,沙盘变成了大屏,但面对一片豪华宽广的大屏,领导们除了点头和提问,还能怎么参与?
我们这代人生活在一个极其分化的时代,不知道当年狄更斯表达的是不是类似的感受。在某些人的手中,数据极其重要,别说金不换了,都快和“命”一样宝贵了;而在另外的人那里,别说熟视无睹了,甚至和垃圾一样是个严重的负担。但偏偏每天充斥的新闻“数据这个安全,那个隐私,国家高度重视,大国竞争的下一个战场”云云。你不得不怀疑,难道我已经被时代抛弃了吗?我是活在旧时代吗?数据的萃取与石油的炼化一样,都是需要分工的,在细分的任务中,可能会有价值密度的高度,但关键步骤不能少。就像不能把从地下挖出来的石油装到一个漂亮的瓶子放到你家车子中,车就能跑起来一样,数据也不能仅仅粉饰成大屏就成为大数据项目的全部成果。用大屏做汇报,挺好;但汇报一下就可以了,让我们把精力再投回数据与算法的配合中来。 你只要参与在其中,即便是从一些简单的工作起步,也是在把握一个好时代。
封面图片来自Josh Cottrell-Schloemer。