怎么玩位置数据——地图分析
不看地图的司机
在上一篇文章《怎么玩位置数据——提出问题》中,用两个生动的例子说明了提问的重要性,提问的角度决定了我们解决问题的方向和思路。来说一个最近发现的一个问题,经常用滴滴打车或者Uber出行,每次使用时,都会把精力花费在软件的地图,反复确认自己上车的位置,但几乎每次司机接单后总会打电话问:“你在哪儿?”感觉这是个无比伤心的事情,因为有时候我也说不清我在哪里。突然觉得在地图上确认自己的位置真是多此一举!那我们经常用的地图到底有什么用呢?
层叠错落的信息
先来说一小段地图发展的历史。上面的图是一张1865年的地图,那一年太平军四处征战,李鸿章的江南机器制造总局刚刚成立。我猜要是曾国藩或者洪秀全要是看到这幅地图一定非常好奇这么多信息这么复杂的地图画工们是如何绘制而成的。鬼佬们的方法很巧妙,他们把所有的建筑物绘制到一块玻璃板上,植被绘制在另一块玻璃板上,道路也绘到一块玻璃板上。这样做的好处就是当画工们在画诸如等高线这样非常密集的信息时,不会同时被房屋这样密集的信息所干扰,也不会一错百错,同时还减少了密集恐惧症的发生率。所有的信息绘制好以后,要做的事情就是把所需信息的玻璃板叠放在一起,然后利用照相制版方法成像出来。
彩色印刷技术出来以后,也沿用了这种“分层”的方法,用三原色来绘制不同的颜色。
再后来,随着计算机技术的发展,技术手段越来越多样,地图的呈现形式也越来越多样,但无论地图最终以什么形式呈现,“分层”的概念一直未变。我们平时用百度地图、高德地图导航,可以把搜索地点的结果理解为一块玻璃板,再把导航的线路理解为另一块玻璃板。由此我们可以把打车时自己标绘的上车地点看做自己绘制的一块玻璃板。
重要的研究方法
地图是地理学研究的一个非常重要的研究手段。除了可以用图形和符号反映到地图的上,我们还可以把知识信息通过地图的形式非常直观的展现出来,帮助我们分析决策。在通过地图分析的道路上,有一个非常经典的教科书般的例子,简单的阐述了地图分析的价值。这个过程,我们在业内称之为“空间分析”。
时间又回到19实际中叶,1854年左右,那时的中国人朋友圈、微博里面还在不停的刷“太平军”,此时的英国伦敦却陷入了一场严重的霍乱之中。当时的伦敦是一个拥有250万人口的城市,那可能是地球上人口最多的城市。虽然维多利亚女王时期的伦敦是一个工业化成都很高的城市,但是人们却只有伊丽莎白时期留下的陈旧基础设施。所以伦敦的卫生情况非常糟糕,没有完善的排污设施,可以想象在没有抽水马桶的年代,粑粑只能承在木桶里,第二天清晨倒出去,好像倒出去就能自动消失一样。瘟疫每个四五年就借助糟糕的环境,随意就能把伦敦人民凸凸掉几万人,政府觉得是恶臭造成了瘟疫的传播,于是他们制定了倾倒地点,让大家往泰晤士河里倾倒。慢慢地,臭味没有了,但是霍乱凸凸的人更多了,因为我们直到霍乱是通过饮水传播而非空气,只可惜绅士们当时并不知道这一点,结果他们实现了恐怖分子都难以实现的目的。
后来冒了一个叫John Snow的医生出来,他一直主张说霍乱是通过水传播的,很显然,没有人相信他。有一天,医生所住的社区突然爆发了霍乱,一星期里,十分之一的人被凸凸了。场面非常可怕,为了说服人们霍乱并非空气传播,他开始走访霍乱家庭。他坚信霍乱是从某个地方爆发的,于是他画了一张地图,把所有的水泵画了出来,又每家每户中病的人数画在地图上。
结论是什么大家应该已经隐约心中有数,但是到底水泵和霍乱的关系有多密切,能够说服大家相信霍乱是通过水体传播的呢?我在GeoHey平台上重现了这份数据,让我们来看看。
霍乱爆发区域中心有个水源,水源附近得霍乱的人数非常多,远离这个水源患病的人数就大大减少。你会发现,在地图的帮助下,你会很容易的就洞察到这一信息,如果没有地图,你看到的就只有数字。
在地图的帮助下,伦敦人民从此走上了幸福快乐的生活,免受霍乱滋扰。
地图的启示
前面说了一大堆,有个词我标红了,那就是“分层”。分层的意义在于叠加,当我们把很多看上去没什么关系的数据放到一起时,往往会产生意料之外的结果。所以,做地图分析的核心是把不同内容的信息相互叠加,观察其间的关系。
南方的春天有种湿哒哒的感觉,北方的春天春风和睦,阳光明媚。真是这样的吗?我们来看地图。
中国人旅游,哪些景点比较热门?来看地图
欢迎从GeoHey获取地理和位置相关的数据、知识、服务
访问网站 http://geohey.com
联系我们 contact@geohey.com
长按扫码关注公众号