把英雄从网格领回街区
网格是什么
现在我都记得,小时候有一款很火爆的PC游戏叫做「英雄无敌」,之所以时隔这么多年都还记得是因为他有个特点,里面的英雄是在一种类似蜂窝的六边形网格地面移动位置的,同时,不同的英雄拥有不同的攻击射程,射程也是按相距格子的数量计算的,所以说白了,计算格子数就是这个游戏的核心玩法。
后期版本以方格来划分战场,跟棋盘一样。早期用六边形进行划分,拥有更丰富的战斗灵活性和策略性。
可是我们知道,这种计步制的游戏能存活到现在的只能是极少了。因为我们有了很多更复杂,更灵活的新选择,我们厌倦了一直被限制在格子里,并且只能移动规定的距离。于是,我们见到了从格子里走出来的英雄变成了如今的「英雄联盟」,甚至还有能跳伞也能潜水的「吃鸡」汉子。
得益于硬件性能的飙升和游戏引擎的改进,游戏设计师已经可以实现越来越复杂精妙的场景和策略。而现实中,很多地理数据的分析师和研究者还是在格子划出来的区域里做分析,展示,甚至决策。那有没有比格网更好的选择呢,当然是有,保证不到最后就告诉你。
为什么还在用网格
网格化处理地面,然后用格子统计落在里面的各种东西,这是一种很机智的处理方式。当我们需要比行政区级别(一般是区县级,有时候会到乡镇街道级)更细粒度的统计单元的时候,我们是没有很多选择的,要么问人要,可是国家会给你地理国情普查小区或者人口普查小区的统计单元吗;要么自己做,如果是小区域的,还可以自己对着遥感影像矢量化,如果要做的是一座城市的分析,那矢量化的成本几乎是不可接受了,最后一条路就是格网化,简单快速,有时候甚至会被他的简洁产生的美感吸引,再要是做成六边形格网的话,那真的叫赏心悦目,嗯。
但如果我们横向的比较一下其他国家做的分析,他们为什么都不用网格,我们不仅承认而且羡慕,那是因为人家有已经有了划分到家门口的地理区划,并且开放,免费拿。美国人口普查局将全国划分成8级区划,最细粒度一级是block,而一个block一般是20-50户人口。所以我们使用格网与其说是一种选择,不如说是一种无奈的妥协。
网格的缺陷也和他的好处一样明显,主要有两个方面。格网的尺度不好控制,要使用网格,先要创建网格,创建网格的重要参数就是格子的宽度,这个宽度可以任意选择,但一个研究区域只会用同一种宽度的格子,同一种宽度的格子怎么能既照顾到需要集中关注的高密度区域,又适宜地表达低密度的地方呢。另外一点,规则的多边形边界和复杂多变的用地类型天然的矛盾,格子不会考虑横跨的高速路对道路两边的天然隔离,格子也不会考虑一所医院和一片购物中心的用地类型有什么差异。
要化解这些尴尬,需要有一套依据道路等级和自然分界线划分的细粒度的自然街区区划,凑巧,我们已经帮你完成了这个愿望。先说使用自然街区很明显的一点好处是,研究相邻区域的关系,再也不用感受格网造成的尴尬了,真相邻还是假相邻一眼便知。
使用网格还可能对分析结果造成比较严重的偏差,直接影响最终决策。由于网格内的地块性质往往非单一,不纯净,容易造成多种地块混合后的高低属性的互相掩盖,真正的土地性质得不到表现。如果使用大范围格网统计的数值做多因素之间的关联分析,很难得到比较准确的结果,因为各类性质的土地混合单元体现不出真正的地块性质。在地理学上,格网一般只用在对自然资源和环境的分析中,城市和社会研究对此十分谨慎。
沿街道划分的自然街区对此就具有天然优势,因为各等级街道是人口的隔离和聚拢的自然表现,小巷胡同可以把附近的人聚拢在一块,高速路和主干道却把一块地切割成比较独立的活动区域,这种符合情理的划分方式会为各种各样的分析提供可靠性上的保障。
即使不使用网格作为分析的单元,而只是当做整合多种数据源的容器也是不适合的。有规则边界的格网很难兼容其他面状的地理区块,比如居住小区面,大学的范围,公园的范围,都不能放进一个格子里,遭到格子的切分就不能完整地分析;房产板块的面也不会刚好都落在格子里;快递,外卖的配送区域,地推人员的负责分区也都不可能依据格子的划分来开展业务,不合情理的划分会严重拉低工作效率。在这些场景下,自然街区作为多源数据的容器会是他们的必然选择。
自然街区的优势
我们回顾一下自然街区对比网格的优势:
- 更精确的描绘真实世界。自然街区不会做无意义的划分,也不会遗漏真实造成的隔离。
- 更准确的抓住事物联系。自然街区不会混淆高低,任何因素都不应该“被平均”,准确的分割才能抓住任何细微的联系。
- 更兼容的关联业务数据。自然街区才有资格说,“都到我碗里来”。
最后是总结和推广时间。在大数据“平民化”发展的趋势下,每个企业,每个人都可能采集到十分丰富的地理数据,越来越多的人想着的如何让躺着的“石油”流动起来,流到客户的“发动机”里,为客户产生价值,这就需要更多货真价实的研究和产品,地理格网已经很难满足对分析精度的要求,采用更真实,更准确,更兼容的地理统计单元是发展的必然趋势。极海为此依据全国海量交通路网和自然分界线数据生产出了两套高标准全国全覆盖的自然街区区划(有两种等级可供选择),并且,现在就可以通过极海在线平台试用部分城市!一旦用上怕是就退不下来了。
PS: 用热力图也可以做某些分析,但同样具有一些局限性,比如显示精度严重依赖显示的比例尺;只能做点数据的展示,很难做多源多类型数据的叠加;适合展示,但不能作为统计和计算的依据。除此之外,线形网络,泰森多边形和散点图也都可以用作地理数据展示和聚合统计,但是使用场景比较特殊,都很难广泛使用。