制图技巧|教你选择正确的分段设色方法
地理学家David Harvey曾说:“分类也许是种基本方法,通过这种方法,我们使来自现实世界的巨大信息流具有某种顺序和相关性”。地图中的分类可以使用数值字段进行分段设置颜色,来表现数据特征。如下图小麦产量对比图,颜色分段图和纯色地图相比较而言就更能表达各省小麦产量的差别。
不同的数据分布特征和使用目的应该选择不同的分段方法。极海地理云平台中数据上图应用中提供了五种分段方法。这篇文章我们聊聊这五种常见的分段方法及其适用场景。
1.自然分段(自然间断点分段法)
指通过调整每类中所有值方差之和使之最大程度减小,得到的结果组内方差尽可能小,类间方差尽可能大,分段点出现在值发生剧烈变化的位置。
适用场景:一般情况下不清楚数据分布特征可以优先选择该方法,自然断点分类法应用非常广泛,如数据分布无特殊规律使用此类方法能最容易得到理想的结果。下图所使用的数据是2018年北京市各街道乡镇的工作人口。数据分布与分段效果图如下所示。
2.平均分段(等间隔法)
指根据数据范围等间隔划分分段区间。
适用场景:适用于数据范围比较固定,极端数值少的数据。如百分比,温度,成绩这类情况,可以很容易比较每类中值的数量,容易突出极端情况特征。缺点是没有考虑数据实际分布情况,分段间隔中可能无值。从下图可以看出平均分段图中极大值分段结果体现的就比自然分段强。如果只想体现极大值可以使用该分段方法
3.分位数法
指选择区间使每个区间的值数量保持一致
适用场景:适用于呈线性分布的数据。优点是保证每个分段都有值,不会出现空值分段。缺点是未考虑到数据分布的实际情况,显示结果可能带来误导性。如下图所示由于极大值数量少,划分到最后一个分段数量特别多导致图上红色色块大幅增加。
4.手动分段
指能自定义设置分段间隔点和分段数量
适用场景:适用于行业规范中分段间隔固定的情况,这时就需要手动调整分段值。如下图所示需要2010全国人口密度分级图中人口密度这个指标分级有一定的标准,就要使用到手动分段。
指一种基于分形思维的Head/tail Breaks分段方法。利用数据特征的自相似性来不断的进行递归分割。
适用场景:适用于长尾数据,Ht-index方法能够更好的展示其头部特征。
如下图,自然界的复杂程度远高于人造事物,如果适用自然分段会扭曲放大自然现象,而通过Head/tail Breaks进行分段结果就更接近于实际情况,需要说明的是并不是可视化效果越好地图就越成功,而是需要更能表达实际场景。
以上就是五种常用的地理数据分类方法及其适用范围,建议在制作分段图时不是选择可视化效果最好的,而是结合目的尝试不同的分段方法,最后选择符合实际情况的选择分段方法。
参考资料
1.《地理空间分析-原理、技术与软件工具》
2.数据分类方法
3.Choropleth Maps – A Guide to Data Classification
4.Head/tail Breaks
5.Geospatial Analysis Requires a Different Way of Thinking: The Problem of Spatial Heterogeneity