地理位置有效性验证

数据中的地理位置有效性验证

数据中的地理位置即一定坐标系下的坐标值,要验证其是否有效,可根据数据的相关属性如区域属性(数据所属省市区县)、名称、地址等进行验证。

一、根据数据的区域属性对数据的地理位置有效性进行验证

数据的地理位置和数据所属的区域范围,在统一坐标系下,可通过地理匹配和简单的数学运算对数据的地理位置有效性进行验证,如图1

图1 温州部分居住区地理位置示意图

图1中蓝色区域范围是温州市行政区划,绿色和黄色的点表示温州市部分居住区,通过图示可看出黄色的点已明显超出温州市的行政区划范围,黄色点代表的居住区其地理位置的有效性过低。黄色的点可利用GIS相关工具进行地理匹配识别出来,亦可通过判断居住区的坐标值是否在行政区划范围的最大和最小坐标值范围内来识别。这两种方法中,前一种识别比后一种识别精准,后一种识别比前一种识别更有效率,适用于大数据量处理。

二、根据数据的名称、地址等属性对数据的地理位置有效性进行验证

根据数据的名称、地址等属性对数据的地理位置有效性进行验证,是利用多个地理编码服务开放平台进行对数据进行地理编码获取新的地理位置,将新的地理位置与数据原有地理位置进行比对,计算两者之间的距离,根据距离是否在一定容差范围内(新旧地理位置在平面上相距300米范围内)来判断数据的地理位置是否有效。具体由图2和图3所示

图2 温州龙锦公寓小区地理位置有效性验证示意图

图3 温州龙湾锦园小区地理位置有效性验证示意图

图2和图3中红色三角形点是数据原有的地理位置,在其侧用黑色字体标注的是数据的名称和地址属性;蓝色的点是利用多个地理编码服务开放平台进行地理编码获取的新地理位置,在其侧用黑色字体标注的是进行地理编码时使用的具体方式;蓝色的线条表示新地理位置与原有地理位置之间的连线,线上用紫色字体标注了两者之间相距的平面距离;

由图2所示,温州龙锦公寓小区其原有的地理位置与所有利用地理编码获取的地理位置相距都小于40米,由此判断龙锦公寓小区的原有地理位置的有效性非常高。

由图3所示,温州龙湾锦园小区其原有的地理位置与利用地理编码获取的6个新地理位置中的4个相距小于300米,根据上述中拟定的判断地理位置有效性的容差范围来看,龙湾锦园小区的原有地理位置的有效性还是很高的。

三、总结

方式一:利用数据的区域属性判断数据的地理位置是否在所属区域范围;方式二:利用数据的名称、地址等属性通过地理编码服务开放平台重新获取数据的地理位置,将新旧地理位置进行交叉比对;上述两种方式都能对数据的地理位置有效性进行一定的验证,综合运用两种方式能提高验证的准确性。另外,验证数据地理位置有效性也是提高数据质量的手段,通过方式一和方式二可以选出数据中需要进行返工(重新获取)的数据,有针对性地对数据进行返工,快速修正数据错误,进而提高数据整体质量。