Geocoding系列:(二)关于路的一百种错误假设

只要不用全文匹配来Geocoding,大概就要想办法区分出地址的各个组成部分。虽然可以用如CRF之类的统计模型进行标注,但标注结果往往有很多错误还需要一些后处理纠正,这就未免对地址的各个组成部分作出各种假设。比如道路的结尾一定是 “路”, “街”, “道”, “弄” 之类有特点的 更多