Geocoding系列(二):关于路的一百种错误假设

只要不用全文匹配来Geocoding,大概就要想办法区分出地址的各个组成部分。虽然可以用如CRF之类的统计模型进行标注,但标注结果往往有很多错误还需要一些后处理纠正,这就未免对地址的各个组成部分作出各种假设。比如道路的结尾一定是 “路”, “街”, “道”, “弄” 之类有特点的 更多

航班数据杂谈

飞行是人类自古以来的理想。经过人类长期的探索和勇敢的尝试,在18世纪产业革命的推动下,1783年法国蒙哥尔费兄弟的热空气气球和J.-A.C.查理的氢气气球相继升空成功,标志着人类航空发展的第一次重大突破。比重小于空气的飞行器作为空中交通工具还存在速度低的缺点,要在大气层中实现高 更多

从《速度与激情8》的“天眼”到《天空之眼》

(并没有剧透,请放心阅读 :P) 上周末上映的《速度与激情8》余热未消,至今中国大陆票房综合累计已超过18亿。本系列已经拍到第八部还能大受欢迎不仅是因为符合人类荷尔蒙的冲动而且也因为层出不穷的黑科技。《速8》中最让小编印象深刻的黑科技是在纽约的街头黑客通过“天眼”系统来控制成千上 更多

LDJ LDJ

周末休闲去哪里?地理大数据告诉你

有没有这样的经历,每次周末出去玩,都觉得人好多,不知道是看景还是看人?心里暗暗地告诉自己,下次周末一定老老实实的,再也不出来玩耍了,就算玩,也只去离家近的超市,商场溜达溜达,为达康书记的GDP加油。当你下周末在超市大排长龙等着结账的时候,不要忘了我现在告诉你,其实周末市区的人比郊 更多

lyb lyb

从自然科学方法到社会经济问题——借用水流工具,来进行"客流"的分析(下)

上一篇文章中,我们在地图上建了高山流水的模型;并提到如果把山体的"梯度"抽象成任何"成本"(时间、金钱、风险、环境影响 etc.),则在"成本"的平面上,从一点到另一点"距离"的含义也即从水流量的累积抽象成了成本的累积,并能用于社会经济问题的分析——这样描述是否有些太抽象了? 本 更多

从啤酒尿布到位置服务

啤酒和尿布的案例是大数据技术应用的经典案例,某家超市在对消费者的购物行为进行分析时发现,男性顾客在购买婴儿尿片时,常常会搭配几瓶啤酒来犒劳自己,根据这个结果推出了将啤酒和尿布捆绑销售的促销手段。 在数据分析中我们常常需要在购物车众多商品种类中找出类似啤酒与尿布这样并发的模式,于是 更多

Zoey

GeoHey Lab:天眼识路

道路数据的时效性决定了导航的好坏。比如,如果两个地点之间新建了一条更短的路,而导航软件用的还是旧的路网的话,偏信导航的司机可能就会多走一段冤枉路;而如果路网的变化能够快速反应在导航软件中,势必可以大大提高司机开车的效率。 传统的路网采集基本上是采用实地勘测的方法,耗时耗力,并且更 更多