从啤酒尿布到位置服务

啤酒和尿布的案例是大数据技术应用的经典案例,某家超市在对消费者的购物行为进行分析时发现,男性顾客在购买婴儿尿片时,常常会搭配几瓶啤酒来犒劳自己,根据这个结果推出了将啤酒和尿布捆绑销售的促销手段。

在数据分析中我们常常需要在购物车众多商品种类中找出类似啤酒与尿布这样并发的模式,于是就有了关联规则。关联规则可以在社交网络数据中用于好友推荐,也可以用在大规模数据集中寻找其他有趣的关系。

计算机在检索数据时,发现出现情况A时,情况B也会出现,即A-->B。衡量这个规则强度的两个指标是支持度和置信度。支持度说明A和B同时出现的情况是不是经常发生,置信度说明A出现后B出现的可能性有多大。若满足给定的支持度与置信度,则说明这样的规则是一种强关联规则。

将关联规则引入到空间数据中,就有了同位模式。即加入邻域参数,寻找在空间邻近距离内频繁抱团出现的地理实体。空间同位模式已被应用于疾病防控、设施布局、城市犯罪分析等。

POI(point of interest)数据包含大量的地理实体,信息丰富。通过对POI数据进行同位模式分析可以挖掘出隐藏的空间规律。在商业选址分析中,决策者可根据不同类型商业网点的空间邻近规律决定新网点的选址。另外,通过分析各类服务请求的空间依赖规律,可以帮助移动位置服务提供商更有效地发布基于位置敏感的服务广告等移动商品。