没有了个人隐私数据,还怎么做位置分析?
我的iPhone X是托堂弟在日本亚马逊上购得的。辗转拿到手了居然发现怎么都关不掉拍照时的喀嚓声,当开始怀疑自己是不是老到对数字设备的基本素养已经严重退化了,才寻求谷歌的帮助——好在谷歌给了答案,在日本出售的iPhone 是无论如何也没法关掉喀嚓声的,就是让拍照者通知一下周边人:我在拍照(我在偷拍你的隐私)。当年我把这个发现当做软件定义世界的好例子——不需要硬件上的不同,只要在软件上做手脚,就能创建不同的特性;今天,随着全球对隐私问题,对个人数据保护的重视,关于苹果这个奇怪的设定的理解,我还是回归了它的本质:苹果尊重各个国家地区对隐私的特殊要求。
我的高中同学跟我说,在德国,有的办公室里要求每个人的手机必须用胶纸贴上摄像头。听起来欧洲的隐私保护要求比日本更加严格。全球似乎有一个共识,中国人对隐私最不在乎。但从今年的3.15晚会上看得出,中国的法律对个人数据的监管肯定越来越严格。那老百姓的认知呢?虽然几乎每个人每天都在不停的刷着手机,但绝大多数人不会了解获取个人隐私的技术细节。不过一旦形成了社会文化的共识,加上iOS和安卓系统会更紧密的提醒用户谨慎处理App获取数据的请求,中国人肯定也会提升对个人数据的关注度。
知名咨询机构WUNDERMAN THOMPSON在2019年对1500名美国成年人(18岁以上)进行调研,于2020年底发布了《隐私时代的客户洞察报告》。报告中的结论是:虽然在线广告和营销中使用的数据历来被认为是相对良性的,但这种情况正在变得越来越糟糕。随着远离类似cookie的技术,各类App越来越倾向于通过确定性标识符(姓名、电子邮件地址、手机号、设备ID)来识别用户。确定性标识符能追踪更复杂的个人信息,而不是像cookie这样的技术只能获取假名身份。
抛开因为在使用手机的过程中而生成的用户画像信息(经用户授权或泄露而获得了隐私),用一群手机的位置代表特定区域的人流量,是很便利的人口分析。这个数据非常轻巧、动态的补充了人口调查数据无法常年更新的不足,使得政府、企业决策者可以根据时间段、时间点的采样人口数量,调整政策、规划设施以及选址优化。极海作为地理大数据的创新者,从第三方技术提供方的角度,用高效能的位置技能为用户提供分析成果,节省了用户为投资大系统、购买大数据的时间和精力。
极海为某营销咨询公司实施的数据分析显示了上海某麦当劳店的消费者及潜在消费者的日间(工作地)和夜间(居住地)的分布。对多月、连续轨迹点的数据处理后进行可视化表达,可以通过下图——圆圈大小表示人流数量的相对多少,颜色用从红到绿表示访问该店的频次高低对比——得出一些洞察:
a、静安区核心地带工作人口数量大,但并非重复消费的客群工作地;
b、重复消费的客群具有明显的工作地聚群特征;
c、部分距离较远小区重复夜间消费的人流甚至超过邻近该店的上海大学周边社区(要获取下图的在线链接,请联系微信小编)。
用相似的逻辑,我们为该咨询公司提供分析报告,这些报告帮助该公司为Ta们的客户制定更加高效的营销策略。
从分析结果中,商家(上图中的麦当劳和奥特莱斯)获取了用户洞察,但却并没有提供任何数据。单单靠商家自己,也无法取得潜在用户的位置。数据是由咨询公司从公开市场上购买的,其中不包含任何个人身份(身份证、手机号)信息。一串轨迹点,完全可以理解为“一部行走的手机”。根据这样的分析,规划师会更容易理解城市居民的出行状态,掌握居民的消费行为,从而优化规划方案,为城市生活的便利性设计出更符合实际情况的设施组合;商家除了更深刻的洞察店铺的运行效率,进而调整布局和选址策略,也一定会对广告的投放有更高的期待。一个简单的道理:重复消费频次高、人口又多的地方加大投放力度就好。
从极海的小伙伴处理海量的散点工作中,我体会,这种类型的位置数据对手机用户的个体是安全的。在整个业务的流程里,无论是商家、咨询商还是我们这样的技术服务商,并没有人、也没有办法将某一条数据归结到一个具体的人身上。即便如此,除了全球各个国家政府的政策风险,无论是手机厂商的态度,操作系统的限制,还是App开发者对第三方SDK的谨慎,以及用户自己通过手机的设置主动收回对隐私(包括位置类型)数据的外泄,都会造成用这类数据做分析恐怕是越来越难。作为一个数据工作者,心理有些戚戚然,但对于我们广大对位置分析有强烈需求的用户,面对难题,我有一些建议:
1、看轻一点外部人口数据的价值,猛挖自己运营数据的金矿:
既然可靠、可信、可买的人口数据难求,那就多多尝试对自己掌握数据的挖掘。数字化转型是每个组织都要搭乘的时代之船——转,上船可能到达彼岸;不转,留在原地淹死。将企业资产数字化只是第一步,轰轰烈烈的数据中台运动最核心还是将企业的数据凝练、运用起来。稍稍在位置的维度增加一些分析工作,哪怕就是基本的可视化,也会提升一点决策的科学性。某共享电动车通过分析电动车轨迹数据,可以发现哪些道路用户常经过(上下班重复频次高),哪些停车场车辆投放数量大但交换律低(浅色大圆圈),哪些停车场投放数量少但交换律高(红色小圆圈)。基于这样的可视化结果,运营策略优化不言自明;
2、机器学习寻找隐藏的相关因子:
用人口数据直接确定目标受众,这个决策直接了当,也符合我们的因果认知直觉。如果确定无疑,再也没有这个数据了呢?您还要不要去探究:某个街区到底是什么特征?我的目标人群会不会在这里?单从位置因素评判,候选点的销售额处于什么区间?销售额到底与什么相关?从极海多次与用户配合(用户提供样本)的实践,将一揽子带有标签的位置数据集(自然街区、POI、房价、交通、客单价、竞品。。。)“喂”给机器,让机器智能自己跑模型,极海的数据科学家给予机器“亲切的指导”,机器预测的结果完全具有可用性。这也是极海智能决策持续进行创新实践的坚定方向;
3、主动跟踪变化,让变化启发洞见。
最后,即便不做那些深度的分析和模型训练工作,也可以主动观察变化来获取洞察。什么地方又有什么新的设施(商场、小区、学校)落成?这种设施归属哪类聚客点?竞争对手或者品牌榜样又在哪里有新的连锁店开业?闭店?哪些地方最近趋近于扎堆?哪些地方倾向于稀疏?就算是用别人的实践,也可以推断人流变化,类比自己的客群。在”极海品牌监测“其中一期的报告中,介绍了奈雪の茶如何跟随星巴克的分析思路,很可能这种跟随策略是最容易复制、也最容易操作的。而极海的使命就是倾全力全网收集、清洗、发布这类高频变化的位置数据。简单的数据,易懂的逻辑,深刻的洞见,这是我们希望和用户一起配合实现的目标。
位置数据在分析师的手里,并无隐私;在手机机主的眼里,却是非常不想泄露的隐私。这是一个悖论。从大趋势上看,通过追求这类数据直击目标人群,会是个让人失望的执念。而对于数据分析工作者来说,被逼去做深入的数据加工、衍生、训练和挖掘,反而能开辟一扇更光明的大门。极海的小伙伴会陪同用户们在大门外,敞亮的享受数据的阳光!