你需要一个可靠的外部数据助手

老友和一群中年爸爸们带娃玩,孩子们恰巧都是儿子,本想是创造一次父子们户外运动、互相沟通的机会,儿子们本身也都是发小的朋友,但吃饭之前,人人都捧着手机沉浸其间。老友发圈感慨这是一种“病”,但他也知道,这病不好治。都快2023年了,这会儿要是还说落年少年们王者、B站、Twitch、Steam(年轻人都懂科学)成瘾,谁能服气?家里的爷爷奶奶们刷快手、头条、彩视、美篇,也够了兴致盎然的勤奋吧,爸爸妈妈们在微博、淘宝、小红书、爱奇艺上美滋滋、乐融融的时候,不也浑身舒畅吗?更不要说人人都要翻来覆去打开的,跨年龄跨性别的微信、抖音了,谁能逃脱?如果社会上每个人都快得上这个病了,那就不是病,该被称为:人类发展的趋势。

朋友说这是“病”,但确定无疑,没有哪个年轻人可以躲得开这个全人类的“病”

这个趋势是什么?是人对自我延伸的需求已经从获取能量向着获取信息演进,从追求吃饱到追求精神愉悦就是这种阶段跃迁的表现。如果用积极的态度看所有人刷手机的行为,那是因为大家是想知道更多——获取知识,想做的更多——匹配能力,想成为更多——寻求机会。只不过在信息洪流中,手机所能提供的,在知识、能力、机会方面的数据密度太低,而因为手机背后互联网的消息刷新极快,使得人类大脑产生的多巴胺密度较高。在前数字化时代,我们靠什么学知识、碰机会、提能力?靠读书,靠聊天,靠反复试错,靠自我复盘、总结、检讨、鼓励。但现在,世界全面数字化的成果之一——手中一部连的上网的手机,就能带来几乎无穷的知识,更为要命的是手机中的信息比读书聊天有意思的多。向内的自我修炼比不上向外的信息求助,从外部寻找一个信息助手,成为人类发展的必然,这也是数字化顺理成章的结果。

人类的信息需求与软件、硬件、外部世界的紧密交叉关系(参考陆奇老师奇绩创坛六月底的演讲)

在数字化的时代,正如无论怎样坚定的内心强大者也不会鄙夷使用搜索引擎,即便已经建立了良好数据化决策习惯的组织也不会只依靠内部数据,而无视外部数据的价值。但有时候人们会被动的过度自信,尤其是内部数据显示出一切顺利,甚至业务发展还在高歌猛进的时候,能冷静识别外部数据透露的信息,并因此而警觉,真是鲜有的思维特质。一个小有名气的故事:

2007年第一部iPhone问世了,不说诺基亚那时候的嗤之以鼻,在欧美国家拥趸巨多的黑莓也没把乔布斯的“玩意儿”当回事儿。从2007年到黑莓2012年一季度濒死前夜的季度报告出来之前,黑莓用户的数量从800万增长到7700万,几乎增长了9 倍——意味着黑莓在iPhone强打江山的那几年,攻城略地一点也不差。同样令人印象深刻的是每季度营业收入的增长:2007年一季度,黑莓的季度营收为10亿美元,到2011年一季度猛增至55亿美元,大多数季度与上年同期都有40%~100%的增长幅度。如果只看黑莓的内部数据, 谁都会觉得黑莓正从一个胜利走向另一个胜利。但事实上,内部数据本身是并不能覆盖整个市场的全貌,其中明显缺乏涉及市场和竞争对手的直接信息。黑莓高管们的自负使他们无视iPhone的销售和用户反馈数据。

而诺基亚的战略失误大家就更耳熟能详了。诺基亚认为的安全可靠、待机超长,黑莓认为的邮件推送、键盘输入才是用户的心头肉,殊不知这些特性很快就被苹果的操作体验、应用商店击败。企业重大事项的决策是个复杂的过程,但对外部数据的忽视,一味的通过内部数据强化已有的认知,无论怎么合理化解释都是大忌。

黑莓当年如日中天时“巧遇”了iPhone的诞生,内部鲜亮的数据反而加剧了企业决策的风险

排斥外部数据,也不完全是因为企业的管理者们傲慢而自恋。从客观角度去看,一个显见的障碍是外部数据从获取到处理、再到洞察,难度太大。我们极海在选址的业务过程中,经常被用户问到:你们有竞争对手(店)的销售额吗?我猜,如果我回答“有”,用户多半也会狐疑:你与店主是亲戚?你有密探在这家店打工?你去门口数人头了?所以很多外部数据既不可靠也成不了规模。那就涉及到精心筛选外部数据的问题了,到底用哪些数据解释哪类现象,依靠什么高频数据获取情报,如何用间接数据推导结论,以及这其中一系列的数据技术。对于没有数据技术储备的组织,这是何其之难!

我再举一个我们自己碰到的例子。当用户需要迅速的定量评判突发的疫情对经济的影响以及为此做好的准备够不够,该选择哪些变量来做这样的数据分析?能将低频的统计数据与疫情相结合,这就算是做足了内部数据的工作,但内部数据仍然没法帮助决策者了解外部环境当下发生的现实状态以及持续的走势。

海南省部分以县区为统计单元的内部数据示例(海口市三亚市发布的统计数据以市为单元)

而我们简单的通过两类每日更新的高频数据来监测疫情带来的影响,通过一定规模的连锁零售门店的关店情况和航班班次来研究与疫情发展及控制后的相关性,来探查疫情的影响范围和程度,进而预测对经济的伤害水平,这个逻辑简单容易理解。用地图表达门店的具体位置,对比可见疫情对三亚的影响要远远超过海口。这种外部数据呈现从而引发的直接效果,为内部数据提供了一个非常有益的补充。更为关键的是,外部数据可以通过持续更新,让决策者对大局做到连贯性心中有数。

海南全省在营门店数量及具体位置,航班起降量与新增病例的相关性监测

在为本文做知识准备的时候,我看到一篇发表于2015年的论文,分析了人们利用在线评论来预测品牌未来竞争力。论文作者们搜集了77家消费者电子产品和技术品牌公司,从2009年11月到2011年2月的网络热度数据,这些公司包括苹果、索尼(Sony)和摩托罗拉(Motorola)。作者们每个月都通过媒体监测服务公司尼尔森(Nielsen)监测7367个的信息源,从论坛到博客文章,从社交网络到媒体平台。监测品牌在互联网上尤其是社交媒体上被提到的次数,例如苹果的产品在2013年被提到了6.01亿次。不过论文作者也说:“遗憾的是,取得的数据通常很繁杂,如果没有数据科学技术背景,难以提取出有意义的市场洞察。”但这项工作极有价值,用户可以依靠外部的助手处理这些庞杂的数据,按照模板定制,用户可以订阅自动获取洞察结果。

这篇论文给了我很大的鼓励,从外部的监测数据可以为用户提供很多超越企业内部的“真知灼见”,极海会致力于将外部监测数据用更方便的手段、更丰富的内容、更节省的成本让用户更轻松的获得。当然外部数据所涉及的维度确实太广太大,我们选择的方向仍然是在空间位置这个角度将其价值发挥出来,而且地理位置类型的数据其本身具有的特殊有趣性,也使得这类数据在群体决策者中容易引发思考和灵感,加强决策的水平。比如大家都在讨论这个夏天全球很多地方都在发生严重的干旱,我国每年夏天都会紧张的长江中下游汛情,今年不但没有任何汛情,反而担心的是旱情影响水稻的收成。从内部数据看只能做静态的判断,但通过外部数据可以迅速的掌握旱情的影响范围,并可以进行预测。

内部数据显示的鄱阳湖范围
鄱阳湖历史上的湖区面积变化(2000年以前卫星影像不全,参考ReaLSAT水库和湖泊表面积变化的全球数据集机器学习代码
鄱阳湖历史平均范围(左图为200个月平均,右图为300个月),内部数据显示的是湖区面积属于正常波动

而对最新情况的判断和预测得从可靠更新的外部数据获得。

2019年8月份鄱阳湖部分湖区的卫星影像(哨兵2,431波段合成,下同)
2020年8月份鄱阳湖部分湖区的卫星影像
2021年8月份鄱阳湖部分湖区的卫星影像
2022年8月份鄱阳湖部分湖区的卫星影像。从对比上看,今年确实水量萎缩严重,湖区很多地方都裸露成沙土。那么到底减少多少水量?这就是该内部专家发挥作用的地方了

过去是大家都没法知道那么多的数据和信息,现在是有人知道,你却不知道,这就是竞争的劣势。从外部数据上能得到高级别的解读和洞察,那需要的是一大票本领,不是一朝一夕可以补足的。在《搜索的喜悦》这本书中,作者用五分钟就找到朋友拍照发过来照片的位置,甚至还把朋友当前所在大厦前台的电话号码也一并找到。这种“神操作”——如何从浩瀚如烟的互联网上搜索(数据和信息)在作者来看来是开心无比的美妙体验。其实高人一筹的“搜索商”是所有数据工作者的必备素质,也是外部数据助手可靠性的第一体现。

《搜索的乐趣》书中的第一个例子,从看似没有任何线索的图片中找到该图片中建筑物在哪里。你也可以试试,能不能5分钟之内搞定(左下角是线索重点)

组织的自我修炼、人才引进和培养,永远都是战略竞争力的体现,这自不必说,如果目前还没有做好准备,就如鸵鸟伏沙般无视外部数据了吗?这个时侯如果有个可靠的外部数据助手,先不用说获取多大多妙的洞察,至少先保证获取数据的效率,也就是快速的将数据处理到位,有可视化的效果初步引发兴趣和新的认知,就已经是很棒的开端了。

最后,总结一下一个可靠的外部数据助手可以帮助组织实现:

1、管理者能够掌握更多信息 通过整合外部数据,管理者可以根据第三方数据来判断本组织的状态。借助与业界同行进行的一对一对比,可以了解组织的发展状况,而不必单单依赖主管们的见识水平和主观判断能力;

2、决策将彻底转向前瞻式 运用外部数据洞察,可以实时察觉竞争格局中的变化。外部数据洞察提供了许多前瞻性信息,涉及到组织竞争力将会如何发展的诸多线索。通过对这些因素的实时分析,发现趋势,并能预测未来的风险与收益;

3、外部动态会成为组织的关注焦点 积极采用外部数据洞察,实际上是承认组织的未来不只取决于内部因素,更取决于广泛的生态系统。组织将受到大量的外部因素影响,管理者们需要真正坐下来认真分析这些因素,这会促成一种寻求决策客观背景的文化;

4、快速连接外部世界的通风口 基于云的计算能力的指数级增长、人工智能的指数级发展以及外部数据的指数级增多,这三种宏观趋势,会让外部数据洞察软件和算法具有惊人的能力,这种能力带来效率的提升,使得高级决策者的判断不再完全依靠当下的内部数据,而是可以快速的对外部世界进行判断,对未来的结果进行预测。