极海第一次用户会,一起发现探索未来的5个洞见

2011年的夏天,我正在美国出差。那是一个周三的傍晚,窗外军港下的斜阳推送着和煦的暖风,餐厅烤肉的香气缓步爬上二层的楼梯,酒店泳池边孩子的戏水欢声与走廊里的音乐一起奏着和弦。我在会议室等待。等待着公司的同事快快打发掉这个有关数据的会议。

会议的进程有点让我焦虑,美国客户不断询问中国的数据质量和覆盖情况,并把中国人口普查(Demographic)数据作为海外数据建设的最高优先级。本来以为我这个“老中”是跟着美国同事们例行公事的打酱油角色,结果成了一干老外们众目睽睽下的数据小白。那个时候的我,关注的是软件功能的what'new,看着美国同事们在数据的海洋中徜徉,我给自己的托词是:“坐观垂钓者,徒有羡鱼情”。

这只是我的“数据尴尬”舞台剧的一幕,我同情的观看了许多中国客户比我还尴尬的剧情。极海的小伙伴们因为爱数据,求数据,表达数据,发掘数据而创业。七年后的这个夏天,极海已经整理、分析、提供千亿条目的地理数据,我们对数据的理解也经历了从基础的POI,到地理数据的扩维丰富(geoenrichment),到数据的训练和衍生,再到用户决策场景的数据实践系列过程。这个时代早已是数据的汪洋甚至宇宙星辰。我的“数据尴尬”舞台剧翻转成了“数据兴奋”,我们在舞台中央的地图上翩翩起舞。

这个夏天,极海要召开第一次用户大会。我们的用户来自金融,地产,零售等行业以及众多的政府部门。他们无一例外都是对数据充满了好奇。无论他们面对的数据是大还是小,和极海的小伙伴一样,我们都怀着像孩童似的好奇心热切的探索:位置数据可以怎样使用就能产生意外的价值?数据如何使得机器变得如此聪明?什么简单可行的算法和模型就赋予组织机器学习的能力?数据通过哪些步骤就让决策智能起来了?

这是我们以年轻的心甚至幼稚的第一次与众多亲爱的用户们一起同台畅所欲言,我却坚信,一定会和大家产生启发式的让人颔首的观点,不过在那些让我期待的精彩瞬间发生之前,我想先说说这两年我们体会到的五点浅见:

1、数据是石油,而数据最大的价值是给机器做食物。

把数据比作石油,这是个好比喻,但这个比喻的时效性转瞬就不强。下个30年的孩子,会不太理解这个比喻。那个时候可控核聚变已经成熟,太阳能可以高效转化,街上没有一辆油车,这些现实使得这个比喻就如同我们现在说数据是木柴一样让人诧异。我们的生活会发生巨大的变化,但数据更值钱了,因为机器更加饥饿,即便是会思考、会自我学习的强人工智能诞生了,机器仍然需要无穷的数据作为食物来生长;数据也更不值钱了,开放的数据比比皆是,IoT带来的是所有的数据皆有位置,数据的可替代性十分强;几乎每个人都是人力传感器,因为区块链的逻辑应用,每个人主动或被动的分享数据都能直接受益。用于决策的数据是从大量的低层次原始数据中衍生而来的。人们放弃了对数据价值的检视,一切价值皆以机器的喜好做评判。

2、增加地理位置维度,所有的数据都会增值。

数据在低维的混杂不清,在高维就会显性的线性可分。在高维空间发现规律,这成为机器学习的意义所在,也是所有数据工作者的共识。地理位置维度成为数据升维的第一选项。过去数据分析师曾经理所当然的认为人们只有线下的生活和地理位置有关,到了后数据时代,发现“人以类聚”是社会基础现象,有着共性线上行为的人群在线下也聚集。人类的职、住、娱,与日常生活的人、货、场仍然是通过位置进行关联。在数据分析的过程中,几乎都会通过位置这个维度进行特征的提取和线性分割。

3、机器学习的目的是为了决策,智能的地图是能够直接参与决策的地图。

所有的决策无论想的多么周全,角度多么宏大,最终都要化简到对边界的划分。对还是错,好还是坏,是还是否,做还是不做。决策者追求的是让机器考虑的更全面,角度更新颖,既有基于历史的考量,也有测算未来的概率。机器学习通过超大级别的计算系统,将人类不可想象的维度纳入计算。而决策者通过要素显性化和结构化的地图,进行人文的,经验式的,甚至直觉的判断。每个决策者都将携手一个机器贤内助,组合成为决策高手。机器学习为人类扩展决策的计算能力,没有机器助手的决策者因为数据计算上的缺失几乎不敢做任何决策。

4、有数据素养的专家,才能称得上是专家。

在通往智能决策的道路上,决策者成为数据和数据方法的受益者,他们热爱数据,依靠数据,对数据技术充满热情。而给他们提供支持的领域专家,必须具有数据素养,才能与决策者对话,而成为数据时代真正的专家。基本的数据素养包括:对聚类,均值,残差,概率这些统计学的基础支柱的理解和思维畅达;回归,决策树,深度神经网络等机器学习模型的熟练掌握;python编程;深谙数据可视化和数据故事。

5、未来不可预测,我们所做的一切是用计算系统最大概率的逼近未来。

无论是不是因为一定会出现“黑天鹅”还是“灰犀牛”,未来都不可预测。放弃对确定性的痴迷,而拥抱不确定性是打开未来世界唯一确定的方式。借助几乎无限的数据,用越来越强大的计算系统,去探索规律,用概率进行决策,并准备好随时失败重新进行计算的迭代,是面对不确定性的反脆弱行为。

极海是用地理数据进行智能决策的专家。位置数据虽然是数据的一个领域,但我们直逼数据的最终目的:智能决策。我们从地图开始,但我们并不限于地图的边界。我们想和您一起探讨数据的未来,我们想和您一起讲述数据的故事,我们想和您一起发现数据的更多洞见!

7月25,北京,凯迪克格兰云天大酒店,等您来。

欢迎从极海获取地理和位置相关的数据、知识、服务

访问网站 http://geohey.com

联系我们 contact@geohey.com

长按扫码关注公众号