自主创新,打造一站式地理云平台
中国城市规划设计研究院领衔建设的“全国新型城镇化监控与评估平台”已经正式发布。平台融合了人口、土地、经济、公共服务、资源环境等多维数据,在时空中延伸,构成“数字矩阵”;同时叠加不同尺度的规划评估模型、监测系统,通过数据挖掘与机器学习为“数字矩阵”赋能,最终构建涵盖城镇化监测、规划评估、城市体检的综合平台。极海作为合作方全程参与了平台规划及建设。极海地理云平台作为基础技术支撑平台,也充分发挥了自身优势和特色。
一站式地理云平台
极海平台的定位是一站式地理云平台,目标是利用云计算、大数据、以及人工智能技术,帮助用户解决与地理位置数据有关的各个环节的问题。具体一点来说,我们认为,处理地理数据问题,无外乎解决三个层面的问题:数据、模型、可视化。
数据指的是获取和管理数据。在极海平台,用户不仅可以使用自己的数据,也可以使用极海平台提供的公共数据。目前也在积极研发深度的数据产品,未来都会提供给用户使用。模型指的是对数据做分析挖掘。之所以重视数据,是因为我们的终极目标是分析挖掘和辅助决策。这需要数据分析和模型来支撑。可视化指的是把数据客观的、丰富多彩的呈现出来。不管是地理数据本身,还是分析预测的结果,最终都要可视化出来,让人能看到才有意义。地理数据带有位置信息,可视化手段和方式会有很大差别。这为可视化带来挑战,尤其是数据大到一定量级。数据、模型、可视化,会出现在数据处理分析和业务流程中的各个环节,要为用户所用,还需要一个成熟稳定的平台,把这些落实成具体的产品。
数据
首先是用户数据。关于地理数据大家都有体验,格式多样,有的有坐标,有的没有坐标,坐标系统还可能不一样。极海平台提供了全格式数据录入工具来解决这些问题。支持的格式除了这些常见的地理数据格式,也支持像Excel、CSV这样的文本数据。数据上传到平台以后,云端会做一系列的工作。比如说,把地址数据通过地理编码转成坐标,统一坐标系,大文件快速存储。数据一旦进入平台,数据本身也变成了一种服务。目前千万量级的文本数据,极海平台5分钟以内就能完成入库。
除了用户数据,极海平台还提供公共数据。这些数据按照覆盖的行政区,按照分类体系组织。用户可快速查找感兴趣的数据。公共数据目前已积累了十几个大类,数据量达到亿万级;涵盖不同的行业、不同的领域;数据也在不断更新迭代,最快的数据一个小时就会更新一次;极海有专门的数据团队采用大规模自动化处理技术来提升数据处理效率、利用智能数据处理技术提升数据质量。
除了基础的公共数据,极海也在积极研发深度数据产品,比如自然街区。用交通路网把城市切分成城市地块,用模型对地块进行优化。然后把与之相关的数据和地块进行关联,形成对城市自然街区的数字画像。比如第一张图是北京自然街区的快餐店分布,第二章是武汉自然街区的幼儿园分布,第三张石常州自然界区之间的驾车距离。我们希望通过这样的方式去描述我们生活的城市,让不同行业对城市有定性和定量的了解。这样的数据产品已经应用于零售店面选址。
模型
极海和中规院做过一次尝试。把全国范围的十字路口聚合到半径1公里的六边形格网,用道路密度来研究城市扩展情况。这是全国范围看的统计结果,这些密密麻麻的点其实是小网格。把地图放大到北京市。其实从结果上看,六边形已经把市区边界描绘的很清晰了。东城西城的道路网明显比其他区域密集。其他红框范围是北京的其他区县。目前这样的空间分析在极海云平台线上就能完成。
数据分析的终极目标是预测。所以除了经典空间分析模型,极海也在探索通过地理数据挖掘做预测。比如这是我们用户自然街区的地块数据,预测零售选址的会员分布。第一张图是把真实的会员数据关联到自然街区,用于模型训练,建立预测模型。后面两幅图是在不同城市任意选择一个候选点,来预测潜在会员分布。
可视化
极海有专门针对地理大数据的可视化服务。现在网页前端的渲染能力已经非常强悍,能做出非常酷炫的效果,但是数据量达到一定量级就会面临瓶颈。所以极海采取了一种云端和前端相结合的方式,充分发挥云端的计算优势和前端的渲染能力。采用动态切片技术,在云端对数据实时切片,前端负责渲染。针对不同的可视化效果,切片也有不同的形式,可以是图片,也可是带有时间信息的矢量切片数据。
当然,可视化效果的样式风格也很重要。所以除了前面的可视化效果,针对带有时间属性的数据,还可以按照时态动画的方式展现。比如这是对从北京开往世界各地的航班的动态模拟。
自主创新-需求为导向
最后和大家分享两点感受。一是自主创新其实是产品得以发展的一种内生需求,只有自主创新才能以需求为导向,更好的服务用户。极海近期服务于一家房地产行业的大型企业,出于数据安全的考虑,用户选择极海平台对数据进行可视化、对外分发数据。极海可视化服务是面向极海平台所有数据的,而不是像传统方式那样需要先发布服务再使用,这种灵活性带来的好处是可以高度定制,所以用户才能够通过浏览器工具或者服务接口根据自己需要做数据可视化。
但是用户的数据是存储在已经建成的数据仓库系统中的,需要可视化的数据是用户查询的临时数据。极海的可视化引擎并不支持这种场景。极海很快就给出了解决方案,通过扩展可视化引擎,支持对高速缓存中的临时数据进行可视化。这样的解决方案让双方工程师花很小的代价就能完成系统对接。而这样的设计能够实现,则取决于极海拥有自主研发技术。
自主创新-需求的边界
另外一点感受是需求的边界。我们经常被问到的一个问题是极海和百度地图比、和高德地图比,有什么优势?这里做了一个对比,不是为了比较孰优孰劣,而是为了说明彼此的侧重点是不一样的。百度地图、高德地图的需求根源是确定地理位置、以及由此衍生出来的服务。而极海平台是要解决与地理位置数据有关的问题。那既然以需求为导向,用户说我就是要用百度地图,因为百度地图更新很快。那是不是就不能选择极海了呢?我们正在探索如何把极海的服务集成到百度地图、高德地图中去使用,发挥各自优势,给用户提供更好的解决方案。
Map Gallery https://geohey.com/gallery
欢迎从GeoHey获取地理和位置相关的数据、知识、服务
访问网站 http://geohey.com
联系我们 contact@geohey.com
QQ群 164183186
长按扫码关注公众号