从美国国防部的数据战略和系统架构,想极海的技术未来
除了中国军迷,很少有人知道,林彪在独自看地图思考战略战术的时候是绝不允许任何人打扰的——据说他常常会看上一整天;而绝大部分中国的小学生都能讲说一段荆轲刺秦王、图穷匕见的故事,虽然不能准确的回答:荆轲献给嬴政的是关于哪儿的地图?在战略家眼里,地图是情报,是知识,是认知,但本质上说,地图的最底层是数据。
在地图炮们的眼里,地图可以用来表达偏见;在政治家眼里,地图是主权的象征——地图不正确也意味着政治不正确,甚至是严重的不正确。纸质的、电子的、在线的地图出版物中,“不正确”的中国地图问题主要出在中印的边境划分上。显然双方在地图上都有各自的主张,这就难为了做地图服务的大互联网公司——用哪一方所主张的国界线,都会遭到另一方的抗议。聪明如谷歌的地图专员想出了办法:来自中国的IP(电脑在互联网上的地址,每个地址都能被识别出电脑所在的物理位置)访问的地图是中国主张的版本,反之亦然。而非这两个国家的IP看到是什么样的国界?有争议的地方用的是虚线。用虚线表达中立吧,你们两家国内的事儿,眼不见为净。
我想,全世界高层的政治家,对哪个版本的什么地图上到底哪条线画的对还是错,并不会真心在意;但如果说某张地图后面有一套涉及到安全、博弈对手举动的情报,没有谁会轻视这张地图。在美国大选投票之前,美国和印度签署了一份协议《基本交流与合作协定》(The Basic Exchange and Cooperation Agreement,简称BECA)。这个协议几乎宣告了美印结为实质上的军事同盟关系。虽然协议的名字看起来没有什么信息养分,实际上主要涉及的内容是双方要在地理空间情报搜集方面实现共享,通过地图和卫星图像来交互信息,以便美印两军进行协同防御。根据印度官员的说法,“任何航海、飞行、作战、定位目标,以及对自然灾害做出反应,甚至使用手机导航的人都依赖于地理空间情报。”所以,对于国家安全,地理空间情报至关重要。美印签署BECA协议后,印度可以使用美国的情报,大大提高其雷达侦查、导航、制导和武装无人机等武器的准确性。我们可以脑补,原来印方并不确信的竞争对手的军事目标,现在可以在美国地理情报的支撑下,对其的研判有了大幅的提升。
本文并不关注印度,而是关注美国国防部如何将数据和信息共享给其盟友们。在美国国防部2020年的数据战略(公开版)中,将国防部的愿景定义为:
国防部是一个以数据为中心的机构,通过快速大规模使用数据来获取作战优势并提高效率(DoD is a data-centric organization that uses data at speed and scale for operational advantage and increased efficiency)。
从这个愿景描述上,我们可以片面的认为国防部就是一个数据中心!在这个愿景的指导下,重点建设的领域是三点:
1、在战场上利用数据优势,联合全域作战;
2、利用数据改进国防部的管理工作,使得高级领导的决策能够得到有力的支撑;
3、使用数据提升业务分析的水平,从而推动所有层级的明智决策。
围绕下面七大目标来落实具体的工作:
1、使数据可见:用户可以查找所需数据;
2、使数据可访问:用户可以检索数据;
3、使数据易于理解:用户可以识别内容、语境和适用性;
4、数据可链接:用户可以通过固有的关系利用数据元素;
5、使数据可信:用户对数据信任,从而敢于用数据决策;
6、数据可互操作:用户对数据有一个共同的表示/理解;
7、确保数据安全:保护数据,防止未经授权的使用/操作。
在这里我们不对具体的目标进行解读。可以想到,像国防部这种层次的战略制定,一定都会有落实的具体动作。比如在分解目标1时,如何评判数据可见了?有具体的子目标指导执行者落实:
子目标 1:在需要的地方和时间公布数据并将其提供给授权用户;
子目标 2:国防部实施元数据标准,包括共享数据的位置和访问方法;
子目标 3:对国防部所有数据源进行编目;
子目标 4:国防部实施公共服务来发布、搜索和发现数据;
子目标 5:作战和业务治理机构根据近实时数据的动态可视化进行决策。
从子目标1中,我们就能看到,能够把数据按照时间、地点授权给指定用户使用,这样的系统才能保证与印度之间的信息共享。否则,难不成要通过光盘或者U盘,让特派员穿梭在美国和印度之间传送不成?在这其中,看似简单的一个子目标,后面要有强大的信息系统来支撑。这个系统要能解决诸如这样的问题:数据如何放在一个可信任的云上?对于不同的用户和任务目的,通过哪些网关接入?如何能形成专家之间的知识互动?
数据是资产。从数据到信息,到知识,再到决策的智慧,必须通过流动才能不断的演化。能够想象,DoD这种级别的机构,一定会建立一个“世界最先进”的信息系统,保证数据的流动。这个信息系统在其去年七月份发布的数字现代化战略中,有概略的描述。同样的,这份文档主要是对该战略提出了一些目标,也为国防部的CIO制定了优先事项。该目标和优先事项都与创建“一个更安全、协调、无缝、透明和成本效益更高的IT架构,将数据转换为可操作的信息,并确保在面对持续的网络威胁时可靠地执行任务”的核心愿景相一致。
该战略要求国防部CIO的四个优先事项是:1、网络安全;2、人工智能;3、云;4、指挥、控制和通信。在“国防信息系统网络DISN”的架构图中虽然没法看到这些优先事项怎么落实到具体的解决方案中,但是这个架构图可以告诉我们,美国国防部希望通过现代信息系统,将他们的数据资源分配给谁来使用。无疑,从图中看得出,这是一个复杂的系统。按照复杂系统的理念,让系统高效的运转乃至健康的生长,不能靠头痛医头脚痛医脚的症状解,得需要找到能牵一发而动全身的杠杆解。在这样的一个系统中,我选择的杠杆解是:让数据看得见找的到。比如让盟友通过这个系统,马上就可以看见已经存在JEDI云上数据,包括遥感影像、三维地形、基础设施、人口分布。。。以及这些数据的基本可视化效果,让专业用户有选择的在云上做进一步的分析和挖掘;盟友对这个系统的效率、可靠性有信心,进而在系统中继续贡献自己的情报和数据。而美国国防部的数据战略第一条恰恰就是“让数据可见”。
我相信美国国防部的这两大战略也并不是已经完美落实了,离目标的实现可能还有很长的路要走,不过就在当下,从美国防部核心层的角度促使这个战略快速实施的一大痛点大概率是有太多的数据和情报希望能也必须要共享出去,而目前的方式方法也确实是比较低效。花销100亿美元去购买一个商业的云(JEDI),能看出来这一痛点的端倪。如果微软的Azure显著的提供多源数据的数据湖级别的管理、安全的网络、分布在全球的高带宽节点以及线上的各种大数据挖掘,那对于一个即便是很专业的像国防部这样的用户也解决了太多的难题。
而对极海这样的数据创业公司来说,这两份战略文件带来的启发,肯定不是想象着未来在国内有类似的大单有机会砸到自己身上,而是设计自身的发展路线,如何去适应这样的架构和数据运转机制。对我的直接启发是:
1、完整的兼容现代商业云的基础软硬件设施。能够用最便捷的方法在云基础设施中部署自己的软件并最大可能的利用商业云的效率、弹性和安全优势;
2、吞吐多源数据。尽可能多的支持各种存储方式的“大数据”类型:结构化的,半结构化的,非结构化的;对象的,SQL的,NoSQL的;一次性载入的,流式的;二维的,三维的 。。。可以有各种角度来对数据进行分类,未来的趋势就是对应到不同类型的数据,就会有不同的技术架构,用户想要搞定这么多的架构就是得遭受巨大的麻烦,谁能解决这个麻烦,用户就会亲睐谁;
3、让数据可见。尽可能将数据都赋予位置标签,或者通过地理位置这个维度对每条数据进行再组装、扩维,让原本无法在地图上表达的数据可以用地图可视化,让原本不具有关联性的数据,通过空间关系实现数据的交叉联动。既是对原有数据的补充,也是为所有专业分析人员增加地理视角。
走在趋势之上,永远是创业的必要基础。数据要发挥出潜在的能量,需要通用的技术,更需要分布在各处不同领域专业乃至非专业人士的视角和技能。这种价值的溢出能量可以算作数据原始共享者的“外部性”和其不具备的“暗知识”吧。极海要成为那个外部性和暗知识的助推器——从地理位置中来,前往决策的智能化明天——而今天,先从让每个人都能把数据用起来开始。
DSIN架构图中的注解:
注1:国防部通用企业云,也被称为联合企业国防基础设施(JEDI)云,是一项将在整个国防部部署基础云技术的计划,同时利用商业优势,重点关注国防部的军事行动——从后方到前方的战术。JEDI将为所有级别的用户提供快速、响应迅速、灵活和自适应的云服务。该计划将通过其演进跨领域解决方案、先进的数据分析能力和国防部的前沿网络安全态势,为高效数据共享奠定基础。微软经过与亚马逊多轮角逐和厮杀,赢下100亿美元这张大单。
注2:CCMD意为战斗指挥部,美国国防部有11个战斗指挥部,每个指挥部要么是关注自己的地理辖区,要么是关注功能任务,在和平和战争时期提供对军事力量的指挥和控制。