探索从你开始:透过esri用户大会看AI驱动的地理信息未来

一年一度的esri用户大会如期在圣地亚哥拉开帷幕,吸引了来自全球的GIS专业人士和技术爱好者。在首日的大会视频中,Jack依旧神采奕奕。作为行业领军企业的首席『远见者』(visioner),Jack必然深知其技术不得不与时俱进,紧跟时代步伐。在这个AI快速发展的时代,GIS行业也面临着前所未有的机遇与挑战。照例第一天的大会展示,要一而再的重申GIS是通用语言的理念以及esri各项最新的技术成果,我更期待Jack是怎样描绘GIS与AI融合的蓝图。

截图来自esri官网,用户大会视频,下同
地图是地理的语言:沟通内容与背景,提供清晰而有价值的见解,让人们更容易理解我们世界的复杂性

从视频回放中,AI肯定是不能缺项的话题。比如:

  • AI助手:推出了能够理解自然语言的助手,用户只需用日常语言描述需求,AI就能自动生成相应的地图或进行复杂的空间分析。这就像在地图应用中引入了一个智能秘书,帮助你快速找到所需的地理信息。
桌面端(ArcGIS Pro alpha)与Online网页应用都配置了与大语言模型对话的窗口
  • 地理AI(GeoAI):将机器学习和深度学习与空间分析相结合,能够自动从海量地理数据中提取有价值的信息。它像一个数字考古学家,从巨大的数据沙漠中挖掘出隐藏的宝藏。
  • 深度学习模型整合:利用AI技术从卫星图像和街景照片中自动识别和提取地理要素。比如,通过分析卫星图像,AI可以迅速识别出森林火灾的边界,帮助消防部门迅速制定救援计划。当然文本整合大语言模型也是必须有的。
  • AI驱动的预测模型:例如,用于预测洪水路径、城市发展趋势等的智能模型。这类似于气象预报,但精确到地理细节,帮助城市规划者做出更明智的决策。

从会议透露的信息来看,esri对AI的发展持谨慎乐观的态度。Ta们认为AI将成为增强GIS功能的强大工具,而非取代人类专业人士。强调AI的目标是简化工作流程,提高效率,并使GIS技术更加普及和易用。同时,Ta们也意识到了AI应用中的伦理和隐私问题,承诺将开发相应的框架和工具来确保AI的负责任使用。

但我觉得这些论述有点老生常谈,虽然今年才算是大模型的元年。迅速的,几乎所有的AI『倡导者』都会说:AI不替代人类,但掌握AI的人替代别人。上周到本周,比esri用户会议影响面大的多的多的事件是萝卜快跑代表的自动驾驶,真的开始替代人了。这个事件不禁让我将GIS联想到了智能驾驶领域的发展。就像汽车行业正在向端到端的自动驾驶系统迈进,软件行业,尤其是GIS领域,有没有可能实现类似的端到端解决方案呢?

什么是端到端的大模型?简单来说,它是一种能够直接从原始输入生成最终输出的AI模型,中间无需人工干预或复杂的中间步骤。在智能驾驶领域,端到端模型可以直接将摄像头和传感器的原始数据转化为驾驶决策,而无需人工设计的复杂规则和算法。

类比到GIS领域,我们可以想象这样一个场景:GIS专业人员不再需要花费大量时间学习复杂的软件操作和工具使用。取而代之的是,Ta们只需用自然语言表达自己的地图制作或空间分析需求,例如"创建一个显示城市人口密度与绿地覆盖率关系的交互式地图"。AI赋能的GIS软件将自动理解这个需求,并将其分解为一系列子任务:数据收集、清洗、空间分析、可视化设计等。然后,AI会自动执行这些任务,最终生成符合要求的地图或分析报告。

这种转变才是彻底颠覆现有GIS专业人员的工作方式。Ta们将从繁琐的技术操作中解放出来,转而专注于更具创造性和战略性的工作,如问题定义、结果解释和决策支持。同时,这也将大大降低GIS技术的使用门槛,使更多非专业人士能够利用地理信息的力量。

然而,这种变革也带来了挑战。传统软件行业,包括GIS领域,都将面临重大转型。开发者需要重新思考软件的设计理念,从提供工具转向提供智能解决方案。用户界面可能会变得更加简洁,但背后的AI引擎将变得更加复杂和强大。需不需要一个专用于GIS的大模型?还是用非常出色的思维链提示语就能调动通用大模型即可以完成复杂的专业任务?虽然目前不论GPT4o还是Claude3.5,在编写更小众一点的程序语言,比如空间SQL,仍然显得很不靠谱,但端到端的趋势还是非常明确的:自主执行的拆解任务,将语言转换成最终成果。

显然大模型带来的革新不仅限于文字语言理解或卫星影像等图像识别,它正在重塑整个软件行业的功能和使用方式。对于GIS来说,我热切期望的是地理信息的获取、分析和应用将变得前所未有的简单和智能。我们正站在所有软件业、包括GIS发展的新起点上,未来的地理信息系统很可能会成为一个全能的”地理自动驾驶大师",帮助我们更好地理解和塑造我们的世界。当然那个时候,是不是会发现,我们这一代人最大的困境是语言的匮乏,无法用语言将一个场景、一个目标、一个地图故事表述清楚,人和人之间的障碍是语言,人和机器之间的障碍是不是只能靠脑机接口来突破?这也从另外一个角度呼应了Jack这些年一直在提的地图是语言、GIS是语言。

即便就是在浏览器页面上运行JavaScript显示的地图应用也是相当复杂的,请试试能将上图任何一幅地图表述成文字?

当下,从esri的会议上,还远未看到这样的进展。也许AI的出现绝对是考验所有软件企业创始人颠覆自己的决心。但作为GIS从业者和爱好者,这些新技术带来了了不起的机遇,让我们可以有机会去和大佬们在新的舞台上平等展示。无论技术如何发展,地理思维和空间分析的核心价值永远不会过时。让我们共同期待并参与构建这个AI驱动的GIS新时代!

“探索从你开始”,用UC第一天最后一个故事,斯科特极地研究所的国家地理探险家Jeff Kerby的号召语作为本文题目