AI不是来签字的

专家还在硬刚幻觉吗？

前天在GISTC 2026 空间智能软件技术大会现场，几位院士（包括欧亚）反复说同一个意思的话：AI 不能替代 GIS 决策者。空间规划审批不能出错，灾害模拟更不能靠幻觉。

这句话你没法反驳。国土空间审批、水利工程、山洪预警，哪一样能让大模型拍脑袋决定？一个参数错了，一条路的选线可能就偏了；一张风险图错了，一个村庄的转移时机可能就耽误了。

但我坐在会场里，觉得很不对劲。GPT都5.6、DeepSeek都V4，Codex都接管桌面了，咱们专家们在专业领域使用AI还和日常跟豆包对话一样吗？

我们说的，真的是同一个 AI 吗？

专家脑子里的 AI，是一个坐在审批桌后面的"电子局长"：看一眼图，读几条政策，上网找找案例，啪地盖章。

我脑子里的 AI，是一个永远不困的审查员。它不签字，不拍板，不承担行政责任。它只是把项目红线丢进"一张图"，把永久基本农田、生态红线、城镇开发边界、现状地类、规划用途、灾害风险区一层层套上去，然后把每一个风险点、每一条依据、每一个坐标、每一次计算过程摆到桌面上。

真正的问题不是 AI 能不能替代专家。

真正的问题是，AI 能不能把专家过去藏在经验、软件、报告和手工流程里的判断过程，变成一条可复核的证据链。

这个问题才值得认真讨论。

老专家怕的不是机器

专家为什么警惕 AI？

表面看是怕幻觉。AI 会编，会错，可能从网上抄一段代码，从 GitHub 扒一个库，临时拼一套权重，还能说得头头是道。这在灾害分析里确实危险。

传统 GIS 不是乱来的。水文模型、坡度坡向、汇流累积、地质条件、降雨阈值、历史灾点、空间统计、权重叠加——这些东西跑了很多年，进过项目，写进报告，有出处，有共识，有责任体系。

专家真正想说的是：这套东西不是你一个 AI 说改就能改的（咱们排除那些AI抢了专家寻租权力的场景哈）。

这句话不能嘲笑。它背后有一种工程世界的底线感。

但有个容易被忽略的反转。

传统模型之所以被认为"科学"，不只是因为它老，也不只是因为它写进了教科书，而是因为它理论上可以被复现、被检验、被比较、被追责。

如果一个模型只是因为"大家一直这么用"，它就不天然科学。它只是形成了惯性。

共识不是科学的终点，共识只是科学在某个时期的临时停靠站。

AI 真正要挑战的，不是传统模型本身。它挑战的是传统模型被使用时，那些不可见的手工过程。

同一个山洪沟，换一个工程师，DEM 预处理方式可能不同。换一个项目组，参数解释可能不同。换一个软件版本，工具链可能断掉。换一个地方，历史灾点更新了，但模型还在沿用几年前的阈值。

这些不叫幻觉。但它们同样会制造风险。

风险穿着"传统流程"的衣服，看起来更像科学。

AI 该追问模型，而不是自创模型

要反驳专家，我不想说"AI 比你们的模型更聪明"。这句话既不准确，也没必要。

更合理的说法是：AI 不该绕开传统模型，它该把传统模型从低频工具变成高频能力。

在水利、山体滑坡、泥石流、应急管理这些场景里，AI 第一阶段根本不需要发明新模型。它应该先学会尊重已有模型，然后追问这些模型有没有被正确调用。

这次分析用的是哪个经过审定的模型？参数来自哪份规范？DEM 分辨率是多少？降雨情景是 10 年一遇、20 年一遇，还是极端暴雨？历史灾害点有没有进入校准样本？土地利用数据是不是最新？同一套模型上一次运行是什么结果？这一次结果变化，是因为降雨变了，地形数据变了，还是参数被人调过？

这不是让 AI 天马行空。这是让 AI 变成一个模型审计员。

过去专家跑模型，很多工作发生在软件界面、个人习惯和项目经验里。最后报告很完整，中间过程未必总是完整留下。

智能体可以把这些过程重新拉到光下。它能检查数据缺口，记录参数版本，调用既有模型，跑多个情景，比较结果差异，标出参数敏感区，最后把"稳定结论"和"需人工判断的边界情形"分开。在这里面都是可以检验的程序代码，AI没有幻觉。

专家仍然拍板。但 Ta 看到的不再是一张孤立的风险图，而是一组带着假设、参数、版本、对比和不确定性的证据包。

这比单纯相信某个软件按钮更科学。

科学不是按钮。科学是可证伪、可追溯。

一张图审批，别让 AI 拍板

把这套逻辑放到国土空间规划"一张图"审批里，看得更清楚。

一个项目红线来了，传统审查要看它是否压占永久基本农田，是否涉及生态保护红线，是否突破城镇开发边界，是否占用耕地，是否进入水源保护区、地灾风险区、历史文化保护范围，是否符合规划用途。

老专家担心 AI 直接说：“这个项目可以批。”

当然不能。

但智能体真正该输出的，是这种东西：

项目范围与永久基本农田交集为 0；与生态保护红线交集为 236.4 平方米；涉及图斑编号 X、Y、Z；最近红线距离为 8.6 米，建议做缓冲复核；项目西南角疑似与已批供地范围重叠；引用政策条款如下。。。；空间查询过程如下。。。；图层版本如下。。。；需人工复核事项如下。。。。

它不是在替人做决定。

它是在把决定之前的黑箱拆开。

这时候，AI 的价值不在于"判断得像专家"，而在于"比人更不容易漏掉机械性检查"。

人审到第十个项目会累，AI 不会。人可能忘记叠某个图层，AI 可以按清单跑完。人赶会的时候只来得及做一个方案，AI 可以先跑三组情景对比。人把关键判断留在脑子里，AI 能把过程写进日志。

“空间审批不可出错"这句话，推不出"不要 AI”。

它只能推出：越是不可出错，越不能只靠人眼、人脑和手工流程。

关系变了

这才是我在大会现场感受到的关系变化。

过去，专家和模型的关系是：专家掌握模型，模型证明专家。有经验的工程师知道该点哪个工具，调哪个参数，看哪个结果，最后写进报告。模型像一枚印章，盖在 Ta 的经验上。

智能体出现后，关系会慢慢变成：专家审查模型，AI 记录模型，系统复跑模型，证据约束模型。

这不是专家被替代。

这是专家第一次被迫面对一个问题：过去那些"我一直这么做"的部分，能不能被清楚说出来？能不能被别人复跑？能不能在数据更新后重新验证？

这会让一些人不舒服。

AI 改变的不是权力表面，而是解释权的分配。

以前，一个项目为什么这样判断，可能只存在于专家的经验里、会议的口头意见里、报告的几句结论里。

以后，系统会追问：你依据的是哪个版本的数据？调用的是哪个模型？为什么选这个参数？为什么忽略那个异常图斑？为什么没有跑极端降雨情景？

这不是机器冒犯专家。

这是工程世界终于有机会把"经验"翻译成"证据"。

真正成熟的专家，不怕被 AI 追问。Ta 怕的是自己多年的经验，永远只能停留在一句"我觉得"。

政府 AI 最难的不是模型智商

政府 AI 落地最大的障碍，可能并不是大模型还不够聪明，或者偶尔胡说八道。

更硬的问题在政府自己的系统里。

哪份数据算权威？三调、年度变更、专项规划、历史审批成果、地方补充图层、项目单位上传红线，它们不一致时听谁的？关于这部分，部信息中心丁主任在会上表达得非常到位。

哪条政策能被机器执行？“原则上不得占用”“确需占用”“依法依规办理”，这些词在人类会议里可以讨论，在系统里必须被拆成硬禁止、条件允许、人工复核、上级审批、材料补正。

谁对 AI 结果负责？AI 生成报告，规则引擎给出预警，审批人员签字，厂商提供工具。出了问题，责任链怎么划？

系统之间怎么打通？一张图平台、审批系统、遥感监测库、项目库、公文系统、档案系统、地图服务、空间数据库，如果没有工具调用和权限审计，AI 最后只能停留在聊天窗口里，写几段漂亮材料。

这才是政府 AI 的真实难题。

别再做大屏，别再接问答框。我们最需要做的，是把权威数据、业务规则、模型工具、权限边界、审计日志和人工签批重新接起来。

没有工具调用的政府大模型，只是更会写材料的 OA。

有证据链的智能体，才可能进入审批现场。

现在能做什么

如果你在这个行业里，现在可以做的事其实不多，但都很具体。

把你最常用的那个模型，参数来源、数据版本、运行记录整理成一张表。不要等 AI 来做，先让自己能回答"为什么选这个参数"。

把你审批或分析过程中的机械性检查列出来。哪些图层每次必须叠？哪些距离每次必须量？这些是最该交给 AI 的。

如果你管数据，先把权威数据版本管起来。三调用哪一版？年度变更更新到哪一年？不要让 AI 自己去猜。

如果你管系统，别急着做大屏。先想清楚一个场景：从 AI 输出结果，到专家签字确认，中间需要经过哪些环节？每个环节留下什么痕迹？

它不是来抢章的

AI 不是来抢章的。它是来照亮盖章之前那段黑暗的。

一张图审批里，它照亮项目红线和控制线之间到底压了多少。灾害模拟里，它照亮模型参数从哪来、数据是哪一版、情景有没有跑全。应急管理里，它照亮三套方案各自的不确定性在哪。政府治理里，它照亮过去藏在经验、流程和文件缝隙里的责任链。

老专家当然还要坐在那里。越是高风险场景，越需要专家坐在那里。

只是 Ta 面前不再是一张孤立的图、一份厚报告、一个软件跑出来的结果。Ta 面前会是一条证据链。数据从哪里来，模型怎么跑，参数怎么选，风险在哪里，哪些结论稳定，哪些必须复核，系统都已经摆出来。

那时，专家和 AI 的关系也许会变得简单一点。

专家不用把 AI 当成越权的年轻人，AI 也不用装成无所不能的专家。会前，它把所有该量的地方重新量一遍，该查的依据重新查一遍，可能漏掉的风险重新摆到桌上。

然后专家看一眼，说：“这份报告，拿到会上。”

这就够了。

AI 不是来替人负责的。它是来让责任终于有迹可循。