AI不是来签字的
专家还在硬刚幻觉吗?
前天在GISTC 2026 空间智能软件技术大会现场,几位院士(包括欧亚)反复说同一个意思的话:AI 不能替代 GIS 决策者。空间规划审批不能出错,灾害模拟更不能靠幻觉。
这句话你没法反驳。国土空间审批、水利工程、山洪预警,哪一样能让大模型拍脑袋决定?一个参数错了,一条路的选线可能就偏了;一张风险图错了,一个村庄的转移时机可能就耽误了。
但我坐在会场里,觉得很不对劲。GPT都5.6、DeepSeek都V4,Codex都接管桌面了,咱们专家们在专业领域使用AI还和日常跟豆包对话一样吗?
我们说的,真的是同一个 AI 吗?
专家脑子里的 AI,是一个坐在审批桌后面的"电子局长":看一眼图,读几条政策,上网找找案例,啪地盖章。
我脑子里的 AI,是一个永远不困的审查员。它不签字,不拍板,不承担行政责任。它只是把项目红线丢进"一张图",把永久基本农田、生态红线、城镇开发边界、现状地类、规划用途、灾害风险区一层层套上去,然后把每一个风险点、每一条依据、每一个坐标、每一次计算过程摆到桌面上。
真正的问题不是 AI 能不能替代专家。
真正的问题是,AI 能不能把专家过去藏在经验、软件、报告和手工流程里的判断过程,变成一条可复核的证据链。
这个问题才值得认真讨论。
老专家怕的不是机器
专家为什么警惕 AI?
表面看是怕幻觉。AI 会编,会错,可能从网上抄一段代码,从 GitHub 扒一个库,临时拼一套权重,还能说得头头是道。这在灾害分析里确实危险。
传统 GIS 不是乱来的。水文模型、坡度坡向、汇流累积、地质条件、降雨阈值、历史灾点、空间统计、权重叠加——这些东西跑了很多年,进过项目,写进报告,有出处,有共识,有责任体系。
专家真正想说的是:这套东西不是你一个 AI 说改就能改的(咱们排除那些AI抢了专家寻租权力的场景哈)。
这句话不能嘲笑。它背后有一种工程世界的底线感。
但有个容易被忽略的反转。
传统模型之所以被认为"科学",不只是因为它老,也不只是因为它写进了教科书,而是因为它理论上可以被复现、被检验、被比较、被追责。
如果一个模型只是因为"大家一直这么用",它就不天然科学。它只是形成了惯性。
共识不是科学的终点,共识只是科学在某个时期的临时停靠站。
AI 真正要挑战的,不是传统模型本身。它挑战的是传统模型被使用时,那些不可见的手工过程。
同一个山洪沟,换一个工程师,DEM 预处理方式可能不同。换一个项目组,参数解释可能不同。换一个软件版本,工具链可能断掉。换一个地方,历史灾点更新了,但模型还在沿用几年前的阈值。
这些不叫幻觉。但它们同样会制造风险。
风险穿着"传统流程"的衣服,看起来更像科学。
AI 该追问模型,而不是自创模型
要反驳专家,我不想说"AI 比你们的模型更聪明"。这句话既不准确,也没必要。
更合理的说法是:AI 不该绕开传统模型,它该把传统模型从低频工具变成高频能力。
在水利、山体滑坡、泥石流、应急管理这些场景里,AI 第一阶段根本不需要发明新模型。它应该先学会尊重已有模型,然后追问这些模型有没有被正确调用。
这次分析用的是哪个经过审定的模型?参数来自哪份规范?DEM 分辨率是多少?降雨情景是 10 年一遇、20 年一遇,还是极端暴雨?历史灾害点有没有进入校准样本?土地利用数据是不是最新?同一套模型上一次运行是什么结果?这一次结果变化,是因为降雨变了,地形数据变了,还是参数被人调过?
这不是让 AI 天马行空。这是让 AI 变成一个模型审计员。
过去专家跑模型,很多工作发生在软件界面、个人习惯和项目经验里。最后报告很完整,中间过程未必总是完整留下。
智能体可以把这些过程重新拉到光下。它能检查数据缺口,记录参数版本,调用既有模型,跑多个情景,比较结果差异,标出参数敏感区,最后把"稳定结论"和"需人工判断的边界情形"分开。在这里面都是可以检验的程序代码,AI没有幻觉。
专家仍然拍板。但 Ta 看到的不再是一张孤立的风险图,而是一组带着假设、参数、版本、对比和不确定性的证据包。
这比单纯相信某个软件按钮更科学。
科学不是按钮。科学是可证伪、可追溯。
一张图审批,别让 AI 拍板
把这套逻辑放到国土空间规划"一张图"审批里,看得更清楚。
一个项目红线来了,传统审查要看它是否压占永久基本农田,是否涉及生态保护红线,是否突破城镇开发边界,是否占用耕地,是否进入水源保护区、地灾风险区、历史文化保护范围,是否符合规划用途。
老专家担心 AI 直接说:“这个项目可以批。”
当然不能。
但智能体真正该输出的,是这种东西:
项目范围与永久基本农田交集为 0;与生态保护红线交集为 236.4 平方米;涉及图斑编号 X、Y、Z;最近红线距离为 8.6 米,建议做缓冲复核;项目西南角疑似与已批供地范围重叠;引用政策条款如下。。。;空间查询过程如下。。。;图层版本如下。。。;需人工复核事项如下。。。。
它不是在替人做决定。
它是在把决定之前的黑箱拆开。
这时候,AI 的价值不在于"判断得像专家",而在于"比人更不容易漏掉机械性检查"。
人审到第十个项目会累,AI 不会。人可能忘记叠某个图层,AI 可以按清单跑完。人赶会的时候只来得及做一个方案,AI 可以先跑三组情景对比。人把关键判断留在脑子里,AI 能把过程写进日志。
“空间审批不可出错"这句话,推不出"不要 AI”。
它只能推出:越是不可出错,越不能只靠人眼、人脑和手工流程。
关系变了
这才是我在大会现场感受到的关系变化。
过去,专家和模型的关系是:专家掌握模型,模型证明专家。有经验的工程师知道该点哪个工具,调哪个参数,看哪个结果,最后写进报告。模型像一枚印章,盖在 Ta 的经验上。
智能体出现后,关系会慢慢变成:专家审查模型,AI 记录模型,系统复跑模型,证据约束模型。
这不是专家被替代。
这是专家第一次被迫面对一个问题:过去那些"我一直这么做"的部分,能不能被清楚说出来?能不能被别人复跑?能不能在数据更新后重新验证?
这会让一些人不舒服。
AI 改变的不是权力表面,而是解释权的分配。
以前,一个项目为什么这样判断,可能只存在于专家的经验里、会议的口头意见里、报告的几句结论里。
以后,系统会追问:你依据的是哪个版本的数据?调用的是哪个模型?为什么选这个参数?为什么忽略那个异常图斑?为什么没有跑极端降雨情景?
这不是机器冒犯专家。
这是工程世界终于有机会把"经验"翻译成"证据"。
真正成熟的专家,不怕被 AI 追问。Ta 怕的是自己多年的经验,永远只能停留在一句"我觉得"。
政府 AI 最难的不是模型智商
政府 AI 落地最大的障碍,可能并不是大模型还不够聪明,或者偶尔胡说八道。
更硬的问题在政府自己的系统里。
哪份数据算权威?三调、年度变更、专项规划、历史审批成果、地方补充图层、项目单位上传红线,它们不一致时听谁的?关于这部分,部信息中心丁主任在会上表达得非常到位。
哪条政策能被机器执行?“原则上不得占用”“确需占用”“依法依规办理”,这些词在人类会议里可以讨论,在系统里必须被拆成硬禁止、条件允许、人工复核、上级审批、材料补正。
谁对 AI 结果负责?AI 生成报告,规则引擎给出预警,审批人员签字,厂商提供工具。出了问题,责任链怎么划?
系统之间怎么打通?一张图平台、审批系统、遥感监测库、项目库、公文系统、档案系统、地图服务、空间数据库,如果没有工具调用和权限审计,AI 最后只能停留在聊天窗口里,写几段漂亮材料。
这才是政府 AI 的真实难题。
别再做大屏,别再接问答框。我们最需要做的,是把权威数据、业务规则、模型工具、权限边界、审计日志和人工签批重新接起来。
没有工具调用的政府大模型,只是更会写材料的 OA。
有证据链的智能体,才可能进入审批现场。
现在能做什么
如果你在这个行业里,现在可以做的事其实不多,但都很具体。
把你最常用的那个模型,参数来源、数据版本、运行记录整理成一张表。不要等 AI 来做,先让自己能回答"为什么选这个参数"。
把你审批或分析过程中的机械性检查列出来。哪些图层每次必须叠?哪些距离每次必须量?这些是最该交给 AI 的。
如果你管数据,先把权威数据版本管起来。三调用哪一版?年度变更更新到哪一年?不要让 AI 自己去猜。
如果你管系统,别急着做大屏。先想清楚一个场景:从 AI 输出结果,到专家签字确认,中间需要经过哪些环节?每个环节留下什么痕迹?
它不是来抢章的
AI 不是来抢章的。它是来照亮盖章之前那段黑暗的。
一张图审批里,它照亮项目红线和控制线之间到底压了多少。灾害模拟里,它照亮模型参数从哪来、数据是哪一版、情景有没有跑全。应急管理里,它照亮三套方案各自的不确定性在哪。政府治理里,它照亮过去藏在经验、流程和文件缝隙里的责任链。
老专家当然还要坐在那里。越是高风险场景,越需要专家坐在那里。
只是 Ta 面前不再是一张孤立的图、一份厚报告、一个软件跑出来的结果。Ta 面前会是一条证据链。数据从哪里来,模型怎么跑,参数怎么选,风险在哪里,哪些结论稳定,哪些必须复核,系统都已经摆出来。
那时,专家和 AI 的关系也许会变得简单一点。
专家不用把 AI 当成越权的年轻人,AI 也不用装成无所不能的专家。会前,它把所有该量的地方重新量一遍,该查的依据重新查一遍,可能漏掉的风险重新摆到桌上。
然后专家看一眼,说:“这份报告,拿到会上。”
这就够了。
AI 不是来替人负责的。它是来让责任终于有迹可循。