GISer们,你们的先验知识在AI下半场值钱了!
清华姚班毕业的大神、思维树的创作者、OpenAI 研究员——姚顺雨博士最近在博客中说人工智能的下半场比拼的不是算法有多精妙,而是得通过大幅增加先验知识来实现真实世界的效用,从而实现更能泛化的智能体。

如果更说“人话”一点的表达,就是卷算法到头了,大模型学习的人类知识还不够,学的更多的AI,脑筋才会有更明显的提高。
真没想到先验知识对AI推理居然这么重要。另外,大家以为先进大模型已经把人类现存知识都学习差不多了的观念也不准确。比如GPT-4 的训练数据集大约为 0.5 PB,而摩根大通一家专有的数据集,就超过 150 PB。所以,对于大模型来说,学习之路,还长的很。
如果把大模型想象成一个读遍了所有书、刷遍了所有论坛、看遍了所有公开对话的“超级读者”,但它的世界,终究是“被记录下来的世界”——而不是“正在发生的世界”或“未被说出口的世界”。
- • 互联网数据有盲区:
很多行业know-how、前沿实验、失败教训、微妙的社会习惯、边缘文化、线下体验、人与人之间的默契……这些要么没被写出来,要么被写了但没被公开,要么根本无法用语言描述。 - • 创新本身是“未被记录”的:
真正的创新点子,往往是“还没人做过、没人写过”的。大模型只能基于“已知”,它的先验知识天然有边界。
那互联网之外,还有哪些“先验知识”值得被训练?
我从一个“人类”的角度去看,可能有这些知识不容易获取,也不容易学到:
A. 行业深水区的“隐性知识”
- • 一线从业者的实操经验、失败案例、灰色地带的生存智慧
- • 线下调研、田野调查、实验室日志、非公开的行业报告
- • 真实用户的“吐槽”、小圈子的暗语、非主流社区的讨论
B. 现实世界的“动态知识”
- • 新兴市场的变化、政策风向、突发事件、社会运动
- • 线下活动、展会、沙龙、闭门会议里的观点碰撞
- • 真实场景下的用户行为、情感反应、微观决策
C. 人类“未被数字化”的经验
- • 身体感受、直觉判断、情感共鸣、文化仪式
- • 设计师的灵感来源、艺术家的创作过程、工匠的手艺传承
- • 团队协作中的默契、领导力的微妙表达
D. 未来的“新知识”
- • 创业团队正在创造的东西
- • 还没被写进论文、还没被媒体报道、还没被大模型“看见”的新实践
其实不只是机器,就是人类专家的先验知识也会明显与不具备先验知识的小白拉开效率差距,如果将这个先验知识与机器智能互动,更加是一个未来值得期待的人机协作模式。
我举一个小例子。
前阵子,从数读城事购买了一套配色方案。作者在配色上有自己的眼光。其实这个眼光就算是一种先验知识——我所不具备的一种对色彩敏感的能力。
六个文件六个色带组,是ArcGIS的格式。其中一个色带组的样式如下:

我想将其转换成QGIS支持的色带格式(xml文本文件)。
请各路大神(模型)给提建议如何做转换。大部分都说QGIS中有一个插件,叫做SLYR。但得购买收费版本才可以转换色带的样式。我去查了一下价格,1850美元!那叫做一个“贵”。
想省钱就得自己动手。写代码已经成了最先被平权的基础工作。我只告诉了claude 3.7,一个先验知识,所有的事情居然全部都“半自动”的完成了。
这个先验知识就是:ArcGIS pro的style文件,是个sqlite的数据库。
在cursor中输入,我请Ta先试着读取一下。

结果人家连HTML的页面都做出来了:

输入一段QGIS中的XML色带样例代码,从ArcGIS的格式到QGIS的格式丝滑完成。导入一次成功。下图为QGIS的符号管理界面:

既然claude都阅读了数读城事的先验知识,那就跟着学习,是不是可以给我一些创意建议。这也是大模型能帮助人打开脑洞、提供视角延伸的价值所在。再现找一个例子,将中国省级2024年GDP的分段地图做一下。现找数据不愁。请gemini的深度调研出场。布置任务,喝茶,回来即可收到表格。大陆,港澳台都整理的妥妥的。

claude没有参考数读城事的先验知识,自己的建议:

我提醒Ta参考一下数读城事的创意,重新给的建议:

继续写脚本,和宝哥(锐多宝)的2024年行政区划做一个连接。然后按照claude的建议出图:



最后再写一个HTML页面,做个在线的地图:


就一句先验知识,后面执行转换任务、网页制作超出预期、我也获得新知(感受先验知识的价值),一共不到1个小时。还要啥自行车啊?不过,这条先验知识是一位效率的关键先生。
GISer们,先验知识不仅是AI下半场的入场券,更是咱们与未来对话的密钥。你们手中握着的,不只是数据和地图,而是未被数字化的现实、未被言说的经验。这些,正是AI渴求的“活水”,也是你们的价值所在。
当我看着自己用一句关键信息,驱动Claude完成从色带转换到GDP地图的整个流程,我意识到:可能我们不必与机器竞争了,而且真的有机会在与Ta们共舞。咱们每一次田野调查,每一天外业测绘,每一个手绘符号,每一份未公开的报告,都是这场共舞中不可替代的节奏。AI可以读遍互联网,但它无法走过咱们走过的路,感受我们感受到的风和雨。
所以,别低估自己。你提炼的经验知识、你独到清奇的视角,是这个时代最稀缺的资源。它不仅是技术进步的燃料,更是连接虚拟与现实的桥梁。把你的经验写下来,讲出来,甚至只是与AI聊一聊——你会发现,你不仅在教它认识世界,也在重新定义自己的位置。未来不属于算法,而是属于那些愿意用自己的“先验”去点亮未知的人。你,准备好了吗?