AI这事儿,到底是谁没弄明白?我看啊,是咱们自己!

Sep 18, 2025

1. 核心之惑:不是AI不行,是你的脑子“转不过弯”

我肯定是掉进信息茧房里了,“人工智能”四个字,就是我眼前脑中天天晃荡的星星。最近看到的报告满天飞,一会儿是“95%的AI项目都失败了”,一会儿是“2026 年 50% 的白领就得失业”,一会儿又是“生产力没见多大提升”,搞得人心惶惶。这阵子的主题:这AI是个华而不实的玩意儿,中看不中用。

很多人啊,一听说AI会“犯错”,会“胡说八道”,立刻就如临大敌,觉得这东西不靠谱,不能托付重任。企业老板们更是直摇头:“我们业务零容忍失误,AI这德行,怎么用?”我还以为大家对 AI 的幻觉已经祛魅了,没想到还是碰到好多人坚持因为 AI 的幻觉而弃之如敝履。

别扯零容忍了! 听到这话,我真是替 AI 鸣个不平。这哪是AI的问题?这分明是咱们这些用AI、想用AI的人,脑子里那根弦儿还没拧过来!说白了,你压根儿就没搞懂AI的“脾气秉性”,就急着给它定罪。

咱们这些年,用惯了那种“一加一就等于二”的死板软件,觉得机器就应该像个精确的齿轮,咔咔作响,分毫不差。结果现在来个AI,它偏不,它告诉你:“一加一,有很大可能等于二,但也可能等于1.99,或者2.01。” 你一下就懵了,觉得这玩意儿不靠谱。

问题是,AI的“不确定性”,它不是缺陷,在我眼里,它恰恰是AI最牛逼,最核心的“功能”! 如果你连这个基本道理都想不明白,那你和这个时代,肯定是有点脱节的。

2. AI的“底牌”:它压根儿就不是一台计算器,而是一个“概率大师”

很多人对AI的理解,还停留在过去那种“逻辑判断机”的层面。以为AI就是一套复杂的规则,你输入A,它就输出B。错了,大错特错!

咱们现在说的这些什么ChatGPT、Gemini、AlphaFold,包括那些高大上的脑机接口,它们的核心原理,都不是什么“板上钉钉”的逻辑,而是彻头彻尾的“统计学”

说得更直白点,AI学到的,就是 “可能性”。它看了一大堆数据,然后琢磨:“如果出现这个情况,那么接下来很有可能出现那个情况。”

  • 比如语言模型:它学的是“当我说‘我’的时候,有很大几率下一个词是‘是’。”
  • 比如医学模型:它学的是“当看到这种蛋白质链,那么它很可能会折叠成这种形状。”
  • 甚至你用它写文章:它知道“要表达这个意思,除了用这个词,还有其他几个词也能用,只是可能性略低一点。”

你看,这哪里是什么“确定性”?它从骨子里就浸润着“随机性”和“概率”。

更有意思的是,AI不仅要学会判断“对的几率有多大”,它还要主动学会判断“犯错的几率有多大”! 说白了,我们是在教它同时估计“确定性”和“不确定性”。

听到这儿,你可能又要犯嘀咕了:“这不是给自己找麻烦吗?谁想让机器给我算错?”

错了!大错特错!

3. 你想要的“确定性”,恰恰是AI的“地狱”

想象一下,如果语言模型每次说话都给你一个“最正确”的词,那会怎么样?

就拿“男孩去了……”这个句子来说,如果AI每次都死板地预测“公园”,那它写出来的文章,你还能看吗?枯燥、乏味、重复,毫无“人味儿”!它根本就没办法“创造”出丰富多彩的语言。

所以,咱们人类复杂的语言,本身就有很多种表达方式。我们恰恰需要AI能够像人一样,每次都能生成“有点不一样”的文本,有点“创意”在里面。这就要求AI不能只盯着那个“最可能”的答案,它要能“考虑”那些“次可能”的、甚至是“不太可能但也能说得通”的答案。

这就引出了一个核心概念——概率分布

简单来说,当AI在预测下一个词的时候,它并不是直接告诉你一个词,而是给你一个所有可能词的“排行榜”,每个词后面都跟着一个“可能性分数”。“公园”可能是90%,“学校”可能是80%,“商场”可能是60%……

这个“排行榜”牛在哪儿?

  • 它给了AI“选择”的权利:不至于死板地只选一个。
  • 它增加了“创造性”:因为AI可以从这个排行榜里“随机”选一个得分高的。
  • 它直接告诉了你“把握有多大”:如果排行榜上,一个词遥遥领先,那AI就很“自信”;如果好几个词分数都差不多,那AI就“懵逼”了,它会告诉你:“这几个词都行,我也不知道哪个最好。”

所以你看,当我们要求AI“有创意”、“能思考”的时候,就等于是在要求它 “拥抱不确定性”。AI的每一次预测,都被有意无意地加入了“随机性”。甚至你让它“贪婪地”只选最靠谱的,它背后的GPU分布式运算,都可能导致结果每次都略有不同。

你还在抱怨AI会犯错?殊不知,这“犯错”的基因,是我们人类亲手给它装进去的,而且,我们还指望着它给我们带来惊喜呢!

4. AI的“冤屈”:我们对它的要求,比对人还苛刻一万倍!

那些动不动就拿“AI不靠谱”说事儿的人,我真想问问他们:你对AI的要求,是不是有点太“离谱”了?

  • 第一,人就不会犯错吗? 你自己工作,是不是每天都“完美无瑕”?你公司里的员工,是不是每个人都“零失误”?别逗了!新西兰有研究表明,AI在审查发票这种枯燥又精细的工作上,不仅比人快得多、便宜得多,而且“犯错率”比人还低!
  • 第二,“幻觉”有那么可怕吗? 所谓的AI“幻觉”,就是它编造事实。但你看看现在顶尖的AI,比如GPT-5,它的“幻觉率”已经低得令人发指了!
LongFact-Concepts、LongFact-Objects 和 FActScore 都是用于评测大模型幻觉(hallucination)能力的基准或指标。LongFact-Concepts 是一个测试大模型对抽象或理论概念事实性理解的任务基准,主要包含与概念相关的开放式事实性问题。其目的是评估模型在长文本生成时,对概念性知识的事实准确率。LongFact-Objects 对应的是测试模型对具体对象或实体事实性理解的任务基准。与 LongFact-Concepts 不同,它聚焦于实体(如人名、地名、事物等)的细节是否被准确表达。FActScore 是一种针对长文本回答进行事实性评测的聚合指标,用于统计回答中被证实为真实的事实比率,并结合准确率和召回率来体现整体事实性表现。FActScore 综合考虑模型给出的事实是否被外部查证支持。

可即便如此,还有那么多老板,咬死不放:“我业务不能有丝毫差错!”

这话听起来冠冕堂皇,实则荒谬至极!

你以为自己对“确定性”有那么大的执念,是啥好事吗?你知道在哪些领域,Ta 们天天跟“不确定性”打交道,而且玩儿得风生水起吗?

网络安全! 这是一个对精度和容错率要求最高的行业了吧?一个微小的漏洞,可能就是几十亿的损失。但他们怎么玩儿的? Ta 们玩儿的是一个叫“零知识证明”的东西。

5. “零知识证明”:看,高手是如何“驯服”不确定性的

“零知识证明”这玩意儿,听起来玄乎,其实核心还是那个词:“概率”

它的牛逼之处在于:我能向你证明一件事是真的,但同时又什么都不给你看。

举个例子。你和一个色盲朋友玩游戏。你手里有两颗一模一样的球,只是颜色不同(红和绿),你朋友看不到区别。你让他把球藏在背后,随便换手,然后拿出来。你必须立刻说出他有没有换手。

一般人,这不是瞎蒙吗?50%的几率。

但你不是!因为你看到了球的颜色,你心里有“秘密”。他一拿出来,你立刻就知道有没有换手。

你朋友惊呆了!因为在他看来,球是完全一样的,你每次都能猜对,这简直是“巫术”!他会怎么想?

他可能会想:“这小子瞎蒙,蒙对了。” 但如果他蒙了8次,次次都对呢?八次都对的概率,算算看,不到0.4%!这已经不是“瞎蒙”能解释的了!

这时候,你朋友就不得不相信:你是个“巫师”,或者你掌握了什么“秘密”!

这就是零知识证明的精髓:我证明了我是“巫师”,但我没告诉你“秘密”是啥(颜色),我只是让你看到,“蒙对的概率”几乎为零,所以我的说法就不得不信!

这个思路,直接用到AI上,就是“统计覆盖率”!

当AI的错误率被降低到无限接近于零的时候,你还纠结它“可能”犯错吗?

“N选一”策略:现在的顶级AI,比如OpenAI和Google,它们很多时候都会让模型跑好几遍,然后从中选出“最好”的那个答案(比如出现次数最多的)。这不就大大降低了单次犯错的概率了吗?

所以,别再把AI用一套根本不适用,甚至对人都不适用的“完美主义”标准去衡量了!学会像网络安全专家那样,用概率去“驯服”不确定性,才是正道!

6. 醒醒吧!不是AI没准备好,是咱们自己还没“开窍”!

说到底,AI现在遭遇的“瓶颈”和“不被接受”,根本不是技术问题,而是 “思维模式”问题!是一种对新事物、新模式的 “无知和抗拒”

那些抱怨AI没用的人,压根儿就没搞懂AI的底层逻辑,更没琢磨透如何去“驾驭”这种自带“不确定性”属性的未来软件。

你当然可以跟你的领导说:“我们公司对AI零容忍失误,所以我们不用AI!” 好啊,你等着被时代淘汰吧!

别自欺欺人了,AI这东西,它已经准备好了!是咱们自己,还没准备好接受它,还没准备好和它一起“进化”!

未来所有的软件,都将或多或少地带有这种“不确定性”的基因。这是趋势,这是宿命。我们能做的,不是抗拒,而是看清它的本质,学会与不确定性共舞,用统计学的智慧,将那点“不确定性”化解掉,让它为你所用!

这盘人类历史上可能最大的棋局才刚刚开始,别傻乎乎地站在原地,还以为自己是智者。有时候,你以为的“理性”,反而是最大的“愚蠢”。

王昊

用地图思考人生

评论正在加载...
Great! You've successfully subscribed.
Great! Next, complete checkout for full access.
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.
分享