
最近,AI圈接连上演了两出“好戏”。
一则是略显荒诞的“闹剧”:据九派新闻报道,有网友让豆包朗读满屏的“若”字,结果AI越读越快,声调逐渐诡异,仿佛深夜“念咒”。面对热搜上的“诡异”质疑,客服的解释颇具技术流色彩:这是语音模型为了效率,在处理大量重复单字时压缩了语调与语速。

另一则则是引发全民共鸣的“正剧”:为何AI总会一本正经地胡说八道?当你让它查资料,它说得头头是道,一核对却发现全是编造的。这种被称为“AI幻觉”的现象,正成为许多人使用人工智能时的共同梦魇。
从“念咒”到“撒谎”,大众往往将这些现象归结为AI的“笨”或“技术不成熟”。但很少有人意识到,这背后隐藏着一个更深层的逻辑:AI的“胡说八道”,在某种程度上,是被现行的训练与评分规则“逼”出来的。
AI不是“思考者”,而是极致的“应试生”
要理解AI为什么会“撒谎”,首先得打破一个迷思:AI并没有主观的欺骗意图。它之所以会编造不存在的法律条文、伪造权威的参考文献,甚至像豆包那样在极端情况下“失语”,核心原因在于它本质上是一个被海量数据喂养出来的“概率预测机器”。
当AI面对“今天天气非常”这个开头时,它并不是在思考天气的冷暖,而是在计算下一个字出现“不错”或“热”的概率最高。它追求的是语言逻辑的通顺,而非客观事实的准确。
更致命的是,目前的AI训练机制,像极了一场残酷的“应试教育”。在现有的主流评分体系中,AI面临着一种扭曲的激励:答对了得分,答错了不得分,而说“不知道”往往也不得分。
试想一下,如果把你放在这样的考场规则下,面对一道冷门且模糊的题目,你会怎么做?与其交白卷(说不知道),不如硬着头皮蒙一个(编造答案),万一蒙对了呢?研究发现,当坦诚说“不知道”和答错一样没有优势时,AI会本能地倾向于“猜测”。
这就是为什么AI在面对冷门知识或细节追问时,会“硬答”。它不是想骗你,它只是太想“拿高分”了。这种被规则倒逼出来的“勤奋”,恰恰造就了它一本正经胡说八道的“自信”。
被“幻觉”反噬的商业化困局
这种技术底层的“应试逻辑”,正在给狂飙突进的AI商业化蒙上一层阴影。
当AI从单纯的聊天机器人进化为能够辅助科研、提供投资建议、甚至参与法律定性的工具时,“幻觉”就不再是一个可以一笑置之的技术瑕疵,而是一颗随时可能引爆的“信任雷”。
近期,全国首例AI幻觉侵权纠纷案的宣判,标志着这一问题已从技术圈外溢至法律与社会层面。从误导投资者造成财产损失,到编造谣言导致名誉侵权,AI的“胡编乱造”正在让企业和用户共同买单。对于科技厂商而言,这不仅是声誉的损失,更是真金白银的赔偿风险;对于用户而言,盲目信任AI生成的“完美答案”,可能意味着在关键时刻做出错误决策。
目前的AI产业,正处于一个尴尬的“青春期”:它拥有了惊人的表达能力和知识广度,却缺乏对事实最基本的敬畏和核查能力。当“流畅度”被置于“准确度”之上,AI生成的内容越华丽,其背后的虚假信息风险就越大。
如何给AI装上“刹车片”?
面对被规则“逼疯”的AI,我们并非束手无策。解决之道,既需要技术端的“规则重塑”,也需要用户端的“认知升级”。
在技术层面,科学家们已经开始反思现有的“指挥棒”。有研究建议改革评分规则:答对得1分,说“不知道”给0分,而答错则要扣分。只有当“撒谎”的成本高于“承认无知”时,AI才会学会诚实地说“我不知道”。此外,行业主流的“检索增强生成(RAG)”技术,相当于让AI从“闭卷考试”变为“开卷考试”,在回答前先检索权威资料,能大幅降低编造概率。
而对于作为普通用户的我们,在享受AI带来的效率红利时,必须建立起一道心理防火墙:
第一,警惕“确定性”。当AI用无比自信、流畅的语气给出一个冷门答案时,多留一个心眼。它的自信源于概率计算,而非事实核查。
第二,善用“不知道”。如果AI回答“不知道”,请不要生气或反复逼问。在当前的机制下,愿意承认无知的AI,反而比强行作答的AI更靠谱。
第三,关键信息必核实。涉及金钱、法律、医疗等严肃场景,务必通过官方渠道进行交叉验证。把AI当作一个才华横溢但偶尔会喝醉的助手,而不是全知全能的神。
AI的“幻觉”问题,本质上是技术发展与人类规则磨合过程中的阵痛。它提醒我们,真正的智能不仅仅是流畅的对话,更是对事实的尊重与对边界的敬畏。在AI真正学会“诚实”之前,保持审慎与批判性思维,是我们驾驭这项技术的唯一法门。