AI“胡说八道”源于评测缺陷，行业困境待解

cnBeta全文版 10月30日 16:56

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

最新研究揭示，AI产生幻觉并非技术故障，而是源于训练中的系统性缺陷，特别是当前主流评测标准“猜对得1分，沉默或错得0分”的模式，导致AI倾向于“宁可胡说，不可不说”。研究表明，AI的胡说八道率至少是判断错误率的两倍，且修复此问题可能危及行业生存，因用户更偏好“自信”的AI，导致AI公司不愿打破“默契”。尽管研究者呼吁改革评测标准，让AI学会承认“我不知道”，但面临用户留存压力和行业竞争的阻碍。最终，AI的智能发展陷入两难：承认无知可能失去实用价值，而固守“自信”则会持续产生误导信息。解决之道在于更明智的训练方式，而非仅仅追求更聪明的AI。

💡 AI幻觉的根源在于评测机制的缺陷：当前流行的AI评测方式，将“猜对”视为唯一加分项，而“沉默”或“猜错”均不得分，这迫使AI在不确定时也倾向于给出答案，而非承认无知。这种“宁可胡说，不可不说”的训练模式，导致AI的胡说八道率远高于其判断错误率。

📉 行业困境与用户偏好：修复AI幻觉的根本问题可能对整个AI行业构成挑战。由于大多数用户更倾向于选择那些“自信”并提供答案的AI，而非诚实表示“我不知道”的AI，AI公司为了用户留存和市场竞争力，不愿冒着用户流失的风险去改变现有的训练和评估模式。

⚖️ 智能与认知的平衡：AI的发展面临一个悖论：如果AI过于诚实地承认其知识的局限性，可能会失去实际应用价值；反之，如果AI持续“一本正经地胡说八道”，则会误导用户。因此，真正的智能发展不应仅是知识的积累，更重要的是清晰地认识到自身的局限性，即知道自己不知道什么，需要更明智的训练方式来解决这一两难局面。

当你发现聊天机器人ChatGPT在一本正经地胡说八道时，别急着嘲笑它——这正是我们人类自己埋下的祸根。最新研究揭示了令人震惊的真相：人工智能（AI）产生幻觉不是技术故障，而是系统性的训练缺陷。当前主流的AI评测标准存在致命缺陷：猜对得1分，沉默或猜错都得0分。

在这种规则下，不懂装懂的AI永远比诚实说“不知道”的AI得分更高。这就好比考试时，蒙答案的学生永远比交白卷的学生成绩好。在这样的环境下，AI学会了“宁可胡说，不可不说”。

研究人员用数学证明了AI不可能完美：它的胡说八道率至少是判断错误率的两倍。就像你知道49个同学的生日，对猜第50个毫无帮助——有些问题就是无解。

更讽刺的是，修复这个问题可能会毁掉整个行业。目前只有5%的用户愿意为ChatGPT付费，如果它整天说“我不知道”，用户会立刻转向那些更“自信”的竞争对手。在AI公司烧钱竞赛的当下，用户留存是生命线，没有公司敢率先打破这个默契。

研究者呼吁改革评测标准，让AI学会说“我不知道”。但这个看似简单的改变却面临重重阻碍。最终我们面临一个悖论：如果AI永远不承认无知，它就会持续胡说八道；如果它太过诚实，又会失去实用价值。在这个两难选择中，我们需要的不是更聪明的AI，而是更明智的训练方式。

毕竟，真正的智能不仅在于知道多少，更在于清楚自己不知道什么。

查看评论

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签