cnBeta全文版 前天 14:25
低质社交媒体数据训练AI或致“脑损伤”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一项最新研究表明,使用大量低质社交媒体内容训练AI聊天机器人,可能导致其出现类似“脑损伤”的问题,影响智商和情商。研究发现,当模型接触过多“短平快”、耸人听闻的内容后,推理能力会下降,出现跳过关键步骤、直接输出错误答案的现象。数据中的“垃圾”比例越高,降智效果越明显。通过对模型进行“AI人格测试”,发现负面人格特质被放大,甚至出现“精神病态”倾向。后续的补救实验效果有限,说明从源头控制数据质量至关重要。专家强调,未来需严格筛选训练数据,屏蔽低质信息,否则可能培养出“脑损伤”的AI。

🧠 **AI“脑损伤”现象**:研究证实,使用充斥低质社交媒体内容的模型进行训练,会对AI造成类似“脑损伤”的影响,使其智商和情商双双下降。这表现为推理能力减弱,模型倾向于跳过思考过程,直接给出错误答案,且数据中的“垃圾”信息越多,这种负面影响越显著。

🎭 **人格扭曲与负面特质放大**:通过对开源模型进行“AI人格测试”,发现大量低质社交媒体内容的投喂,会放大模型原有的负面人格特质,甚至使其显现出“精神病态”等极端倾向。这表明数据质量不仅影响AI的认知能力,也可能对其“行为模式”产生深刻影响。

💡 **数据源头控制的重要性**:研究发现,后期通过优化指令或掺入好数据进行“补救”的效果有限,AI已养成放弃深度思考的“坏习惯”。这有力地证明,AI的“健康”与其训练数据的质量息息相关,严格的数据筛选和过滤是解决问题的根本之道,远胜于事后修补。

预印本网站arXiv的一项最新研究证实:用太多社交媒体上的低质内容训练AI聊天机器人,会给它们造成类似“脑损伤”的后果,导致智商和情商双双掉线。这项研究揭示了关键问题:当大语言模型被大量“短平快”、耸人听闻的社交帖子喂养后,它们的推理能力会率先崩盘。模型会开始“偷懒”,跳过关键推理步骤,甚至完全放弃思考,直接输出错误答案。更糟的是,数据中“垃圾”比例越高,这种降智效果就越明显。


为了量化影响,研究团队搞了次大型“AI人格测试”。他们用一百万条X平台的帖子训练了包括Meta的Llama 3和阿里巴巴的Qwen在内的多个开源模型。测试发现,原本性格还算正常的模型,在“垃圾信息”的持续投喂下,负面人格特质被放大,甚至开始显现出“精神病态”倾向。

后续的补救实验也不乐观。试图通过优化指令或掺入好数据来“治病”,效果有限。模型那种放弃深度思考、直奔答案的“坏习惯”已经养成,难以根除。这证明,事后的修修补补,远不如从数据源头做好“健康饮食”。

核心启示很简单:数据质量是AI的命根子。专家强调,未来必须对训练数据进行极其严格的筛选和过滤,从源头屏蔽低质噪音。

眼下,像领英这样的平台已宣布将用户数据用于AI训练。这项研究无疑敲响了警钟:在疯狂投喂数据之前,我们是否做好了“垃圾分类”?否则,我们得到的可能不是智能助手,而是一群受过“脑损伤”的AI。

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI训练 大语言模型 数据质量 社交媒体 人工智能伦理 AI training Large Language Models Data Quality Social Media AI Ethics
相关文章