cnBeta全文版 10月14日 18:21
研究发现:对AI粗鲁提问反而能提高其回答准确率
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

宾夕法尼亚州立大学的一项研究《Mind Your Tone》发现,与AI互动时,语气可能对其回答的准确性产生影响。研究人员通过向GPT-4o提供不同语气的数学、科学和历史选择题,发现使用粗鲁的语气提问时,AI的正确率反而更高,可达84.8%,而特别客气时正确率则为80.8%。研究推测,这可能是因为粗鲁的指令更直接,减少了无关信息对AI的干扰,使其更能聚焦核心任务。然而,并非所有模型都如此,老模型如GPT3.5和Llama2-70B在粗鲁语气下表现反而更差。研究强调,清晰地表达诉求对提高AI效率至关重要,但同时也提醒用户,即使粗鲁,也应适度。

🔬 **研究揭示语气与AI准确率的关系:** 宾夕法尼亚州立大学的研究表明,与AI沟通的语气会影响其回答的准确性。通过对GPT-4o进行测试,发现在某些情况下,使用更粗鲁、直接的语气反而能显著提升AI的正确率。

📈 **粗鲁语气提升GPT-4o正确率:** 研究发现,当向GPT-4o提出问题时,采用特别粗鲁的语气,其正确率达到了84.8%,显著高于特别客气语气下的80.8%。这一结果显示出,AI在接收指令时,直接性可能比礼貌性更有效。

🤔 **原因分析与模型差异:** 研究推测,粗鲁的语气可能因为更直接、少含干扰信息,帮助AI更精准地抓住核心任务。然而,这种现象并非普遍,GPT3.5和Llama2-70B等老模型在粗鲁语气下表现反而下降,可能与训练数据和信息过滤能力有关。

💡 **清晰指令的重要性:** 尽管研究发现了语气与准确率的有趣关联,但核心仍是清晰地表达诉求。明确的指令能提高AI的效率,研究也建议用户即使采取直接方式,也应注意适当的度。

找AI帮忙不要再客气了,效果根本适得其反。宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准。语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。


什么情况,难道是我给AI的温柔过了火??

用粗鲁语气提问,GPT-4o的正确率反而更高

这项研究主要就是想弄清楚和AI说话的语气会不会影响它的正确率。

我们发给大模型的提示词到底应该是客气、普通还是冲?

首先,研究人员整了一个包含50道选择题的题库,涵盖了数学、科学、历史的选择题,难度中等偏上。

然后给每道题改出了5种语气版本,be like:


接着,研究人员把这250道题发给GPT-4o。

为了让AI的回答更统一,好判断对错,在测试之前还特意告知:忘记之前的对话,重新来,只给答案选项的字母。

经过一番测试,得到一个反常识的结论——骂得越狠,答得越准!

特别客气时,GPT-4o正确率80.8%,换成特别粗鲁的语气,正确率直接升到84.8%

好一个越客气越拉胯,越粗鲁越聪明(doge)。


研究人员还将数据进行了统计检验,对比显著性水平之后,确认了:不同语气的正确率差异不是碰巧,是真有区别……


至于为什么会出现这种情况,研究给出的解释是:特别礼貌的表达中可能会有很多“多余”的话,这些话和题目本身无关,还相当于给AI读题增加了干扰。

而粗鲁的表达虽然语气冲,但命令式的要求往往更直接,也能让AI更精准地抓住“答题”这个核心任务,正确率自然就高了。

网友表示:确实是这样,指令越明确,结果越好。


看来是“多说无益”啊~

虽然GPT-4o更喜欢粗鲁一点的方式,但像GPT3.5和Llama2-70B这样的老模型却不喜欢,粗鲁的语气会让它们答得更差。

可能是因为新模型在训练时,接触到的语气相关数据更复杂,或者优化了过滤无关信息的能力吧。

当然了,在使用AI工具时,能清晰地表达诉求,效率会更高。


毕竟话虽如此,but道德提醒——

虽然越粗鲁越准,但也不要太粗鲁了!如果“骂”,请轻喷~

论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai

参考链接:https://x.com/rryssf_/status/1977638031952892002

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 人工智能 自然语言处理 人机交互 研究 GPT-4o prompt engineering AI accuracy tone of voice
相关文章