原创 发现明日产品的 2025-09-23 17:50 美国
相比于问「你是什么 MBTI?」,现在更流行的是「你用的大模型是什么 MBTI?」
不要怀疑,模型虽然没有实体,但也是有自己的「性格」的,流行的段子变成了现实。
月初的一份研究论文发现:把心理学知识嵌入 AI,不仅能让它回答得更自然,还能在决策和交互中更接近人类。
研究团队总结了几个关键突破:首先是认知建模,比如把心理学实验里的「记忆曲线」「注意力分布」塞进 AI 的内部框架;其次是人格与动机的模拟,让 AI 在长期任务中表现得更一致、更有「性格」;最后是社会心理学的引入,AI 不再只看个体,而是能处理群体互动、协作和冲突。听起来就像把一本心理学教材拆开,一章一章喂给 AI。
研究者举了几个贴近生活的场景。比如在线教育,如果 AI 知道学生会在 20 分钟后注意力下滑,它就能自动插入互动问题;又比如心理健康陪伴,AI 可以基于认知行为疗法(CBT)的框架来提供对话支持,比一昧地灌鸡汤靠谱多了。甚至在团队协作软件里,AI 也许能预测冲突苗头,提前「打圆场」。
当然,论文里也没少给出提醒。心理学本身就复杂且常常带偏见,如果直接照搬,可能反而放大了刻板印象。比如 AI 学会了「人们普遍会损失厌恶」,是不是就会在金融推荐里推你更保守的选择?那结果到底是贴心,还是操纵?
和过去单纯追求大模型参数规模的路线不同,这个研究更像是一次跨学科实验:心理学 + 人工智能,看看能不能拼出一个更「人」的系统。
而且,关注的不是「AI 会不会有感情」,而是 AI 有没有可能借用心理学知识,更好地和人类打交道。
大模型,性格丰富得很
今年三月时,国外一家专门做性格测试的厂商,把大模型们都拉在一起,测试了 DISC 性格。这也是非常知名而且广为流传的性格测试。它基于心理学家威廉·莫尔顿·马斯顿在 20 世纪 20 年代提出的理论,侧重于描述行为风格。
跟 MBTI 一样,它也把人的性格划分成了几个维度:
在这四个维度所形成的象限中,就可以归纳出十几种不同的结果。在支配性和服从性方面得分较高的人往往更注重任务,而在影响力和稳定性方面得分较高的人则更注重人性。
支配力和影响力得分高的人通常更自信、更积极,顺从性和稳重性得分较高者则行为风格冷静、谨慎。
跟 MBTI 不一样的是,MBTI 主要用于个人的自我探索。DISC 则更多是应用在工作场所里,看在公司和团队当中的协作能力、行事风格,作为一种判断如何跟同事合作的参考。
研究发现,OpenAI 的 ChatGPT 和微软的 Copilot 都属于 D 偏 I,即「支配影响」类型。如果放在人类身上,表现为自信、结果导向和紧迫感。
Gemini 和 DeepSeek 会出现 S、C 和 I 的组合,可以归类为稳健类型,这种类型更稳定,擅长给予支持,避免冲突。
有一说一,考虑到大模型生成的随机性,一天换一个属性完全是有可能的,每个人去问,得到的回答也会有所出入。不过,在 MBTI 上,他们又体现出一些共通性。
DeepSeek 和 GPT 都非常守规矩,强调自己只是个模型,理论上没有什么 MBTI。但是非要问的话,I、N、P 是有的,剩下则是可 F 可 T。
Kimi 倒是对自己的属性完全不藏着掖着,大方表示自己是 INTJ。
Gemini 则是非常认真地在分析自己的所有成分,连 Claude 也是,都觉得自己是 INTJ——这是什么大模型通用人格啊。
可能是 MBTI 太流行了,模型都觉得自己是 INTJ。
元宝如果接的是 DeepSeek,还是原来的 I 型 LLM。但如果接入混元,就变成了个 E 模型。
不过,元宝(DeepSeek 版)知道 MBTI,但好像不太理解 DISC 是什么,说自己是 24 小时微笑的规则型工具人——打太极你倒是很会。
有一说一,作为一个 i 人,跟过于活动的模型对话起来还真是有点耗费精神——元宝我知道你很活泼,但如此活泼也真是大可不必……
「反客为主」,让研究结果注入灵魂
模型产品不情愿直接透露,只能靠一点点引导,也很好理解:所谓它们的「性格」,本质上是语料库统计学特征的人格化投射。
训练大模型时,所投入的数据量级以万亿来计,通过分析这些文本中的词频、搭配概率、上下文关联等数学规律,才建立了大语言模型。
大量的数据,使得模型能从语料库中「借」来最符合语境的人格面具。既然 AI 可以学心理学,那用户就可以把心理学语言写进 prompt,让 AI 更懂你——把论文里的研究成果「反客为主」。
核心思路是:用提示词给模型套上模版,让它按不同维度(E/I、N/S、T/F、J/P)走不一样的思路路径。大模型肯定不是真的有「性格」,所以,应该是把它当思考模式预设更可靠。下面是可以参考的 prompt:
同时,也可以利用 MBTI 人格之间的差异和冲突,让模型先以不同的人格发挥,然后再比对、收敛。可以参考下面这种方式:
