GPT-5.1：更“好聊”且易于调教的AI助手

硅星人Pro 前天 13:20

OpenAI发布了GPT-5.1，作为GPT-5家族的一次重要升级，旨在解决用户对其前代的反馈，特别是语气过于生硬的问题。GPT-5.1提供了Instant（更健谈、指令遵循更可靠）和Thinking（复杂推理更快、答案更易懂）两款核心模型。Instant模型在对话中更具“人情味”，能共情用户并提供分场景建议，同时显著提升了指令遵循能力。Thinking模型则在保持复杂任务能力的同时，缩短了简单任务的响应时间，并优化了解释的清晰度。此外，GPT-5.1还引入了八种可定制的“人格”风格和精细化的“滑杆”调节，让用户能更灵活地塑造AI的交互方式，使其更贴合个人或工作需求。

🌟 **GPT-5.1 Instant：对话体验的“人性化”升级** Instant模型是GPT-5.1最显著的改进之一，其对话方式被重新设计，旨在提供更自然、更具共情的交流体验。与GPT-5相比，Instant在面对用户表达压力时，不再仅仅提供标准化的建议列表，而是会主动称呼用户，表达理解，并根据具体情境（如“大脑混乱时”或“想彻底放松时”）提供分场景的建议。其语气更加贴近朋友间的安慰和鼓励，甚至会加入幽默元素，同时保持信息密度。在指令遵循方面，Instant模型也得到了系统性改进，能够更严格地遵守用户设定的规则，例如在所有回答中仅使用六个词的要求，这标志着其在理解和执行复杂指令方面有了质的飞跃。

🧠 **GPT-5.1 Thinking：推理能力的优化与易用性提升** Thinking模型针对复杂推理和长链任务进行了工程化优化。它通过更智能地分配思考时间，缩短了处理简单任务（如概括、常识问答）的响应时间，速度约为GPT-5 Thinking最快任务的两倍。对于复杂的任务（如多步推理、代码重构、长文分析），Thinking模型会投入更多时间进行深度分析，从而提供更全面、更细致的解决方案。此外，其回答的清晰度和可读性也得到了提升，通过将复杂的概念拆解为易于理解的解释，并加入“这意味着什么”和“现实中如何应用”等说明，使得非专业用户也能更好地理解。在安全性方面，5.1 Thinking在精神健康等新评估场景下有所改善，整体安全水平与GPT-5相当。

🎨 **个性化与“好调教”：八种人格与精细化滑杆** GPT-5.1引入了革命性的人格调节功能，用户可以在ChatGPT的个性化设置中选择Default、Professional、Friendly、Candid、Quirky、Efficient、Nerdy、Cynical等八种风格，分别对应默认、职场精英、暖聊、直接鼓劲、脑洞系、效率党、技术宅、毒舌等多种人设。这使得用户能够根据自己的偏好，直接调整AI的交互风格，如输出的简洁度、热情程度、表情符号的使用等。更进一步，“隐藏在设置里的滑杆”允许用户进行更精细的控制，并且这些设置对所有模型即时生效，无需重新开始会话。这一改变将部分提示工程（Prompt Engineering）的技巧产品化为用户界面设置，大大降低了AI的定制门槛，让用户可以更方便地将AI塑造成自己理想中的“数字同事”。

📈 **核心能力提升：推理、安全与上下文处理** GPT-5.1在多个硬指标上实现了提升。通过引入“自适应推理”能力，Instant模型在AIME 2025、Codeforces等数学和编程评测中表现显著优于GPT-5。Thinking模型在简单任务上更快，复杂任务上分析更深入。安全性方面，5.1在精神健康、情感依赖等敏感对话评估中有改善，并在对抗越狱测试中展现出更强的防御能力。上下文窗口也得到了扩展，GPT-5.1 Instant可达约128k tokens，Thinking版本在企业/教育计划下可扩展至约196k tokens，为处理更长的对话和文档提供了支持。

原创硅基版 2025-11-13 13:00 北京

简单问题更fast，复杂问题更智能

五个月前，OpenAI 把 GPT-5 端上桌，一堆人吐槽：跑分是高了，但好用度反而不如 4o——语气太直男，聊天有点“冷冰冰”，乃至一度被用户喊着“退钱换回 4o”。

今天凌晨上线的 GPT-5.1，很明显是在回应那一波“差评”。这一次，OpenAI 几乎没怎么炫技参数，也没花大篇幅放榜单，而是反复强调两个关键词：更好聊，更好调。

一、GPT-5.1 是啥？先把基本盘讲清楚

官方给 GPT-5.1 的定义非常克制：它不是一代全新的模型，而是 GPT-5 家族的一次「.1」级升级。

这次一共两款核心型号：

GPT-5.1 Instant：ChatGPT 里最常用的那个默认模型，现在变得更「暖」、更健谈、指令遵循也更靠谱。

GPT-5.1 Thinking：负责复杂推理、长链任务的高阶模型，现在在简单问题上更快、复杂问题上更「咬得住」，同时回答更容易读懂。

在 ChatGPT 里，它们的使用方式是：

前端默认仍是 GPT-5.1 Auto 自动路由 ——系统会替你判断用 Instant 还是 Thinking，常规聊天/改写走 Instant，复杂推理/分析走 Thinking。

你也可以像现在一样手动切换模型。

覆盖范围和节奏：

今天起先给 Pro / Plus / Go / Business / 企业 / 教育版推送，随后几天陆续开放给免费用户。

API 端本周内上线：

gpt-5.1-chat-latest → GPT-5.1 Instant

gpt-5.1 → GPT-5.1 Thinking（带自适应推理）

老版 GPT-5 会在「旧版模型」里保留三个月，给开发者和重度用户一个「后悔药」观察期，避免上次 5 刚上线就被全网喊着换回 4o 那种尴尬重演。

二、更「有人味」的 Instant：从冷知识库到「会安慰人的朋友」

如果只说一句话：GPT-5.1 最大的变化，是 Instant 的说话方式被「重做」了。

官方在博客里用了一个非常典型的例子：

同样是「我最近压力很大，给点放松建议」——

GPT-5 给的是一套很标准的「心理健康 tips 列表」，条理清晰，但你能感到：这是个很专业、但有点距离感的顾问。GPT-5.1 Instant 则会先叫出你的名字、先共情你的处境，再给出分场景的小建议（比如「大脑很乱时」「想彻底放松时」分开讲），用词更像一个认真在「哄你」的朋友。

有测试者发现，5.1 会主动记住你的称呼，在后续对话里用上，整体语气更幽默，甚至会加点小吐槽和梗，但同时并不影响信息密度。

更重要的是，5.1 在「听人话」这件事上也补了一课。

官方给了一个很 geek 的测试：你对模型说：「以后所有回答都只用六个词。」

GPT-5 版本会先说「好的，我会这么做」，但下一句回答其实已经超出了 6 个词。

GPT-5.1 Instant 在这个例子里能严格遵守「六个词」的要求，从头到尾都不破功。

这背后是两件事：

1. 指令遵循的系统性改进 ——模型更倾向于先抽象出「规则」，再填内容。

2. Instant 也获得了「自适应推理」能力 ——碰到棘手的问题，会先「想一会儿」再答，而不是上来就秒回。官方称在 AIME 2025、Codeforces 这类数学与编程评测中，5.1 的表现明显优于 5。

如果你过去嫌 GPT-5 聊天「像念稿」，那 5.1 Instant 最直观的变化，就是：更像人在说话了。

三、Thinking：更聪明，也更「省心」的推理模型

相比于 Instant 的「性格大改造」，GPT-5.1 Thinking 的更新更偏「工程向」。核心有两点：

1. 思考时间更聪明地分配

对简单任务（概括、常识问答），思考时间缩短，大约是 GPT-5 Thinking 最快任务的两倍速度。

对复杂任务（多步推理、代码重构、长文分析），反而会花更多时间「咀嚼」，慢一点，但给出更完整的解法。

2. 回答更清晰、少点术语轰炸

官方用棒球统计（BABIP、wRC+）举例：GPT-5 版本给的解释更像 wiki 条目；

GPT-5.1 Thinking 则把公式拆成「概念解释 + 使用场景」，加了很多「这意味着什么」「现实里怎么用」这类句子，对非专业读者更友好。

系统卡的评估里，还有几件对重度/企业用户很关键的小事：

在多类安全测试上，5.1 Thinking 与 5 大致持平，个别仇恨/骚扰场景略有回退，但在「精神健康」等新引入的评估上有所改善。

在对抗越狱（StrongReject）测试中，新旧两代模型安全水平相当。

对终端用户来说，可以简单理解为：

5.1 Thinking 更像一个「愿意多想一会儿、但解释更人话」的专家。

对于需要用它做长报告、复杂代码重构、研究推理的人，这是一个很实际的升级——不是「能不能做」，而是「做出来的东西你看不看得下去」。

四、不止更聪明，也更「好调教」：八种人格 + 精细化滑杆

GPT-5.1 还有一块很重要，但容易被忽略的更新：ChatGPT 的「人格调节台」被彻底改版了。

现在，在个性化设置里你可以选：

Default / Professional / Friendly / Candid / Quirky / Efficient / Nerdy / Cynical

分别对应：默认、职场精英、暖聊、直接鼓劲、脑洞系、效率党、技术宅、毒舌等风格。

总结了一些媒体和博主的评价：

原来很多人爱用的「Robot」人格，现在被改名为 Efficient（高效），行为几乎不变：少废话、信息密度高、不跟你寒暄。

新增的 Quirky（古怪）、Cynical（愤世嫉俗）则更偏娱乐/陪聊，吐槽感更强。ArsTechnica 甚至用「走钢丝」形容 OpenAI 在「好玩」和「不越界」之间的平衡。

更细的一层，是「隐藏在设置里的滑杆」：

你可以直接在设置里调：输出要多简洁、多热情、表情符号要不要多一点；

ChatGPT 还会在对话里根据你的提示，主动询问要不要一键更新全局语气（比如你老说「别太啰嗦」，它会提议自动帮你把风格改得更简短）。

这些参数对所有模型即时生效，包括正在聊的那一串对话，不再需要「重新开一个新会话」。

这意味着什么？

过去大家要靠各种「定制指令」hack 出来的人设（比如「你是一个傲娇但专业的数据分析师」），现在有更多直接可见的控制钮可用了——OpenAI 在把「提示工程」的一部分，产品化成了 UI 设置。

五、网友实测：有人说「人味回来了」，也有人嫌它话太多

从昨晚到现在，X、Reddit、Hacker News 上的首批体验者大致分成两派。日常用户普遍觉得 GPT-5.1「好聊多了」：开口先安慰、会接情绪，给建议不再一股脑儿甩清单，而是拆成几步讲，语气更口语化。有网友形容「像换回了一个有耐心、会说人话的朋友」，也有人专门夸它记得称呼、能顺着上下文接话，「人味」确实比 5 更浓。

但在 Hacker News 等技术社区，也有人反过来吐槽：官方博客给的对比例子里，「同样一个问题，GPT-5 的信息密度更高，GPT-5.1 反而显得啰嗦」，甚至有人怀疑这是在「用话多换停留时间」，用的就是那个老词——“Enshittification 2.0”。目前的大致共识是：想要陪聊和共情，5.1 提升很明显；追求极致效率的话，还得靠人格和风格设置把它再「拧紧」一点。

六、除了体感，这次「底层战斗力」有没有提升？

从官方的系统卡和第三方汇总来看，GPT-5.1 的硬指标变化主要集中在三块：

1. 推理与数学/编程能力

Adaptive reasoning 让 Instant 也能「先想再答」，带来 AIME 2025、Codeforces 这类评测的显著提升；

Thinking 版则在同等「标准思考时间」下，在一组代表性 ChatGPT 任务中，简单题更快、难题更细。

2. 安全性与敏感场景

在新的「精神健康」「情感依赖」等敏感对话评估中，5.1 总体和 5 持平或略有改善，尤其是 Thinking 版本在精神健康场景下有提升；

在强越狱（StrongReject）测试里，5.1 Instant 对越狱提示的防御能力明显优于早期版本。

3. 上下文和 API 侧体验

第三方整理显示，ChatGPT 中 GPT-5.1 Instant 的上下文可达约 128k tokens，Thinking 在企业/教育计划下可扩展到约 196k，上限比现有 5 系列更宽（具体数值还要以 OpenAI 模型页正式更新为准）。

从「刷榜」到「好用」，轮到你来打分了

如果把这次更新拉远一点看，GPT-5.1 不是一场「再堆一次参数」的技术炫技，而是一次挺明确的姿态调整：从讲模型有多强，转向讲这个助手好不好相处、好不好用。它把语气、人设、指令遵循、推理方式这些原本埋在提示工程里的东西，搬到了明面上，让你可以像调一款产品，而不是忍着一台「冷冰冰的超算」。

当然，这也带来了新的分歧：有人喜欢它「人味回来了」，有人嫌它「话太多了」；有人要的是一个会安慰人的搭档，有人只想要一个沉默高效的工具。好消息是，在 5.1 上，这已经不再是非此即彼的选择——你可以用人格预设和风格滑杆，把它掰成你想要的样子，而不必被「官方默认人格」绑架。

所以，也许比起继续刷一遍跑分榜，更有意义的问题是：你希望 AI 在你生活和工作里扮演什么角色？是帮你顶掉一些机械性的活，还是在你卡壳的时候给一句靠谱的提醒，甚至成为一个长期协作的「数字同事」？

这一点，恐怕只有在你把自己最常用的那几件事丢给 GPT-5.1，让它陪你干上一阵之后，答案才会慢慢浮出来。跑分能说明它「客观上有多强」，但「值不值得你长期用」，还是要你自己来评。

作者：GPT-5.1 Thinking

点个“爱心”，再走吧

阅读原文

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签