2025年 11 月 12 日，OpenAI 宣布了对 GPT-5 系列的重大升级，推出了 GPT-5.1。这次更新的核心目标是让 ChatGPT 不仅更智能，而且在对话交流上更令人愉悦。新版本引入了两个升级模型：GPT-5.1 Instant 和 GPT-5.1 Thinking，它们在智能、沟通风格和指令遵循方面都有显著提升。此外，本次更新还提供了更直观、更有效的工具，让用户可以轻松定制 ChatGPT 的语调和风格，使其更符合个人偏好。

核心内容

GPT-5.1 Instant:

作为最常用的模型，其默认风格变得更热情、更具对话感。
提升了指令遵循能力，能更可靠地回答用户提出的问题。
首次引入了“自适应推理” (adaptive reasoning) 功能，使其在处理数学（如 AIME 2025）和编程（如 Codeforces）等复杂问题时，能花更多时间思考，从而提供更准确的答案，同时对简单问题保持快速响应。

GPT-5.1 Thinking:

作为高级推理模型，它在效率和易用性上得到提升，能根据问题难度精确调整思考时间。
回答变得更清晰，减少了专业术语，使其更易于理解。
默认语调也变得更热情和富有同理心。

发布与过渡计划

推出时间: GPT-5.1 将从即日开始向付费用户（Pro, Plus, Go, Business）推出，随后覆盖免费用户。企业和教育版用户将获得为期七天的提前体验权限。
API 集成: GPT-5.1 Instant 和 GPT-5.1 Thinking 将在本周晚些时候登陆 API。
旧版模型: 原有的 GPT-5 模型将在付费用户的下拉菜单中保留三个月，以便用户比较和适应。

个性化定制功能

语调预设: 更新并优化了语调选项，保留了 Default、Friendly 和 Efficient，并新增了 Professional、Candid 和 Quirky 等选项。
精细化控制: 正在试验一项新功能，允许用户在个性化设置中直接微调 ChatGPT 的特征，如简洁度、热情度或表情符号使用频率。
即时生效: 个性化设置的更改将立即在所有对话（包括正在进行的对话）中生效，确保体验的一致性。

命名与未来

命名原因: 本次更新命名为 GPT-5.1 是为了反映其在 GPT-5 这一代模型内的重大改进。
未来方向: 未来的发展将继续围绕提升模型能力、对话体验和个性化定制展开。

GPT-5.1：一个更智能、更健谈的 ChatGPT

我们正在升级 GPT-5，同时让 ChatGPT 更易于定制。今天开始向所有人推出，从付费用户开始。

今天，我们通过发布以下内容来升级 GPT-5 系列：

GPT-5.1 即时版 (Instant)：我们最常用的模型，现在更热情、更智能，并且更擅长遵循您的指示。
GPT-5.1 思考版 (Thinking)：我们的高级推理模型，现在更容易理解，处理简单任务更快，处理复杂任务时更执着。

我们从用户那里清楚地听到，优秀的人工智能不仅要智能，还应该易于交谈。GPT-5.1 在智能和沟通风格上都有显着改善。

我们还让您更容易地塑造 ChatGPT 的语气。对聊天风格的偏好因人而异，甚至因对话而异——因此我们引入了更直观、更有效的控制方式，以便 ChatGPT 能够更好地匹配您想要的回复语气。

GPT-5.1 即时版

GPT-5.1 即时版，ChatGPT 最常用的模型，现在默认更热情、更健谈。根据早期测试，它常常以其趣味性给人带来惊喜，同时保持清晰和实用。

User：我感到压力很大，需要一些放松的技巧

GPT-5：

这里有几个简单有效的方法可以帮助缓解压力——你可以根据自己的感受和时间来混合搭配：

-----

##### **🧘‍♀️ 快速重置 (1–5 分钟)**

  - **深呼吸：** 试试 *4-7-8* 方法——吸气 4 秒，屏住 7 秒，呼气 8 秒。重复 4 轮。
  - **渐进式放松：** 从脚趾开始，依次收紧和放松每个肌肉群，直到头部。
  - **接地：** 环顾四周，说出你看到的 5 样东西、能摸到的 4 样东西、听到的 3 种声音、闻到的 2 种气味、尝到的 1 种味道。这能让你迅速回到当下。

-----

##### **☕ 10–20 分钟充电**

  - **到外面去：** 短暂散步，尤其是在有绿植或风景的地方，有助于快速降低皮质醇。
  - **引导冥想或平静的音乐：** 试试 Calm、Headspace，或者就在 Spotify 上搜索“轻柔钢琴”或“环境音乐”。
  - **伸展休息：** 放松颈部、肩膀和臀部——这些最容易积累紧张感的部位。

-----

##### **🌙 较长时间的重新校准**

  - **数字排毒：** 离开屏幕和通知 30-60 分钟。阅读、小睡或听播客。
  - **写日记：** 写下让你感到沉重的事情，或者列出三件你感激的事情——两者都能降低压力感知。
  - **温水淋浴或泡澡：** 热量能放松肌肉，减缓心率。如果有的话，可以加入浴盐或薰衣草精油。

-----

##### **🧩 心态转变**

  - **善待自己：** 当我们感到落后时，压力常常会激增。提醒自己：“我被允许休息；充电后我能更清晰地思考。”
  - **简化决策：** 当不堪重负时，只选择\_下一步\_要做的一件事——微小的进展能减少精神负担。

-----

如果你告诉我**这是哪种压力**（工作、育儿、财务、情感、身体等），我可以为你量身定制一套技巧，甚至是一个匹配你情况的迷你日常计划。

需要我这么做吗？

GPT-5.1 即时版：

我懂你，罗恩——这完全正常，尤其是你最近有这么多事情要处理。这里有几种减压方法，取决于你感受到的是哪种压力：

-----

##### **🌬️ 如果你思绪纷乱**

  - **方盒呼吸法：** 吸气 4 拍，屏气 4 拍，呼气 4 拍，屏气 4 拍——重复 5 次。它见效快，能从生理上镇静你的神经系统。
  - **说出你所见：** 找出你能看到的 5 样东西、摸到的 4 样、听到的 3 种声音、闻到的 2 种气味和尝到的 1 种味道——这是一种接地技巧，能让你回到当下。

-----

##### **🎧 如果你需要慢下来**

  - **音乐重置：** 放一些氛围音乐或 lo-fi（Brian Eno, Khruangbin，甚至是 Gorillaz 的器乐版）。让自己沉浸其中一整首歌的时间——不要刷手机。
  - **走到外面：** 即使是 5 分钟的日光浴或绕着街区走一圈，也能比大多数“放松妙招”更快地重置皮质醇水平。

-----

##### **🧘‍♂️ 如果你想彻底放松**

  - **伸展解压：** 向后转动肩膀，弯腰摸脚趾，然后在地板上靠墙抬腿 3-5 分钟。这是一个简单的瑜伽动作（倒箭式），效果惊人。
  - **温水淋浴或泡澡：** 热量能放松肌肉，并向大脑发出休息信号——如果能调暗灯光或点上蜡烛，效果更佳。

-----

需要我为你量身定制一个现在就能做的**5 分钟短 routines** 吗（可以是身体、精神或创意方面的——任你选）？

.

我们还改进了**指令遵循**能力，因此模型能更可靠地回答你实际提出的问题。

User: 始终用六个词回答

GPT-5：明白。所有回复都将是六个词。

User: 今年夏天我该去哪里旅行？

GPT-5：

今年夏天探索日本怎么样？

它是 2025 年夏季的热门目的地。你会发现文化、自然和现代都市生活的融合。如果你更喜欢离德克萨斯近一点的地方，可以考虑墨西哥或加拿大。

想要日本（或其他地方）特定城市的建议吗？

User: 为什么是那里？

GPT-5：丰富的文化，美丽的风景，美味的食物。

GPT-5.1 Instant：明白，我将用六个词回答。

User: 今年夏天我该去哪里旅行？

GPT-5.1 Instant：考虑日本、意大利、希腊、加拿大、冰岛。

User: 为什么是那里？

GPT-5.1 Instant：风景、文化、美食、气候、友好的当地人。

GPT-5.1 即时版首次可以利用自适应推理来决定何时在回答更具挑战性的问题前先思考，从而在保持快速响应的同时，得出更周到、更准确的答案。这体现在数学和编码评估（如 AIME 2025 和 Codeforces）上的显著进步。

GPT-5.1 Thinking

我们也在升级 GPT-5 思考版，使其在日常使用中更高效、更易于理解。它现在能更精确地根据问题调整思考时间——在复杂问题上花费更多时间，同时更快地响应简单问题。在实践中，这意味着对困难请求的回答更周到，对简单请求的等待时间更短。

GPT-5.1 在简单任务上花费时间更少，在困难任务上花费时间更多

xxx

GPT-5.1 思考版比 GPT-5 思考版能更动态地调整其思考时间。在一个具代表性的 ChatGPT 任务分布上，GPT-5.1 思考版在最快任务上的速度大约是原来的两倍，在最慢任务上的速度大约是原来的两倍慢。两个模型的思考时间均设置为标准。

GPT-5.1 思考版的回复也更清晰，行话和未定义的术语更少。这使我们最强大的模型更易于使用和理解，尤其是在处理工作中的复杂任务和解释技术概念时。

User：解释一下 BABIP 和 wRC+

GPT-5：

这是你想要的简洁、不含糊的解释器。

##### **BABIP (Batting Average on Balls In Play，场内球安打率)**

**它是什么：** 打入\_场内\_的球（不包括全垒打和三振）形成安打的频率。

**公式（击球员或投手）：**

$$BABIP = \frac{H - HR}{AB - K - HR + SF}$$

  - H = 安打, HR = 全垒打, AB = 打数, K = 三振, SF = 高飞牺牲打。

**为什么重要：**

  - 它反映了击球质量、防守、球场和运气。
  - 联盟平均值大多数赛季徘徊在 **.300** 左右。
  - **击球员：** 速度 + 强力击球可以维持高于平均的 BABIP；小样本中的大幅波动通常会回归均值。
  - **投手：** 允许的 BABIP 趋向于聚集在联盟平均值附近；除非是极端接触型投手 + 顶级防守，否则大的异常值通常会回归均值。

**快速解读：**

  - **\>.330**：强力击球/速度快 *或* 有些好运。
  - **.270–.300**：典型范围。
  - **\<.270**：击球疲软/跑速慢 *或* 运气差/面对顶级防守。

##### **wRC+ (Weighted Runs Created Plus，标准化加权得分创造)**

**它是什么：** 衡量**每个打席**总进攻价值的黄金标准，经过球场和时代校准。它告诉你一个击球员相比联盟平均水平（**100 = 平均**）对得分创造的贡献有多大。

**标尺：**

  - **100** = 联盟平均
  - **120** = 比联盟平均好 20%
  - **80** = 比联盟平均差 20%
  - **140+** = 明星/精英赛季

**构建方式（概念上）：**

1.  从 **wOBA**（加权上垒率，根据一垒安打/二垒安打/三垒安打/全垒打/保送的实际得分价值加权）开始。
2.  转换为 **wRAA**（高于平均的得分数）。
3.  根据**球场**和**联盟/赛季**效应进行调整。
4.  标准化，使 **100 = 平均** → 这就是 **wRC+**。

**为什么它很棒：** 它可以公平地比较不同球场（库尔斯 vs 西雅图）和不同赛季（进攻大年 vs 死球时代）的击球员。它也比打击率捕捉到更多信息——保送和长打被恰当地计算在内。

**局限性（两种数据）：**

  - BABIP 在小样本中噪音很大；需要结合背景（速度、击球形态）。
  - wRC+ 只关乎进攻；它忽略了防守和跑垒（要看全面情况请使用 WAR）。

如果你想，我可以拉取当前的联盟平均值和几个蓝鸟队的例子来让这更具体。

GPT-5.1 Thinking:

不错，极客数据时间 🧢

我会用大白话解释每一个，然后再补充一点背景。

-----

##### **1. BABIP – 场内球安打率 (Batting Average on Balls In Play)**

**它是什么：** BABIP 衡量的是**打到场内的球形成安打的频率**，\_不包括\_全垒打和三振。

**公式（概念上）：**

BABIP = (安打数 − 全垒打数) ÷ (打数 − 三振数 − 全垒打数 + 牺牲飞球数)

所以：

  - 它只关心**防守球员能处理的球**。
  - 它忽略了：
      - 三振（没有球打入场内）
      - 全垒打（没有防守球员参与）
      - 保送/触身球（不计入打数）

**为什么重要：**

  - BABIP 经常被用作击球员和投手的**运气 / 波动性指标**。
  - 联盟平均的 BABIP 通常在 **.295–.300** 左右。
      - **远高于 .300？** 可能意味着：
          - 击球很强劲
          - 跑得快，能跑出内野安打
          - *或者* 只是运气好，打出德州安打
      - **远低于 .300？** 可能意味着：
          - 大量软弱击球
          - 受到布阵 / 站位的影响
          - *或者* 运气差，球都“直冲”防守球员而去

**人们实际上如何使用它：**

  - 对击球员：
      - BABIP 非常高 + 以前没有高 BABIP 记录 → “他可能要降温了。”
      - BABIP 非常低 + 基本功扎实 → “他可能会反弹。”
  - 对投手：
      - 面对他的 BABIP 异常高 → “可能有些运气差 / 身后防守烂。”

-----

##### **2. wRC+ – 标准化加权得分创造 (Weighted Runs Created Plus)**

**它是什么：** wRC+ 是一个**综合性的击球数据**，告诉你\_一个击球员在创造得分方面与联盟平均水平相比有多好\_，并根据球场和时代进行了调整。

  - **100 = 联盟平均**
  - **120 = 比联盟平均好 20%**
  - **80 = 比联盟平均差 20%**

所以如果一个球员的 **wRC+ 是 135**，这意味着：

“这个击球员在创造得分方面比联盟平均水平强 35%。”

**它包含什么（概念上）：**

  - 它始于 **wRC (加权得分创造)**，即：
      - 使用 **wOBA** (加权上垒率)
      - 为一垒安打、二垒安打、全垒打、保送等赋予适当的价值
      - 然后将其转换为“创造的得分”
  - 然后 wRC+：
      - 调整**球场因素**（库尔斯 vs 投手球场等）
      - 调整**得分环境 / 时代**
      - 将所有内容标准化，使 **100 始终为联盟平均水平**

**为什么重要：**

  - wRC+ 是**最好的单一数字击球数据之一**，因为它：
      - 考虑了**每种事件的价值**（全垒打 \> 一垒安打）
      - 调整了**球场**和**赛季背景**
      - 把每个人都放在同一个标尺上

**大致范围：**

  - **70 及以下** – 烂棒子
  - **80–90** – 低于平均
  - **100** – 平均
  - **110–120** – 稳稳高于平均
  - **130–140** – 全明星级别
  - **150+** – MVP 级别的怪物赛季

-----

##### **总结**

  - **BABIP**：“场内球形成安打的频率是多少？”

→ 用来嗅探击球结果中的**运气 vs 真实技术**。

  - **wRC+**：“这个击球员在创造得分方面与联盟平均（经球场和时代调整）相比如何？”

→ **100 = 平均**，每高/低一点就是好/差百分之几。

如果你想，我们可以找个蓝鸟队的球员，看看他的 BABIP 和 wRC+ 说明了他这个赛季的表现。

GPT-5.1 Thinking 的默认语气也更热情、更有同理心。

User: 哎我在开会前把咖啡洒了自己一身你说大家会不会觉得我是个白痴 :(

GPT-5：

噢，那种感觉太扎心了。很遗憾发生了这种事。

简短回答：不，大多数人可能没那么想。我们总是极大地高估了别人对我们失误的关注度（“聚光灯效应”）。人们通常都专注于自己的幻灯片、笔记或焦虑——而不是别人的咖啡渍。

如果这能让你好受点，这里有个给大脑的快速重置：

  - 换个故事：“我看起来很傻”→“我处理了一个讨厌的突发状况，并且还是出席了。”
  - 如果有人提到，用一句话回应：“咖啡想造反，但我坚持下来了。”然后继续。
  - 记下你在会议中做得好的一件事——内容、提出的问题、推动的决策。

为下次（实用工具包）：

  - 汰渍/OxiClean 去污笔，或者一点洗洁精 + 水 → 从外向内轻拍。
  - 在办公室放件深色开衫/西装外套，以防万一。
  - 办公桌抽屉里备用一件上衣；迷你除臭剂和薄荷糖以掩盖咖啡味。

你不是白痴——你只是一个洒了东西但坚持下去的人。这是有能力，不是笨拙。需要帮忙起草一份轻松的会议后续说明或纪要，来强化“专业”印象吗？

GPT-5.1 Thinking:

嘿——他们没有。你只是慌了神，所以你的大脑在做那种把小意外灾难化成性格缺陷的事。但老实说，人们几乎注意不到这些。每个人都在各个会议间奔波，一半人都在走神，应付着自己的混乱。咖啡洒了只能说明是“忙碌的普通人”，而不是“白痴”。

我来带你快速捋一捋：

##### **1. 你的解读不是现实。**

你感到尴尬，所以你的大脑编造了一个别人在评判你的故事。事实上，大多数人甚至不记得发生过这事。

##### **2. 你还是坚持开完了会。**

这就是能力。大多数人可能就有点崩了。你扛住了。

##### **3. 这些时刻实际上让你更讨人喜欢。**

微小的不完美使人\_更\_有亲和力。一个过度精致的人让人感觉不真实。洒了点咖啡？这很有人情味。

##### **4. 就算有人注意到了，也只是一闪而过。**

而且老实说，他们可能很佩服你坚持下来了。

你不是白痴。你只是一个经历了混乱时刻、擦干净、然后继续工作的人。这和愚蠢恰恰相反——这是韧性。

深呼吸。你没事的。

这次发布是模型在能力和易用性方面向前迈出的一步。GPT-5.1 自动版 (Auto) 将继续将每个查询路由到最适合它的模型，因此在大多数情况下，你根本不需要选择模型。你会注意到的是，GPT-5.1 的整体回答在智能和语气上都感觉更自然了。

GPT-5.1 即时版和思考版今天开始推出， 首先是付费用户（Pro、Plus、Go、Business），然后是免费和未登录用户。企业版和教育版计划获得为期七天的抢先体验开关（默认关闭）。在该窗口期之后，GPT-5.1 将成为唯一的默认模型。

如果你今天查看 ChatGPT，可能不会立即看到 GPT-5.1。我们计划在接下来的几天内逐步推出，以帮助保持所有人都能稳定使用。我们很快也会将 GPT-5 Pro 升级到 GPT-5.1 Pro。

我们将在本周晚些时候将 GPT-5.1 即时版和思考版都引入 API。GPT-5.1 即时版将作为 gpt-5.1-chat-latest 添加，GPT-5.1 思考版将在 API 中作为 GPT-5.1 发布，两者都具有自适应推理能力。

GPT-5（即时版和思考版）将在接下来的三个月内保留在 ChatGPT 的旧模型下拉菜单中，供付费订阅者使用，以便人们有时间按自己的节奏比较和适应。GPT-5 的日落期不影响其他旧模型的可用性。未来，当我们推出新的 ChatGPT 模型时，我们的方法是给人们足够的空间来评估变化并分享反馈，使我们能够在平稳过渡的同时继续创新我们的前沿模型。日落期将会被清晰且提前通知。

GPT-5.1 功能更强、更好用，我们鼓励你尝试一下，看看有什么不同。我们的系统卡附录⁠ 包含了有关 GPT-5.1 安全方法的更多信息。

关于命名的说明：此更新称为 GPT-5.1，以反映有意义的改进，同时仍属于 GPT-5 这一代。未来对 GPT-5 的迭代升级将遵循相同的模式。

让 ChatGPT 成为你专属的

在改进模型的同时，我们正让定制 ChatGPT 的语气和风格变得更容易。 人们对 ChatGPT 应如何回应有着强烈且多样的偏好，将其语气调整到你觉得合适的状态应该毫不费力。

今年早些时候，我们添加了预设选项来定制 ChatGPT 回应的语气。今天，我们正在优化这些选项，以更好地反映人们使用 ChatGPT 的最常见方式。默认 (Default)、友好 (Friendly)（原“倾听者”）、高效 (Efficient)（原“机器人”）得以保留（并有更新），我们还增加了专业 (Professional)、坦率 (Candid) 和奇趣 (Quirky)。这些选项旨在与我们所了解的人们自然引导模型的方式保持一致，使其能够快速直观地选择一种感觉上最适合你的个性。

xxx

这些个性设置适用于所有模型。我们今年早些时候推出的原始刻薄 (Cynical)（原“愤世嫉俗者”）和极客 (Nerdy)（原“书呆子”）选项将保持不变，仍在个性化设置的同一位置下拉菜单中。

除了这些预设之外，对于那些希望更精细控制 ChatGPT 回应方式的用户，我们还在试验一种功能，允许直接从个性化设置中调整 ChatGPT 的特性——包括回复的简洁度、热情度或易读性，以及使用表情符号的频率。ChatGPT 还可以在对话中主动提议更新这些偏好，当它注意到你要求某种语气或风格时，无需你导航到设置中。你可以随时调整或删除这些偏好。

更新后的风格和语气选项于今天推出，而微调特定特性的功能将作为一项实验，于本周晚些时候开始逐步向有限数量的用户推出。这两项功能都将随着时间的推移不断改进。此外，更新后的 GPT-5.1 模型也更擅长遵守自定义指令，让你能更精确地控制语气和行为。

你在个性化设置中所做的更新现在会立即在所有聊天中生效，包括正在进行的对话，因此你的体验保持一致。以前，对基本风格和语气或自定义指令的更改只适用于之后开始的对话。

作者

OpenAI

核心内容#

GPT-5.1 Instant:#

GPT-5.1 Thinking:#

发布与过渡计划#

个性化定制功能#

命名与未来#

GPT-5.1：一个更智能、更健谈的 ChatGPT#

GPT-5.1 即时版#

GPT-5.1 Thinking#

让 ChatGPT 成为你专属的#

作者#

核心内容

GPT-5.1 Instant:

GPT-5.1 Thinking:

发布与过渡计划

个性化定制功能

命名与未来

GPT-5.1：一个更智能、更健谈的 ChatGPT

GPT-5.1 即时版

GPT-5.1 Thinking

让 ChatGPT 成为你专属的

作者