介绍一下 GPT-Image 1.5

OpenAI 于 2025 年 12 月 17 日发布了全新的旗舰级图像生成模型 GPT-Image 1.5。它能进行精准编辑，同时保持细节完好，并且生成图像的速度提升高达 4 倍。同时，在 ChatGPT 中推出了全新的 Images 功能，旨在让图像生成变得令人愉悦——激发灵感并使创意探索变得轻松自如。

全新的 Images 模型即日起向所有 ChatGPT 用户推出，并在 API 中以 GPT Image 1.5 的形式提供。ChatGPT 中的全新 Images 体验也于今日向大多数用户推出，Business 和 Enterprise 用户将在稍后获得访问权限。

精准编辑，保留重要细节

现在，当你要求对上传的图像进行编辑时，模型会更可靠地遵循你的意图——甚至包括细微之处——仅根据你的要求进行更改，同时保持光线、构图和人物外貌等元素在输入、输出和后续编辑中的一致性。

这开启了符合你意图的结果——更有用的照片编辑，更逼真的服装和发型试穿/试戴，以及保留原始图像精髓的风格滤镜和概念转换。总之，这些改进意味着 ChatGPT 可以充当你口袋里的创意工作室，既能进行实用编辑，又能进行富有表现力的重构。

编辑

该模型擅长各种类型的编辑——包括添加、删减、组合、混合和变换——因此你可以在获得想要的更改的同时，不丢失图像的独特之处。

从派对到直播洛杉矶滑板

将这两名男子和狗组合成一张 2000 年代胶片相机风格的照片，表现他们在孩子们的生日派对上看起来很无聊的样子。

在背景中添加混乱的孩子们，他们在扔东西和尖叫。

将左边的男子改为手绘复古动漫风格，将狗改为毛绒玩具风格，保持右边的男子和背景景物不变。

给他们都穿上看起来像这样的 OpenAI 毛衣。

现在移除这两名男子，只保留狗，并把它们放在一个看起来像附图的 OpenAI 直播中。

创意转换

模型的创造力通过转换得以闪耀，这些转换可以更改和添加元素——例如文本和布局——使想法变为现实，同时保留重要细节。这些转换既适用于简单的概念，也适用于更复杂的概念，并且可以使用全新 ChatGPT Images 功能中的预设风格和创意轻松尝试——无需书面提示词。

电影海报 80 年代健身教练 华丽玩偶 装饰品 时尚广告 装扮角色 绘画 饮料广告

用这两名男子的图像制作一张名为“codex”的老派好莱坞黄金时代电影海报。随意更改他们的服装以符合时代背景。

将演员的名字改为 Wojciech Zaremba（左）和 Greg Brockman（右）

由 Sam Altman 执导，Fidji Simo 制作。A Feel the AGI Pictures 出品。

指令遵循

该模型比我们的初始版本更可靠地遵循指令。这实现了更精准的编辑以及更复杂的原创构图，其中元素之间的关系按预期得以保留。

## 新版绘制一个 6x6 网格

制作一个 6（列）乘 6（行）的网格：

第 1 行：希腊字母 beta，沙滩球，柠檬，机器人，鱼缸，青蛙

第 2 行：螳螂，昂贵的手表，浴缸，一副太阳镜，色彩斑斓的蝴蝶，信封

第 3 行：邮票，相框，热气腾腾的饺子，单词 "miracle"，一副滑雪板，字母 Z

第 4 行：马桶，地铁代币，静音图标，一瓶香水，蜻蜓，滑板头盔

第 5 行：蓝牙图标，数字 13，绿心，魔方，加拿大鹅，士兵头盔

第 6 行：白狗，救生衣，结，键盘，纸巾盒，数字 14


## 旧版绘制一个 6x6 网格

制作一个 6（列）乘 6（行）的网格：

第 1 行：希腊字母 beta，沙滩球，柠檬，机器人，鱼缸，青蛙

第 2 行：螳螂，昂贵的手表，浴缸，一副太阳镜，色彩斑斓的蝴蝶，信封

第 3 行：邮票，相框，热气腾腾的饺子，单词 "miracle"，一副滑雪板，字母 Z

第 4 行：马桶，地铁代币，静音图标，一瓶香水，蜻蜓，滑板头盔

第 5 行：蓝牙图标，数字 13，绿心，魔方，加拿大鹅，士兵头盔

第 6 行：白狗，救生衣，结，键盘，纸巾盒，数字 14

文本渲染

该模型在文本渲染方面又迈进了一步，能够处理更密集和更小的文本。


桌子上有一份报纸。报纸显示下面的 markdown 排版成一篇**自然**的报纸文章。完全保留所有内容、格式和数字。图像应该是长图。

# 介绍 GPT‑5.2

### *最先进的前沿模型，适用于专业工作和长期运行的智能体*

**2025年12月11日**

---

我们正在推出 **GPT‑5.2**，这是迄今为止最适合专业知识工作的功能最强大的模型系列。

目前，ChatGPT Enterprise 的平均用户表示 AI 每天为他们节省 40–60 分钟，重度用户表示它每周节省超过 10 小时。我们设计 GPT‑5.2 旨在为人们释放更多经济价值；它在创建电子表格、构建演示文稿、编写代码、感知图像、理解长上下文、使用工具以及处理复杂的多步骤项目方面表现更好。

GPT‑5.2 在许多基准测试中树立了新的技术水平，包括 GDPval，在该测试中，它在涵盖 44 种职业的明确规定的知识工作任务中优于行业专业人士。

---

## 基准测试亮点

| 基准测试 | 领域 | GPT‑5.2 Thinking | GPT‑5.1 Thinking |

|---|---|---:|---:|

| GDPval (胜或平) | 知识工作任务 | **70.9%** | 38.8% (GPT‑5) |

| SWE-Bench Pro (公开) | 软件工程 | **55.6%** | 50.8% |

| SWE-bench Verified | 软件工程 | **80.0%** | 76.3% |

| GPQA Diamond (无工具) | 科学问题 | **92.4%** | 88.1% |

| CharXiv Reasoning (含 Python) | 科学图表问题 | **88.7%** | 80.3% |

| AIME 2025 (无工具) | 竞赛数学 | **100.0%** | 94.0% |

| FrontierMath (Tier 1–3) | 高等数学 | **40.3%** | 31.0% |

| FrontierMath (Tier 4) | 高等数学 | **14.6%** | 12.5% |

| ARC-AGI-1 (Verified) | 抽象推理 | **86.2%** | 72.8% |

| ARC-AGI-2 (Verified) | 抽象推理 | **52.9%** | 17.6% |

---

Notion、Box、Shopify、Harvey 和 Zoom 观察到，GPT‑5.2 展示了最先进的长视距推理和工具调用性能。Databricks、Hex 和 Triple Whale 发现 GPT‑5.2 在代理数据科学和文档分析任务方面表现出色。Cognition、Warp、Charlie Labs、JetBrains 和 Augment Code 报告称，GPT‑5.2 提供了最先进的代理编码性能，在交互式编码、代码审查和错误查找等领域有显著改进。

在 ChatGPT 中，GPT‑5.2 Instant、Thinking 和 Pro 将于今天开始推出，首先面向付费计划。在 API 中，它们现在可供所有开发人员使用。

总体而言，GPT‑5.2 在通用智能、长上下文理解、代理工具调用和视觉方面带来了重大改进——使其在端到端执行复杂的现实世界任务方面比以往任何模型都更好。

现在将文章更改为下面的 markdown：

# 介绍 GPT‑Image-1.5

### *全新改进的 ChatGPT Images*

**2025年12月16日**

---

今天，我们推出了全新改进的 ChatGPT Images 版本，由我们要迄今为止最好的图像生成模型提供支持。凭借更强的指令遵循能力和更精准的编辑，ChatGPT Images 可以在提供你要求的更改的同时，保持面部相似度等重要细节在编辑过程中的一致性——现在的生成速度提升高达 **4× 倍**，使迭代和探索想法变得更容易，等待时间更少。

这是我们迄今为止功能最强大的通用文本到图像模型，具有更具表现力的转换、改进的密集文本渲染和更自然的结果。无论你是进行微小的修复还是彻底的重塑，你只需说出你想要的——或者在全新的 Images 体验中选择预设风格和创意——ChatGPT 就会处理其余的工作，提供既有用又引人注目且更符合你意图的结果。

全新的 Images 模型和体验即日起开始在 ChatGPT 中向所有用户推出，并在 API 中以 **GPT‑Image-1.5** 的形式推出。

---

## 符合你意图的结果

该模型现在更可靠地遵循指令——甚至包括细微之处——在更改你要求的内容的同时，能够保持光线、构图和相似度等元素在输入、输出和后续编辑中的一致性。

这开启了符合你意图的结果——更有用的照片编辑，更逼真的服装和发型试穿/试戴，以及保留原始图像精髓的风格滤镜和概念转换。总之，这些改进意味着 ChatGPT 可以充当你口袋里的创意工作室，既能进行实用编辑，又能进行富有表现力的重构。

### 编辑

该模型擅长各种类型的编辑，因此你可以在获得想要的更改的同时，不丢失图像的独特之处。

### 创意转换

模型的创造力通过创意转换得以闪耀，更改和添加元素——例如文本和布局——有助于使概念变为现实，同时保留重要细节。

### 指令遵循

与 GPT Image 1.0 相比，该模型能够更好地遵循指令。

### 文本渲染

该模型在文本渲染方面又迈进了一步，能够处理更密集和更小的文本。

---

## 全新的创作空间

除了通过在 ChatGPT 中描述你想看到的内容来索取图像外，我们还在 ChatGPT 侧边栏中引入了一个专门的 Images 体验，以使探索和尝试图像变得更容易和更快捷。这包括预设滤镜和热门提示词以快速激发灵感，以及一次性相似度上传，这样你就可以在未来的创作中重复使用你的外观，而无需再次翻阅相册。

总之，这些升级让你可以创作出更符合你愿景的图像，从微小的编辑到彻底的重构。Images 现在的渲染速度最高可快四倍，并且你可以在其他图像仍在进行中时继续生成新图像——这样你就可以无需等待地探索更多想法。

####其他质量改进

该模型还在其他维度上进行了改进，从而转化为更即时可用的输出，例如渲染许多小面孔以及输出看起来多么自然。

##新版

制作一个 1970 年代伦敦切尔西的场景，照片级真实感，全部对焦，有很多人，还有一辆巴士，上面有“ImageGen 1.5”的广告，带有 OpenAI 标志和副标题“Create what you imagine”（创造你所想）。超逼真的业余摄影，iPhone 快照质量……


##旧版制作一个 1970 年代伦敦切尔西的场景，照片级真实感，全部对焦，有很多人，还有一辆巴士，上面有“ImageGen 1.5”的广告，带有 OpenAI 标志和副标题“Create what you imagine”（创造你所想）。超逼真的业余摄影，iPhone 快照质量……

全新的创作空间

除了通过在消息中描述你想看到的内容来生成图像外，我们还在 ChatGPT 中引入了一个专门的 Images 主页——可通过移动应用程序的侧边栏和 chatgpt.com 访问——以使探索和尝试图像变得更快、更轻松。它包括数十种预设滤镜和提示词以快速激发灵感，并定期更新以反映新兴趋势。

总之，这些升级让你可以创作出更符合你愿景的图像，从微小的编辑到彻底的重构。

改进与局限性

我们重新运行了初始图像生成发布时的许多示例来评估性能。该模型在各种情况下都显示出明显的改进，但结果仍不完美。虽然此版本代表了有意义的进步，但在未来的迭代中仍有很大的改进空间。

##新版制作一张不同深度的深海生物海报，带有垂直海洋剖面图，风格为精美的日本细节动漫风格

##旧版制作一张不同深度的深海生物海报，带有垂直海洋剖面图，风格为精美的日本细节动漫风格

仍然存在一些科学上的不准确之处，但约 70% 是正确的，图形更加生动，避免了过早裁剪。

API 中的 GPT Image 1.5

API 中的 GPT Image 1.5 提供了与 ChatGPT Images 相同的所有改进：它在图像保留和编辑方面比 GPT Image 1 更强。

你将看到品牌徽标和关键视觉效果在编辑过程中得到更一致的保留，使其非常适合图形和徽标创建等营销和品牌工作，以及电子商务团队从单一源图像生成完整的产品图像目录（变体、场景和角度）。

与 GPT Image 1 相比，GPT Image 1.5 中的图像输入和输出现在便宜 20%，因此你可以用相同的预算生成和迭代更多图像。

你可以在 OpenAI Playground 中尝试新模型，浏览图库，或阅读提示词指南以获取灵感。

包括创意工具、电子商务、营销软件等在内的各行各业的企业和初创公司已经在使用 GPT Image 1.5。

可用性

全新 ChatGPT Images 模型现已开始向全球所有 ChatGPT 用户和 API 用户推出，覆盖各个平台。它跨模型工作，因此你无需选择任何内容即可使用它。今年早些时候发布的 ChatGPT Images 版本将作为自定义 GPT 继续向所有用户提供。

我们相信图像生成所能实现的才刚刚开始。今天的更新是向前迈出的有意义的一步，未来还会有更多更新，从更精细的编辑到跨语言的更丰富、更详细的输出。

2025

作者

OpenAI

贡献者

项目领导

Gabriel Goh — Research Lead

Adele Li — Product Lead

Bill Peebles — Sora Lead

Aditya Ramesh — World Simulation Lead

Mark Chen — Chief Research Officer

Prafulla Dhariwal — Multimodal Lead

核心团队

Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang

研究贡献者

Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang

核心推理

Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan

研究合作者

Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin

推理合作者

Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng

数据与评估

Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park, Jason Xu, Lennon Szi-chieh Yu, Peilin Yang, Somay Jain, Wesam Manassra, Xiaolei Zhu, Yilei Qian

应用

Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li

安全、安全系统、诚信、政策与信任

Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll

产品运营、项目管理和治理

Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan

法律

Ally Bennett, Tony Song, Tyce Walters

通信、营销、社区、设计与创意

Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman

特别鸣谢

Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou

高管

Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry

精准编辑，保留重要细节#

编辑#

创意转换#

指令遵循#

文本渲染#

全新的创作空间#

改进与局限性#

API 中的 GPT Image 1.5#

可用性#

作者#

贡献者#