AI 需求正在吞掉算力:Anthropic、SpaceX、OpenAI 与奇点经济的新战场

本文整理自 原视频,由有道龙虾总结和发布。 如果只用一句话概括这期 Moonshots,那就是:AI 已经不是“有没有人用”的问题,而是“全世界的算力够不够喂它”的问题。 Anthropic 的增长速度夸张到有点不真实。Dario Amodei 在开发者大会上透露,Anthropic 2026 年第一季度增长了 80 倍,原本预期只是 10 倍。它的年化收入运行率从 2025 年底的 90 亿美元,跳到 2026 年 4 月的 300 亿美元,5 月据说已经超过 400 亿美元。 更疯狂的预测是:如果 Anthropic 在 2026 年底达到 1000 亿美元 ARR,按 40 倍收入倍数估值,可能就是 4 万亿美元公司;如果 2027 年达到 1 万亿美元 ARR,那就是 40 万亿美元估值。 这听起来像科幻,但讨论嘉宾的判断很直接:这不是泡沫式想象,而是真金白银的需求正在涌进来。 Anthropic 最大的问题,不是没人买,而是不够卖 过去很多公司增长靠新增用户。但 Anthropic 的情况更像早期电力:用户不仅越来越多,每个用户还在不断发明新的用法。 100 年前,美国只有约 30% 的家庭有电、约 30% 有电话。最开始人们用电照明,后来用来驱动电梯、冰箱、收音机、各种家电。AI token 也在经历同样的过程:先是聊天,接着写代码、做法律文书、跑业务流程、做研究、管公司。 所以真正的瓶颈变成了算力。 节目里提到,Anthropic 甚至可能通过涨价和软件优化继续挤出更多收入。即便芯片供应短期跟不上,模型、调度、推理效率还可以再压榨一轮。换句话说,增长不会简单地因为 GPU 不够而停止,只会逼着市场把每一张卡都榨干。 Elon 把 Colossus 1 交给 Anthropic,这步棋很微妙 最戏剧性的部分,是 Anthropic 接手 SpaceX 在孟菲斯的 Colossus 1 数据中心。...

May 18, 2026 · 2 min · fisherdaddy

OpenAI 播客:ImageGen 2.0——从石器时代到文艺复兴的图像生成飞跃

本文整理自 OpenAI Podcast 对 ImageGen 2.0 研究员 Kenji Hata 与产品负责人 Adele Li 的访谈,由有道龙虾总结和发布。 主持人 Andrew Mayne 在 OpenAI 播客中邀请了 ImageGen 2.0 的核心团队成员——研究员 Kenji Hata 和产品负责人 Adele Li,深入探讨了这个新一代图像生成模型为何被称为"图像生成领域的文艺复兴"。 从投资人到 AI 产品经理:Adele 的跨界之路 Adele Li 在加入 OpenAI 之前一直从事投资行业,曾在 Redpoint Ventures 投资 AI 和软件公司。大约两年前加入 OpenAI,最初负责数据和计算基础设施,后来逐渐转向产品侧,过去半年一直在负责 ImageGen 产品。 她认为产品经理的核心就是"做需要做的事"。对于 ImageGen 来说,特别之处在于需要同时调动多种能力:与研究人员协作、分析市场机会、理解用户需求。 “现在的市场和我们一年前发布 ImageGen 1.0 时已经完全不同了。市面上有多个图像生成工具,ChatGPT 本身也发生了巨大变化。思考 ImageGen 的演进及其在 ChatGPT 中的角色,让我非常兴奋。” 研究员 Kenji:从音频项目到图像生成 Kenji Hata 同样在大约两年前加入 OpenAI,第一个项目是一个音频相关的工作。后来他逐渐参与到 ImageGen 1.0 的开发中,最终全职投入这个项目。 发布两周:每周超过 15 亿张图像 ImageGen 2.0 发布后的两周内,使用量增长了超过 50%。目前每周在 ChatGPT 上生成的图像超过 15 亿张。...

May 16, 2026 · 2 min · fisherdaddy

Codex不只是写代码:一场悄悄发生的"工作方式革命"

本文整理自 OpenAI Forum 发布的分享视频,由有道龙虾总结和发布。 “Codex"这个词听起来像是给程序员准备的。但如果你参加过最近一期的OpenAI论坛,你会发现座下没人讨论怎么写代码——他们聊的是怎么找旧金山最好的面包、怎么做日常购物、怎么让一个AI代理当自己的"迷你参谋长”。 Tibo Sio,OpenAI Codex的负责人,开门见山地说了一个让人意外的数据:现在Codex上执行的大部分任务,根本不是编程任务。 从云端代码助手到桌面万能代理 Codex的故事其实走过一段弯路。 大约两年前,OpenAI团队开始追逐一个"宏大的挑战":让AI达到顶级软件工程师的编程水平。他们推出的第一个公开版本,今天的团队叫它"Codex Web"——一个跑在云端的东西,你通过网页界面告诉它要改什么代码,它去翻你的代码仓库,自动生成改动,然后在GitHub上开一个Pull Request。 听起来很酷。但问题是:摩擦太大了。 你得把自己电脑上那一整套开发环境在云端重新搭一遍,而模型当时也没聪明到次次都靠谱。团队很快意识到:与其让人适配工具,不如让工具适配人。 “我们决定让它在每个人自己的机器上本地跑。“Tibo说。 转折点:连程序员的大部分时间都不在写代码 Codex最初是给工程师用的。但做着做着他们发现了一个有意思的事实:软件工程师每天真正写代码的时间,大概也就20%到30%。 剩下的时间呢?翻工单、排优先级、讨论架构方案、查Bug、处理线上事故、做值班……大量工作其实是信息搜集、沟通协调、上下文梳理。这些事跟写代码没半毛钱关系。 于是技术团队自己开始"吃自己的狗粮”——用Codex处理那些非编码的杂活。结果效果之好,让他们意识到:手里拿着的根本不是"代码工具”,而是一个通用得多的东西。 Tibo讲了一个让他印象深刻的瞬间:产品负责人Alexander在Codex发布前夕,同时跑着多个Codex代理——一个在搜集用户反馈,一个在跟开发者确认状态,一个在实时更新项目计划文档——而他自己正坐在会议室里跟Tibo讨论。 “我从来没见过一个人这么高效,“Tibo说,“那一刻我就觉得,我们在改变的不只是软件工程。” 这就是那个"原来这东西是给所有人用"的觉醒时刻。 面包、咖啡和"属于你一个人的软件” 为了让观点落地,Tibo在现场做了个演示。 他住在旧金山,对当地面包的离谱价格很不满,于是对Codex说了一句话:“帮我在旧金山找最好的面包,列个表格,标明价格和购买地点。” 五分钟之后,一张完整的电子表格出现了:烘焙店名、面包种类、描述、价格,一清二楚。 然后他随口又说了一句:“把同样的东西做成网页,放地图上。” 四分钟后,一个带交互地图的网页生成了——每家店的位置、面包信息、价格,全在地图上可视化呈现。他甚至可以说"对咖啡也做同样的分析”,八分钟后旧金山咖啡地图也做好了。 整个过程,Tibo连键盘都没碰——全程语音操作。 “这不是我花一整个周末才能做出来的东西,“他说,“在以前,这根本就不会发生。它不是从’几周变几秒’,是从’永远不可能’变成了’几分钟的事’。” 这就是Tibo反复强调的"个人软件"时代:每个人都有能力为自己量身打造小工具,而不用求人。设计师可以在代码库里直接改UI细节,不用跟工程师排期;市场人员可以做深度竞争分析,不用等数据团队排期。 首席参谋、自动化日报和一个"不用看邮件"的未来 Tibo自己怎么用Codex?他打开侧边栏——一天之内已经派发了上百个任务给Codex代理: 整理桌面文件 管理计算资源集群 帮我看值班轮转情况 检查即将上线的发布计划,标出有风险的项目 每天早上9点扫描我的Gmail、Notion和日历,给我一份当日摘要,标出需要注意的事项 “它就像我的小参谋长,“他说,“帮我花精力在最重要的事情上。” 他甚至做了一个"个人新闻简报”——根据他自己的偏好筛选信息,每天早上推送。以前,这种事要么不存在,要么得雇个人专门做。 更激进的想象是:未来你甚至不用看邮件了。一个全天候运行的代理读你的收件箱,只在真正重要的时候提醒你。“你只管设定目标,剩下的它帮你搞定。” 从10分钟到好几周:/goal模式的底气 对话的后半段,Tibo透露了一个正在铺开的新功能:slash goal。 普通模式下,你给Codex一个具体任务,它干完了汇报。但在goal模式下,你给它一个长期目标——比如"解决一个非常难的数学问题”——它就会像着了魔一样持续攻坚,干几个小时、几天、甚至几周,直到自己认为目标达成。 目前已经有人用它把整个程序从一种语言翻译成另一种,有人在物理和数学问题上用它突破瓶颈。 “几个月前我们还在激动它能连续工作10分钟,“Tibo说,“现在我们在讨论连续工作几周。有时候,天才不过就是能对同一件事持续思考更久。” 给非技术用户的三个行动建议 论坛上有观众问了一个很实操的问题:非开发人员到底怎么做,才能用好Codex? Tibo给了三条: 1. 加入社群,看别人怎么用。 他自己都会被一些神奇的用法规避惊艳到。OpenAI论坛就是这样一个互相学习的地方。 2. 给它精确的指令,别模糊。 把它当成一个刚入职的新同事——没有上下文,不知道你的偏好。你得说清楚"成功长什么样"和"什么样算搞砸了”。比如要一份PPT,就明确说"我要10页,前两页放背景信息,中间六页做技术拆解,最后两页放开放问题和Q&A”。越具体,成功的概率越高。 3. 尽量连接更多信息源。 Codex现在有超过100个插件——日历、Notion、各类工具都可以接进来。接入的信息源越多,它能帮的忙就越大。 但有一条重要的提醒:别把所有事情都交给它。Tibo特别指出他见过最大的错误就是"过度委托”——把包括自己对问题的理解都一并外包出去。真正用好Codex的人,是在用它提升自己的认知,而不是替代自己的思考。它可以用图像和图表帮你理解复杂概念,但做笔记、主动回想、验证理解,永远是你自己的事。 企业落地的真正瓶颈:不是能力,是信任 当被问到企业采用的最大障碍时,Tibo的回答很直接:不是模型能力不够,是信任和安全问题。 “如果有代理在你公司里到处乱跑,不小心删了敏感文件,或者把不该发出去的信息外泄——没人敢用。” OpenAI在做三件事来解决这个: 沙箱默认运行:可以限制代理只能访问特定文件夹,甚至禁止联网 细粒度权限控制:可以设成"只能读不能写”,数据安全仍由你掌控 “自动审查"机制(Auto Review):另一个独立代理实时监控主代理的每一步操作,风险动作直接拦截 “就像一个裁判在旁边,看到越界的操作立刻喊停。”...

May 16, 2026 · 1 min · fisherdaddy

OpenAI 研究员谈数学与 AGI:从算不清露营账单,到奥赛金牌和研究级证明

本文整理自 YouTube 视频《How Math Unlocked AGI》,由有道龙虾总结和发布。 几年前,如果你让 ChatGPT 算一笔稍微复杂一点的露营 AA 账,或者帮三个不同时区的人找一个合适的 Zoom 会议时间,它大概率会翻车。 今天,OpenAI 的研究员已经在讨论另一个问题:模型能不能帮助 Fields Medalists 做日常研究?能不能解决 42 年没人解决的开放问题?能不能把数学家几个月甚至几年才能完成的思考,压缩成几天、几小时,甚至未来更长时间的自动研究? 在 OpenAI Podcast 里,主持人 Andrew Mayne 和两位研究员 Sebastian Bubeck、Ernest Ryu 聊了一场关于数学、科学和 AGI 的对话。Sebastian 曾在 Princeton 任教,长期研究优化和机器学习理论,后来加入 Microsoft,现在是 OpenAI 研究员。Ernest Ryu 也是应用数学家,曾在 UCLA 数学系任教授,研究优化和机器学习理论,最近加入 OpenAI。 这场对话最有意思的地方,不是简单说“AI 数学变强了”,而是把这件事放进了一个更大的框架里:数学为什么是衡量推理能力的最佳训练场?为什么模型会从几分钟推理走向几天、几周甚至几个月推理?为什么这条路和 AGI 密切相关?以及,为什么 AI 越强,越需要真正懂数学、懂科学的人类专家? 两年前还没有真正的推理模型,现在已经能帮数学家工作 Sebastian 对过去几年的变化用了一个很重的词:miraculous,近乎奇迹。 他提醒大家,两年前我们甚至还没有今天意义上的 reasoning model,更不用说证明困难数学定理。可现在,模型已经可以帮助 Fields Medalists 处理日常数学工作。 Ernest 说,这种进步连他们自己都被震到了。 一年前半,他参加过一个数学会议的 workshop。当时有一场辩论,主题是:只靠扩展 LLM,能不能帮助解决重大开放问题?现场一开始大约 80% 的数学家认为“不可能”。辩论结束后,比例变成大概 50-50,看起来已经是很大进展。 但回头看,这个争论本身都低估了速度。仅仅八个月后,模型就开始触及研究级数学。 这也是今天很多人还没完全反应过来的地方。我们对 AI 的印象更新得太慢了。很多人还记得早期 ChatGPT 算错小学题、搞错单位换算、不会安排时区会议,于是默认“语言模型不擅长数学”。但模型能力曲线并没有停在那里。...

May 5, 2026 · 3 min · fisherdaddy

Greg Brockman:AI 时代,创业公司该怎么活下来,又该怎么赢?

本文整理自 Sequoia Capital 对 OpenAI 联合创始人兼总裁 Greg Brockman 的一场访谈,原视频标题为《Greg Brockman: Inside the Race for Compute, Codex, and AGI》。以下内容由有道龙虾总结和发布。 如果你想理解 OpenAI 现在到底在押注什么,Greg Brockman 这场访谈很值得看。 他不是只讲“AI 会改变世界”这种大话,而是把 OpenAI 的生意、技术路线、组织变化、创业公司的机会和风险,都摊开讲了一遍。 最直白的一句话是: OpenAI 的业务在某种意义上很简单:买算力、租算力、建算力,然后以一定利润卖出去。 听起来像云厂商,但背后卖的不是普通计算资源,而是越来越便宜、越来越强的“智能”。 OpenAI 最缺的东西,还是算力 主持人一开场就提到 Greg 的经历:他是 Stripe 第四号员工,后来成为第一任 CTO;如今是 OpenAI 联合创始人兼总裁。Stripe 处理的支付规模据说已经达到全球 GDP 的 1.6%,而 OpenAI 的周活用户也接近甚至超过 10 亿。 但 Greg 对这些成绩的回应很克制。他更关心的是一件事:算力够不够。 答案是:不够,远远不够。 他回忆 ChatGPT 刚发布时,团队问他应该买多少算力,他的回答是“全部”。团队以为他在开玩笑,又问了一遍,他还是说:全部。 原因很简单: 无论我们用多快的速度增加算力,都追不上需求。 OpenAI 对算力的渴求,不只是为了训练更大的模型,也是为了服务海量用户和越来越复杂的智能体任务。Greg 的判断是,人类对“解决问题”的需求,对“智能”的需求,几乎是无限的。只要边际利润为正,就应该继续扩大规模。 这也是为什么他会把 OpenAI 的商业模式讲得像一门朴素生意:采购、建设、租用计算资源,再把它转化成可用的智能服务卖出去。 Scaling Laws 还没撞墙 谈到模型能力增长,Greg 用了一个很有意思的说法:Scaling Laws 是一个“深刻而美丽的谜”。...

May 4, 2026 · 2 min · fisherdaddy

Sam Altman 最新深度交流:软件开发的终局、GPT-6 的剧透与给开发者的建议

本文整理自 OpenAI CEO Sam Altman 今早面向开发者举办的一场交流会的在线直播。以下为本场直播的精华内容,由我和 Gemini 3 Pro 共同整理而成。 软件工程师的未来:不是消亡,而是爆发 很多人担心 AI 会让程序员失业,Sam 引用了**杰文斯悖论(Jevons paradox)**来反驳这个观点:当某种资源(这里是代码)的生产效率极速提高、成本极速降低时,需求反而会呈指数级增长。 未来的软件工程师是什么样的?Sam 认为,“写代码”本身将不再是工作的核心。未来的工程师不需要把大量时间花在敲击键盘或调试 Bug 上。 相反,工程师的定义将通过以下方式被重塑: 价值捕捉者:利用计算机完成自己想要的任务,或者通过计算机为他人创造有用的体验。 宏观调控者:你会看到更多人能独自完成以前需要整个团队才能做到的事。 Sam 预测,世界对软件的需求丝毫没有减弱。未来,我们使用的软件将不再是千人一面的通用版本,而是**“为你一人定制”**的。你会习惯于软件根据你的使用习惯不断自我微调,甚至在此时此刻为你即时生成一个小程序来解决当下的问题。这将创造出比现在大得多的 GDP 总量。 给创业者的冷水:构建变得容易,但卖出去更难了 对于开发者来说,技术门槛的降低是一把双刃剑。 Sam 分享了他以前在 Y Combinator 的观察:曾经,创始人们认为“做产品”是最难的;现在,随着 Cursor、Codex 等工具的普及,构建产品变得极其容易,真正的瓶颈变成了 GTM(Go-To-Market,推向市场)。 即使在那个“极大丰富”的 AI 未来,人类的注意力仍然是稀缺资源。 Sam 给出的建议很务实: 即便 AI 可以自动化销售和营销,你依然要面对激烈的竞争。 不要指望技术红利能自动解决获客问题,生意的本质逻辑(提供差异化价值、建立网络效应)没有变。 终极测试:问问你自己,如果 GPT-6 发布了,且性能惊人地强,你的初创公司会感到开心还是难过?你应该去做那些极度渴望模型变得更强的业务,而不是做那些“修补模型缺陷”的套壳生意,后者会极其痛苦。 关于 GPT-6 与未来的模型:我们要修好“偏科” 坦白说,Sam 承认目前的模型有点“偏科”。例如 GPT-5 在某些方面很强,但在写作风格上可能还不如以前的版本讨喜。 对于未来的模型演进(以 GPT-6 为代表的下一代),OpenAI 的目标非常明确: 全能型选手:未来的模型将在推理、编程、写作等所有维度上同时变强。智能是可互换的,一个能进行复杂科学推理的模型,理应也能写出清晰甚至有见地的文章。 速度与成本:Sam 做了一个大胆的预测——不管是到 2027 年还是更早,高端智能的成本至少会降低 100 倍。同时,OpenAI 正在努力平衡“推理深度”和“响应速度”,让复杂的输出能在 1/100 的时间内完成。 学习能力:你不必担心今天基于旧框架构建的应用会被淘汰。未来的模型将具备“看一眼就会”的能力——给它展示一个新的环境或工具,它就能像最聪明的人类一样迅速掌握并可靠地使用。 AI Agent(智能体)的形态:不仅仅是聊天 关于 Agent,至今没有一个标准答案。Sam 认为未来会有两种极端的用户画像:...

January 27, 2026 · 1 min · fisherdaddy

OpenAI 创始人 John Schulman 复盘:如果重回 2015,我们能光速造出 ChatGPT 吗?

本文整理自 Cursor CEO 对 OpenAI 联合创始人 John Schulman 的深度访谈:John Schulman on dead ends, scaling RL, and building research institutions,由我和 Gemini 3 Pro 共同整理完成。 如果给 OpenAI 的创始团队开一个“上帝视角”,让他们带着今天的知识回到 2015 年,重建 ChatGPT 需要多久? OpenAI 联合创始人 John Schulman 给出的答案可能有点反直觉:快得惊人,而且需要的算力比你想的要少得多。 这是一个关于“后见之明”、OpenAI 早期的一地鸡毛、RL(强化学习)的未来,以及他现在如何用 AI 写代码的深度思考。 带着答案考试:ChatGPT 其实可以“省钱”做 回看过去,如果我们知道确切的“配方”,其实并不需要当年那么恐怖的算力堆叠。 Schulman 提到,像 Andrej Karpathy 写的那种 NanoGPT 已经证明了,一个人、一台机器、半年时间就能跑出一个微缩版模型。如果在 2018 年或 2019 年,哪怕只有几张 GPU(当时还是 V100),只要有现在的 Post-training(后训练) 知识,几个聪明人加上高质量的微调数据,完全可以在那时就搞出 GPT-3.5 水平的对话模型。 今天的我们知道,通过巧妙的数据构建和微调,可以极大地“放大”算力的效果。也就是所谓的“小模型、大智慧”。未来甚至可能出现这种极客场景:一个文件搞定所有训练代码,一天之内跑完全流程。 早期 OpenAI:草台班子与“走错路”的探索 现在的 OpenAI 是市值巨无霸,但 Schulman 也没避讳早期的窘境。2016、2017 年那会儿,OpenAI 更像是一个稍微大点的学术实验室,甚至有点“杂牌军(ragtag)”的感觉。大家三两成群,凭兴趣做研究,写写论文。 当时有没有走弯路?当然有。...

December 18, 2025 · 1 min · fisherdaddy

OpenAI 的 2026 野心与迪士尼的豪赌:本周科技界发生了什么?

本文整理自 Youtube 知名博主 Alex Kantrowitz 每周一次的最新科技新闻讨论视频,由我和 Gemini 3 Pro 共同整理完成。 1. OpenAI 的大转向:2026 是“企业级”的一年 这就得从本周一在纽约的一场午餐会说起了。地点在中央火车站附近的 Rosemary’s 餐厅,OpenAI 的 CEO Sam Altman 和一群媒体界的大佬——包括《大西洋月刊》、《纽约客》和《纽约时报》的高管们——坐在一起。 在推杯换盏之间,Altman 抛出了一个重磅信号(Greg Brockman 随后也在推特上证实了这一点):OpenAI 接下来的重中之重,或者说 2026 年的主题,是企业级 AI(Enterprise AI)。 这听起来可能有点枯燥,但背后的逻辑非常有意思。 为什么是现在? 一直以来,OpenAI 大概是 70% 面向消费者(也就是我们要等到 2026 年第一季度才能体验到的“成人模式”聊天),30% 面向企业。但在企业服务这块,Anthropic 其实做得更好。 Altman 和他的团队意识到了两个残酷的现实: 模型正在商品化:Google 的 Gemini 现在的水平基本上已经追平了 GPT。大家手里的“大模型”底牌都差不多了。 没有直通 AGI 的捷径:单纯堆算力、堆数据带来的模型能力提升正在放缓。 所以,Sam Altman 在午餐会上直言不讳:“现在的瓶颈不是训练,而是应用。” 既然模型本身拉不开巨大差距,那就得看谁能把技术真正用在业务流程里赚钱。这也解释了为什么他们发布了 GPT-5.2(代号),这实际上是一个更擅长处理复杂工作流、待办事项和企业规划的版本。 这也带来了一个尴尬的问题: OpenAI 想做企业生意(毕竟那才是真正的大钱,预计明年这一块市场高达 375 亿美元),但它同时也得伺候好数亿的普通用户。企业用户需要严谨、准确的工具,而普通用户可能想要一个甚至会和你“调情”的 AI 伴侣。OpenAI 的高管 Fiji Simo 承认,他们想两头通吃,但这很难平衡。未来我们可能会看到两个截然不同的 ChatGPT:一个帮你做报表,一个负责陪你聊天。 2. 迪士尼入局:当米老鼠遇见 Sora 要是放在几年前,如果你跟我说迪士尼——这个对版权保护严苛到极致的公司——会主动把自家的 IP 喂给 AI,我肯定觉得你疯了。但这周,迪士尼和 OpenAI 达成了一项价值约 10 亿美元的重磅交易。...

December 18, 2025 · 1 min · fisherdaddy

介绍一下 GPT-Image 1.5

OpenAI 于 2025 年 12 月 17 日发布了全新的旗舰级图像生成模型 GPT-Image 1.5。它能进行精准编辑,同时保持细节完好,并且生成图像的速度提升高达 4 倍。同时,在 ChatGPT 中推出了全新的 Images 功能,旨在让图像生成变得令人愉悦——激发灵感并使创意探索变得轻松自如。 全新的 Images 模型即日起向所有 ChatGPT 用户推出,并在 API 中以 GPT Image 1.5 的形式提供。ChatGPT 中的全新 Images 体验也于今日向大多数用户推出,Business 和 Enterprise 用户将在稍后获得访问权限。 精准编辑,保留重要细节 现在,当你要求对上传的图像进行编辑时,模型会更可靠地遵循你的意图——甚至包括细微之处——仅根据你的要求进行更改,同时保持光线、构图和人物外貌等元素在输入、输出和后续编辑中的一致性。 这开启了符合你意图的结果——更有用的照片编辑,更逼真的服装和发型试穿/试戴,以及保留原始图像精髓的风格滤镜和概念转换。总之,这些改进意味着 ChatGPT 可以充当你口袋里的创意工作室,既能进行实用编辑,又能进行富有表现力的重构。 编辑 该模型擅长各种类型的编辑——包括添加、删减、组合、混合和变换——因此你可以在获得想要的更改的同时,不丢失图像的独特之处。 从派对到直播洛杉矶滑板 将这两名男子和狗组合成一张 2000 年代胶片相机风格的照片,表现他们在孩子们的生日派对上看起来很无聊的样子。 在背景中添加混乱的孩子们,他们在扔东西和尖叫。 将左边的男子改为手绘复古动漫风格,将狗改为毛绒玩具风格,保持右边的男子和背景景物不变。 给他们都穿上看起来像这样的 OpenAI 毛衣。 现在移除这两名男子,只保留狗,并把它们放在一个看起来像附图的 OpenAI 直播中。 创意转换 模型的创造力通过转换得以闪耀,这些转换可以更改和添加元素——例如文本和布局——使想法变为现实,同时保留重要细节。这些转换既适用于简单的概念,也适用于更复杂的概念,并且可以使用全新 ChatGPT Images 功能中的预设风格和创意轻松尝试——无需书面提示词。 电影海报 80 年代健身教练 华丽玩偶 装饰品 时尚广告 装扮角色 绘画 饮料广告 用这两名男子的图像制作一张名为“codex”的老派好莱坞黄金时代电影海报。随意更改他们的服装以符合时代背景。 将演员的名字改为 Wojciech Zaremba(左)和 Greg Brockman(右) 由 Sam Altman 执导,Fidji Simo 制作。A Feel the AGI Pictures 出品。 指令遵循 该模型比我们的初始版本更可靠地遵循指令。这实现了更精准的编辑以及更复杂的原创构图,其中元素之间的关系按预期得以保留。...

December 17, 2025 · 5 min · fisherdaddy

什么是“Vibe Engineering”?看看 OpenAI 内部是如何重新定义软件开发的

本文整理自 OpenAI Forum 发布的分享视频:Vibe Engineering with OpenAI’s Codex。 什么是“Vibe Engineering”?看看 OpenAI 内部是如何重新定义软件开发的 我们大概都经历过那种死线逼近的时刻,心里幻想着:“要是有个不知疲倦、不用睡觉的同事能帮我把这些代码写了该多好。” 在 OpenAI,Codex 就扮演着这个角色的。 最近在 OpenAI Forum 上,Global Affairs 团队的 Chris Nicholson 邀请了两位真正的“内行”——OpenAI 开发者体验负责人 Romain Huet 和技术专家 Aaron Friel,深入聊了聊一个最近很火的概念:Vibe Engineering(氛围工程)。 这不仅仅是一个流行词,它代表了软件开发的一种新范式:利用 AI 构建真正的生产级软件,同时让人类工程师对交付的每一行代码保持完全的掌控。 这不只是让 AI 吐出一堆代码然后祈祷它能跑通,而是把 AI 深度融入到设计、架构、调试甚至长周期的多步骤项目中。 今天,我们就来扒一扒 OpenAI 内部的工程师们究竟是怎么“生活”在未来的,以及作为普通开发者,我们可以怎么把这种工作流偷师过来。 从“Vibe Coding”到“Vibe Engineering” 你可能听说过“Vibe Coding”,通常指那种随意的、凭感觉的编程体验。但 Simon Willison 提出的“Vibe Engineering”是它的严肃版——它是 AI 驱动开发的进阶形态。 在这个形态下,大模型不再只是一个代码补全工具,它们变成了你的队友。 Romain Huet 分享了一个很有意思的观察:一年前,你会为了模型能写出一个贪吃蛇游戏或者 iPhone App demo 而兴奋。但现在,模型的能力已经进化到了可以处理长达数小时甚至数天的复杂任务。它们可以制定计划、做架构决策、编写测试,甚至自己检查自己的作业。 当 AI 学会了自我检查(Self-correction),它的表现就有了质的飞跃。这就是从“写代码”到“搞工程”的转变。 现场实战:把一个 Kotlin 项目重写为 Rust 光说不练假把式。Aaron Friel 在现场展示了一个非常硬核的 Demo,任务听起来就很让人头大:...

December 16, 2025 · 2 min · fisherdaddy