Codex不只是写代码：一场悄悄发生的"工作方式革命"

本文整理自 OpenAI Forum 发布的分享视频，由有道龙虾总结和发布。

“Codex"这个词听起来像是给程序员准备的。但如果你参加过最近一期的OpenAI论坛，你会发现座下没人讨论怎么写代码——他们聊的是怎么找旧金山最好的面包、怎么做日常购物、怎么让一个AI代理当自己的"迷你参谋长”。

Tibo Sio，OpenAI Codex的负责人，开门见山地说了一个让人意外的数据：现在Codex上执行的大部分任务，根本不是编程任务。

从云端代码助手到桌面万能代理

Codex的故事其实走过一段弯路。

大约两年前，OpenAI团队开始追逐一个"宏大的挑战"：让AI达到顶级软件工程师的编程水平。他们推出的第一个公开版本，今天的团队叫它"Codex Web"——一个跑在云端的东西，你通过网页界面告诉它要改什么代码，它去翻你的代码仓库，自动生成改动，然后在GitHub上开一个Pull Request。

听起来很酷。但问题是：摩擦太大了。

你得把自己电脑上那一整套开发环境在云端重新搭一遍，而模型当时也没聪明到次次都靠谱。团队很快意识到：与其让人适配工具，不如让工具适配人。

“我们决定让它在每个人自己的机器上本地跑。“Tibo说。

转折点：连程序员的大部分时间都不在写代码

Codex最初是给工程师用的。但做着做着他们发现了一个有意思的事实：软件工程师每天真正写代码的时间，大概也就20%到30%。

剩下的时间呢？翻工单、排优先级、讨论架构方案、查Bug、处理线上事故、做值班……大量工作其实是信息搜集、沟通协调、上下文梳理。这些事跟写代码没半毛钱关系。

于是技术团队自己开始"吃自己的狗粮”——用Codex处理那些非编码的杂活。结果效果之好，让他们意识到：手里拿着的根本不是"代码工具”，而是一个通用得多的东西。

Tibo讲了一个让他印象深刻的瞬间：产品负责人Alexander在Codex发布前夕，同时跑着多个Codex代理——一个在搜集用户反馈，一个在跟开发者确认状态，一个在实时更新项目计划文档——而他自己正坐在会议室里跟Tibo讨论。

“我从来没见过一个人这么高效，“Tibo说，“那一刻我就觉得，我们在改变的不只是软件工程。”

这就是那个"原来这东西是给所有人用"的觉醒时刻。

面包、咖啡和"属于你一个人的软件”

为了让观点落地，Tibo在现场做了个演示。

他住在旧金山，对当地面包的离谱价格很不满，于是对Codex说了一句话：“帮我在旧金山找最好的面包，列个表格，标明价格和购买地点。”

五分钟之后，一张完整的电子表格出现了：烘焙店名、面包种类、描述、价格，一清二楚。

然后他随口又说了一句：“把同样的东西做成网页，放地图上。”

四分钟后，一个带交互地图的网页生成了——每家店的位置、面包信息、价格，全在地图上可视化呈现。他甚至可以说"对咖啡也做同样的分析”，八分钟后旧金山咖啡地图也做好了。

整个过程，Tibo连键盘都没碰——全程语音操作。

“这不是我花一整个周末才能做出来的东西，“他说，“在以前，这根本就不会发生。它不是从’几周变几秒’，是从’永远不可能’变成了’几分钟的事’。”

这就是Tibo反复强调的"个人软件"时代：每个人都有能力为自己量身打造小工具，而不用求人。设计师可以在代码库里直接改UI细节，不用跟工程师排期；市场人员可以做深度竞争分析，不用等数据团队排期。

首席参谋、自动化日报和一个"不用看邮件"的未来

Tibo自己怎么用Codex？他打开侧边栏——一天之内已经派发了上百个任务给Codex代理：

整理桌面文件
管理计算资源集群
帮我看值班轮转情况
检查即将上线的发布计划，标出有风险的项目
每天早上9点扫描我的Gmail、Notion和日历，给我一份当日摘要，标出需要注意的事项

“它就像我的小参谋长，“他说，“帮我花精力在最重要的事情上。”

他甚至做了一个"个人新闻简报”——根据他自己的偏好筛选信息，每天早上推送。以前，这种事要么不存在，要么得雇个人专门做。

更激进的想象是：未来你甚至不用看邮件了。一个全天候运行的代理读你的收件箱，只在真正重要的时候提醒你。“你只管设定目标，剩下的它帮你搞定。”

从10分钟到好几周：/goal模式的底气

对话的后半段，Tibo透露了一个正在铺开的新功能：slash goal。

普通模式下，你给Codex一个具体任务，它干完了汇报。但在goal模式下，你给它一个长期目标——比如"解决一个非常难的数学问题”——它就会像着了魔一样持续攻坚，干几个小时、几天、甚至几周，直到自己认为目标达成。

目前已经有人用它把整个程序从一种语言翻译成另一种，有人在物理和数学问题上用它突破瓶颈。

“几个月前我们还在激动它能连续工作10分钟，“Tibo说，“现在我们在讨论连续工作几周。有时候，天才不过就是能对同一件事持续思考更久。”

给非技术用户的三个行动建议

论坛上有观众问了一个很实操的问题：非开发人员到底怎么做，才能用好Codex？

Tibo给了三条：

1. 加入社群，看别人怎么用。 他自己都会被一些神奇的用法规避惊艳到。OpenAI论坛就是这样一个互相学习的地方。

2. 给它精确的指令，别模糊。 把它当成一个刚入职的新同事——没有上下文，不知道你的偏好。你得说清楚"成功长什么样"和"什么样算搞砸了”。比如要一份PPT，就明确说"我要10页，前两页放背景信息，中间六页做技术拆解，最后两页放开放问题和Q&A”。越具体，成功的概率越高。

3. 尽量连接更多信息源。 Codex现在有超过100个插件——日历、Notion、各类工具都可以接进来。接入的信息源越多，它能帮的忙就越大。

但有一条重要的提醒：别把所有事情都交给它。Tibo特别指出他见过最大的错误就是"过度委托”——把包括自己对问题的理解都一并外包出去。真正用好Codex的人，是在用它提升自己的认知，而不是替代自己的思考。它可以用图像和图表帮你理解复杂概念，但做笔记、主动回想、验证理解，永远是你自己的事。

企业落地的真正瓶颈：不是能力，是信任

当被问到企业采用的最大障碍时，Tibo的回答很直接：不是模型能力不够，是信任和安全问题。

“如果有代理在你公司里到处乱跑，不小心删了敏感文件，或者把不该发出去的信息外泄——没人敢用。”

OpenAI在做三件事来解决这个：

沙箱默认运行：可以限制代理只能访问特定文件夹，甚至禁止联网
细粒度权限控制：可以设成"只能读不能写”，数据安全仍由你掌控
“自动审查"机制（Auto Review）：另一个独立代理实时监控主代理的每一步操作，风险动作直接拦截

“就像一个裁判在旁边，看到越界的操作立刻喊停。”

代码只是个工具，不是目的

对话快结束时，主持人Chris提了一个贯穿全场的洞察：过去，有需求的人和能解决需求的人是两拨人。他们之间的沟通成本高得惊人，最终做出来的东西往往是"还行，但也就那样了”。而现在，有需求的人自己就能把解决方案做出来。

“Codex这个词本来的意思是’书’，不是’代码’，“Chris说，“这是个我们都熟悉的东西——拿在手里、随时翻阅。而Codex实际在做的事，是让信息获取、分析和行动之间的那堵墙消失。”

Tibo的总结是：他们在构建的是一个极其通用、极其强大的代理。只要接入正确的信息源，允许它对世界采取行动，它几乎能做任何你允许它做的事。

而最让人兴奋的是，这不是给少数人的特权——OpenAI的意图是把这种能力"尽可能广泛地分发出去”。

如果你正在读这篇文章，不妨想一想：在自己的生活或工作中，有没有一个反复出现的工作流——一份分析报告、一个计划、一个表格、一套流程——你一直想做但从来"没时间碰”。找出来，打开Codex，试一次。不需要相信任何人说的任何话，你自己的体验就是最好的答案。

从云端代码助手到桌面万能代理#

转折点：连程序员的大部分时间都不在写代码#

面包、咖啡和"属于你一个人的软件”#

首席参谋、自动化日报和一个"不用看邮件"的未来#

从10分钟到好几周：/goal模式的底气#

给非技术用户的三个行动建议#

企业落地的真正瓶颈：不是能力，是信任#

代码只是个工具，不是目的#