介绍一下 OpenAI Codex
OpenAI 于 2025 年 5 月 16 日推出了 Codex ,Codex 是一款由 OpenAI 推出的云端 AI 软件工程代理,它由专为软件工程优化的 codex-1 模型驱动。Codex 能够帮助开发者自动执行多种软件开发任务,例如编写新功能、修复错误、回答代码库相关问题以及创建拉取请求。该工具旨在通过并行处理任务和与现有开发工作流集成,显著提升软件工程师的效率和专注度。Codex 目前已向 ChatGPT Pro 、Team 和 Enterprise 用户推出,并计划很快支持 Plus 和 Edu 用户。 Codex 的工作方式与环境: 用户可以通过 ChatGPT 的侧边栏访问 Codex,通过输入提示来分配编码任务(点击 “Code”)或就代码库提问(点击 “Ask”)。 每个任务都在一个独立的、预装了用户代码库的云沙箱环境中处理。 Codex 具备读写文件、运行命令(包括测试工具、Linter 和类型检查器)的能力。 任务完成时间通常在 1 到 30 分钟之间,用户可以实时监控其进度。 Codex 会提供其操作的可验证证据,包括终端日志和测试输出的引用,允许用户追踪任务完成的每一步。 用户可以审查结果、请求修改、创建 GitHub 拉取请求或直接将更改集成到本地环境。 可以通过在代码仓库中放置 AGENTS.md 文件来指导 Codex,告知其如何导航代码库、运行哪些测试命令以及如何遵循项目规范。 模型与性能: Codex 由 codex-1 模型驱动,这是 OpenAI o3 的一个优化版本,专门针对软件工程任务进行了训练。 codex-1 通过强化学习在真实世界的编码任务上进行训练,以生成接近人类风格的代码、精确遵循指令,并能迭代运行测试直至通过。 在编码评估和内部基准测试中,即使没有 AGENTS.md 文件或自定义脚手架, codex-1 也表现出强大的性能。例如,在 SWE-Bench Verified 基准测试中, codex-1 达到了 75% 的准确率,并在 OpenAI Internal SWE tasks 上表现优异(约 70%)。 安全性、信任与人类偏好对齐:...