OpenAI Atlas 工程团队:我们如何构建 OWL,我们基于 ChatGPT 的浏览器 Atlas 背后的新架构

为了纠正大家都认为 ChatGPT Atlas 是 Chromium 的套壳,ChatGPT Atlas 工程团队编写本文来说明 ChatGPT Atlas 的底层有很多创新之处。虽然 Atlas 使用的是 Chromium,但它的构建方式与通常的 Chromium 不同。 Atlas 浏览器的核心创新在于其独特的 OWL 架构,该架构通过将 Chromium 引擎作为一个独立的服务层运行,从而与主应用程序进程分离。这种解耦设计不仅解决了传统浏览器架构在性能和用户体验上的瓶颈,还为实现复杂的 Agent (智能体) 功能和快速的产品迭代奠定了坚实的基础。它使得 Atlas 能够同时利用 Chromium 强大的网络兼容性与现代原生框架 (SwiftUI, AppKit) 带来的流畅体验。 关键细节 背景与挑战 产品目标: 团队希望创造一款能将 ChatGPT 作为网络“副驾驶”的浏览器,拥有即时启动、支持数百个标签页而不影响性能,以及丰富的动画和视觉效果。 技术选型: Chromium 因其先进的引擎、强大的安全模型和无与伦比的网络兼容性,成为自然的选择。 架构难题: 直接使用或修改 Chromium 的标准架构难以实现上述产品目标,特别是快速启动和高性能。同时,深度修改 Chromium 会导致后续版本更新和维护变得极其困难和耗时。 解决方案:OWL 架构 核心思想: OWL (OpenAI’s Web Layer) 是 OpenAI 的解决方案。它将 Chromium 的浏览器进程从 Atlas 主应用进程中剥离出来,使其成为一个独立的后台服务。 工作模式: Atlas 应用作为 OWL Client (客户端),而 Chromium 进程作为 OWL Host (主机)。两者通过 Chromium 自家的消息传递系统 Mojo 进行通信 (IPC)。 OWL 带来的优势 应用更简洁: Atlas 的用户界面几乎完全由 SwiftUI 和 AppKit 构建,代码库更清晰、技术栈更统一。 启动更快速: Chromium 在后台异步启动,用户界面几乎可以瞬间加载。 隔离性更强: Chromium 引擎的卡顿或崩溃不会影响 Atlas 主应用的稳定性。 维护更容易: 由于 Atlas 没有构建在 Chromium 的开源 UI 之上,与上游 Chromium 的代码差异更小,便于维护和升级。 迭代更迅速: 大多数工程师无需在本地编译 Chromium (耗时数小时),而是使用预编译的 OWL 二进制文件,使 Atlas 的构建时间从数小时缩短到几分钟。 针对 Agent 功能的特殊设计 渲染: 为了让 AI 模型能看到完整的页面上下文,Atlas 会将下拉菜单等在主窗口外渲染的 UI 元素重新组合到主页面图像中。 输入: Agent 生成的输入事件会直接发送到渲染器,而不是通过拥有更高权限的浏览器层,以保证沙箱安全边界。 数据隔离: Agent 浏览可以在临时的“登出”环境中运行。它使用 Chromium 的 StoragePartition 基础架构创建隔离的内存存储,确保每个 Agent 会话都是全新的,会话结束后所有数据都会被丢弃。 原文:我们如何构建OWL:我们基于ChatGPT的浏览器Atlas背后的新架构 作者:Ken Rockot,技术团队成员;Ben Goodger,ChatGPT Atlas工程主管...

October 31, 2025 · 2 min · fisherdaddy

介绍一下 OpenAI 推出的浏览器 Atlas

OpenAI 于 2025 年 10 月 21 日推出了一款以 ChatGPT 为核心的全新网络浏览器——ChatGPT Atlas。这款浏览器旨在通过深度集成 AI,重塑用户的网页浏览体验,使其成为一个能够理解用户意图并主动完成任务的“超级助理”。 ChatGPT Atlas 的核心思想是将 ChatGPT 的强大功能与浏览器深度融合,让 AI 能够理解用户正在浏览的内容和上下文,从而在不离开当前页面的情况下,提供即时帮助、自动化执行任务。这标志着网页浏览从被动获取信息,向与 AI 协同完成工作的主动模式转变。其最终目标是让用户能够将繁琐的日常任务委托给 AI,从而专注于更重要的事情。 关键细节 核心功能与特性 深度集成: ChatGPT 内置于浏览器中,可随时调用,理解当前页面内容,无需复制粘贴。 浏览器记忆 (Browser memories): Atlas 可以选择性地记住用户浏览过网站的上下文信息,并在后续的对话和任务中利用这些信息,例如,可以要求它“总结我上周看过的所有招聘信息,并分析行业趋势”。 代理模式 (Agent mode): 在此模式下,ChatGPT 可以在浏览器中为用户执行具体操作。例如,根据一个在线食谱,自动寻找商店、将所有配料加入购物车并下单。该功能目前为 Plus、Pro 和 Business 用户提供预览。 用户控制与隐私安全 用户自主控制: “浏览器记忆”功能完全可选,用户可以随时在设置中查看、归档或删除这些记忆。用户也可以随时控制 ChatGPT 对特定网站的访问权限。 数据训练: 默认情况下,用户的浏览内容不会被用于训练 OpenAI 的模型。用户可以选择在数据控制设置中开启“包括网页浏览”来授权训练。 代理模式安全措施: 代理无法在浏览器中运行代码、下载文件或安装扩展程序。 在访问金融机构等敏感网站时,代理会暂停以确保用户知情。 尽管有安全措施,官方仍提示代理模式存在被恶意指令利用的风险,并建议用户保持警惕。 发布与平台支持 首发平台: ChatGPT Atlas 今日起在全球范围内向 macOS 用户推出,覆盖 Free、Plus、Pro 和 Go 等多个版本。 后续支持: Windows、iOS 和 Android 平台的版本也即将推出。 企业版本: Business、Enterprise 和 Edu 用户可在管理员授权后使用 Beta 版本。 原文:介绍 ChatGPT Atlas 今天我们推出 ChatGPT Atlas,一款以 ChatGPT 为核心构建的新型网页浏览器。...

October 27, 2025 · 2 min · fisherdaddy