Claude 计算机和浏览器使用最佳实践

本文由有道龙虾翻译并发布,原文来自 Anthropic 官方博客:Best practices for computer and browser use with Claude。文章系统总结了 Claude 计算机使用和浏览器使用在截图分辨率、坐标缩放、点击准确性、思考预算、安全防护、上下文管理、批量工具、Advisor 工具和演示学习等方面的工程最佳实践。 Claude 的最新模型在计算机使用和浏览器使用能力上迈出了重要一步。凭借这些特性,LLM 现在能够驱动越来越复杂的智能体系统,用于支撑真实工作,例如构建软件应用,以及跨多个互不相同的技术自动化工作流。 在这篇博客文章中,我们分享了 Claude 计算机使用与浏览器使用的最佳实践,内容从简单的配置变更到更高级的集成模式不等。我们希望这篇文章能在你开始将 Claude 的计算机使用与浏览器使用能力集成到产品中时有所帮助。我们还发布了一个新的演示实现,其中封装了部分最佳实践,并提供了在 Claude 计算机使用能力之上进行开发时有用的附加工具。 请注意,除非另有说明,这些建议适用于 Claude 4.6 系列(Opus 4.6、Sonnet 4.6、Haiku 4.5)以及 Claude Opus 4.7。当 4.6 系列与 Opus 4.7 的指导建议存在差异时,我们会在正文中明确指出。我们的发现基于内部实验,未来可能会随着新模型和新技术的出现而更新。 入门:分辨率与缩放 点击准确性是任何计算机使用集成的基础。如果点击没有落在应有的位置,后续一切都无法正常工作:表单填不上,按钮按不下,工作流也会失败。影响最大的单项优化同时也是最简单的优化之一:在将截图发送给 API 之前,先对截图进行下采样/缩小。 确保正确缩放 当你向 Claude 的 Computer Use API 发送截图时,模型会看到它,并在你指定的 display_width_px / display_height_px 坐标空间中返回点击坐标。但这里有一个重要约束:API 对图像大小有内部处理限制。超过这些限制的图像会在模型看到之前被下采样/缩小,这意味着模型是在图像的降质版本上进行点击判断,而你的执行框架期望的坐标却与原始分辨率对齐。 对于我们的 Claude 4.6 模型系列,API 的限制如下: 最大长边:1568 像素 最大总像素数:1.15 百万像素 超过任一限制的图像都会被内部下采样/缩小 我们的 Opus 4.7 模型支持更高分辨率。限制如下:...

May 20, 2026 · 12 min · fisherdaddy