Anthropic 推出了 Anthropic 经济指数 (Anthropic Economic Index),旨在深入理解 生成式 AI 系统对劳动力市场和经济产生的重大影响。该指数的首份报告基于 Claude.ai 上的数百万匿名对话进行了首次数据分析,揭示了 生成式 AI 如何融入现代经济中的实际工作任务。为了促进更广泛的研究和政策制定,Anthropic 开放了用于此分析的数据集,并邀请经济学家、政策专家和其他研究人员为该指数提供input。
初步报告的主要发现包括:
- 生成式 AI 的使用目前主要集中在软件开发和技术写作任务中。
- 大约 36% 的职业在其至少四分之一的相关任务中使用了 生成式 AI,而约 4% 的职业在其四分之三的相关任务中使用了 生成式 AI。
- 生成式 AI 的使用更倾向于增强人类能力(57%),即 AI 与人类协作并提升其能力,而非直接自动化任务(43%)。
- 生成式 AI 在中等至中高工资职业中的使用更为普遍,但在最低和最高工资岗位中的使用率较低。这可能反映了当前 AI 能力的局限性以及技术应用的实际障碍。
数据来源与分析方法
该研究基于经济学文献中关于职业任务而非职业本身的见解,使用 Anthropic 内部的自动化分析工具 Clio 分析了约一百万次 Claude (Free 和 Pro 版本) 的对话。Clio 将每次对话与美国劳工部 ONET (Occupational Information Network) 数据库中的职业任务进行匹配,ONET 数据库包含约 20,000 个特定工作相关任务。然后,研究人员按照 O*NET 的分类方案,将任务分组到相应的职业和职业类别中。
AI 使用的行业分布
数据显示,“计算机和数学” 类别(主要涵盖软件工程角色)的职业中,生成式 AI 的采用率最高,占 Claude 查询的 37.2%,任务包括软件修改、代码调试和网络故障排除等。“艺术、设计、体育、娱乐和媒体” 类别位居第二,占 10.3%,主要反映了人们使用 Claude 进行各种写作和编辑工作。而 “农业、渔业和林业” 等体力劳动型职业的 AI 使用率最低,仅占 0.1%。
AI 使用深度与职业
分析发现,只有约 4% 的职业在至少 75% 的任务中使用 生成式 AI。然而,更适度的 AI 使用更为普遍:约 36% 的职业在至少 25% 的任务中使用了 AI。这表明,在当前数据集中,没有证据表明职业被完全自动化,相反,AI 正在经济的许多任务中扩散,对某些任务组的影响比其他任务组更强。
AI 使用与薪资水平
研究结合 O*NET 数据库提供的美国各职业中位数薪资数据进行分析。有趣的是,低薪和极高薪职业的 AI 使用率都非常低,而中等至中高薪资范围内的特定职业,如计算机程序员和文案,是 AI 的主要用户。
自动化与增强的比例
总体而言,研究观察到 AI 的使用略微偏向于增强人类能力,其中 57% 的任务属于增强,43% 的任务属于自动化。这意味着在略多于一半的情况下,AI 不是被用来取代人类执行任务,而是与人类协同工作,参与验证 (例如,复核用户的工作)、学习 (例如,帮助用户获取新知识和技能) 和任务迭代 (例如,帮助用户集思广益或进行重复性的生成任务) 等。
研究的局限性
该研究提供了一个独特的视角来观察 AI 如何改变劳动力市场,但也存在一些局限性,包括:无法确定用户使用 Claude 是否与工作相关;不清楚用户如何使用 Claude 的回复;数据仅分析了 Claude.ai Free 和 Pro 计划的用户,而非 API、Team 或 Enterprise 用户;Clio 系统可能存在分类错误;Claude 无法生成图像,可能导致某些创意用途未被纳入数据;鉴于 Claude 被宣传为先进的编码模型,编码用例可能被过分强调。
未来研究方向
鉴于 AI 使用的快速扩张和模型能力的不断提升,劳动力市场的图景可能在短时间内发生巨大变化。Anthropic 将定期重复上述分析,以跟踪可能发生的社会和经济变化,并定期发布结果和相关数据集作为 Anthropic 经济指数的一部分。未来的纵向分析将有助于深入了解 AI 和就业市场,例如监测职业内部 AI 使用深度的变化,以及自动化与增强比例的变化。
开放数据和征求意见
该研究和 Anthropic 经济指数最重要的贡献在于其提供 AI 影响详细数据的新方法。Anthropic 立即开放共享用于上述分析的数据集,并计划在未来提供更多此类数据集。同时,欢迎研究人员提供反馈并提出新的研究方向。
Anthropic 经济指数
未来几年,人工智能 (AI) 系统将深刻影响人们的工作方式。因此,我们推出了 Anthropic 经济指数,旨在长期追踪 AI 对劳动力市场和经济的潜在影响。
该指数的 初始报告 基于 Claude.ai 平台上的数百万次匿名对话,提供了前所未有的数据和分析,更清晰地展示了 AI 如何融入现代经济的实际应用中。
我们也在 开源用于此分析的数据集,方便研究人员在此基础上深入研究。为了应对劳动力市场即将到来的转型,以及它对就业和生产力带来的影响,我们需要制定相应的政策,而这需要集思广益。因此,我们也欢迎经济学家、政策专家和其他研究人员 对该指数提出建议。
经济指数第一篇论文的主要发现是:
- 目前,AI 的应用主要集中在软件开发和技术写作领域。超过三分之一的职业 (约 36%) 在其至少四分之一的相关任务中使用了 AI,而约 4% 的职业在其四分之三的相关任务中使用 AI。
- 相比于 AI 直接执行任务的自动化 (43%),AI 更多地被用于增强人类能力 (57%),即 AI 与人类协作,提升工作效率。
- AI 在与计算机程序员和数据科学家等中高工资职业相关的任务中应用更为普遍,但在低收入和高收入职位中的应用均较低。这可能反映了当前 AI 能力的瓶颈,以及实际应用中存在的障碍。
请参阅下文,了解有关我们初步发现的更多详细信息。

AI 在劳动力市场中的应用概况
我们的 新论文 基于长期以来对技术在劳动力市场影响的研究,从工业革命时期的珍妮纺纱机到今天的汽车制造机器人。我们关注的是 AI 正在产生的持续影响。我们没有调查人们对 AI 的使用情况,也没有试图预测未来;相反,我们掌握了关于 AI 实际应用方式的直接数据。
分析职业任务
我们的研究始于经济学文献中的一个重要 见解:有时候,关注工作中的具体任务,比关注职业本身更有意义。不同职业的工作内容往往包含一些共通的任务和技能。例如,视觉模式识别就是设计师、摄影师、安检员和放射科医生都需要完成的任务。
与新技术相比,某些任务更适合被自动化或增强。因此,我们认为 AI 会有选择性地应用于不同职业中的不同任务。分析具体任务,而非仅仅分析整个工作,能让我们更全面地了解 AI 如何融入经济活动。
使用 Clio 将 AI 使用与任务匹配
这项研究得益于 Claude 提供的洞见,以及名为 “Clio” 的自动化分析工具。Clio 能够在保护用户隐私的前提下,分析与 Claude 的对话 [1]。我们使用 Clio 处理了约一百万个与 Claude 的对话数据集 (特别是 Claude.ai 上的 Free 和 Pro 对话),并按照职业任务对这些对话进行了分类。
我们根据美国劳工部的分类来选择任务。美国劳工部维护着一个包含约 20,000 个与工作相关的特定任务的数据库,即职业信息网络 (Occupational Information Network, O*NET) O*NET。Clio 将每个对话与 O*NET 数据库中的任务进行匹配,选出最能代表 AI 在对话中发挥作用的任务 (匹配过程如下图所示)。然后,我们按照 O*NET 的分类方法,将任务归类到相应的职业中,再将职业划分为几个大的类别,如教育与图书馆、商业与金融等。

结果
AI 在不同职业中的应用。 在我们的数据集中,“计算机与数学”类别的任务和职业对 AI 的采用率最高,主要集中在软件工程领域。发送给 Claude 的查询中有 37.2% 属于该类别,涉及软件修改、代码调试和网络故障排除等任务。
第二大类别是“艺术、设计、体育、娱乐和媒体”(占查询的 10.3%),主要反映了用户使用 Claude 进行各种写作和编辑活动。不出所料,涉及大量体力劳动的职业,如“农业、渔业和林业”类别中的职业 (占查询的 0.1%),AI 的使用率最低。
我们还将数据集中 AI 的使用率与各职业在整个劳动力市场中的占比进行了比较,结果如下图所示。

职业内部 AI 使用的深度。 我们的分析发现,很少有职业在大部分相关任务中使用 AI:只有约 4% 的工作在至少 75% 的任务中使用了 AI。然而,适度使用 AI 的情况更为普遍:约 36% 的工作在至少 25% 的任务中使用了 AI。
正如我们预测的那样,没有证据表明 AI 会完全取代人类的工作:相反,AI 渗透到经济活动的各个环节中,但对不同任务的影响程度有所差异。
AI 使用与薪资水平。 O*NET 数据库提供了美国各职业的薪资中位数。通过将这些信息纳入分析,我们得以比较不同职业的中位数工资,以及 AI 在其对应工作任务中的应用程度。
有趣的是,无论是低薪还是高薪职业,AI 的使用率都相对较低 (通常是那些需要大量手工操作的工作,例如洗发师和产科医生)。反而是那些收入处于中等偏上水平的职业,如计算机程序员和文案撰稿人,成为了 AI 的主要用户。

自动化与增强。 我们还深入研究了任务的具体执行方式——哪些任务属于“自动化”(AI 直接执行任务,例如格式化文档),哪些任务属于“增强”(AI 与用户协作完成任务)。
总体而言,我们发现 AI 更多地被用于增强人类能力。57% 的任务属于增强,43% 的任务属于自动化。换句话说,在大多数情况下,AI 并非用于取代人类,而是作为助手,与人类协同完成任务,例如验证 (仔细检查工作)、学习 (帮助获取新知识和技能) 以及迭代 (辅助头脑风暴或进行重复性的生成任务)。

注意事项
我们的研究为了解 AI 如何改变劳动力市场提供了一个独特的视角。但与所有研究一样,也存在一些局限性,包括:
- 我们无法确定用户是否在利用 Claude 完成工作任务。例如,用户向 Claude 寻求写作或编辑方面的建议,可能是在工作,也可能仅仅是为了撰写个人爱好性质的小说。
- 同样重要的是,我们并不清楚用户如何处理 Claude 的回复。他们是直接复制粘贴代码片段?还是会核实信息的准确性?亦或是直接采纳?在我们的数据中,有些看似自动化的行为,实际上可能属于增强。例如,用户让 Claude 撰写备忘录 (看似自动化),但之后又会亲自进行修改 (实际属于增强)。
- 此外,我们的分析仅限于 Claude.ai 免费和 Pro 计划的用户数据,不包括 API、团队或企业用户。虽然 Claude.ai 的数据包含一些与工作无关的对话,但我们使用语言模型过滤掉了这些数据,只保留与职业任务相关的对话,从而尽可能减少了干扰。
- 由于任务类型繁多,Clio 有可能错误地分类某些对话 (有关我们如何验证分析的详细信息,请参阅完整论文,特别是附录 B);
- Claude 无法生成图像 (除非通过代码间接实现),因此数据中不会包含一些创造性的使用案例;
- 考虑到 Claude 经常被宣传为顶尖的编码模型,我们有理由认为,在我们的数据集中,编码相关的应用可能被过度呈现。因此,我们并不认为本数据集中的使用情况能够代表 AI 的整体应用情况。
结论与未来研究
AI 的应用正在迅速普及,AI 模型的能力也日渐增强。在不久的将来,劳动力市场的格局可能会发生显著变化。因此,我们会定期重复上述分析,追踪可能出现的社会和经济变革。相关结果和数据集将作为 Anthropic 经济指数的一部分定期发布。
通过这些长期跟踪分析,我们可以更深入地了解 AI 对就业市场的影响。例如,我们可以监测 AI 在各个职业中的应用深度变化。如果 AI 仍然只应用于特定任务,并且只有少数职业在大多数任务中采用 AI,那么未来很可能大部分现有工作都会逐渐演变,而不是彻底消失。此外,我们还可以监测自动化与增强的比例,从而判断哪些领域自动化趋势更为明显。
我们的研究主要提供关于 AI 应用现状的数据,但并不涉及政策建议。如何应对 AI 对劳动力市场的影响,不能仅仅依靠孤立的研究结果,而需要结合实际证据、社会价值观以及各方经验。我们希望通过新的研究方法,进一步阐明这些问题。
有关我们的分析和结果的更多详细信息,请阅读 完整论文。
开放数据与征求意见
本文以及 Anthropic 经济指数的最大贡献在于,它提供了一种全新的方法来获取关于 AI 影响的详细数据。我们将立即公开分享用于本次分析的数据集,并计划在未来陆续发布更多相关数据集。
完整的数据集可以在 此处 下载。
如果您是研究人员,希望对我们的数据提出反馈或建议新的研究方向,请点击 此处 填写表格。
致谢
感谢 Jonathon Hazell、Anders Humlum、Molly Kinder、Anton Korinek、Benjamin Krause、Michael Kremer、John List、Ethan Mollick、Lilach Mollick、Arjun Ramani、Will Rinehart、Robert Seamans、Michael Webb 和 Chenzi Xu 针对本文的早期研究结果和草案提出的宝贵意见和讨论。
加入我们
如果您有兴趣加入 Anthropic,研究 AI 对劳动力市场的影响,欢迎申请我们的社会影响 研究科学家 和 研究工程师 职位。