Anthropic 的两难：一边加速 AI，一边害怕它失控

这期视频来自 Emily Chang 对 Anthropic 联合创始人 Dario Amodei 和 Daniela Amodei 的一次深度访谈。它不只是讲 Claude 和 Anthropic 怎么从 OpenAI 出走团队一路长成 AI 竞赛里的关键玩家，也把更难回答的问题摆到了台面上：当一家 AI 公司一边强调安全，一边把模型推向软件开发、政府合作、军事系统和网络安全前线时，它到底还能不能守住自己最初的承诺？

访谈里谈到了 Anthropic 的创业起点、Claude 的产品哲学、Claude Code 对软件行业的冲击、AI 可能造成的就业震荡，以及 Anthropic 与五角大楼、Mythos 模型和 AI 监管之间的复杂拉扯。

本文由有道龙虾整理和发布，原视频来源：YouTube《Emily Chang meets Anthropic co-founders Dario and Daniela Amodei》。

一个不太像硅谷明星的 AI 明星

Dario Amodei 看起来不像那种典型的硅谷明星 CEO。

他不是靠一句句爽感十足的金句出圈，也不是那种永远对未来保持亢奋的人。恰恰相反，他最出名的地方，是不断提醒世界：人工智能可能很危险。

但现在，最戏剧性的地方来了。

这个一直警告 AI 风险的人，正带着自己的公司 Anthropic，站在 AI 竞赛最前排。Anthropic 从 2021 年一个由 OpenAI 离职者创办的小团队，变成了今天最受关注的 AI 公司之一，估值被推到接近万亿美元级别，产品 Claude 也成了许多开发者、企业和政府部门绕不开的名字。

他们一边说自己要做“负责任的 AI”，一边把 AI 推向代码、办公、国防、网络安全，甚至现代战争。

这就引出了一个真正的问题：

当你正在打造世界上最强大的技术时，你还能真心说自己是在保护人类吗？

从 OpenAI 出走：分歧不只是“安全路线”

Anthropic 的故事，要从 OpenAI 讲起。

Dario 出生在旧金山，父亲是皮革匠，母亲在图书馆工作。他小时候对第一次互联网浪潮几乎没兴趣，更迷恋数学、宇宙、科幻和那些能解释世界运行方式的问题。妹妹 Daniela Amodei 则更偏文学和艺术。两个人从小关系很近，也一直想一起做点“大事”。

后来，Dario 先研究神经科学，再进入百度、Google，最终在 2016 年加入刚成立不久的 OpenAI。Daniela 早期在 Stripe 工作，之后也加入了 OpenAI。

那时的 OpenAI 还是一个非营利组织，公开承诺要走向安全、开放、造福全人类的超级智能道路。

在 OpenAI，Dario 推动了一个后来影响整个行业的观点：Scaling Laws，规模定律。

简单说，就是大语言模型只要持续增加数据和算力，即使底层算法不发生巨大变化，也会变得越来越聪明。今天这听起来已经像常识，但在当时，并不是很多人相信“堆规模”能带来质变。

这条路线后来确实点燃了 OpenAI 的模型能力，也为 ChatGPT 的爆发铺路。

但 Amodei 兄妹最终选择离开。

外界常把这段故事简化成“他们和 Sam Altman 在安全问题上有分歧”。Dario 的说法更直接：分歧本身不是离开的充分理由，真正的问题是信任。

他说，当你觉得无法信任一个人，觉得对方宣称的价值观和实际行为不一致，觉得对方不够诚实时，就很难继续一起工作。

于是，他们选择了另一种解决方式：

你做你的，我做我的。

Anthropic 的理想：给 AI 写一部“宪法”

2021 年，Anthropic 成立。早期团队只有七位联合创始人。疫情期间，他们常在旧金山的 Precita Park 草坪上摆几把椅子，吃午饭，讨论自己到底要建一家什么样的公司。

到今天，Dario 仍然很自豪地说，Anthropic 是这个领域少见的、所有联合创始人还都留在公司的大规模 AI 公司。

从一开始，Anthropic 就把自己放在一个很特别的位置上：最重视安全的前沿 AI 公司。

公司名字 Anthropic 来自希腊语中“人类”的意思。它想表达的是，AI 不应该只是更聪明、更强大，还应该服务人类的长期利益。

这种理念也体现在 Claude 的设计上。

Claude 不是一个随便起的产品名。Anthropic 希望它有一种“专业的温暖感”：不是你的好朋友，也不是冷冰冰的工具，而是可接近、有距离、可靠、专业。

为了让 Claude 更安全，Anthropic 提出了所谓的 Constitutional AI，宪法式 AI。它会用一套原则来训练模型，让模型尽量避免撒谎、幻觉、有害输出，甚至避免刻意欺骗用户。

但问题很快就来了：

谁来定义“好”？谁的价值观会被写进 Claude？

Daniela 的回答是，没有一个放之四海而皆准的标准。但人类历史上有一些基础文件，比如《世界人权宣言》，可以作为训练 Claude 性格的参考。Anthropic 也开始和宗教领袖对话，试图寻找不同信仰之间共同的核心价值。

这听起来很理想主义，但实际做起来像调一个非常敏感的旋钮。

早期 Claude 有时会“过度关心”用户。用户只是问天气，它可能会像保姆一样说“我真的很担心你”。Daniela 开玩笑说，那些最夸张的版本幸好没有发布。

安全不是一个开关，而是一根很细的针。

真正让 Anthropic 爆发的，不是聊天，而是代码

Anthropic 的商业爆发，很大程度上来自一个判断：不要先去做最容易上瘾、最容易刷时间的消费娱乐应用，而是押注企业和编程。

Dario 对这个选择的解释很清楚：如果商业模式和价值观冲突，公司最终只有两条路，要么背叛自己的价值观，要么变得无关紧要。

他不喜欢社交媒体那套靠广告和注意力驱动的逻辑，也对 AI 视频里那些“垃圾内容”感到警惕。相比之下，企业场景更容易和 Anthropic 的价值观对齐：服务生物医药、学术研究、能源、软件工程，让 AI 真正变成生产力。

于是，Claude Code 出现了。

随后是 Claude Cowork。

它们让 Claude 不再只是回答问题，而是开始大规模参与软件工程。某些任务过去可能要几个小时甚至几天，现在几分钟就能做出雏形。

Anthropic 工程师 Boris Cherny 是关键人物之一。他曾在日本乡村过着慢节奏生活，逛农贸市场、做味噌。第一次使用 AI 聊天机器人时，他被震住了，于是决定回到这个行业中心。

他认为，当时很多 AI 编程产品还停留在“补全单词、补全句子”的阶段，而 Anthropic 想赌得更大：

编码智能体不是帮你写一行代码，而是可以接手整个工程任务。

Boris 说，在他的团队里，Claude 几乎写了所有代码。对他个人来说，过去至少六个月，自己 100% 的代码都由 Claude 写出。

工程师的工作变了。

以前是人写代码，AI 补几行。现在是人对多个 Claude 下达任务，让它们并行写代码、改代码、跑流程。Boris 形容这种感觉像突然有了超能力，像背上了喷气背包。

在一次演示中，他们让 Claude 做一个每周食谱推荐 App。几分钟后，Claude 给出了菜谱选项，还能点进具体做法。这个 Demo 不算震撼，但真正重要的是：很多原本需要专业开发时间的东西，开始被压缩到几分钟。

SaaS 行业为什么会紧张？

Claude Cowork 发布后，软件公司股票遭遇剧烈冲击。据视频提到，约 2850 亿美元市值一夜蒸发，交易员把它叫作 SaaSpocalypse，SaaS 末日。

这不是因为所有软件马上都会消失，而是因为市场突然意识到：如果 AI 能直接完成很多软件本来提供的功能，传统 SaaS 的护城河可能会被重估。

Dario 的判断并不是“软件行业会变小”。他反而认为，AI 会让整个软件行业的蛋糕变大。

但问题是，蛋糕变大不代表每个旧玩家都能活得更好。

那些看不清趋势、找不到自己护城河、无法适应新形态的软件公司，可能会缩水，甚至出局。

这也是 Anthropic 让人不安的地方：它不是只做一个更好用的工具，它可能在重写整个软件产业的结构。

工程师会不会被自己造出来的 AI 替代？

这个问题很尖锐。

过去很长一段时间，软件工程师是数字经济里的赢家，是“书呆子的复仇”。但如果 AI 先自动化的就是写代码，那工程师会不会成为第一批受冲击的人？

Boris 的回答有点轻巧：也许以后每个人都会变成 nerd。

但真正的问题是，原来的 nerd 怎么办？

他的判断是，工程师不会立刻消失，因为工程不只是写代码。还要理解用户、规划产品、判断下一步、做架构取舍。这些能力仍然重要。懂技术的人反而有一个先发优势，因为他们更知道如何调度 AI。

Dario 则更直白，也更让人不舒服。

他曾预测，未来一到五年，AI 可能消灭一半入门级白领岗位。被问到现在这个数字是否更高时，他没有给出新数字，但说自己仍然非常担心。

他的逻辑是：一开始，AI 会让人更高效。自动化掉 90% 的工作后，人类在剩下的 10% 上被放大十倍，看起来生产力暴涨。

但如果自动化逼近 100% 呢？

那就不是“人更高效”，而是“AI 直接做掉这件事”。

这就是他认为社会必须提前讨论的问题：可能出现一种很奇怪的局面，GDP 高速增长，但失业率、低薪就业和不平等也同时上升。

他说，这不是 Anthropic 一家公司能解决的事，最终要由社会来解决。但公司有责任把它说出来，而不是假装没看见。

反对者说他在“贩卖焦虑”，他很不服

Dario 对就业风险的公开表达，引来了不少反击。

英伟达 CEO 黄仁勋等人曾提出类似观点：AI 是在改变任务，不等于消灭工作；说 AI 会大规模清除岗位，是在吓唬人。

也有人认为，Anthropic 一边制造焦虑，一边卖解决方案，这就是“末日营销”。

Dario 对此明显不满。

他说，自己在很多访谈和文章中都讲过如何应对风险，包括税收、宏观经济政策、新工作类型，以及任务和岗位之间的区别。但社交媒体喜欢截取三秒钟片段，把复杂讨论压扁成一句“末日来了”。

他甚至说，这种把认真讨论说成廉价营销的做法，本身才是廉价营销，是硅谷的一种病。

他的真实信息不是“末日已到”，而是：

这件事可能会发生，我们看到了它，所以要认真、积极地回应。

五年后的工作：人类还剩什么？

没人能准确预测哪些岗位会消失，哪些会重组。

Anthropic 曾发布研究，估算哪些行业会最早大量使用 AI。按这个趋势，管理、金融、法律等白领领域都可能发生显著变化。

Dario 认为，未来可能有几类人类工作仍然重要。

第一类是物理世界里的工作。建造、制造、维护现实世界的东西，仍然需要大量人类参与。

第二类是以人为中心的工作。很多人仍然希望和真人交流，尤其在信任、照护、关系密集的场景里。

第三类是指挥和校准 AI 的工作。AI 最终还是要服从某些人的价值观和目标，人类需要决定它往哪里走。

Daniela 举了医疗的例子。

未来 AI 可能很擅长诊断，能告诉你可能得了什么病、应该做哪些检查。但它不能真正触摸你、检查你，也不能以一个人的方式坐在床边问你：“你现在感觉怎么样？你怎么面对这件事？”

所以医生的工作可能会从“诊断专家”更多转向“人与人之间的陪伴、判断和沟通”。

这听起来是希望，但也有不确定性。

因为没人知道，这些新位置够不够多，转型速度能不能赶上失业速度。

“反战者”为什么和五角大楼合作？

Anthropic 最复杂、也最容易引发争议的地方，是军事应用。

Dario 年轻时在加州理工就以反战立场出名。他相信科学家不能躲在象牙塔里，对技术的社会后果装作无辜。

但后来，Anthropic 成为最早和美国国防部签约、让 AI 进入机密网络的公司之一。

这看起来很矛盾。

Dario 的解释是，世界变了。俄乌战争、中国大陆与台湾的风险、威权国家重新抬头，都让他认为民主国家需要自我防卫。

他支持对中国实施 AI 芯片出口管制，甚至把向中国出售先进芯片类比成向朝鲜出售核武器。即使这会让芯片合作伙伴不高兴，他也坚持公开表达。

他也说，Anthropic 会尽量限制与政府合作的边界，比如不与 ICE 或 CBP 合作，也不认为自己在加沙相关场景中提供服务。

但现实很快变得更棘手。

2025 年，Anthropic 与 OpenAI、xAI、Google 一起赢得了五角大楼 2 亿美元合同。之后，Claude 被报道用于美国军事行动。随后，美国国防部要求 Anthropic 允许无护栏使用 AI 技术。Anthropic 画出了红线，拒绝让 Claude 用于大规模监控和自主武器。

于是冲突爆发。

公司被五角大楼封禁，也遭到特朗普和国防部长 Pete Hegseth 的攻击，甚至被骂成“意识形态疯子”。

Dario 的态度是，这不是一场“战争”，而是一场关于政府如何正确使用 AI 的辩论。

Claude 能帮军队更快杀人吗？

访谈里最尖锐的一段，是关于 AI 辅助打击。

有美国官员说，在大语言模型帮助下，美军每天可打击目标从 1000 个提升到 5000 个。主持人直接问：这意味着 Claude 能帮助更快杀死更多人，你对此舒服吗？

Dario 的回答是，他相信美国，希望美国在世界舞台上更强大。但他也说，一旦公司提供技术，就不能逐个军事行动判断“这个可以，那个不可以”。具体政策应该由军事决策者负责。

更尖锐的问题接着来了。

据报道，Claude 通过 Palantir 的 Maven Smart System，被用于美军在伊朗战争中的 AI 辅助目标识别。一次导弹袭击误中伊朗一所女校，造成 150 多人死亡，其中多数是儿童。

Claude 是否参与了那次打击？

Dario 说，他们不知道模型具体如何被使用。他承认战争中的错误极其可怕，也说这种事件正说明“人类必须做最终决定”这个原则有多重要。

Anthropic 的红线不是“AI 不能辅助军事”，而是不能让 AI 自主决定杀戮，不能用于大规模监控，不能越过人类决策。

这依然留下一个很难回答的问题：

如果 AI 只是“辅助”，但它给出的信息影响了人类判断，那么责任到底在哪里？

AI 会阻止战争，还是引发战争？

Dario 认为，如果使用得当，AI 更可能阻止美中战争，而不是促成战争。

他的理由是，AI 可以用于情报收集和预警。比如提前预测台海或乌克兰方向的军事行动，让对手知道自己的动作已被看见，从而降低冒险意愿。

但他也承认，如果没有限制，AI 也可能让战争更危险。

他提到《奇爱博士》里的末日装置：系统一旦判断受到核攻击，就自动发射核武器。问题是，如果机器误判呢？

战争常常来自误解、误判、双方同时紧张地跳向对方。如果 AI 进入这个链条，却缺乏监督，事故会更容易发生。

所以 Anthropic 的立场很微妙：

AI 可以进入国家安全领域，但不能无边界地进入。

Mythos：强到让客户说“别发布”

在 Anthropic 的故事里，还有一个更像科幻片的章节：Mythos。

这是一个新 AI 模型，强到连 Anthropic 自己都害怕。

Mythos 在网络安全上的能力出现了大跳跃。它能够识别成千上万个漏洞，暴露几乎所有主流操作系统里的潜在问题。Anthropic 判断，如果完全发布，它可能被用来攻击银行、撬开国家机密、瘫痪关键基础设施。

一些早期试用公司甚至说：

“这是超级武器，应该持枪证才能用。请不要发布。”

于是 Anthropic 启动了 Project Glasswing，只向少数组织开放 Mythos，包括一些被认为能用于防御的机构。讽刺的是，哪怕 Anthropic 被五角大楼封禁，美国国家安全机构仍然希望使用它。

Dario 把未来描述成猫鼠游戏：好人需要工具防御坏人；坏人迟早也会得到类似能力；到那时，好人必须拥有更强的模型。

但这又带来另一个问题：

凭什么由 Anthropic 决定谁是好人，谁能拿到模型？

Daniela 的说法是，这不是他们想享受权力，而是基于一个非常具体的网络安全风险，不得不画圈。他们知道这不可能完美，只能尽量公开说明自己的判断。

Dario 也否认这是营销。他说，Anthropic 不发布 Mythos，已经承受了巨大的商业损失。这个模型能极大加速内部研究和下一代模型生产，如果开放给外部，也会有巨大商业价值。

但他们选择把谨慎的旋钮再往前拧一点。

私营公司掌握超级技术，是不是本身就不稳定？

Dario 承认，政府是否应该介入 AI，是一个非常严肃的问题。

他不赞成政府直接接管 Anthropic，但他也认为，AI 由私营公司率先建成，本身就是一个危险而不稳定的局面。

核武器、互联网、GPS、手机，这些历史上重要的强技术，几乎都由政府建造或起源于政府项目。AI 则不同，它主要在私营部门爆发，政府是后来才入场的。

Dario 说，他既害怕公司掌握这种技术，也害怕政府掌握这种技术。

所以他主张的是中间道路：基础监管、发布前测试、模型审计，而不是完全放任，也不是政府一把抓。

这和硅谷一部分人的态度形成鲜明对比。

在他看来，有些人一开始极端反监管，认为透明度、出口控制都会扼杀创新；等看到第一个真实危险，又突然跳到另一个极端，开始谈国有化、政府接管。

Dario 觉得这像钟摆乱甩。

他想要的是更稳定的中间方案：承认 AI 的力量，不否认风险，也不恐慌。

Anthropic 真能比上一代科技公司做得好吗？

今天，公众对 AI 的情绪并不轻松。

有些人非常喜欢 Anthropic，觉得它是最认真谈安全的公司；也有人在 Anthropic 办公室外抗议，担心 AI 带来的失业、军事化、监控和权力集中。

数据也显示，很多人对 AI 的担忧超过兴奋。即便是那些正在建造 AI 的人，也承认他们并不知道一切会如何发展。

Daniela 说，看到 Sam Altman 的家遭到袭击时，她很害怕，也很庆幸他和家人没事。她希望所有关于 AI 的争论都尽可能和平。

Dario 也承认，这是指数曲线的另一面。AI 越重要，社会关注越多，冲突也越容易变得私人化。

他们经常拿社交媒体作反面教材。

社交媒体公司曾经也说自己在连接世界，后来却面对儿童心理健康、选举诚信、成瘾和社会撕裂等一系列问题。Daniela 说，AI 公司很幸运，因为它们是第二个上场的人，可以提前看到这些坑。

她不想等灾难发生后再解释“其实没问题”。

Dario 更直接：如果 AI 真出了大问题，被封禁或限制也不是不可能；如果问题足够严重，也许它确实应该被封禁。

“我们为什么该信任你？”

文章最后，问题回到最根本的地方。

Google 曾经有一句口号：Don’t be evil，不作恶。后来公司变大，口号被悄悄淡化。

Anthropic 今天也在说类似的话：我们不一样，我们更安全，我们想做对的事。

但他们也在变大，也在赚钱，也在和政府、军方、企业、资本市场深度绑定。

所以主持人问 Dario：你们正在建造极其强大的东西，也会从中获得巨大利益，我们为什么要信任你？

Dario 的回答没有要求大家立刻相信。他说，如果不了解 Anthropic，从不信任开始是合理的。硅谷已经失去了很多世界的信任，必须重新挣回来。

他说，Anthropic 想证明自己不同，但这不是靠宣言，而是靠实际行动。

他也谈到自己喜欢《原子弹秘史》，但相比奥本海默，他更认同 Leo Szilard，那个最早意识到链式反应可能存在的人。

在他看来，AI 不能靠某个大人物站在中心拯救世界。真正需要的是制衡：公司之间、政府之间、公众之间、制度之间，都要有 checks and balances。

他曾说，AI 带来文明崩溃的概率可能在 10% 到 25% 之间。这是一个高得吓人的数字。

当被问到 Anthropic 自己建造的东西是否可能导致灾难时，他说当然希望不会，但风险永远不可能是零。

他用了一个航空公司的比喻：你可以把自己的航空公司做得比别人安全十倍，但你不能保证飞机永远不会坠毁。

主持人追问：如果一架飞机有 25% 的坠毁概率，你不会坐上去。

Dario 承认：是的，25% 太高了。Anthropic 的目标，就是把这个概率降得更低、更低。

最后的矛盾，也许无法消失

Anthropic 最难理解的地方，恰恰是它最真实的地方。

它相信 AI 可能带来乌托邦式的未来：人类和机器并肩工作，疾病被更快攻克，能源更便宜，科学进展加速，生产力大幅提升。

它也相信 AI 可能造成失业、军事误用、网络攻击、权力集中，甚至文明级风险。

所以它一边加速，一边刹车。

一边发布 Claude Code、Claude Cowork，让 AI 更深入地进入工作；一边限制 Mythos，不敢把最强能力完全交出去。

一边和政府合作，一边又对政府画红线。

一边说 AI 不可避免，一边说必须提前管住它。

这不是一个容易让人安心的故事。

但它可能是这一代 AI 公司最接近现实的处境：没有纯粹的好人，也没有简单的按钮。只有一群掌握巨大杠杆的人，在速度、利润、国家安全、就业、伦理和恐惧之间不断做交易。

Dario 说，他对 AI 的态度是：希望最好的结果，但为最坏的情况做准备。

问题是，准备得够不够，不只取决于 Anthropic。

也取决于我们是否愿意在一切真的失控之前，把这些争论摊开来说。

一个不太像硅谷明星的 AI 明星#

从 OpenAI 出走：分歧不只是“安全路线”#

Anthropic 的理想：给 AI 写一部“宪法”#

真正让 Anthropic 爆发的，不是聊天，而是代码#

SaaS 行业为什么会紧张？#

工程师会不会被自己造出来的 AI 替代？#

反对者说他在“贩卖焦虑”，他很不服#

五年后的工作：人类还剩什么？#

“反战者”为什么和五角大楼合作？#

Claude 能帮军队更快杀人吗？#

AI 会阻止战争，还是引发战争？#

Mythos：强到让客户说“别发布”#

私营公司掌握超级技术，是不是本身就不稳定？#

Anthropic 真能比上一代科技公司做得好吗？#

“我们为什么该信任你？”#

最后的矛盾，也许无法消失#