这期视频来自 Emily Chang 对 Anthropic 联合创始人 Dario Amodei 和 Daniela Amodei 的一次深度访谈。它不只是讲 Claude 和 Anthropic 怎么从 OpenAI 出走团队一路长成 AI 竞赛里的关键玩家,也把更难回答的问题摆到了台面上:当一家 AI 公司一边强调安全,一边把模型推向软件开发、政府合作、军事系统和网络安全前线时,它到底还能不能守住自己最初的承诺?

访谈里谈到了 Anthropic 的创业起点、Claude 的产品哲学、Claude Code 对软件行业的冲击、AI 可能造成的就业震荡,以及 Anthropic 与五角大楼、Mythos 模型和 AI 监管之间的复杂拉扯。

本文由有道龙虾整理和发布,原视频来源:YouTube《Emily Chang meets Anthropic co-founders Dario and Daniela Amodei》。

一个不太像硅谷明星的 AI 明星

Dario Amodei 看起来不像那种典型的硅谷明星 CEO。

他不是靠一句句爽感十足的金句出圈,也不是那种永远对未来保持亢奋的人。恰恰相反,他最出名的地方,是不断提醒世界:人工智能可能很危险。

但现在,最戏剧性的地方来了。

这个一直警告 AI 风险的人,正带着自己的公司 Anthropic,站在 AI 竞赛最前排。Anthropic 从 2021 年一个由 OpenAI 离职者创办的小团队,变成了今天最受关注的 AI 公司之一,估值被推到接近万亿美元级别,产品 Claude 也成了许多开发者、企业和政府部门绕不开的名字。

他们一边说自己要做“负责任的 AI”,一边把 AI 推向代码、办公、国防、网络安全,甚至现代战争。

这就引出了一个真正的问题:

当你正在打造世界上最强大的技术时,你还能真心说自己是在保护人类吗?

从 OpenAI 出走:分歧不只是“安全路线”

Anthropic 的故事,要从 OpenAI 讲起。

Dario 出生在旧金山,父亲是皮革匠,母亲在图书馆工作。他小时候对第一次互联网浪潮几乎没兴趣,更迷恋数学、宇宙、科幻和那些能解释世界运行方式的问题。妹妹 Daniela Amodei 则更偏文学和艺术。两个人从小关系很近,也一直想一起做点“大事”。

后来,Dario 先研究神经科学,再进入百度、Google,最终在 2016 年加入刚成立不久的 OpenAI。Daniela 早期在 Stripe 工作,之后也加入了 OpenAI。

那时的 OpenAI 还是一个非营利组织,公开承诺要走向安全、开放、造福全人类的超级智能道路。

在 OpenAI,Dario 推动了一个后来影响整个行业的观点:Scaling Laws,规模定律。

简单说,就是大语言模型只要持续增加数据和算力,即使底层算法不发生巨大变化,也会变得越来越聪明。今天这听起来已经像常识,但在当时,并不是很多人相信“堆规模”能带来质变。

这条路线后来确实点燃了 OpenAI 的模型能力,也为 ChatGPT 的爆发铺路。

但 Amodei 兄妹最终选择离开。

外界常把这段故事简化成“他们和 Sam Altman 在安全问题上有分歧”。Dario 的说法更直接:分歧本身不是离开的充分理由,真正的问题是信任。

他说,当你觉得无法信任一个人,觉得对方宣称的价值观和实际行为不一致,觉得对方不够诚实时,就很难继续一起工作。

于是,他们选择了另一种解决方式:

你做你的,我做我的。

Anthropic 的理想:给 AI 写一部“宪法”

2021 年,Anthropic 成立。早期团队只有七位联合创始人。疫情期间,他们常在旧金山的 Precita Park 草坪上摆几把椅子,吃午饭,讨论自己到底要建一家什么样的公司。

到今天,Dario 仍然很自豪地说,Anthropic 是这个领域少见的、所有联合创始人还都留在公司的大规模 AI 公司。

从一开始,Anthropic 就把自己放在一个很特别的位置上:最重视安全的前沿 AI 公司。

公司名字 Anthropic 来自希腊语中“人类”的意思。它想表达的是,AI 不应该只是更聪明、更强大,还应该服务人类的长期利益。

这种理念也体现在 Claude 的设计上。

Claude 不是一个随便起的产品名。Anthropic 希望它有一种“专业的温暖感”:不是你的好朋友,也不是冷冰冰的工具,而是可接近、有距离、可靠、专业。

为了让 Claude 更安全,Anthropic 提出了所谓的 Constitutional AI,宪法式 AI。它会用一套原则来训练模型,让模型尽量避免撒谎、幻觉、有害输出,甚至避免刻意欺骗用户。

但问题很快就来了:

谁来定义“好”?谁的价值观会被写进 Claude?

Daniela 的回答是,没有一个放之四海而皆准的标准。但人类历史上有一些基础文件,比如《世界人权宣言》,可以作为训练 Claude 性格的参考。Anthropic 也开始和宗教领袖对话,试图寻找不同信仰之间共同的核心价值。

这听起来很理想主义,但实际做起来像调一个非常敏感的旋钮。

早期 Claude 有时会“过度关心”用户。用户只是问天气,它可能会像保姆一样说“我真的很担心你”。Daniela 开玩笑说,那些最夸张的版本幸好没有发布。

安全不是一个开关,而是一根很细的针。

真正让 Anthropic 爆发的,不是聊天,而是代码

Anthropic 的商业爆发,很大程度上来自一个判断:不要先去做最容易上瘾、最容易刷时间的消费娱乐应用,而是押注企业和编程。

Dario 对这个选择的解释很清楚:如果商业模式和价值观冲突,公司最终只有两条路,要么背叛自己的价值观,要么变得无关紧要。

他不喜欢社交媒体那套靠广告和注意力驱动的逻辑,也对 AI 视频里那些“垃圾内容”感到警惕。相比之下,企业场景更容易和 Anthropic 的价值观对齐:服务生物医药、学术研究、能源、软件工程,让 AI 真正变成生产力。

于是,Claude Code 出现了。

随后是 Claude Cowork。

它们让 Claude 不再只是回答问题,而是开始大规模参与软件工程。某些任务过去可能要几个小时甚至几天,现在几分钟就能做出雏形。

Anthropic 工程师 Boris Cherny 是关键人物之一。他曾在日本乡村过着慢节奏生活,逛农贸市场、做味噌。第一次使用 AI 聊天机器人时,他被震住了,于是决定回到这个行业中心。

他认为,当时很多 AI 编程产品还停留在“补全单词、补全句子”的阶段,而 Anthropic 想赌得更大:

编码智能体不是帮你写一行代码,而是可以接手整个工程任务。

Boris 说,在他的团队里,Claude 几乎写了所有代码。对他个人来说,过去至少六个月,自己 100% 的代码都由 Claude 写出。

工程师的工作变了。

以前是人写代码,AI 补几行。现在是人对多个 Claude 下达任务,让它们并行写代码、改代码、跑流程。Boris 形容这种感觉像突然有了超能力,像背上了喷气背包。

在一次演示中,他们让 Claude 做一个每周食谱推荐 App。几分钟后,Claude 给出了菜谱选项,还能点进具体做法。这个 Demo 不算震撼,但真正重要的是:很多原本需要专业开发时间的东西,开始被压缩到几分钟。

SaaS 行业为什么会紧张?

Claude Cowork 发布后,软件公司股票遭遇剧烈冲击。据视频提到,约 2850 亿美元市值一夜蒸发,交易员把它叫作 SaaSpocalypse,SaaS 末日

这不是因为所有软件马上都会消失,而是因为市场突然意识到:如果 AI 能直接完成很多软件本来提供的功能,传统 SaaS 的护城河可能会被重估。

Dario 的判断并不是“软件行业会变小”。他反而认为,AI 会让整个软件行业的蛋糕变大。

但问题是,蛋糕变大不代表每个旧玩家都能活得更好。

那些看不清趋势、找不到自己护城河、无法适应新形态的软件公司,可能会缩水,甚至出局。

这也是 Anthropic 让人不安的地方:它不是只做一个更好用的工具,它可能在重写整个软件产业的结构。

工程师会不会被自己造出来的 AI 替代?

这个问题很尖锐。

过去很长一段时间,软件工程师是数字经济里的赢家,是“书呆子的复仇”。但如果 AI 先自动化的就是写代码,那工程师会不会成为第一批受冲击的人?

Boris 的回答有点轻巧:也许以后每个人都会变成 nerd。

但真正的问题是,原来的 nerd 怎么办?

他的判断是,工程师不会立刻消失,因为工程不只是写代码。还要理解用户、规划产品、判断下一步、做架构取舍。这些能力仍然重要。懂技术的人反而有一个先发优势,因为他们更知道如何调度 AI。

Dario 则更直白,也更让人不舒服。

他曾预测,未来一到五年,AI 可能消灭一半入门级白领岗位。被问到现在这个数字是否更高时,他没有给出新数字,但说自己仍然非常担心。

他的逻辑是:一开始,AI 会让人更高效。自动化掉 90% 的工作后,人类在剩下的 10% 上被放大十倍,看起来生产力暴涨。

但如果自动化逼近 100% 呢?

那就不是“人更高效”,而是“AI 直接做掉这件事”。

这就是他认为社会必须提前讨论的问题:可能出现一种很奇怪的局面,GDP 高速增长,但失业率、低薪就业和不平等也同时上升。

他说,这不是 Anthropic 一家公司能解决的事,最终要由社会来解决。但公司有责任把它说出来,而不是假装没看见。

反对者说他在“贩卖焦虑”,他很不服

Dario 对就业风险的公开表达,引来了不少反击。

英伟达 CEO 黄仁勋等人曾提出类似观点:AI 是在改变任务,不等于消灭工作;说 AI 会大规模清除岗位,是在吓唬人。

也有人认为,Anthropic 一边制造焦虑,一边卖解决方案,这就是“末日营销”。

Dario 对此明显不满。

他说,自己在很多访谈和文章中都讲过如何应对风险,包括税收、宏观经济政策、新工作类型,以及任务和岗位之间的区别。但社交媒体喜欢截取三秒钟片段,把复杂讨论压扁成一句“末日来了”。

他甚至说,这种把认真讨论说成廉价营销的做法,本身才是廉价营销,是硅谷的一种病。

他的真实信息不是“末日已到”,而是:

这件事可能会发生,我们看到了它,所以要认真、积极地回应。

五年后的工作:人类还剩什么?

没人能准确预测哪些岗位会消失,哪些会重组。

Anthropic 曾发布研究,估算哪些行业会最早大量使用 AI。按这个趋势,管理、金融、法律等白领领域都可能发生显著变化。

Dario 认为,未来可能有几类人类工作仍然重要。

第一类是物理世界里的工作。建造、制造、维护现实世界的东西,仍然需要大量人类参与。

第二类是以人为中心的工作。很多人仍然希望和真人交流,尤其在信任、照护、关系密集的场景里。

第三类是指挥和校准 AI 的工作。AI 最终还是要服从某些人的价值观和目标,人类需要决定它往哪里走。

Daniela 举了医疗的例子。

未来 AI 可能很擅长诊断,能告诉你可能得了什么病、应该做哪些检查。但它不能真正触摸你、检查你,也不能以一个人的方式坐在床边问你:“你现在感觉怎么样?你怎么面对这件事?”

所以医生的工作可能会从“诊断专家”更多转向“人与人之间的陪伴、判断和沟通”。

这听起来是希望,但也有不确定性。

因为没人知道,这些新位置够不够多,转型速度能不能赶上失业速度。

“反战者”为什么和五角大楼合作?

Anthropic 最复杂、也最容易引发争议的地方,是军事应用。

Dario 年轻时在加州理工就以反战立场出名。他相信科学家不能躲在象牙塔里,对技术的社会后果装作无辜。

但后来,Anthropic 成为最早和美国国防部签约、让 AI 进入机密网络的公司之一。

这看起来很矛盾。

Dario 的解释是,世界变了。俄乌战争、中国大陆与台湾的风险、威权国家重新抬头,都让他认为民主国家需要自我防卫。

他支持对中国实施 AI 芯片出口管制,甚至把向中国出售先进芯片类比成向朝鲜出售核武器。即使这会让芯片合作伙伴不高兴,他也坚持公开表达。

他也说,Anthropic 会尽量限制与政府合作的边界,比如不与 ICE 或 CBP 合作,也不认为自己在加沙相关场景中提供服务。

但现实很快变得更棘手。

2025 年,Anthropic 与 OpenAI、xAI、Google 一起赢得了五角大楼 2 亿美元合同。之后,Claude 被报道用于美国军事行动。随后,美国国防部要求 Anthropic 允许无护栏使用 AI 技术。Anthropic 画出了红线,拒绝让 Claude 用于大规模监控和自主武器。

于是冲突爆发。

公司被五角大楼封禁,也遭到特朗普和国防部长 Pete Hegseth 的攻击,甚至被骂成“意识形态疯子”。

Dario 的态度是,这不是一场“战争”,而是一场关于政府如何正确使用 AI 的辩论。

Claude 能帮军队更快杀人吗?

访谈里最尖锐的一段,是关于 AI 辅助打击。

有美国官员说,在大语言模型帮助下,美军每天可打击目标从 1000 个提升到 5000 个。主持人直接问:这意味着 Claude 能帮助更快杀死更多人,你对此舒服吗?

Dario 的回答是,他相信美国,希望美国在世界舞台上更强大。但他也说,一旦公司提供技术,就不能逐个军事行动判断“这个可以,那个不可以”。具体政策应该由军事决策者负责。

更尖锐的问题接着来了。

据报道,Claude 通过 Palantir 的 Maven Smart System,被用于美军在伊朗战争中的 AI 辅助目标识别。一次导弹袭击误中伊朗一所女校,造成 150 多人死亡,其中多数是儿童。

Claude 是否参与了那次打击?

Dario 说,他们不知道模型具体如何被使用。他承认战争中的错误极其可怕,也说这种事件正说明“人类必须做最终决定”这个原则有多重要。

Anthropic 的红线不是“AI 不能辅助军事”,而是不能让 AI 自主决定杀戮,不能用于大规模监控,不能越过人类决策。

这依然留下一个很难回答的问题:

如果 AI 只是“辅助”,但它给出的信息影响了人类判断,那么责任到底在哪里?

AI 会阻止战争,还是引发战争?

Dario 认为,如果使用得当,AI 更可能阻止美中战争,而不是促成战争。

他的理由是,AI 可以用于情报收集和预警。比如提前预测台海或乌克兰方向的军事行动,让对手知道自己的动作已被看见,从而降低冒险意愿。

但他也承认,如果没有限制,AI 也可能让战争更危险。

他提到《奇爱博士》里的末日装置:系统一旦判断受到核攻击,就自动发射核武器。问题是,如果机器误判呢?

战争常常来自误解、误判、双方同时紧张地跳向对方。如果 AI 进入这个链条,却缺乏监督,事故会更容易发生。

所以 Anthropic 的立场很微妙:

AI 可以进入国家安全领域,但不能无边界地进入。

Mythos:强到让客户说“别发布”

在 Anthropic 的故事里,还有一个更像科幻片的章节:Mythos。

这是一个新 AI 模型,强到连 Anthropic 自己都害怕。

Mythos 在网络安全上的能力出现了大跳跃。它能够识别成千上万个漏洞,暴露几乎所有主流操作系统里的潜在问题。Anthropic 判断,如果完全发布,它可能被用来攻击银行、撬开国家机密、瘫痪关键基础设施。

一些早期试用公司甚至说:

“这是超级武器,应该持枪证才能用。请不要发布。”

于是 Anthropic 启动了 Project Glasswing,只向少数组织开放 Mythos,包括一些被认为能用于防御的机构。讽刺的是,哪怕 Anthropic 被五角大楼封禁,美国国家安全机构仍然希望使用它。

Dario 把未来描述成猫鼠游戏:好人需要工具防御坏人;坏人迟早也会得到类似能力;到那时,好人必须拥有更强的模型。

但这又带来另一个问题:

凭什么由 Anthropic 决定谁是好人,谁能拿到模型?

Daniela 的说法是,这不是他们想享受权力,而是基于一个非常具体的网络安全风险,不得不画圈。他们知道这不可能完美,只能尽量公开说明自己的判断。

Dario 也否认这是营销。他说,Anthropic 不发布 Mythos,已经承受了巨大的商业损失。这个模型能极大加速内部研究和下一代模型生产,如果开放给外部,也会有巨大商业价值。

但他们选择把谨慎的旋钮再往前拧一点。

私营公司掌握超级技术,是不是本身就不稳定?

Dario 承认,政府是否应该介入 AI,是一个非常严肃的问题。

他不赞成政府直接接管 Anthropic,但他也认为,AI 由私营公司率先建成,本身就是一个危险而不稳定的局面。

核武器、互联网、GPS、手机,这些历史上重要的强技术,几乎都由政府建造或起源于政府项目。AI 则不同,它主要在私营部门爆发,政府是后来才入场的。

Dario 说,他既害怕公司掌握这种技术,也害怕政府掌握这种技术。

所以他主张的是中间道路:基础监管、发布前测试、模型审计,而不是完全放任,也不是政府一把抓。

这和硅谷一部分人的态度形成鲜明对比。

在他看来,有些人一开始极端反监管,认为透明度、出口控制都会扼杀创新;等看到第一个真实危险,又突然跳到另一个极端,开始谈国有化、政府接管。

Dario 觉得这像钟摆乱甩。

他想要的是更稳定的中间方案:承认 AI 的力量,不否认风险,也不恐慌。

Anthropic 真能比上一代科技公司做得好吗?

今天,公众对 AI 的情绪并不轻松。

有些人非常喜欢 Anthropic,觉得它是最认真谈安全的公司;也有人在 Anthropic 办公室外抗议,担心 AI 带来的失业、军事化、监控和权力集中。

数据也显示,很多人对 AI 的担忧超过兴奋。即便是那些正在建造 AI 的人,也承认他们并不知道一切会如何发展。

Daniela 说,看到 Sam Altman 的家遭到袭击时,她很害怕,也很庆幸他和家人没事。她希望所有关于 AI 的争论都尽可能和平。

Dario 也承认,这是指数曲线的另一面。AI 越重要,社会关注越多,冲突也越容易变得私人化。

他们经常拿社交媒体作反面教材。

社交媒体公司曾经也说自己在连接世界,后来却面对儿童心理健康、选举诚信、成瘾和社会撕裂等一系列问题。Daniela 说,AI 公司很幸运,因为它们是第二个上场的人,可以提前看到这些坑。

她不想等灾难发生后再解释“其实没问题”。

Dario 更直接:如果 AI 真出了大问题,被封禁或限制也不是不可能;如果问题足够严重,也许它确实应该被封禁。

“我们为什么该信任你?”

文章最后,问题回到最根本的地方。

Google 曾经有一句口号:Don’t be evil,不作恶。后来公司变大,口号被悄悄淡化。

Anthropic 今天也在说类似的话:我们不一样,我们更安全,我们想做对的事。

但他们也在变大,也在赚钱,也在和政府、军方、企业、资本市场深度绑定。

所以主持人问 Dario:你们正在建造极其强大的东西,也会从中获得巨大利益,我们为什么要信任你?

Dario 的回答没有要求大家立刻相信。他说,如果不了解 Anthropic,从不信任开始是合理的。硅谷已经失去了很多世界的信任,必须重新挣回来。

他说,Anthropic 想证明自己不同,但这不是靠宣言,而是靠实际行动。

他也谈到自己喜欢《原子弹秘史》,但相比奥本海默,他更认同 Leo Szilard,那个最早意识到链式反应可能存在的人。

在他看来,AI 不能靠某个大人物站在中心拯救世界。真正需要的是制衡:公司之间、政府之间、公众之间、制度之间,都要有 checks and balances。

他曾说,AI 带来文明崩溃的概率可能在 10% 到 25% 之间。这是一个高得吓人的数字。

当被问到 Anthropic 自己建造的东西是否可能导致灾难时,他说当然希望不会,但风险永远不可能是零。

他用了一个航空公司的比喻:你可以把自己的航空公司做得比别人安全十倍,但你不能保证飞机永远不会坠毁。

主持人追问:如果一架飞机有 25% 的坠毁概率,你不会坐上去。

Dario 承认:是的,25% 太高了。Anthropic 的目标,就是把这个概率降得更低、更低。

最后的矛盾,也许无法消失

Anthropic 最难理解的地方,恰恰是它最真实的地方。

它相信 AI 可能带来乌托邦式的未来:人类和机器并肩工作,疾病被更快攻克,能源更便宜,科学进展加速,生产力大幅提升。

它也相信 AI 可能造成失业、军事误用、网络攻击、权力集中,甚至文明级风险。

所以它一边加速,一边刹车。

一边发布 Claude Code、Claude Cowork,让 AI 更深入地进入工作;一边限制 Mythos,不敢把最强能力完全交出去。

一边和政府合作,一边又对政府画红线。

一边说 AI 不可避免,一边说必须提前管住它。

这不是一个容易让人安心的故事。

但它可能是这一代 AI 公司最接近现实的处境:没有纯粹的好人,也没有简单的按钮。只有一群掌握巨大杠杆的人,在速度、利润、国家安全、就业、伦理和恐惧之间不断做交易。

Dario 说,他对 AI 的态度是:希望最好的结果,但为最坏的情况做准备。

问题是,准备得够不够,不只取决于 Anthropic。

也取决于我们是否愿意在一切真的失控之前,把这些争论摊开来说。