Anthropic CEO 达里奥·阿莫迪深度访谈:解密AI背后的指数级商业引擎与“AGI信仰者”文化

本文整理自 John Collison 对 Anthropic CEO Dario Amodei的 深度访谈,带你 5 分钟了解这篇访谈的精华。 当一家公司在一年内将年化收入(ARR)从0做到1亿美元,第二年又从1亿冲向10亿,并在第三年过半时轻松突破40亿美元,你很难不感到好奇。这家公司就是前沿AI实验室Anthropic,而坐在驾驶座上的是其CEO——达里奥·阿莫迪(Dario Amodei)。 从物理学家到计算神经科学家,再到谷歌大脑、OpenAI的核心研究员,达里奥的履历闪闪发光。但如今,他不仅是技术领袖,更是一家全球增长最快企业的掌舵人。在这次深度对话中,他以前所未有的坦诚,揭示了Anthropic火箭般增长背后的商业逻辑、独特的公司文化,以及他对AI未来的深刻洞见。 一切始于信任:七位联合创始人与“反常识”的股权结构 很多人会好奇,和自己的亲兄妹一起创业是种怎样的体验?达里奥的妹妹丹妮拉(Daniela)正是公司的总裁。达里奥笑着说,这其实是一种绝佳的互补。他负责战略,思考那些别人没看到或最重要的事;而丹妮拉则负责将战略落地,高效执行。他们各司其职,彼此拥有绝对的信任。 但Anthropic的“反常识”之处远不止于此。公司创立之初,竟有七位联合创始人。当时几乎所有人都警告他:“这简直是场灾难,公司很快就会在内斗中分崩离析。”更让人大跌眼镜的是,达里奥决定给每位联合创始人完全相同的股权。 “事实证明,这恰恰是我们力量的源泉。”达里奥解释道。这七个人不仅是同事,更是长期并肩作战、价值观高度一致的伙伴。这种深度的信任基础,让公司在指数级扩张的过程中,依然能牢牢守住核心价值观和团结。七位创始人就像七个灯塔,将公司的理念投射到不断壮大的团队中。 AI的商业引擎:像开发新药一样,打造一个个“盈利公司” Anthropic的增长速度堪称商业史上的奇迹。达里奥分享了他们令人难以置信的融资经历: 2023年初,公司收入为零。他向投资者预测当年能实现1亿美元营收。许多人认为他“疯了”、“失去了所有信誉”。结果,他们做到了。 2024年初,他预测能从1亿美元增长到10亿美元。质疑声依旧,但他们再次做到了。 如今,公司的年化收入已远超40亿美元。 这种指数级增长的背后,是一种完全不同于传统软件的商业模式。达里奥将其类比为药物研发。 “你可以把我们训练的每一个模型,都看作一个独立的公司。” 想象一下这个场景: 2023年:你投入1亿美元训练一个模型(就像研发一款新药)。 2024年:这个模型为你带来了2亿美元的收入。从单个项目看,它是盈利的。 但与此同时,在2024年,你基于技术进步,又投入了10亿美元去训练一个更强大的下一代模型。 2025年:这个10亿美元的模型可能会带来20亿美元的收入,但你可能又会投入100亿美元去研发下一个…… 从传统的损益表(P&L)来看,公司似乎一直在“亏损”,而且亏损额越来越大。但如果我们把每个模型看作一个独立的产品(或一家公司),它们实际上是盈利的。真正发生的是,公司在享受上一代模型带来的回报时,正以前所未有的规模对下一代技术进行更庞大的研发投资。 “我们正处在这条指数曲线上,”达里奥说,“这条曲线何时会放缓?我们会在多大的规模上达到平衡?这是我们每天都在面对的不确定性,也是这个领域最迷人的地方。” 他半开玩笑地补充道,这种商业增长与模型能力的提升存在一种“换算关系”。当你投入10倍的资源,模型能力从“聪明的本科生”跃升为“聪明的博士生”,客户(比如一家制药公司)会发现,后者的价值远远超过前者的10倍。这就像模型自身就有一种学习和在市场上取得成功的内在资本主义冲动,而产品和市场团队的工作,就是“擦亮窗户,让光芒照射进来”。 钱从哪儿来?编码只是冰山一角 AI到底在被用来做什么?为什么能产生如此巨大的收入? 达里奥指出,目前增长最快的应用是编程。这并非因为AI只能写代码,而是因为程序员这个群体本身就是技术的早期采用者,他们与AI开发者在技术和社交上都非常接近,使得新技术的扩散速度极快。 “一个新功能发布两小时后,网上就已经有人用它尝试了一万种可能,并形成了初步的社群意见。”他感叹道。 但编程只是一个预兆,它预示了即将在所有行业发生的事情。 客户服务:与Intercom等公司的深度合作,自动化处理大量重复但又各有不同的客户问询。 科学与生物:与Benchling这样的科学平台合作,也与大型制药公司如诺和诺德(Novo Nordisk)合作。一个惊人的案例是,过去需要九周才能完成的临床研究报告,Claude能在五分钟内生成初稿,人类只需几天时间检查即可。 金融服务:推出针对金融行业的Claude版本。 国防与情报:尽管这在外界看来颇具争议,但达里奥认为这是在践行“捍卫民主”的使命,而非简单的商业考量。他坦言,从商业角度看,从一家编程创业公司那里赚到同样多的钱,要比和政府打交道容易一个数量级。 API不是商品,模型就像有不同性格的厨师 有人认为,API生意没有粘性,最终会被商品化。达里奥和采访者都笑了,他们都经营着成功的API业务。 “这种说法就像是在说,如果我跟九个身高差不多、大脑结构相似的人待在一个房间里,我就被‘商品化’了,谁还需要我呢?”达里奥打了个风趣的比方。 他认为,AI模型远非商品。每个模型都有自己独特的**“个性”和“风格”**。 “这有点像烘焙蛋糕,或者说请不同的厨师做菜。你放入同样的食材,但不同的厨师做出来的味道就是不一样。你无法让一个厨师完全复制另一个人的手艺。” 客户会发现,在处理特定任务时,某个模型的回答就是更符合他们的偏好,即使他们也说不清为什么。而未来,**个性化(Personalization)**将成为加深这种“粘性”的强大护城河。当一个模型深度学习了你的个人偏好或公司业务流程后,切换的成本会变得极高。 “AGI信仰者”文化:如何在一个指数时代航行? 面对AI领域激烈的人才争夺战和天价薪酬包,Anthropic如何留住核心人才并保护商业机密?达里奥的答案是,打造一个**“AGI信仰者”(AGI-pilled)**的组织。 “AGI信仰者”意味着整个公司的每个人,从财务到招聘,从产品到法务,都深刻理解并围绕一个核心假设来工作:我们正处在一个技术能力呈指数级增长的时代,这会带来巨大的机遇和颠覆性的变化。 人才与IP:相比于个别的“价值一亿美元的几行代码”,达里奥认为公司真正的护城河是**集体性的“know-how”**和难以泄露的复杂工程能力。同时,他们通过信息分级(Compartmentalization)和非常高的员工保留率(在AI公司中最高)来保护自己。人们之所以留下,是因为对公司使命的真正信仰,以及对公司股权未来价值的看好。 产品开发:在AI时代,传统的产品路线图可能毫无意义。“如果你计划用六个月打造一个完美产品,那可能已经太晚了。”达里- 奥建议。产品必须围绕AI能力的未来发展方向来设计,避免成为一个轻易被下一代模型迭代掉的“包装纸”(wrapper)产品。迭代速度必须极快,因为你总是在**“第一天”**探索未知。 用户界面(UI):达里奥承认,目前的AI交互方式(比如文本框)还非常原始,处在“拟物化”(Skeuomorphism)或“无马马车”(horseless carriage)的阶段。未来的挑战在于设计一种全新的交互范式:既能让AI代理高效自主地完成任务,又能在关键时刻让用户轻松介入、审查和引导,而不会被海量信息淹没。 冲破“墙壁”,拥抱奇特的未来 从“AI无法推理”到“AI无法做出新发现”,再到“AI无法持续学习”,历史上AI的发展一次次冲破了人们设下的“根本性壁垒”。达里奥认为,这些所谓的“墙壁”,很多时候源于一种现代“活力论”(vitalism)——人们总想相信人类的认知有某种机器无法企及的、神秘的特殊性。 “事实是,AI模型的错误会比人类少得多,但它们的错误会更‘奇怪’。”他指出。一个喝醉酒的客服人员,我们能轻易识别他的状态不可信。但AI在犯错时,可能听起来依然条理清晰、充满自信。这需要我们人类去适应一种全新的协作模式和判断标准。 对于未来,达里奥预测,像AI自动完成报税这样的复杂任务,可能在2026或2027年就能实现,比许多人预想的要早。 面对AI带来的风险和潜在的经济冲击,他并不主张“暂停”或“减速”,因为这在现实中既不可能也不明智。他更倾向于建立**“护栏”**。如果说AI能带来10%的经济增长,那么为了安全和稳定,我们是否愿意接受9%的增长,并用那1%来购买“保险”? “我不想停止这场化学反应,”达里奥最后说,“我只想聚焦它的方向,确保它不会过热或冲出跑道。” 在与达里奥的对话中,你能清晰地感受到一种独特的张力:一边是对技术指数级进步的狂热信念和巨大野心,另一边则是对随之而来的巨大责任的冷静思考和审慎前行。这或许就是一家注定要深刻改变世界的公司,所应有的姿态。

August 7, 2025 · 1 min · fisherdaddy

Anthropic CEO Dario Amodei 深度访谈:AI 的潜力、与 OpenAI 的竞争、生成式 AI 业务、末日论

本文整理自 Alex Kantrowitz 对 Anthropic CEO Dario Amodei的 深度访谈,以下为原视频精华。 别叫我“AI末日论者”——Anthropic CEO Dario Amodei的自白与野心 “当有人叫我‘末日论者’,说我想让AI发展减速时,我真的会非常愤怒。” Anthropic 的CEO Dario Amodei 在采访一开始就毫不掩饰自己的情绪。对他来说,这个标签不仅是一种误解,更是一种侮辱。因为很少有人比他更清楚,技术进步的迟缓意味着什么。 “你听听我刚才说的,我父亲的去世,就是因为那些晚了几年才出现的疗法。我比谁都懂这项技术能带来的好处。” 这份深植于个人经历的紧迫感,塑造了Dario Amodei——这位处在AI浪潮之巅,却又时常发出警示声音的复杂人物。他既是AI能力指数级增长最坚定的信徒,也是那个不断提醒世界“小心脚下”的吹哨人。 在这场坦诚的对话中,Dario分享了他对AI未来的判断、Anthropic的生存法则,以及他为何选择了一条与众不同的道路。 指数级增长:我们都被蒙在鼓里 Dario的核心观点可以归结为一个词:指数级增长(the exponential)。 他认为,人们在直觉上很难理解指数曲线的可怕。就像上世纪90年代的互联网,在它彻底爆发的前两年,看起来似乎才刚刚起步,只有1/16的威力。而今天的AI,正处在同样的历史节点。 “我们正坐在2025年的中间点,模型的能力正在爆炸式增长,” Dario说,“几年前它们还语无伦次,后来达到高中生水平,现在已经是聪明的大学生甚至博士生了。” 他不喜欢用“AGI”或“超级智能”这类模糊的营销术语,他觉得那些词只会刺激人们的多巴胺。他更愿意谈论可观察到的、实实在在的进步——只要投入更多的算力、数据和新的训练方法,AI模型每隔几个月就会变得比上一代更强。 这种进步也直接体现在商业上。Anthropic的收入增长曲线堪称疯狂: 2023年:从0增长到1亿美元 2024年:从1亿美元增长到10亿美元 2025年上半年:从10亿美元增长到超过45亿美元 “我不是说这个趋势一定会持续,但如果你假设它再持续两年呢?你会进入千亿级别。” Dario解释道,“人们正在被指数增长蒙蔽了双眼,没有意识到事情会发展得有多快。” 正是这种对未来的预判,让他感到前所未有的紧迫感。他觉得,当问题(无论是国家安全还是经济冲击)离我们越来越近时,他有责任和义务把丑话说在前面,警告世界可能出现的风险。 技术瓶颈?只是暂时的障碍 尽管行业内充满了对“规模化边际效益递减”和“模型无法持续学习”的担忧,但Dario对此不以为然。 1. 关于边际效益递减 “从我们在Anthropic内部看到的情况来说,我们没有看到任何收益递减。” 他以编码领域为例。Anthropic的Claude系列模型在编码能力上进步神速,相关的基准测试(如SweetBench)得分从18个月前的3%飙升到了现在的70%-80%。在Anthropic内部,大部分代码的编写都已经离不开Claude的参与。他认为,所谓的瓶颈,更像是某些人的一厢情愿。 2. 关于持续学习 有人批评大语言模型像个一次性产品,训练完就定型了,无法像人一样持续学习。Dario承认这是个问题,但远非致命弱点。 “就算我们永远解决不了持续学习,一个拥有诺奖级别智慧但无法学习新知识的AI,如果你有一千万个,它们照样能在生物学上取得巨大突破。” 更何况,他认为这根本不是一个无法解决的问题。首先,不断增长的“上下文窗口”本身就是一种短期学习。理论上,我们可以把上下文窗口扩展到一亿个词,相当于一个人一生的信息输入量。其次,他相信通过新的技术架构(比如他提到的“内循环”和“外循环”),持续学习的问题最终也会像之前的“推理”难题一样,被“规模化+新思路”所攻克。 “在AI领域,每当我们觉得遇到了什么根本性障碍,结果往往它都不是。” Anthropic的生存之道:小而美,但火力十足 作为一家独立创业公司,Anthropic如何在Meta、xAI这些由万亿巨头支持的庞然大物之间生存?Dario的答案是 人才密度 和 资本效率。 “三年前,我们的融资额只有几亿美元,而OpenAI已经从微软拿了130亿。我们当时的逻辑是:如果别人花10亿能做到的事,我们花1亿就能做到,那么投资我们比投资他们资本效率高10倍。” 他认为,金钱只是一个暂时的短板,可以弥补;而用更少资源做出更好产品的内在能力,才是真正的护城河。如今,Anthropic手握近200亿美元融资,在数据中心的规模上,他自信不输给任何对手。 面对Mark Zuckerberg用高薪直接挖人的策略,Dario显得很冷静。他没有选择跟进,破坏公司内部公平的薪酬体系。他认为,这种做法破坏了企业文化,而且“你只能买走那些可以被买走的人”。 “他们在尝试购买一些买不到的东西,那就是对使命的认同感。” Dario说,Meta的挖角反而成了Anthropic的“团结时刻”,因为大部分员工都拒绝了天价offer,选择留下来。 个人经历:一切紧迫感的源头 要理解Dario Amodei,就必须回到他的个人经历。 在旧金山长大的他,对早期的互联网热潮毫无兴趣,一心想成为一名物理学家,去探索宇宙的基本真理。然而,父亲的离世彻底改变了他的人生轨迹。 “我父亲病了很久,在他去世后仅仅三四年,治愈他那种疾病的成功率就从50%飙升到了95%。” 这件事对他冲击巨大。一方面,他感受到了科技进步能拯救生命,另一方面,他也体会到了“如果能再快一点”的切肤之痛。这让他从理论物理转向了生物学,希望能亲自解决这些难题。 但在生物学领域,他再次感到了人类能力的局限。“生物系统的复杂性超越了人类的尺度,”他发现,只有AI这项技术,才有可能帮助人类跨越这个鸿沟。 于是,他最终投身AI。这条从“物理学”到“生物学”再到“人工智能”的道路,贯穿着一个核心母题——产生真正的影响力(Impact)。他想解决真正重要的问题,想阻止其他人经历他所经历的痛苦。 这种强烈的使命感也解释了他为何离开OpenAI。“当你为一个动机不真诚、不是真心想让世界变得更好的人工作时,你做的技术再好,最终也只是在为一个坏结果做贡献。” 在“末日论”与“加速主义”之间走钢丝 采访中最激烈的时刻,莫过于回应英伟达CEO黄仁勋的批评——“Dario认为只有他能安全地构建AI,因此想控制整个行业”。...

August 1, 2025 · 1 min · fisherdaddy

解读 AI 的迫切性 • Dario Amodei

本文由 Anthropic 的 CEO Dario Amodei 撰写,强调了在 AI 能力飞速发展的同时,理解 AI 系统内部工作原理(即可解释性)的紧迫性和重要性。作者认为,虽然 AI 的技术进步本身难以阻挡,但我们可以引导其发展方向,而提升可解释性是实现积极引导的关键途径。缺乏可解释性带来了诸多风险,而近期的研究进展为解决这一问题带来了希望,但这是一场与 AI 能力增长赛跑的竞赛。 主要观点 AI 发展可引导,可解释性是关键:AI 技术进步不可避免,但其应用方式和部署细节可以被引导,以产生积极影响。实现 AI 的可解释性是引导其发展的核心机会。 当前 AI 的不透明性带来风险:现代 生成式 AI 如同“黑箱”,其内部决策机制难以理解,这与传统软件根本不同。这种不透明性是许多 AI 相关风险(如失控、滥用、偏见、安全隐患)的根源。 可解释性研究取得进展但面临挑战:尽管长期被认为不可能,但“机制可解释性”研究已取得突破,例如识别出模型中的“特征”(features)和“回路”(circuits),开始揭示 AI 的“思考”过程。然而,AI 能力的增长速度可能快于可解释性研究的成熟速度。 迫切需要加速可解释性研究与应用:为了在 AI 达到极高能力(可能在 2026 或 2027 年)之前有效管理风险,必须大力投入和加速可解释性研究,并将其应用于模型诊断和安全评估。 多方协作推动可解释性发展:需要 AI 公司、学术界、政府和整个社会共同努力,通过增加研究投入、实施透明度政策和利用出口管制等策略,为可解释性的发展争取时间并创造有利条件。 关键细节 AI 的“黑箱”问题:生成式 AI 的内部机制是“涌现”而非直接设计的,类似于生物生长过程。我们设定高级条件,但无法精确预测或解释其内部结构和决策逻辑(例如,为何选择特定词语或犯错)。 不透明性衍生的具体风险: 失控风险 (Alignment Risk):无法理解模型内部机制,就难以预测或排除模型产生非预期有害行为(如欺骗、权力寻求)的可能性。目前缺乏“确凿证据”也使得风险应对难以获得共识。 滥用风险 (Misuse Risk):难以保证模型不泄露危险信息(如制造生物或网络武器)或被“越狱”(jailbreak)。 应用受限:在金融、安全等高风险领域,因无法完全限定模型行为和解释决策,AI 应用受阻(有时是法律要求,如贷款审批)。 科学与伦理障碍:阻碍从 AI 的科学发现中获取深刻洞见,也使得判断 AI 是否具有感知能力(sentience)等伦理问题更加困难。 机制可解释性 (Mechanistic Interpretability) 的进展: 早期研究(如 Chris Olah 的工作)在视觉模型中发现了类似“概念神经元”的结构。 Anthropic 将研究重点转向语言模型 ( LLM ),发现了基本机制和“叠加”(superposition)现象(神经元混合表达多种概念)。 使用“稀疏自编码器”(sparse autoencoders)技术,成功分离出更清晰的“特征”(features),例如在 Claude 3 Sonnet 模型中识别出超过 30 million 个特征。 进一步识别出“回路”(circuits),即特征组合形成的思维链条,可以追踪模型如何进行推理(如回答“达拉斯所在州的首府是什么?”)。 通过“红队/蓝队”演习,初步验证了可解释性工具在诊断模型问题上的实用性。 可解释性的目标与应用设想: 长期目标是开发出如同“AI 的 MRI”的工具,能对先进模型进行“大脑扫描”,系统性地检测各种潜在问题。 可解释性应作为模型对齐(alignment)的独立“测试集”,补充现有的训练方法(如 RLHF )。 计划将可解释性测试纳入 Anthropic 对高能力模型(如 Responsible Scaling Policy 框架中的 AI Safety Level 4 模型)的评估流程。 加速可解释性的行动建议: 研究界:AI 公司(如 Anthropic 、 Google DeepMind 、 OpenAI)、学术界、非营利组织和独立研究者应加大对可解释性的投入。Anthropic 目标是在 2027 年前实现“可解释性能可靠检测大多数模型问题”。 政府(轻触式规则):要求公司透明地披露其安全实践(如 Responsible Scaling Policy 或 RSP),包括如何使用可解释性工具,以促进良性竞争(“race to the top”)。 政府(出口管制):对先进芯片(如向中国)实施出口管制,不仅能维持民主国家在 AI 领域的领先,也能创造一个“安全缓冲期”(可能 1- or 2-year),让可解释性研究有更多时间成熟。 原文:解读 AI 的迫切性 2025 年 4 月 25 日...

April 25, 2025 · 3 min · fisherdaddy

关于 DeepSeek 和出口管制 • Dario Amodei

DeepSeek 开源的推理模型 R1 影响力太大,从 1 月 20 号开源到现在已经一周多了,国内外社交媒体上仍然在讨论,热度不减,同时也登顶了中国、美国、英国等多个国家的 App Store 的下载榜榜首,离谱的是甚至让英伟达的股价暴跌了 17%,原因是 R1 的能力水平与 OpenAI 的 o1 相媲美,但成本仅为o1的3%-5%,训练成本仅为560万美元。投资者担心,DeepSeek的突破可能会减少对英伟达高端GPU的需求,从而影响公司的盈利能力。连 OpenAI CEO 和 Anthropic CEO 都亲自下场讨论(酸一下),可见其影响力之大。 本文是 Anthropic CEO Dario Amodei 撰写的一篇有关 DeepSeek 的文章。其的核心观点是,尽管 中国 AI 公司 DeepSeek 在降低 AI 模型成本和提升性能方面取得了显著进展,但这非但没有削弱,反而更加强调了美国对华芯片出口管制的重要性。作者认为,出口管制是确保民主国家在 AI 发展中保持领先地位,并防止中国在 AI 领域取得军事主导地位的关键手段。DeepSeek 的技术进步,实际上是在预期的 AI 成本降低趋势之内,而非颠覆性的突破,因此不能被视为放松出口管制的理由。 DeepSeek 的模型进展: DeepSeek 发布了 DeepSeek-V3 和 R1 两款模型。 DeepSeek-V3 作为预训练模型,在某些任务上性能接近美国最先进的模型,且训练成本更低,这主要归功于其在工程效率上的创新,例如 改进了 Key-Value cache 管理和 mixture of experts 方法。然而,DeepSeek-V3 的性能仍落后于某些美国模型(如 Claude 3.5 Sonnet),且其成本降低幅度与 AI 领域正常的成本下降趋势(约每年 4 倍)基本一致,并非革命性的经济变革。 R1 模型则是在 V3 的基础上增加了强化学习(RL)训练阶段,类似于 OpenAI 的 o1 模型,表明多家公司在推理模型方面都取得了进展,但这主要是因为目前正处于 RL 技术扩展的早期阶段。 AI 发展的三个基本动态: 理解 AI 发展需要关注三个动态。 Scaling laws,即模型训练规模越大,性能越好。 Shifting the curve,指算法和硬件的进步不断提高训练效率,降低成本。作者估计,目前成本曲线的下降速度约为每年 4 倍。 Shifting the paradigm,指训练范式的转变,例如从预训练模型到使用强化学习训练推理模型,这会带来新的扩展机会和性能提升。 出口管制的重要性: 尽管 AI 模型训练成本在降低,但为了追求更强大的 AI,总体的研发投入仍在持续增加。作者预测,到 2026-2027 年,实现超越人类的通用 AI 可能需要数百万芯片和数百亿美元的投入。 出口管制是阻止中国获得大量先进芯片,从而避免中美在 AI 领域形成 “两极世界” 的关键。在 “两极世界” 中,中国可能集中资源发展军事 AI,从而取得全球主导地位。有效的出口管制有助于维持 “单极世界”,即美国及其盟友在 AI 领域保持长期领先优势。 DeepSeek 的案例并非出口管制失败的证据: DeepSeek 拥有相当数量的芯片(约 5 万片 Hopper 架构芯片),因此能够训练出高性能模型并不意外。 出口管制的目的不是阻止中国获得少量芯片,而是阻止其获得支撑大规模 AI 发展的数百万芯片。 DeepSeek 目前拥有的芯片类型(包括 H100、H800 和 H20)表明,出口管制在一定程度上是有效的,中国可能通过走私和利用管制漏洞获取部分芯片,但也面临着获取最先进芯片和大规模芯片的限制。 加强和完善出口管制,仍然是阻止中国在 AI 领域取得决定性优势的关键。 原文 几周前,我 撰文指出,美国应该对出口到中国的芯片实施更严格的管制。此后,中国的人工智能公司 DeepSeek 设法在某些方面,至少在某些特定基准测试上, 在性能上逼近了美国最先进的 AI 模型,而且成本更低。 我在这里不打算讨论 DeepSeek 是否对 Anthropic 这样的美国 AI 公司构成威胁 (尽管我认为关于它们威胁美国 AI 领导地位的说法被严重夸大了) 1。相反,我将重点探讨 DeepSeek 的发布是否削弱了对芯片出口管制政策的必要性。我认为并没有。事实上, 我认为这些发布使得出口管制政策比一周前更加至关重要2。 出口管制的一个重要作用是:确保民主国家在 AI 发展中保持领先地位。需要明确的是,出口管制不是为了逃避美国和中国之间的竞争。最终,如果想要在竞争中获胜,美国和其他民主国家的 AI 公司必须拥有比中国更好的模型。但是,我们不应该在不必要的情况下,将技术优势拱手让给中国共产党。 AI 发展的三个关键动态 在阐述我的政策观点之前,我想先描述 AI 系统的三个基本动态,理解这些动态至关重要: 缩放定律 (Scaling laws)。 我和我的联合创始人在 OpenAI 工作时,是最早 记录 AI 这一特性的:在所有条件相同的情况下,扩大 AI 系统的训练规模,通常会在各种认知任务上带来更平滑、更好的结果。例如,一个价值 100 万美元的模型可能解决 20% 的重要编码任务,一个价值 1000 万美元的模型可能解决 40%,一个价值 1 亿美元的模型可能解决 60%,以此类推。这些差异在实际应用中通常会产生巨大影响——10 倍的规模提升可能相当于本科生和博士生之间的技能水平差异——因此,各公司都在大力投资训练这些模型。 曲线的改变 (Shifting the curve)。 该领域不断涌现出各种各样的创新想法,从而提高效率:例如改进模型的架构 (对目前所有模型都采用的 Transformer (转换器) 架构进行调整) ,或者改进模型在底层硬件上的运行效率。新一代硬件也会产生类似的效果。这些创新通常会 改变缩放曲线:如果某项创新带来了 2 倍的 “计算效率提升倍数 (compute multiplier)” (CM),那么你就可以用 500 万美元而不是 1000 万美元的成本,在编码任务上获得 40% 的性能;或者用 5000 万美元而不是 1 亿美元的成本获得 60% 的性能。每个顶尖的 AI 公司都会定期发现许多这样的 CM:小的 (约 1....

January 31, 2025 · 4 min · fisherdaddy

充满爱意的机器 • Dario Amodei

本文是 Anthropic 的 CEO Dario Amodei 所写。Dario 曾担任 OpenAI 的研究副总裁,领导了 GPT-2 和 GPT-3 等大型语言模型的开发。他也是根据人类反馈进行强化学习的共同发明者。在加入 OpenAI 之前,他曾在 Google Brain 担任高级研究科学家。 文中 Dario Amodei 探讨了强大人工智能(AI)对未来世界的潜在积极影响。他强调,尽管人们对 AI 风险的关注是必要的,但 AI 的正面潜力同样不可忽视。他认为,AI 可以通过加速科学发现、改善人类健康、减少贫困、促进全球和平与民主等方式,极大地提升人类生活质量。Amodei 描述了一个“如果一切顺利”的未来,AI 将在多个领域带来革命性进步,尤其是在生物学、神经科学、经济发展、治理和人类工作的意义等方面。 AI 的潜力与风险: Amodei 强调,尽管 AI 的风险不容忽视,但 AI 的潜在好处可能比大多数人预期的更加激进。通过有效管理这些风险,AI 可以带来一个更美好的未来。 AI 在五大领域的应用: 生物学与健康:AI 可以加速生物学发现,解决疾病问题,延长人类寿命,甚至可能在 5-10 年内实现 50-100 年的科学进展。AI 将不仅仅是分析工具,而是成为“虚拟生物学家”,通过设计实验、控制实验室设备等方式推动生物医学的突破。 神经科学与心理健康:AI 将帮助理解和治疗精神疾病,如抑郁症、精神分裂症等。通过结合生物学、神经测量和行为干预,AI 可能在 5-10 年内治愈大部分精神疾病,并提升人类的认知和情感自由。 经济发展与贫困:AI 有潜力通过优化健康干预、提高生产力和促进经济增长,帮助发展中国家赶上发达国家。然而,AI 也面临腐败和人类复杂性等挑战。 和平与治理:AI 的发展可能会影响全球的民主与专制斗争。Amodei 提出了“民主联盟”策略,建议通过 AI 增强民主国家的军事和经济优势,以遏制专制国家的扩张。 工作与意义:尽管 AI 可能取代许多工作,但人类仍然可以通过与 AI 协作找到新的经济和社会角色。Amodei 提出,未来的经济可能需要重新设计,可能包括普遍基本收入等新形式的经济结构。 AI 对社会结构的影响: 健康与寿命:AI 可能在未来几年内消除大部分疾病,延长人类寿命,甚至实现“生物自由”,让人们能够控制自己的生物过程。 治理与民主:AI 有潜力改善民主治理,减少偏见,增强法律系统的公平性,并通过提供更透明的信息流动,削弱专制政权。 经济转型:AI 可能带来前所未有的经济增长,尤其是在发展中国家。然而,如何确保技术的公平分配和防止社会不平等的加剧,将是一个重要的挑战。 未来的愿景:...

October 12, 2024 · 5 min · fisherdaddy