本文来自 Andrej Karpathy 在 X 上发布的一篇文章《Power to the people: How LLMs flip the script on technology diffusion 》。核心观点是,大型语言模型( LLMs )的技术扩散模式颠覆了传统技术自上而下(从政府/企业到个人)的传播路径。 LLMs 目前为普通个体带来了前所未有的、不成比例的巨大利益,其影响在企业和政府层面反而相对滞后。这是因为 LLMs 提供了广泛但相对浅显的能力,极大地赋能了缺乏多领域专业知识的个人;而组织机构在利用这种新技术时,则面临着整合复杂性、高风险以及内部惯性等挑战。尽管当前 LLMs 的普惠性是历史性的,但未来的技术发展和成本结构可能改变这种“利益分配”格局。

  • 传统技术扩散:历史上,变革性技术(如电力、计算机、互联网、 GPS )通常遵循从政府/军事到企业再到个人的“自上而下”路径,因为早期技术稀缺、资本密集且需要专业知识。
  • LLMs 的独特路径LLMs (以 ChatGPT 为例)显著逆转了该模式。 ChatGPT 成为史上增长最快的消费应用,拥有 4 亿周活跃用户,广泛用于写作、编码、翻译、学习、研究等个人任务。
  • 个体受益显著的原因
    • LLMs 大幅提升了个人在多个陌生领域的能力水平。
    • 使用门槛极低:成本低廉(甚至免费)、快速、易于通过网络或本地设备访问,并支持自然语言交流。
  • 企业/政府受益相对有限的原因
    • 能力匹配度LLMs 提供的是“准专家级”的广泛但浅显、可能出错的能力。而组织的核心优势在于整合深度专业知识。 LLMs 更多是提升现有专家的效率,而非带来颠覆性改变。
    • 复杂性与风险:组织运营涉及更高的复杂性(系统集成、遗留系统、安全、隐私、合规)和更低的容错率,难以简单应用 LLMs ,且“幻觉”等错误的代价高昂。
    • 组织惯性:企业文化、政治因素、沟通成本、培训挑战和官僚主义阻碍了对这种新型、多才多艺但尚不完全可靠工具的快速采纳。
  • 当前的普惠性:目前,普通人( Mary , Jim , Joes )比大型组织(如 Google 或美国政府)更能体验到 LLMs 带来的改变。前沿模型如 GPT 4o 对所有人(包括 Bill Gates )都同样可及。
  • 未来展望与不确定性
    • LLMs 的持续影响取决于性能的提升。
    • “利益分配”格局可能改变。如果未来获取更强 AI 能力需要高昂成本(性能与资本支出挂钩),大型组织和富裕个体可能重新获得优势(例如,使用 GPT-8-pro-max-high 对比 GPT-6 mini )。
    • 影响因素包括:扩大性能差距的技术(如规模扩展、模型集成)和缩小差距的技术(如模型蒸馏)。
  • 作者的感慨:当前的局面——强大的 AIChatGPT )几乎一夜之间免费普及到每个人的口袋里——是独特且出乎意料的,与许多科幻设想不同。引用并修正 William Gibson 的名言:“未来已来,且分布惊人地均匀”。作者对此表示赞赏(“权力归于人民”)。

原文:赋能于民:大语言模型如何改写技术普及的剧本

变革性技术通常遵循自上而下的扩散路径:它们往往起源于政府或军事部门,然后逐渐普及到企业,最终进入个人手中——比如电力、密码学、计算机、航空、互联网或 GPS。这种发展路径似乎是理所当然的,因为新兴的强大技术在早期通常比较稀缺,需要大量的资金投入,而且使用它们还需要专业的技能。

然而,非常独特和引人注目的是,大语言模型 (LLM) 却呈现出截然相反的趋势——它们给普通人带来了巨大的好处,而对企业和政府的影响相对较小,并且有所滞后。ChatGPT 是有史以来用户增长速度最快的消费级应用,每周有 4 亿活跃用户使用它来写作、编程、翻译、辅导、总结、深度研究和集思广益等等。这不仅仅是对现有工具的小幅升级,而是极大地提升了个人在各个领域的能力。更重要的是,使用门槛非常低——这些模型价格低廉(甚至免费),运行速度快,只需一个网址 (或者在本地设备上) 就能随时随地使用,而且它们支持各种语言,理解不同的语调、俚语甚至表情符号。这简直太不可思议了。在我看来,普通人从未体验过如此迅速、如此巨大的技术飞跃。

那么,为什么大语言模型 (LLM) 在企业和政府部门带来的好处相对不明显呢?我认为首要原因是,大语言模型 (LLM) 所提供的能力具有非常鲜明的特点——它们能提供近似于专家的知识和技能,并且覆盖的领域非常广泛。换句话说,它们既具有多面性,但也存在知识浅薄和容易出错的问题。而另一方面,企业和政府等组织的核心优势在于能够将不同领域的专业知识整合起来,例如通过雇佣工程师、研究员、分析师、律师和营销人员等等。虽然大语言模型 (LLM) 确实可以提高这些专家的工作效率(比如起草法律条款、生成代码模板等),但对组织的提升更多体现在原有业务上的改进。相比之下,个人通常只擅长一个领域,因此大语言模型 (LLM) 提供的广泛的“准专业”能力,使他们能够做很多以前做不到的事情。现在,人们可以轻松“玩转”代码应用,能够理解法律文件,能够看懂深奥的学术论文,能够进行数据分析,还能够生成用于品牌宣传和营销的多媒体内容。而且,他们不需要额外的专家协助,就能以足够的能力完成这些工作。

其次,组织需要处理的问题更加复杂,涉及的协调工作也更多,比如各种系统的集成、遗留系统、企业品牌或风格指南、严格的安全协议、隐私保护、国际化、法规遵从和法律风险等等。需要考虑的变量更多,限制条件也更多,容错率也更低。想要把所有这些信息都塞进上下文窗口并不容易。你不可能只是随便“糊弄”一段代码就完事。一次灾难性的“幻觉”就可能让你丢掉饭碗。第三,大型组织还存在着众所周知的惰性,包括企业文化、历史惯例、快速变化时期愈演愈烈的部门政治、沟通成本、分布式员工的再培训难题以及根深蒂固的官僚主义。在快速采用一种新兴的、多功能但又不够深入且容易出错的工具时,这些都是巨大的阻碍。我并不想贬低大语言模型 (LLM) 对企业和政府的影响,但至少在目前,总体而言,它们对个人生活带来的改变远大于对组织机构带来的改变。Mary、Jim 和 Joes 们正在享受到最大的红利,而不是 Google 或美国政府。

展望未来,大语言模型 (LLM) 的持续普及当然取决于其性能的不断提升和能力的完善。“利益分配”的整体情况尤其值得关注,它很大程度上取决于性能随着资本投入变化的动态范围。目前,最先进的大语言模型 (LLM) 性能非常容易获得,而且价格低廉。如果想要进一步提升性能、可靠性或自主性,再多的资金投入也无济于事。有钱也买不到更强大的 ChatGPT。比尔·盖茨和你一样都在使用 GPT 4o。但这种情况会一直持续下去吗?训练时的扩展(增加参数和数据)、测试时的扩展(增加计算时间)以及模型集成(增加批量处理)都在不断扩大动态范围。另一方面,模型蒸馏(通过训练小模型来模仿大模型的行为,从而获得性能卓越的小模型)则是一种缩小动态范围的力量。可以肯定的是,一旦金钱能够买到明显更强大的 ChatGPT,情况将会发生改变。大型组织可以利用其雄厚的资源来获取更强的智能。而且,在“个人”这个范畴内,精英阶层可能会再次与社会大众分道扬镳。他们的孩子将由 GPT-8-pro-max-high 辅导,而普通人家的孩子只能用 GPT-6 mini。

但至少在当下,我们正处于技术史上一个独特且前所未有的时刻。回顾过去的科幻作品,你会发现很少有人能预测到人工智能 (AI) 革命会以这种方式展开。它本该是由将军们掌控的最高机密的政府级超级项目,而不是 ChatGPT 几乎在一夜之间出现,并免费安装在每个人口袋里的设备中。还记得 William Gibson 的那句名言吗——“未来已经到来,只是分布不均”? 令人惊讶的是,未来已经到来,而且分布得非常均衡。 权力属于人民。 我个人非常喜欢这种局面。