本文翻译自 Notion 创始人 Ivan Zhao 在 X 上发表的文章:Steam, Steel, and Infinite Minds。

每个时代都由其奇迹材料所塑造。钢铁锻造了镀金时代。半导体开启了数字时代。如今,AI 作为无限思维已经到来。如果历史教会了我们什么,那就是掌握这种材料的人将定义这个时代。

[左图:少年时期的安德鲁·卡内基和他的弟弟。右图:镀金时代的匹兹堡钢铁厂。]
19 世纪 50 年代,安德鲁·卡内基作为一名电报员,奔跑在匹兹堡泥泞的街道上。当时十分之六的美国人是农民。在两代人的时间里,卡内基和他的同辈们锻造了现代世界。马匹被铁路取代,烛光被电力取代,铁被钢取代。
从那以后,工作从工厂转移到了办公室。如今,我在旧金山经营一家软件公司,为数百万知识工作者打造工具。在这个行业重镇,每个人都在谈论通用人工智能(AGI),但二十亿案头工作者中的大多数尚未感受到它的存在。知识工作很快会变成什么样子?当组织架构吸收了永不休眠的思维时,会发生什么?
[早期的电影看起来通常像舞台剧,只有一台摄像机对着舞台拍摄。]
这种未来往往难以预测,因为它总是伪装成过去的样子。早期的电话像电报一样简练。早期的电影看起来像是被拍摄下来的戏剧。(这就是马歇尔·麦克卢汉所说的“通过后视镜驶向未来”。)
[今天最流行的 AI 形式看起来就像过去的谷歌搜索。引用马歇尔·麦克卢汉的话:“我们总是通过后视镜驶向未来。”]
今天,我们看到的是模仿谷歌搜索框的 AI 聊天机器人。我们正深陷于每一次新技术变革都会出现的那个令人不安的过渡阶段。
我没有关于接下来会发生什么的全部答案。但我喜欢用几个历史隐喻来思考 AI 如何在不同层面上发挥作用,从个人到组织,再到整个经济体。
最初的端倪可以在知识工作的高级祭司——程序员身上找到。
我的联合创始人 Simon 就是我们所说的“10 倍程序员”,但他现在很少写代码了。走过他的办公桌,你会看到他同时指挥着三四个 AI 编程智能体(Agent),它们不仅打字更快,而且会思考,这让他变成了“30-40 倍工程师”。他在午餐或睡前排好任务,让它们在他离开时工作。他已经成为无限思维的管理者。
[20 世纪 70 年代《科学美国人》的一项关于移动效率的研究激发了史蒂夫·乔布斯著名的“大脑的自行车”隐喻。只不过从那以后,我们一直在信息高速公路上费力地踩着踏板。]
20 世纪 80 年代,史蒂夫·乔布斯称个人电脑为“大脑的自行车”。十年后,我们铺设了互联网这条“信息高速公路”。但今天,大多数知识工作仍然是人力驱动的。这就像我们在高速公路上骑自行车一样。
有了 AI 智能体,像 Simon 这样的人已经从骑自行车毕业,转而驾驶汽车了。
其他类型的知识工作者什么时候才能开上车?必须解决两个问题。
[与编程智能体相比,为什么 AI 更难帮助知识工作?因为知识工作更加碎片化,且更难以验证。]
首先是上下文碎片化。对于编程,工具和上下文往往存在于一个地方:IDE、代码库、终端。但一般的知识工作分散在数十个工具中。想象一个 AI 智能体试图起草一份产品简介:它需要从 Slack 讨论串、战略文档、仪表盘中的上季度指标以及仅存在于某人脑海中的组织记忆中提取信息。今天,人类是胶水,通过复制粘贴和在浏览器标签页之间切换将所有这些缝合在一起。在上下文整合之前,智能体将仍然受困于狭窄的用例中。
第二个缺失的要素是可验证性。代码具有一种神奇的属性:你可以通过测试和报错来验证它。模型制造者利用这一点来训练 AI 更好地编程(例如强化学习)。但是,你如何验证一个项目是否管理得当,或者一份战略备忘录是否优秀?我们尚未找到改进一般知识工作模型的方法。因此,人类仍然需要在回路中进行监督、指导,并展示什么是好的结果。
[1865 年的《红旗法案》要求车辆在街道上行驶时,必须有一名旗手在车前行走(该法案于 1896 年废除)。这是一个不受欢迎的“人在回路中”的例子。]
今年的编程智能体教会了我们,“人在回路中(human-in-the-loop)”并不总是可取的。这就像让专人检查工厂流水线上的每一颗螺栓,或者走在汽车前面开路(参见:1865 年的《红旗法案》)。我们希望人类站在杠杆点上监督回路,而不是身处其中。一旦上下文得到整合且工作可验证,数十亿工人将从骑自行车转变为开车,进而从开车转变为自动驾驶。
公司是一项近代的发明。随着规模扩大,它们会退化并达到极限。
[1855 年纽约和伊利铁路公司的组织结构图。现代公司和组织结构图随铁路公司而演变,后者是第一批需要跨越遥远距离协调成千上万人的企业。]
几百年前,大多数公司都是只有十几人的作坊。现在我们有拥有数十万员工的跨国公司。通信基础设施(通过会议和信息连接的人脑)在指数级的负载下不堪重负。我们试图通过层级、流程和文档来解决这个问题。但我们一直用人类尺度的工具来解决工业尺度的问题,就像用木头建造摩天大楼一样。
两个历史隐喻展示了未来的组织在拥有新的奇迹材料后可能会呈现出怎样不同的面貌。
[钢铁奇迹:伍尔沃斯大楼于 1913 年在纽约竣工时,是世界上最高的建筑。]
第一个是钢铁。在钢铁出现之前,19 世纪的建筑只有六七层高。铁很坚固,但易碎且沉重;如果增加更多楼层,结构就会因自重而坍塌。钢铁改变了一切。它既坚固又有延展性。框架可以更轻,墙壁可以更薄,突然间建筑物可以拔地而起几十层。新型建筑成为可能。
AI 是组织的钢铁。它有潜力跨工作流保持上下文,并在需要时浮现决策而没有噪音。人类沟通不再必须是承重墙。每周两小时的对齐会议变成五分钟的异步审查。曾经需要三层审批的高管决策可能很快会在几分钟内完成。公司可以扩张,真正地扩张,而不会出现我们已视为不可避免的退化。
[一个用水车为运营提供动力的磨坊。水力强大但不可靠,并且将磨坊限制在少数地点和季节性中。]
第二个故事是关于蒸汽机的。工业革命初期,早期的纺织厂坐落在河流溪流旁,由水车驱动。当蒸汽机出现时,工厂主最初只是用水车换掉蒸汽机,其他一切保持不变。生产力的提升微乎其微。
真正的突破发生在工厂主意识到他们可以完全脱离水力时。他们在更靠近工人、港口和原材料的地方建造了更大的工厂。并且他们围绕蒸汽机重新设计了工厂(后来,当电力出现时,工厂主进一步去中心化,不再依赖中央动力轴,而是在工厂周围为不同的机器放置更小的发动机。)生产力爆发,第二次工业革命真正起飞了。
[Thomas Allom 的这幅 1835 年版画描绘了英国兰开夏郡的一家纺织厂。它由蒸汽机驱动。]
我们仍处于“更换水车”的阶段。AI 聊天机器人被硬塞进现有的工具中。我们还没有重新构想,当旧的限制消除,你的公司可以依靠在你睡觉时工作的无限思维运转时,组织会是什么样子。
在我的公司 Notion,我们一直在做实验。除了我们的 1,000 名员工外,现在还有 700 多个智能体在处理重复性工作。它们做会议记录并回答问题以综合部落知识。它们处理 IT 请求并记录客户反馈。它们帮助新员工入职并了解员工福利。它们撰写每周状态报告,这样人们就不必复制粘贴了。而这仅仅是起步。真正的收益仅受限于我们的想象力和惰性。
钢铁和蒸汽不仅改变了建筑和工厂。它们改变了城市。

直到几百年前,城市还是人类尺度的。你可以在四十分钟内走遍佛罗伦萨。生活的节奏由一个人能走多远、声音能传多远来设定。
后来钢铁框架让摩天大楼成为可能。蒸汽机驱动的铁路将市中心与腹地连接起来。电梯、地铁、高速公路紧随其后。城市的规模和密度爆炸式增长。东京。重庆。达拉斯。
这些不仅仅是佛罗伦萨的放大版。它们是不同的生活方式。特大城市令人迷失方向、匿名、更难导航。这种难以辨认性是规模的代价。但它们也提供了更多的机会,更多的自由。比人类尺度的文艺复兴城市所能支持的更多的人,以更多的组合做更多的事情。
我认为知识经济即将经历同样的转变。
今天,知识工作几乎占美国 GDP 的一半。其中大部分仍然在人类尺度上运作:几十人的团队,由会议和电子邮件决定节奏的工作流,超过几百人就会不堪重负的组织。我们用石头和木头建造了佛罗伦萨。
当 AI 智能体大规模上线时,我们将建造东京。跨越成千上万个智能体和人类的组织。不间断运行的工作流,跨越时区,无需等待某人醒来。决策由恰到好处的“人在回路中”综合而成。
感觉会不一样。更快,杠杆率更高,但起初也会让人更加迷失方向。周会、季度规划周期和年度审查的节奏可能不再有意义。新的节奏出现了。我们失去了一些易读性。我们获得了规模和速度。
每一种奇迹材料都需要人们停止通过后视镜看世界,开始想象新的世界。卡内基看着钢铁,看到了城市的天际线。兰开夏郡的工厂主看着蒸汽机,看到了不再受河流束缚的厂房。
我们仍处于 AI 的水车阶段,将聊天机器人硬塞进为人类设计的工作流中。我们需要停止要求 AI 仅仅做我们的副驾驶。我们需要想象,当人类组织由钢铁加固,当繁重的工作被委托给永不休眠的思维时,知识工作会是什么样子。
蒸汽。钢铁。无限思维。下一个天际线就在那里,等待我们去建造。