本文是 Replit 的创始人 Amjad Masad 所写,主要描述了公司从传统编程平台向基于自然语言的“软件生成平台”转型的历程。他强调,Replit 的核心目标已从“帮助用户编写代码”转变为“让用户通过自然语言轻松创建软件”。通过推出名为“Agent”的创新工具,Replit 正在推动软件开发的民主化,使非专业人士也能创建高度定制化的应用程序。这种转变不仅加速了公司的收入增长,还可能彻底改变人们与计算机交互的方式。
- Replit 的战略转型与 Agent 的推出
- 从编程到软件生成:Replit 不再仅仅是一个代码编写工具,而是一个通过自然语言生成软件的平台。
- Agent 的成功:2023 年 9 月推出的 Agent 是首个大规模可用的软件代理工具,用户仅需 $25 即可创建 30-40 个小型 SaaS 应用,极大降低了开发成本。
- 团队重组与增长:尽管因战略调整裁员后团队规模减半,但公司收入在短短 5-6 个月内增长了 5 倍。
- Agent 的核心特点与应用
- 高度定制化:用户可以通过代码调整应用程序的功能,使其完全符合个人需求。例如,Masad 自己使用 Agent 将医生提供的 PDF 表单转化为睡眠记录应用,并不断优化。
- 全栈解决方案:Replit 提供从开发环境到数据库管理的一站式服务,用户无需具备深厚的技术背景。
- 人机协作:Agent 依赖“人类在循环中的”模式,用户需不断指导和调整代理的任务方向,避免其“漂移”。
- 技术基础与行业影响
- 依赖基础模型:Agent 使用 Anthropic 的 Claude 3.5 模型,并通过工程创新实现了更高效的任务执行。
- 测试时计算(Test-Time Compute):通过并行运行多个代理并选择最佳结果,Agent 提高了任务完成的可靠性。
- 未来潜力:尽管目前尚未出现重大突破性的模型,现有技术的持续优化已显著提升实际应用能力。
- 软件开发的民主化
- 非专业用户的崛起:Replit 正在缩小程序员与普通用户之间的差距,任何人都可以通过 Agent 创建应用程序。
- 技能转变:未来的关键技能将是清晰思考、有效地与 AI 系统交互,以及将创意转化为可执行的指令。
- 应用场景广泛:从工作到生活,用户可以创建满足个人需求的小型应用,而无需依赖昂贵的 SaaS 工具。
- 行业趋势与挑战
- 计算能力的限制:Replit 已面临云服务商(如 Google Cloud)计算配额的瓶颈,但 Masad 认为未来的突破可能来自算法改进和数据利用,而非单纯的计算扩展。
- 自然语言界面的未来:Masad 预测,未来两年内,基于自然语言的用户界面将成为主流,取代鼠标和传统交互方式。
- 长期愿景
- 个人软件革命:Replit 希望通过降低开发门槛,让普通用户像使用 PC 和智能手机一样轻松创建软件。
- 消费者级产品:未来版本的 Replit 将针对普通用户和学生优化,推动软件开发的普及化。
- 经济潜力:随着平台的易用性提升,预计会出现更多基于 Replit 的创业公司和高收入个人开发者。
原文
Reed Albergotti: 是什么促使你转向 AI 智能体 (Agent) 方向的?
Amjad Masad: 这背后有点像创始人二次创业的故事。公司发展壮大后,企业文化变得有些迟缓和保守。因此,我组建了一个名为“AI 智能体 (Agent) 特遣队”的团队,汇集了公司最优秀的人才。我们要彻底改变公司的发展方向。Replit 的目标不再仅仅是编写代码,而是要创造软件。我们希望仅通过自然语言就能轻松“召唤”出所需的软件。
那时,这个想法是否可行还不确定,但团队中的每个人都充满干劲。我们进行了裁员,那些没有加入 AI 智能体 (Agent) 特遣队的员工感到士气低落,觉得自己没有在做重要的事情,所以很多人最终选择了离开。我们失去了一半的团队,从 130 人减少到大约 65 人。但与此同时,在过去的五到六个月里,我们的收入却增长了五倍。
哇。收入增长来自哪里?
AI 智能体 (Agent)。它取得了巨大的成功。我们在九月份发布了它,这基本上是目前世界上第一个可供体验的大规模、实用的软件 AI 智能体 (Agent)。我甚至可以说它是独一无二的。
Cognition 公司开发的 Devin(一款编码 AI 智能体 (Agent)) 应该是什么样的?
他们最近宣布了一项 500 美元的收费计划,但我认为他们的规模还无法与我们相比。在 Replit 上,你只需支付 25 美元,就能获得相当多的使用额度。每月花费 25 美元,你就可以构建 30 到 40 个微型 SaaS 应用,并且可以根据需要付费继续开发。人们可以用 5 到 10 美元的价格构建应用程序。许多用户正在用它替换内部工具,彻底淘汰原有的 SaaS 产品。无论是大型企业还是小型创业者,他们都借此节省了大量资金。
有没有哪款工具特别受欢迎,被大家广泛使用?
并没有。有趣的是,它的应用呈现出“长尾”分布的特点。如果某一款应用特别流行,肯定会有人直接复制或借鉴。但 Replit AI 智能体 (Agent) 的独特之处在于其高度的定制化。如果你使用 TypeForm,只能点击一些预设的选项。而使用 Replit AI 智能体 (Agent),你可以利用代码的强大功能,对应用进行无限的个性化定制,从而构建完全符合你需求的工具。
我正在与一位睡眠医生合作,他给了我一张纸质的记录表,让我记录睡眠日记。如果我用纸记录,很容易就会弄丢。所以我把医生发给我的 PDF 文件导入到 Replit AI 智能体 (Agent) 中,把它变成了一个可以记录我睡眠情况的应用程序。随着时间的推移,我不断地为它添加新功能,例如绘制睡眠数据图表和进行分析。这就像拥有一个随叫随到的初级开发人员。
你需要在云端建立数据库吗?它是自动完成所有这些操作,还是你需要了解相关技术?
Replit 的优势在于,我们过去七八年一直在构建相关的基础设施。它可以自动处理所有这些事情,并且完全托管。
在发布 AI 智能体 (Agent) 之前,你曾提到,你们的优势在于可以看到代码从概念到实际应用的全过程。这是否是 AI 智能体 (Agent) 特遣队成功的关键?
关键的突破在于我们为实现 AI 智能体 (Agent) 所做的许多工程方面的工作。当然,Anthropic 的 Claude 3.5 Sonnet 模型 [以及] 对整个行业来说也是一个巨大的进步。Cursor 等公司都是在这款模型发布后才开始取得进展的。AI 编码领域有趣之处在于,每当出现一个性能飞跃的新模型时,它都会为基于该模型构建的公司带来更多创新体验。
这预示着未来将如何发展?你们拥有丰富的训练数据,事实证明,新的模型足够强大,可以自行完成任务。
我一直在思考这个问题。数据仍然重要。但关键在于,这些模型确实不负“基础模型”之名,它们已经进化成通用的模型,可以针对任何下游任务进行微调。我们正在利用自身的数据进行微调。我认为这些数据将具有巨大的价值。但即使不使用自己的数据,我们也能取得如此大的进展,这引发了行业内的许多思考。基础模型公司似乎比一年前更具长期发展的潜力,因为这些模型确实非常强大,且具有广泛的适用性。
如果你们可以直接使用 Anthropic 的模型,这是否意味着你们的竞争优势并不明显?
在过去的七八年里,我们一直在构建一个平台,它可以提供开发环境,运行代码,安装软件包,管理数据库并进行部署。我们实现了“一键部署”。这才是我们创造的真正价值。这与其说是一个难以逾越的“护城河”,不如说是一个“先发优势”。只要我们保持创新和进步的速度,并不断深化我们的技术积累,我认为我们就可以继续保持领先地位。而商业上的真正问题是,如何建立持久的竞争优势。
这与你之前的预测大相径庭。在第一次采访中,我问你:“这是否意味着,任何人都可以创建应用程序?” 而你回答说:“哦,这在可预见的未来不会发生。” 我感觉那仿佛发生在昨天。
我在 2023 年 10 月的 TED 演讲中提到:“未来将朝着这个方向发展,但我不知道它是否会在十年内实现。” 但令人惊讶的是,我们在今天就已经实现了那次演讲中描述的一切。这对我来说是一个巨大的转变。我知道这些事情都会发生,但我没想到会这么快。
当然,开发过程仍然需要一定的人工参与、创造力以及技术。我们已经知道,“提示”也是一项技能:你需要将高层次的想法分解为具体的步骤,你需要评估系统的表现并给出反馈。这些因素都决定了它不是一个完全自动化的过程。实际上,你仍然需要做很多工作。而我们所做的创新在于,人始终参与其中。
你认为这种模式会持续下去吗?
我仍然认为,在整个过程中,你需要对 AI 智能体 (Agent) 进行指导。现在 AI 智能体 (Agent) 的一个问题是,它们很容易“跑偏”。我们采用的 “人在回路” 的模式,让 AI 智能体 (Agent) 在完成一部分工作后会返回来,接受用户的指导。某种程度上,你就像在“照看”它们,引导它们回到你希望完成的任务上来。AI 智能体 (Agent) 能否发挥创造力并提出新想法?我认为是可以的。但目前这并不是瓶颈,真正的瓶颈在于,它们很容易偏离目标。
测试时计算提供的推理能力是否能帮助解决这个问题?
测试时计算的核心思想是,大语言模型 (LLM) 的确具有一定的随机性,可能会在某些方面出现偏差。解决这个问题的方法是同时运行多个模型,并选择最佳的路径。我们也在考虑采用类似的方法。例如,我们给 AI 智能体 (Agent) 一个指令,它会启动 5 到 10 个 AI 智能体 (Agent) 来竞争完成应用程序的构建。如果我们想发布 “Replit o1” [这里指 OpenAI 的 GPT-o1 模型],它会通过分叉 10 个进程来实现,并根据某种标准来选择最佳的方案反馈给用户。
你们正在使用 Claude 3.5 Sonnet。如果使用 o1 模型会怎么样?
目前,o1 的工作方式有点“自我中心”。它在自己的“头脑”中思考,然后给你一个最终答案。你可以给它一个问题,它会深入思考,产生许多潜在的想法,然后通过一个奖励模型来评估这些想法。在某种程度上,编程比自然语言处理更容易,因为你可以获得实际的验证。你的奖励模型可以使用实际的编程输出来进行训练。与自然语言不同,你可以从环境中获得反馈。对于 o1,如果他们能提供接口,让我们能够访问其思考过程,例如“运行这段 Python 代码”或“读取这个文件”,它就可以从环境中获取反馈。但就目前的形式而言,我认为它不太适合用作 AI 智能体 (Agent),因为它没有提供访问其思考过程的接口,让我们无法获得环境反馈。你可以想象,如果有一个类似于 o1 的系统,它可以在思考过程中进行工具调用,例如,它可能会思考 “我想知道这个文件是什么” ,然后读取这个文件。或者思考“如果我运行这段 Python 代码,会发生什么?”
测试时计算对你们的价值在于,可以使用它来创建各种不同的应用程序,并将它们与 Python 和数据库连接起来,但 OpenAI 无法做到这一点,因为它受到自身系统的限制。
这或许也是它“自我中心”的原因。它在自己的数据中心里,不断地进行自我循环。
你们是否尝试过自己实现测试时计算?
是的。Replit AI 智能体 (Agent) 已经采纳了一些测试时计算的思想,进行了大量的思考。我们生成了大量的 Token 来分析问题,例如,“我在控制台中看到了一个错误,我需要思考如何解决它。也许我应该查看一下这个文件,看看里面有什么。然后我应该撤销更改,重新运行程序”。行动观察是一种测试时计算的方式,因为大语言模型 (LLM) 的标准使用方式是请求-响应模式。用户发送一个请求,AI 助手返回一个响应。而我们使用 AI 智能体 (Agent) 的方式是:用户发送一个请求,AI 智能体 (Agent) 可以循环多次,并最终决定何时终止任务。
你们可以用它来创建 iOS 应用程序吗?
我们正在努力实现这一点。
这方面的挑战是什么?
Apple 的生态系统非常封闭。挑战主要来自基础设施方面,例如如何创建应用程序,如何让它们在浏览器中运行,以便用户可以看到结果,以及如何安装、部署和测试它们。
你们是否看到有人用它创造出商业上可行的产品?
目前还处于早期阶段,距离发布只有三个月,还没有出现任何特别成功的产品。当然,在 AI 智能体 (Agent) 之前,Replit 上已经有一些成功案例。而 AI 智能体 (Agent) 的出现,则让各种应用的潜力更加令人期待。如果你在六个月后问我,我可能会给你讲一个能带来数百万美元年度经常性收入的案例,但目前,人们还只是在发布一些简单的应用。
大家对工作、生活和家庭相关的应用程序都充满热情。对于创业者而言,开发功能完善的应用程序更具挑战性。一旦应用获得一定的用户量,对系统的要求就会呈指数级增长,因为用户数量庞大,而且可能出现各种各样的问题。但是,如果你的应用程序开始走红,你就可以考虑投资聘请开发人员了。
我认为在未来六个月内,情况将会有所改变。我们可能会看到一些初创公司完全在 Replit 和 Replit AI 智能体 (Agent) 上运行。在未来一两年内,我认为会出现越来越多的由个人创业者创办的、价值数十亿美元的初创公司。
很多人都在讨论我们是否已经遇到了瓶颈,认为 AI 的发展已经停滞不前。你认为这种观点从何而来?
如果我们从实际应用的角度来看,情况并非如此。现在是否存在一些我们去年做不到,而今天可以做到的事情?如果你身处编码领域,答案是肯定的。如果你关注计算机的应用,答案也是肯定的。现在的 AI 模型可以使用计算机、鼠标和键盘,这是一个巨大的进步。
AI 的能力正在快速发展。所谓“遇到瓶颈”的说法可能更多地停留在学术层面,因为我们还没有看到新一代的 AI 模型出现。更确切地说,我们正在扩展现有模型的能力,例如从 GPT-2 到 GPT-3,再到 GPT-4。这种情况已经有一段时间没有发生了。人们曾预计它会在 2024 年出现。有传言说,OpenAI 的新模型已经推迟了一年,因此人们对它是否能够出现持怀疑态度。但总而言之,这更多的是学术层面的探讨。我认为,我们应该从更实际的角度来看待问题,关注基准测试的结果和实际应用能力,而它们都在朝着正确的方向发展。
我在这里充当“魔鬼的代言人”,承认 “有一段时间没有出现重大飞跃” 的说法是有一定道理的。但另一方面,作为一名实际的应用程序开发者,我并不太在意这些。我真正关心的是,现在的技术能否继续为我解锁更多有用的功能,以便我围绕它构建新的应用。
你会考虑计算基础设施和构建巨大的计算能力吗?你们会尝试规划一年内需要多少计算资源吗?
事实上,我们已经遇到了 Google Cloud 的配额限制,他们无法为我们提供足够的模型使用量。我们经常遇到这些限制。我们是 Google Cloud 上 Anthropic Claude 的三大用户之一,甚至用完了配额。这表明计算资源确实存在明显的限制。在某个阶段,训练受到了限制;现在,随着测试时计算的普及,推理能力也开始受到限制。我是否担心这个问题?这就像任何我无法控制的事情一样。我不会过度担忧。我会尝试去理解它,因为它会影响我对事物发展方向的看法。但这些计算资源最终会被开发出来,并被充分利用。
你们是否可以规划一个实验,它在六个月后就不再昂贵了?
我不认为所有的能力提升都来自于计算规模的扩大。一些提升来自于算法的改进,一些来自于数据,包括训练方法、数据收集方法和数据购买方法。现在有很多数据交易正在进行。可以扩展的方面有很多,包括数据、训练计算和推理计算。但对我而言,很难找到一个可以指导我业务发展的具体指标。
相反,这几乎需要一种“基于信念”的方法。例如,我提出了一个以我的名字命名的定律。我认为,每六个月,学习一点编程的回报就会翻倍。每六个月,在 Replit 上学习一些新知识并加以应用,其价值就会越来越高。如果你能掌握更多的技术,例如能够进行更多的调试,阅读和理解更多的代码,那么即使是少量的技能提升,也会带来指数级的回报。
这个定律是否成立?
我认为是这样的。9 月份我们发布了 AI 智能体 (Agent),我想在接下来的几个月里,我们还会发布一些新的功能,这将使 Replit 更易于使用,并且更加强大。
我们可以从另一个角度来看待这个问题。如果你不参与到这些变革中,你会失去什么?
AI 是否会变得如此简单,以至于在某个时候,你不再需要学习任何技能?
我认为技能仍然是必要的。但这种技能与以往大不相同。我认为它更加纯粹。使用 AI 系统和 Replit 等工具的技能更加纯粹。现在更重要的是:你是否能够产生好的想法?你是否能够将这些想法转化为大语言模型 (LLM) 可以理解的指令?以及你是否能够根据 LLM 返回的结果,有效地指导它?这才是真正的技能。人们称之为“提示”,但我不认为这仅仅是 “提示”。它还包括清晰的思考,以及对技术的一般理解,能够理解这些系统是如何工作的。如果你具备这些能力,你就能获得巨大的成功。
假设你是一位才华横溢的律师,你逻辑清晰,但对这些技术一无所知。一年后,他们是否能凭借自身的思维能力快速上手,还是会落后于时代?
他们可能会稍微落后一些,因为这些系统是全新的,你需要逐渐建立起对它们的直觉。这需要花费一定的时间。我对大语言模型 (LLM) 的直觉也是通过实践慢慢培养起来的。到 2022 年,我基本上了解了如何与它们“对话”,所以当 ChatGPT 出现时,我已经是 “提示” 方面的专家了。也许那些在 ChatGPT 出现时才开始接触 AI 的人,现在也拥有了和我类似的认知模型。这需要时间,但我认为,前提条件是清晰的思考能力。
所以,如果一个人不尝试构建自己的软件,不为家人开发应用程序,就意味着他已经落后了吗?
在生活中发现软件可以解决的问题,也是一种重要的能力。你需要能够发现问题的本质,并且意识到可以通过软件来解决。例如,像记录睡眠日记这样简单的需求,也可以通过应用程序来实现。或者,你也可以开发一个家务管理应用,或是一个旅行计划工具。
真正令人兴奋的是,程序员和非程序员之间的差距正在迅速缩小,普通人将有机会像今天的黑客一样自由地使用计算机。自从图形用户界面出现以来,技术世界就一直存在着巨大的鸿沟,一部分人负责开发应用程序,另一部分人则负责使用它们。但计算机的最初愿景并非如此,它原本希望人人都是程序员,但因为编程太难,所以没有实现。而现在,我们正在回归那个最初的愿景。
鼠标何时会消失?何时每个用户界面都将变成自然语言交互?
我很难回答“何时”这个问题,因为即使你能预测时间,也很难预测普及程度,尤其是在政府、教育、军队等监管严格的行业。现在仍然有计算机运行着 Cobalt 和 Pascal 等老旧的编程语言。但如果排除这些限制因素,我认为消费级软件在未来两年内将会发生巨大的变革。视听输入将成为我们未来两年使用计算机的主要方式。
Replit 的未来发展方向是什么?你们是否会成为专业程序员的首选平台?
我想说,我们现在已经不太关注专业程序员了。桌面界面的出现,让计算机用户从 1000 万增长到 10 亿,而移动设备的出现,又将这个数字推高到 50 亿。每一次的普及都伴随着用户数量级的增长,因为技术变得更加易于使用。
基本上,如果你会使用电子表格,那么你就应该可以使用 Replit AI 智能体 (Agent) 之类的工具来制作软件。全球有数十亿的电子表格用户,这意味着有潜力使用 Replit 的用户基数非常庞大。
我们即将发布一个移动应用程序版本,它针对使用 AI 智能体 (Agent) 开发软件进行了优化。很快它就会达到消费级水平。即使是与科技行业没有直接联系的儿童和普通用户,也应该可以使用 Replit 来开发应用程序,让他们的生活变得更加美好。这就像是个人电脑革命,是个人软件时代的到来。我认为这一切都会很快发生。我们的用户增长速度非常快。这与 Replit 之前的增长模式截然不同。过去,我们只是不断增加用户数量,而现在,我们吸引的用户开始在平台上付费开发应用程序,这对我们来说是一件好事。更重要的是,用户从平台中获得的价值也越来越高,而不是像过去那样,仅仅是学习编程,尝试构建东西,但最终没有取得太大的进展。即使到下个月,在 Replit 上开发应用程序也将变得更加容易。