本文是 Replit 的创始人 Amjad Masad 所写，主要描述了公司从传统编程平台向基于自然语言的“软件生成平台”转型的历程。他强调，Replit 的核心目标已从“帮助用户编写代码”转变为“让用户通过自然语言轻松创建软件”。通过推出名为“Agent”的创新工具，Replit 正在推动软件开发的民主化，使非专业人士也能创建高度定制化的应用程序。这种转变不仅加速了公司的收入增长，还可能彻底改变人们与计算机交互的方式。

Replit 的战略转型与 Agent 的推出

从编程到软件生成：Replit 不再仅仅是一个代码编写工具，而是一个通过自然语言生成软件的平台。
Agent 的成功：2023 年 9 月推出的 Agent 是首个大规模可用的软件代理工具，用户仅需 $25 即可创建 30-40 个小型 SaaS 应用，极大降低了开发成本。
团队重组与增长：尽管因战略调整裁员后团队规模减半，但公司收入在短短 5-6 个月内增长了 5 倍。

Agent 的核心特点与应用

高度定制化：用户可以通过代码调整应用程序的功能，使其完全符合个人需求。例如，Masad 自己使用 Agent 将医生提供的 PDF 表单转化为睡眠记录应用，并不断优化。
全栈解决方案：Replit 提供从开发环境到数据库管理的一站式服务，用户无需具备深厚的技术背景。
人机协作：Agent 依赖“人类在循环中的”模式，用户需不断指导和调整代理的任务方向，避免其“漂移”。

技术基础与行业影响

依赖基础模型：Agent 使用 Anthropic 的 Claude 3.5 模型，并通过工程创新实现了更高效的任务执行。
测试时计算（Test-Time Compute）：通过并行运行多个代理并选择最佳结果，Agent 提高了任务完成的可靠性。
未来潜力：尽管目前尚未出现重大突破性的模型，现有技术的持续优化已显著提升实际应用能力。

软件开发的民主化

非专业用户的崛起：Replit 正在缩小程序员与普通用户之间的差距，任何人都可以通过 Agent 创建应用程序。
技能转变：未来的关键技能将是清晰思考、有效地与 AI 系统交互，以及将创意转化为可执行的指令。
应用场景广泛：从工作到生活，用户可以创建满足个人需求的小型应用，而无需依赖昂贵的 SaaS 工具。

行业趋势与挑战

计算能力的限制：Replit 已面临云服务商（如 Google Cloud）计算配额的瓶颈，但 Masad 认为未来的突破可能来自算法改进和数据利用，而非单纯的计算扩展。
自然语言界面的未来：Masad 预测，未来两年内，基于自然语言的用户界面将成为主流，取代鼠标和传统交互方式。

长期愿景

个人软件革命：Replit 希望通过降低开发门槛，让普通用户像使用 PC 和智能手机一样轻松创建软件。
消费者级产品：未来版本的 Replit 将针对普通用户和学生优化，推动软件开发的普及化。
经济潜力：随着平台的易用性提升，预计会出现更多基于 Replit 的创业公司和高收入个人开发者。

原文

Reed Albergotti: 是什么促使你转向 AI 智能体 (Agent) 方向的？

Amjad Masad: 这背后有点像创始人二次创业的故事。公司发展壮大后，企业文化变得有些迟缓和保守。因此，我组建了一个名为“AI 智能体 (Agent) 特遣队”的团队，汇集了公司最优秀的人才。我们要彻底改变公司的发展方向。Replit 的目标不再仅仅是编写代码，而是要创造软件。我们希望仅通过自然语言就能轻松“召唤”出所需的软件。

那时，这个想法是否可行还不确定，但团队中的每个人都充满干劲。我们进行了裁员，那些没有加入 AI 智能体 (Agent) 特遣队的员工感到士气低落，觉得自己没有在做重要的事情，所以很多人最终选择了离开。我们失去了一半的团队，从 130 人减少到大约 65 人。但与此同时，在过去的五到六个月里，我们的收入却增长了五倍。

哇。收入增长来自哪里？

AI 智能体 (Agent)。它取得了巨大的成功。我们在九月份发布了它，这基本上是目前世界上第一个可供体验的大规模、实用的软件 AI 智能体 (Agent)。我甚至可以说它是独一无二的。

Cognition 公司开发的 Devin（一款编码 AI 智能体 (Agent)）应该是什么样的？

他们最近宣布了一项 500 美元的收费计划，但我认为他们的规模还无法与我们相比。在 Replit 上，你只需支付 25 美元，就能获得相当多的使用额度。每月花费 25 美元，你就可以构建 30 到 40 个微型 SaaS 应用，并且可以根据需要付费继续开发。人们可以用 5 到 10 美元的价格构建应用程序。许多用户正在用它替换内部工具，彻底淘汰原有的 SaaS 产品。无论是大型企业还是小型创业者，他们都借此节省了大量资金。

有没有哪款工具特别受欢迎，被大家广泛使用？

并没有。有趣的是，它的应用呈现出“长尾”分布的特点。如果某一款应用特别流行，肯定会有人直接复制或借鉴。但 Replit AI 智能体 (Agent) 的独特之处在于其高度的定制化。如果你使用 TypeForm，只能点击一些预设的选项。而使用 Replit AI 智能体 (Agent)，你可以利用代码的强大功能，对应用进行无限的个性化定制，从而构建完全符合你需求的工具。

我正在与一位睡眠医生合作，他给了我一张纸质的记录表，让我记录睡眠日记。如果我用纸记录，很容易就会弄丢。所以我把医生发给我的 PDF 文件导入到 Replit AI 智能体 (Agent) 中，把它变成了一个可以记录我睡眠情况的应用程序。随着时间的推移，我不断地为它添加新功能，例如绘制睡眠数据图表和进行分析。这就像拥有一个随叫随到的初级开发人员。

你需要在云端建立数据库吗？它是自动完成所有这些操作，还是你需要了解相关技术？

Replit 的优势在于，我们过去七八年一直在构建相关的基础设施。它可以自动处理所有这些事情，并且完全托管。

在发布 AI 智能体 (Agent) 之前，你曾提到，你们的优势在于可以看到代码从概念到实际应用的全过程。这是否是 AI 智能体 (Agent) 特遣队成功的关键？

关键的突破在于我们为实现 AI 智能体 (Agent) 所做的许多工程方面的工作。当然，Anthropic 的 Claude 3.5 Sonnet 模型 [以及] 对整个行业来说也是一个巨大的进步。Cursor 等公司都是在这款模型发布后才开始取得进展的。AI 编码领域有趣之处在于，每当出现一个性能飞跃的新模型时，它都会为基于该模型构建的公司带来更多创新体验。

这预示着未来将如何发展？你们拥有丰富的训练数据，事实证明，新的模型足够强大，可以自行完成任务。

我一直在思考这个问题。数据仍然重要。但关键在于，这些模型确实不负“基础模型”之名，它们已经进化成通用的模型，可以针对任何下游任务进行微调。我们正在利用自身的数据进行微调。我认为这些数据将具有巨大的价值。但即使不使用自己的数据，我们也能取得如此大的进展，这引发了行业内的许多思考。基础模型公司似乎比一年前更具长期发展的潜力，因为这些模型确实非常强大，且具有广泛的适用性。

如果你们可以直接使用 Anthropic 的模型，这是否意味着你们的竞争优势并不明显？

在过去的七八年里，我们一直在构建一个平台，它可以提供开发环境，运行代码，安装软件包，管理数据库并进行部署。我们实现了“一键部署”。这才是我们创造的真正价值。这与其说是一个难以逾越的“护城河”，不如说是一个“先发优势”。只要我们保持创新和进步的速度，并不断深化我们的技术积累，我认为我们就可以继续保持领先地位。而商业上的真正问题是，如何建立持久的竞争优势。

这与你之前的预测大相径庭。在第一次采访中，我问你：“这是否意味着，任何人都可以创建应用程序？” 而你回答说：“哦，这在可预见的未来不会发生。” 我感觉那仿佛发生在昨天。

我在 2023 年 10 月的 TED 演讲中提到：“未来将朝着这个方向发展，但我不知道它是否会在十年内实现。” 但令人惊讶的是，我们在今天就已经实现了那次演讲中描述的一切。这对我来说是一个巨大的转变。我知道这些事情都会发生，但我没想到会这么快。

当然，开发过程仍然需要一定的人工参与、创造力以及技术。我们已经知道，“提示”也是一项技能：你需要将高层次的想法分解为具体的步骤，你需要评估系统的表现并给出反馈。这些因素都决定了它不是一个完全自动化的过程。实际上，你仍然需要做很多工作。而我们所做的创新在于，人始终参与其中。

你认为这种模式会持续下去吗？

我仍然认为，在整个过程中，你需要对 AI 智能体 (Agent) 进行指导。现在 AI 智能体 (Agent) 的一个问题是，它们很容易“跑偏”。我们采用的 “人在回路” 的模式，让 AI 智能体 (Agent) 在完成一部分工作后会返回来，接受用户的指导。某种程度上，你就像在“照看”它们，引导它们回到你希望完成的任务上来。AI 智能体 (Agent) 能否发挥创造力并提出新想法？我认为是可以的。但目前这并不是瓶颈，真正的瓶颈在于，它们很容易偏离目标。

测试时计算提供的推理能力是否能帮助解决这个问题？

测试时计算的核心思想是，大语言模型 (LLM) 的确具有一定的随机性，可能会在某些方面出现偏差。解决这个问题的方法是同时运行多个模型，并选择最佳的路径。我们也在考虑采用类似的方法。例如，我们给 AI 智能体 (Agent) 一个指令，它会启动 5 到 10 个 AI 智能体 (Agent) 来竞争完成应用程序的构建。如果我们想发布 “Replit o1” [这里指 OpenAI 的 GPT-o1 模型]，它会通过分叉 10 个进程来实现，并根据某种标准来选择最佳的方案反馈给用户。

你们正在使用 Claude 3.5 Sonnet。如果使用 o1 模型会怎么样？

目前，o1 的工作方式有点“自我中心”。它在自己的“头脑”中思考，然后给你一个最终答案。你可以给它一个问题，它会深入思考，产生许多潜在的想法，然后通过一个奖励模型来评估这些想法。在某种程度上，编程比自然语言处理更容易，因为你可以获得实际的验证。你的奖励模型可以使用实际的编程输出来进行训练。与自然语言不同，你可以从环境中获得反馈。对于 o1，如果他们能提供接口，让我们能够访问其思考过程，例如“运行这段 Python 代码”或“读取这个文件”，它就可以从环境中获取反馈。但就目前的形式而言，我认为它不太适合用作 AI 智能体 (Agent)，因为它没有提供访问其思考过程的接口，让我们无法获得环境反馈。你可以想象，如果有一个类似于 o1 的系统，它可以在思考过程中进行工具调用，例如，它可能会思考 “我想知道这个文件是什么” ，然后读取这个文件。或者思考“如果我运行这段 Python 代码，会发生什么？”

测试时计算对你们的价值在于，可以使用它来创建各种不同的应用程序，并将它们与 Python 和数据库连接起来，但 OpenAI 无法做到这一点，因为它受到自身系统的限制。

这或许也是它“自我中心”的原因。它在自己的数据中心里，不断地进行自我循环。

你们是否尝试过自己实现测试时计算？

是的。Replit AI 智能体 (Agent) 已经采纳了一些测试时计算的思想，进行了大量的思考。我们生成了大量的 Token 来分析问题，例如，“我在控制台中看到了一个错误，我需要思考如何解决它。也许我应该查看一下这个文件，看看里面有什么。然后我应该撤销更改，重新运行程序”。行动观察是一种测试时计算的方式，因为大语言模型 (LLM) 的标准使用方式是请求-响应模式。用户发送一个请求，AI 助手返回一个响应。而我们使用 AI 智能体 (Agent) 的方式是：用户发送一个请求，AI 智能体 (Agent) 可以循环多次，并最终决定何时终止任务。

你们可以用它来创建 iOS 应用程序吗？

我们正在努力实现这一点。

这方面的挑战是什么？

Apple 的生态系统非常封闭。挑战主要来自基础设施方面，例如如何创建应用程序，如何让它们在浏览器中运行，以便用户可以看到结果，以及如何安装、部署和测试它们。

你们是否看到有人用它创造出商业上可行的产品？

目前还处于早期阶段，距离发布只有三个月，还没有出现任何特别成功的产品。当然，在 AI 智能体 (Agent) 之前，Replit 上已经有一些成功案例。而 AI 智能体 (Agent) 的出现，则让各种应用的潜力更加令人期待。如果你在六个月后问我，我可能会给你讲一个能带来数百万美元年度经常性收入的案例，但目前，人们还只是在发布一些简单的应用。

大家对工作、生活和家庭相关的应用程序都充满热情。对于创业者而言，开发功能完善的应用程序更具挑战性。一旦应用获得一定的用户量，对系统的要求就会呈指数级增长，因为用户数量庞大，而且可能出现各种各样的问题。但是，如果你的应用程序开始走红，你就可以考虑投资聘请开发人员了。

我认为在未来六个月内，情况将会有所改变。我们可能会看到一些初创公司完全在 Replit 和 Replit AI 智能体 (Agent) 上运行。在未来一两年内，我认为会出现越来越多的由个人创业者创办的、价值数十亿美元的初创公司。

很多人都在讨论我们是否已经遇到了瓶颈，认为 AI 的发展已经停滞不前。你认为这种观点从何而来？

如果我们从实际应用的角度来看，情况并非如此。现在是否存在一些我们去年做不到，而今天可以做到的事情？如果你身处编码领域，答案是肯定的。如果你关注计算机的应用，答案也是肯定的。现在的 AI 模型可以使用计算机、鼠标和键盘，这是一个巨大的进步。

AI 的能力正在快速发展。所谓“遇到瓶颈”的说法可能更多地停留在学术层面，因为我们还没有看到新一代的 AI 模型出现。更确切地说，我们正在扩展现有模型的能力，例如从 GPT-2 到 GPT-3，再到 GPT-4。这种情况已经有一段时间没有发生了。人们曾预计它会在 2024 年出现。有传言说，OpenAI 的新模型已经推迟了一年，因此人们对它是否能够出现持怀疑态度。但总而言之，这更多的是学术层面的探讨。我认为，我们应该从更实际的角度来看待问题，关注基准测试的结果和实际应用能力，而它们都在朝着正确的方向发展。

我在这里充当“魔鬼的代言人”，承认 “有一段时间没有出现重大飞跃” 的说法是有一定道理的。但另一方面，作为一名实际的应用程序开发者，我并不太在意这些。我真正关心的是，现在的技术能否继续为我解锁更多有用的功能，以便我围绕它构建新的应用。

你会考虑计算基础设施和构建巨大的计算能力吗？你们会尝试规划一年内需要多少计算资源吗？

事实上，我们已经遇到了 Google Cloud 的配额限制，他们无法为我们提供足够的模型使用量。我们经常遇到这些限制。我们是 Google Cloud 上 Anthropic Claude 的三大用户之一，甚至用完了配额。这表明计算资源确实存在明显的限制。在某个阶段，训练受到了限制；现在，随着测试时计算的普及，推理能力也开始受到限制。我是否担心这个问题？这就像任何我无法控制的事情一样。我不会过度担忧。我会尝试去理解它，因为它会影响我对事物发展方向的看法。但这些计算资源最终会被开发出来，并被充分利用。

你们是否可以规划一个实验，它在六个月后就不再昂贵了？

我不认为所有的能力提升都来自于计算规模的扩大。一些提升来自于算法的改进，一些来自于数据，包括训练方法、数据收集方法和数据购买方法。现在有很多数据交易正在进行。可以扩展的方面有很多，包括数据、训练计算和推理计算。但对我而言，很难找到一个可以指导我业务发展的具体指标。

相反，这几乎需要一种“基于信念”的方法。例如，我提出了一个以我的名字命名的定律。我认为，每六个月，学习一点编程的回报就会翻倍。每六个月，在 Replit 上学习一些新知识并加以应用，其价值就会越来越高。如果你能掌握更多的技术，例如能够进行更多的调试，阅读和理解更多的代码，那么即使是少量的技能提升，也会带来指数级的回报。

这个定律是否成立？

我认为是这样的。9 月份我们发布了 AI 智能体 (Agent)，我想在接下来的几个月里，我们还会发布一些新的功能，这将使 Replit 更易于使用，并且更加强大。

我们可以从另一个角度来看待这个问题。如果你不参与到这些变革中，你会失去什么？

AI 是否会变得如此简单，以至于在某个时候，你不再需要学习任何技能？

我认为技能仍然是必要的。但这种技能与以往大不相同。我认为它更加纯粹。使用 AI 系统和 Replit 等工具的技能更加纯粹。现在更重要的是：你是否能够产生好的想法？你是否能够将这些想法转化为大语言模型 (LLM) 可以理解的指令？以及你是否能够根据 LLM 返回的结果，有效地指导它？这才是真正的技能。人们称之为“提示”，但我不认为这仅仅是 “提示”。它还包括清晰的思考，以及对技术的一般理解，能够理解这些系统是如何工作的。如果你具备这些能力，你就能获得巨大的成功。

假设你是一位才华横溢的律师，你逻辑清晰，但对这些技术一无所知。一年后，他们是否能凭借自身的思维能力快速上手，还是会落后于时代？

他们可能会稍微落后一些，因为这些系统是全新的，你需要逐渐建立起对它们的直觉。这需要花费一定的时间。我对大语言模型 (LLM) 的直觉也是通过实践慢慢培养起来的。到 2022 年，我基本上了解了如何与它们“对话”，所以当 ChatGPT 出现时，我已经是 “提示” 方面的专家了。也许那些在 ChatGPT 出现时才开始接触 AI 的人，现在也拥有了和我类似的认知模型。这需要时间，但我认为，前提条件是清晰的思考能力。

所以，如果一个人不尝试构建自己的软件，不为家人开发应用程序，就意味着他已经落后了吗？

在生活中发现软件可以解决的问题，也是一种重要的能力。你需要能够发现问题的本质，并且意识到可以通过软件来解决。例如，像记录睡眠日记这样简单的需求，也可以通过应用程序来实现。或者，你也可以开发一个家务管理应用，或是一个旅行计划工具。

真正令人兴奋的是，程序员和非程序员之间的差距正在迅速缩小，普通人将有机会像今天的黑客一样自由地使用计算机。自从图形用户界面出现以来，技术世界就一直存在着巨大的鸿沟，一部分人负责开发应用程序，另一部分人则负责使用它们。但计算机的最初愿景并非如此，它原本希望人人都是程序员，但因为编程太难，所以没有实现。而现在，我们正在回归那个最初的愿景。

鼠标何时会消失？何时每个用户界面都将变成自然语言交互？

我很难回答“何时”这个问题，因为即使你能预测时间，也很难预测普及程度，尤其是在政府、教育、军队等监管严格的行业。现在仍然有计算机运行着 Cobalt 和 Pascal 等老旧的编程语言。但如果排除这些限制因素，我认为消费级软件在未来两年内将会发生巨大的变革。视听输入将成为我们未来两年使用计算机的主要方式。

Replit 的未来发展方向是什么？你们是否会成为专业程序员的首选平台？

我想说，我们现在已经不太关注专业程序员了。桌面界面的出现，让计算机用户从 1000 万增长到 10 亿，而移动设备的出现，又将这个数字推高到 50 亿。每一次的普及都伴随着用户数量级的增长，因为技术变得更加易于使用。

基本上，如果你会使用电子表格，那么你就应该可以使用 Replit AI 智能体 (Agent) 之类的工具来制作软件。全球有数十亿的电子表格用户，这意味着有潜力使用 Replit 的用户基数非常庞大。

我们即将发布一个移动应用程序版本，它针对使用 AI 智能体 (Agent) 开发软件进行了优化。很快它就会达到消费级水平。即使是与科技行业没有直接联系的儿童和普通用户，也应该可以使用 Replit 来开发应用程序，让他们的生活变得更加美好。这就像是个人电脑革命，是个人软件时代的到来。我认为这一切都会很快发生。我们的用户增长速度非常快。这与 Replit 之前的增长模式截然不同。过去，我们只是不断增加用户数量，而现在，我们吸引的用户开始在平台上付费开发应用程序，这对我们来说是一件好事。更重要的是，用户从平台中获得的价值也越来越高，而不是像过去那样，仅仅是学习编程，尝试构建东西，但最终没有取得太大的进展。即使到下个月，在 Replit 上开发应用程序也将变得更加容易。

原文#

原文