月之暗面杨植麟:Kimi K2 发布后的深度思考与未来之路
在 Kimi K2 模型发布后,月之暗面创始人杨植麟接受了张小珺的专访。他深入探讨了从“缸中之脑”到 Agent 的 AI 范式转变,攀登“无限雪山”的哲学思考,以及 Kimi 的技术路线与未来,如果有时间建议大家去看看原文。本次访谈中核心围绕他在大模型创业第二年的思考、公司最新发布的 Kimi K2 模型,以及他对 AI 发展的哲学观。杨植麟将 AI 研发比作攀登一座“无限的山”,强调在不断解决问题的过程中拓展知识边界。 以下内容是对此次访谈简单的摘要,由 FisherAI Chrome 插件完成,模型为:Gemini 2.5 Pro。 主要观点 AI 研发是永无止境的探索:杨植麟深受《无穷的开始》一书影响,认为 AI 发展如同攀登一座没有顶峰的雪山。核心理念是“问题不可避免,但问题可以解决”,每一次技术突破都会带来新的挑战,从而驱动知识和技术的无限进步。 AI 范式正从“缸中之脑”走向与世界交互:当前 AI 的关键转变是从只能进行内部思考的推理模型,演变为能够通过多轮、使用工具与外部世界交互的 Agent (智能体)。这一转变的核心是 test-time scaling,即在推理时投入更多计算以完成更复杂的任务。 K2 模型的战略核心是提升效率与 Agent 能力:面对高质量数据有限的瓶颈,K2 模型的核心目标是提升 token efficiency (数据利用效率),通过 Muon 优化器等技术,让模型“吃一份数据,学到两份的知识”。同时,重点发展 Agentic (智能体式) 能力,让模型具备解决复杂问题的泛化能力。 Agent 的最大挑战是泛化能力:当前 Agent 训练容易过拟合特定基准测试 (如 SWE-bench),导致在真实、多样的场景中表现不佳。杨植麟认为,未来的突破口在于用更 AI native 的方式训练 AI,即让模型参与自身的研发过程 (L4 Innovator 阶段),以解决泛化性难题。 组织管理与科研创新的哲学相通:杨植麟将强化学习 (RL) 的理念应用于团队管理,认为应以设定目标和奖励 (RL) 为主,辅以必要的指导 (SFT),从而激发团队的创造力和主观能动性,避免因过度指导而扼杀创新。 关键细节 关于 Kimi K2 模型: 定位:Kimi K2 是一个于 2025 年 7 月发布的、基于 MoE 架构的开源编程和 Agentic 大语言模型。杨植麟在内部将其比作“乔戈里峰”,象征其攀登难度虽大但并非终点。 技术创新:为解决数据墙问题,K2 重点提升 token efficiency。关键技术包括首次在大规模模型训练中采用经优化的 Muon 优化器,以及通过数据改写 (Rephrase) 策略增强模型对高质量数据的吸收和泛化能力。 关于 AI 范式演进: 从“缸中之脑”到 Agent:“缸中之脑”指模型仅在内部进行长思考推理 (Reasoning);而 Agent 则能通过工具 (如浏览器、代码解释器) 与外部世界交互,完成多步骤的复杂任务。 “一方产品”趋势:模型公司自己下场做产品 (如 Claude Code),将模型、工具和环境进行端到端整合训练,相比第三方开发者在 API 上搭建应用,这种方式的上限可能更高。 L1 到 L5 并非严格线性:杨植麟认为 OpenAI 提出的 L1 到 L5 等级是重要的里程碑,但并非严格的先后依赖关系。例如,解决 L3 (Agent) 的泛化问题,可能需要 L4 (Innovator) 的能力,即用 AI 训练 AI。 关于战略与思考: 开源策略:杨植麟承认开源有市场博弈的因素,但更希望通过与社区分享技术,共同加速技术进步。他认为开源主要赋能下游应用,但模型核心能力的提升仍依赖原厂。 商业模式:当前 AI 公司的商业模式主要为 API 服务和“一方产品”。月之暗面会进行尝试,但当前首要目标仍是提升模型能力,相信技术领先自然会带来商业成功。 AI 的终极价值:杨植麟将 AI 视为“人类文明的放大器”,能够极大地加速科学发现和知识创造的进程。他认为,即使 AI 能替代大部分创造性工作,人类的独特价值依然存在于“体验”和“爱”。