在 Kimi K2 模型发布后,月之暗面创始人杨植麟接受了张小珺的专访。他深入探讨了从“缸中之脑”到 Agent 的 AI 范式转变,攀登“无限雪山”的哲学思考,以及 Kimi 的技术路线与未来,如果有时间建议大家去看看原文。本次访谈中核心围绕他在大模型创业第二年的思考、公司最新发布的 Kimi K2
模型,以及他对 AI
发展的哲学观。杨植麟将 AI
研发比作攀登一座“无限的山”,强调在不断解决问题的过程中拓展知识边界。
以下内容是对此次访谈简单的摘要,由 FisherAI Chrome 插件完成,模型为:Gemini 2.5 Pro。
主要观点
- AI 研发是永无止境的探索:杨植麟深受《无穷的开始》一书影响,认为
AI
发展如同攀登一座没有顶峰的雪山。核心理念是“问题不可避免,但问题可以解决”,每一次技术突破都会带来新的挑战,从而驱动知识和技术的无限进步。 - AI 范式正从“缸中之脑”走向与世界交互:当前
AI
的关键转变是从只能进行内部思考的推理模型,演变为能够通过多轮、使用工具与外部世界交互的Agent
(智能体)。这一转变的核心是test-time scaling
,即在推理时投入更多计算以完成更复杂的任务。 - K2 模型的战略核心是提升效率与 Agent 能力:面对高质量数据有限的瓶颈,
K2
模型的核心目标是提升token efficiency
(数据利用效率),通过Muon
优化器等技术,让模型“吃一份数据,学到两份的知识”。同时,重点发展Agentic
(智能体式) 能力,让模型具备解决复杂问题的泛化能力。 - Agent 的最大挑战是泛化能力:当前
Agent
训练容易过拟合特定基准测试 (如SWE-bench
),导致在真实、多样的场景中表现不佳。杨植麟认为,未来的突破口在于用更AI native
的方式训练AI
,即让模型参与自身的研发过程 (L4 Innovator
阶段),以解决泛化性难题。 - 组织管理与科研创新的哲学相通:杨植麟将强化学习 (
RL
) 的理念应用于团队管理,认为应以设定目标和奖励 (RL
) 为主,辅以必要的指导 (SFT
),从而激发团队的创造力和主观能动性,避免因过度指导而扼杀创新。
关键细节
- 关于 Kimi K2 模型:
- 定位:
Kimi K2
是一个于 2025 年 7 月发布的、基于MoE
架构的开源编程和Agentic
大语言模型。杨植麟在内部将其比作“乔戈里峰”,象征其攀登难度虽大但并非终点。 - 技术创新:为解决数据墙问题,
K2
重点提升token efficiency
。关键技术包括首次在大规模模型训练中采用经优化的Muon
优化器,以及通过数据改写 (Rephrase
) 策略增强模型对高质量数据的吸收和泛化能力。
- 定位:
- 关于 AI 范式演进:
- 从“缸中之脑”到 Agent:“缸中之脑”指模型仅在内部进行长思考推理 (
Reasoning
);而Agent
则能通过工具 (如浏览器、代码解释器) 与外部世界交互,完成多步骤的复杂任务。 - “一方产品”趋势:模型公司自己下场做产品 (如
Claude Code
),将模型、工具和环境进行端到端整合训练,相比第三方开发者在API
上搭建应用,这种方式的上限可能更高。 - L1 到 L5 并非严格线性:杨植麟认为
OpenAI
提出的L1
到L5
等级是重要的里程碑,但并非严格的先后依赖关系。例如,解决L3
(Agent) 的泛化问题,可能需要L4
(Innovator) 的能力,即用AI
训练AI
。
- 从“缸中之脑”到 Agent:“缸中之脑”指模型仅在内部进行长思考推理 (
- 关于战略与思考:
- 开源策略:杨植麟承认开源有市场博弈的因素,但更希望通过与社区分享技术,共同加速技术进步。他认为开源主要赋能下游应用,但模型核心能力的提升仍依赖原厂。
- 商业模式:当前
AI
公司的商业模式主要为API
服务和“一方产品”。月之暗面会进行尝试,但当前首要目标仍是提升模型能力,相信技术领先自然会带来商业成功。 - AI 的终极价值:杨植麟将
AI
视为“人类文明的放大器”,能够极大地加速科学发现和知识创造的进程。他认为,即使AI
能替代大部分创造性工作,人类的独特价值依然存在于“体验”和“爱”。