闫俊杰深度复盘:MiniMax 的 AI 进化之路

本文来晚点于 2025年 1 月份对 MiniMax 创始人兼 CEO 闫俊杰的访谈。 闫俊杰认为,AI 大模型的发展逻辑与移动互联网不同,不应依赖用户反馈来提升模型能力。他指出,更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。他强调,技术驱动是 AI 公司发展的核心,并认为开源能加速技术进化。他认为,AI 领域需要清晰定义模型能力分级,并通过技术手段逼近定义好的指标,而不是通过大量的 AB 测试和用户反馈来迭代模型。 MiniMax 的技术选择 MiniMax 发布了首个开源模型 MiniMax-01 系列,该模型在 4000 亿以上参数的大模型中,首次使用了线性注意力机制新架构,能高效处理 400 万 token 上下文。闫俊杰认为 long-context(长上下文)是 Agent(智能体)的重要能力。MiniMax 没有第一批跟进 OpenAI o 系列模型,而是选择了线性注意力机制,这与行业共识不同。 对用户和产品的看法 闫俊杰认为,用户数量并非 AI 竞争的核心,不应使用移动互联网的产品方法论来思考 AI 产品。他认为,AI 产品的重点在于模型能力的提升,而非用户反馈。他指出,“ChatGPT” 的 DAU 是 “Claude” 的 50 倍到 100 倍,但它们的模型其实差不多,这说明智能水平的提升,没那么依赖很多用户。 开源的意义 闫俊杰认为,开源能加速技术进化,并有助于建立技术品牌。他表示,MiniMax 开源模型不会藏更好的东西,因为所有模型一年之后都会落后。他认为,技术品牌之所以重要,本质也是因为这个行业最大的驱动力是技术进化。 对行业误区的反思 闫俊杰指出,中国大部分公司,包括创业公司和大厂,都在用做推荐系统的方法来做大模型产品,这是一种误区。他认为,应该非常清晰地定义模型能力分级,然后搞清楚每一代提升,需要什么样的算法、数据和推理过程,通过技术手段来逼近定义好的指标。 技术驱动的体现 MiniMax 在产品开发中,优先考虑算法上限高的功能,即使这会影响用户体验。例如,海螺视频虽然访问量很高,但页面仍然粗糙,因为 MiniMax 优先考虑算法的进步。 对 Agent 的看法 闫俊杰认为,Agent 的重要能力在于处理长上下文和多 Agent 之间的协同。他认为,AI 的发展方向是能处理复杂任务,达到专业人士的水平。他认为,Agent 最先落地的场景是 coding 和信息的获取。...

January 17, 2025 · 1 min · fisherdaddy