本文来晚点于 2025年 1 月份对 MiniMax 创始人兼 CEO 闫俊杰的访谈

闫俊杰认为,AI 大模型的发展逻辑与移动互联网不同,不应依赖用户反馈来提升模型能力。他指出,更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。他强调,技术驱动是 AI 公司发展的核心,并认为开源能加速技术进化。他认为,AI 领域需要清晰定义模型能力分级,并通过技术手段逼近定义好的指标,而不是通过大量的 AB 测试和用户反馈来迭代模型。

MiniMax 的技术选择

MiniMax 发布了首个开源模型 MiniMax-01 系列,该模型在 4000 亿以上参数的大模型中,首次使用了线性注意力机制新架构,能高效处理 400 万 token 上下文。闫俊杰认为 long-context(长上下文)是 Agent(智能体)的重要能力。MiniMax 没有第一批跟进 OpenAI o 系列模型,而是选择了线性注意力机制,这与行业共识不同。

对用户和产品的看法

闫俊杰认为,用户数量并非 AI 竞争的核心,不应使用移动互联网的产品方法论来思考 AI 产品。他认为,AI 产品的重点在于模型能力的提升,而非用户反馈。他指出,“ChatGPT” 的 DAU 是 “Claude” 的 50 倍到 100 倍,但它们的模型其实差不多,这说明智能水平的提升,没那么依赖很多用户。

开源的意义

闫俊杰认为,开源能加速技术进化,并有助于建立技术品牌。他表示,MiniMax 开源模型不会藏更好的东西,因为所有模型一年之后都会落后。他认为,技术品牌之所以重要,本质也是因为这个行业最大的驱动力是技术进化。

对行业误区的反思

闫俊杰指出,中国大部分公司,包括创业公司和大厂,都在用做推荐系统的方法来做大模型产品,这是一种误区。他认为,应该非常清晰地定义模型能力分级,然后搞清楚每一代提升,需要什么样的算法、数据和推理过程,通过技术手段来逼近定义好的指标。

技术驱动的体现

MiniMax 在产品开发中,优先考虑算法上限高的功能,即使这会影响用户体验。例如,海螺视频虽然访问量很高,但页面仍然粗糙,因为 MiniMax 优先考虑算法的进步。

对 Agent 的看法

闫俊杰认为,Agent 的重要能力在于处理长上下文和多 Agent 之间的协同。他认为,AI 的发展方向是能处理复杂任务,达到专业人士的水平。他认为,Agent 最先落地的场景是 coding 和信息的获取。

对自身和团队的反思

闫俊杰反思了自己认知不足时的一些失误,并认为应该放下 ego(自我),思考更深。他认为,创业不是天选之子,而是需要独特的理解和创新。他认为,MiniMax 的团队特点是客观、扁平、灵活,沟通直接。他认为,人才密度最高的是字节跳动,但创业公司更能激发人才的潜力。

对竞争格局的看法

闫俊杰认为,不应把创业公司分成一个单独类别,而应看整个行业的发展。他认为,“DeepSeek” 和智谱是挺不错的公司。他认为,AI 领域不应套用移动互联网的逻辑,大公司过去的优势仍然有意义,但不是唯一的。他认为,MiniMax 的定位策略是希望自己一直在浪潮里,能参与推动浪潮继续发生,并能让公司持续发展下去。

对未来的展望

闫俊杰认为,AI 在专业领域达到专业人士水平是可预见的未来,这将是一个实质提升。他希望自己的技术水平变得更高,并认为技术认知能否不停提升才是最重要的。他认为,最大的痛苦是不知道要做取舍,而一旦知道,就不痛苦了。