本文来自晚点LatePost的文章《中国大模型生存战:巨头围剿,创业难熬》,梳理出了其中的核心内容,并重新做了组织。
中国大模型的现状
现在悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。
一位去年跟踪了 4 家大模型公司的投资人,曾 “辛辛苦苦要到了” 六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些 founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。”
做大模型,“一年低消也要 20 亿-30 亿美元”,这超出任何一家中国大模型六小龙的总融资额。
目前大模型创业的两难是,to C AI 产品仍跳不出移动互联网生态,而字节、腾讯等公司在这里积累已久。其中,大公司最擅长,创业公司也绕不开的一个环节就是投放和流量获取。
投资人也逐渐认清现实:模型能持续比字节好,比开源的也好,而且好得很明显,这很难,最终要赢在产品。
现在大公司正处在 “上头” 期,但 “一旦一件事干了几年还拿不到结果”,内部张力会涌现,尤其是组织上的拉扯。这时如果创业公司还在场,可能有机会。百度已出现了类似的张力。在百度,训练基础大模型、开发 to C 大模型产品和提供 to B 大模型方案,分属三个事业群。一位百度人士说,到今年中,当百度模型训练团队希望调动更多算力,训更强的大模型时,会遭遇 GPU 不够用的情况,需要集团高层出面协调——同样是 GPU,放在 to B 业务,马上就有收入,而训练新模型,回报则不明确。
所有依靠新技术的创业,都是在和大公司赛跑——看创业团队先补上完整的商业化体系,还是大公司先学会新技术。这一竞赛的结果,取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛有多高、赛道有多长。
大模型 vs 移动互联网浪潮:移动互联网是新软件、新硬件同时出现,从电脑到手机,带来了 App 的强劲自然增长,当时的流量成本也低得多。“现在是新软件有了,还没有新硬件。”。但实际上,大模型产品现在的软件也还是 “半新状态”:由大模型支撑的很多产品,仍是一个个 App,模型能力是提升体验的最重要动力,但需求洞察、功能设计,流量和用户获取依然重要。如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏。
美团创始人王兴曾说:大多数人以为战争由拼搏组成,其实战争是由等待和煎熬组成。
当前中国 AI 产品数据战况
Kimi 和豆包激烈交战的生产力方向,普遍被认为价值高、智能含量高。而在类 Character.ai 的陪伴和虚拟社交产品上,巨头暂时没拿出那么多火力。
字节豆包 App: 今年 9 月的日活为 760 万,月活 4200 多万,30 日留存率34.5%。到 10 月,豆包的日活已达 945 万。中国日活最大的 AI 产品。
Kimi 智能助手:今年 9 月的日活为 130 多万,月活 1000 万出头,30 日留存率约 28%
2023 年 11 月,第一还是百度文心一言,当时豆包日活不到 130 万,比文心少几十万。
字节 Flow 旗下的 “猫箱”,目前日活在 65 万左右, 30 日留存率达到44.8%。字节另一款类似猫箱的产品 “小黄蕉”,已被放弃。
MiniMax 的 Talkie 加星野的总日活则约有 500 万。星野 9 月日活为 94 万,30 日留存率达到 60%
以上数据来自 QuestMobile。
关于视频生成,月之暗面从去年 10 月就开始做视频模型,起步很早;而今年 9 月,字节已发布了 2 个视频生成大模型——PixelDance 和 Seaweed,前者来自 AI Lab,后者来自 Seed。MiniMax 视频模型团队只有约 10 人,月之暗面的视频模型团队也是相似规模。MiniMax 在今年 8 月底发布了视频生成模型,月之暗面则至今还没发布。
字节的 AI 战略
在 ChatGPT 横空出世前,字节更看重 AI for Science,“押错了宝”。那之前,约有 100 多人的字节 AI Lab NLP 组里,只有不到 10 人在研究大语言模型。不到 12 个月里,字节跳动在大模型上后来居上。昆仑万维创始人周亚辉:“去年字节的 AI 战略是不及格,但完全不影响今年的满分表现。这符合我对这个组织快速迭代能力(卷死人能力)的预期。”
这波 AI 中,字节 AI 战略也就 40 分,还是靠了家底厚……当然以一鸣同学天才般的智力和悟性,Hands on 估计不出 3 月,就会从 40 变 80 甚至 90 分。
字节大模型研发负责人朱文佳,去年四季度 OKR 的首要目标还是 “让语言模型整体效果达到 GPT-3.5”。当时百度和一批头部大模型创业公司的进度已来到追赶 GPT-4。而今年夏天之后,字节大模型口碑迅速翻转,其产品数据和影响力也今非昔比。
从生产力到娱乐陪伴,从对话产品到 Agent 工具再到文生图,字节陆续推出了十几个 AI 应用,饱和式地覆盖了几乎所有主要 AI 产品方向。字节还做了AI 硬件——在今年 10 月推出能与豆包语音对话的 Ola Friend 耳机,近期还在研发 AI 眼镜。
不少人AI 论文作者和字节创始人张一鸣一对一聊过,这其中还有尚未毕业的博士生。一些技术人才也从创业阵营转向巨头,字节的 AI 技术骨干持续增加,包括今年 2 月加入的 Google 原 VideoPoet 项目负责人蒋路,8 月加入的零一万物黄文灏,和阿里通义大模型原技术负责人周畅,和智谱 AI 的一名资深研究员……还有许多人未浮出水面,字节大模型团队里用花名的人越来越多。
从今年 4 月起,抖音 App 就不再接受其它 AI 产品的投放。同时,豆包作为字节系产品,在抖音投放时很可能有折扣。当年字节大力做教育产品时,就有类似的操作。
字节的 AI 新部门 —— Flow 团队
Flow 现在已是和抖音、火山、飞书等平级的主要业务部门。广义的 Flow 大部门现在有 3 部分:AI 产品团队 Flow,大模型研发团队 Seed,和产品研发支持团队 Stone。
Flow 部门的总负责人为朱骏,他同时是豆包产品的总负责人。
朱骏今年 45 岁,他曾为感受世界而去酒吧驻唱。他联合创立的 Musical.ly 在 2017 年被字节收购,成为抖音产品形态的基础之一。朱骏加入字节后,负责过战略投资、TikTok、产品和战略等。
与朱骏搭档的 Seed 负责人是朱文佳,此前是 TikTok 产品技术负责人。2015 年,朱文佳从百度加入当时刚成立 3 年的字节,是把深度学习应用到今日头条上的第一批技术骨干。朱文佳之下,字节有 4 个主要模型研发方向,分别是:朱文佳百度时期的同事、字节原搜索技术负责人乔木带队的大语言模型,字节智能创作团队负责人杨建朝带队的视觉模型(蒋路即在杨建朝团队),以及王雨轩带队的语音模型。
新近加入的周畅则将探索一个更前沿的方向——世界模型。“接触过他的人都觉得他很有技术野心。”
Stone 则于今年下半年从 Flow 产品团队中拆分,向字节工程技术负责人洪定坤汇报。这让朱骏可以更专注于产品的洞察、设计和运营。
在字节,一些一线员工并不想转岗去 Flow,因为这是个变动不居、正在 “跑马圈地” 的部门。也有字节员工认为豆包是 “ ICU 产品”——离开投放的插管就活不下去。
阿里的 AI 战略
阿里是中国最积极做开源大模型的公司。到今年 9 月,其 Qwen 系列开源大模型的总下载量已超 4000 万次,衍生出了 5 万个大模型,仅次于 Meta 的 Llama 系列。
2023 年冬天,去年冬天,阿里开始接触 MiniMax,并在今年初投资了约 6 亿美元。
2024 年春节前,阿里大手笔投资月之暗面近 8 亿美元,持股比例约 40%,月之暗面投后估值来到 23.4 亿美元,与之前的第一,MiniMax 相当。这符合阿里云的战略:做智能算力供应商。类似微软与 OpenAI 的组合,阿里用算力加现金,投资了一批大模型公司。
大模型六小龙人员调整情况
智谱 AI 高峰期有 1000 多人,今年一度缩减上百人,不少交付、销售人员离开;
零一万物调整了数十人的团队,集中在产品和运营部门;
MiniMax 的商业化和部分产品运营团队总计减员约 50 人;
月之暗面则因收缩海外业务,减少 10 余位员工;
百川智能也减员约 20 人,主要调整了 C 端产品人员。