DeepSeek 的 10 万亿美元大战略

本文翻译自 GDP(@bookwormengr)发布在 X 上的文章《DeepSeek’s 10 trillion USD grand strategy》。本文完全由有道龙虾翻译、排版和发布。 你有没有想过,DeepSeek 可能如何赚钱,而且赚很多钱? 他们没有像 GLM、MoonShot 和 MiniMax 那样推出有竞争力的编程套餐。他们没有多模态、音频、视频模型。到目前为止,他们也没有一个 harness(他们最近才开始招聘来构建 harness)。DeepSeek 还长期致力于开源,并且非常乐于分享自己的“秘方”。这是疯狂吗?这是纯粹浪费钱吗?那些准备向他们投资 100 亿美元的投资人,是在把钱倒进下水道吗? 不,恰恰相反,至少在我看来是这样! 这里我会介绍我对 DeepSeek 迄今所做事情的观察,以及他们似乎正在遵循的一项战略。DeepSeek CEO 梁文锋的目光似乎盯着一个更大的奖项:他们可能实现 1 万亿美元估值,同时帮助创造一个 10 万亿美元规模的产业。 TechInAsia 关于 DeepSeek 最新融资轮的新闻 重新审视 DeepSeek 的英雄之旅 DeepSeek 一直逆风而行。他们没有选择不断构建略微更好的模型,然后急着销售即时应用,比如编程套餐。 我在 2025 年 1 月 27 日写过一条爆火推文,谈我眼中的“DeepSeek 英雄之旅”。这个故事现在变得更加有趣了。 当人们还在尝试构建 dense models 时,DeepSeek 选择了更难训练的专家混合模型(MoE)。 他们采用“第一性原理”方法,发明了新的 GRPO 算法,用来替代强化学习(RL)中占主导地位、实现成本更高的 PPO 算法。 他们发现了基于可验证奖励的强化学习(RLVR),将其作为提升模型推理能力的关键策略。 他们提出了通过“多 Token 预测”实现投机解码的简单策略,同时也让训练信号更密集。 他们完善了“零气泡”流水线,以提高有限 GPU 资源的使用效率。 他们发布了专家负载均衡器,让大家更容易部署专家混合模型。尤其是通过“宽专家并行”策略,模型可以更经济地服务,因为可以使用更大的 batch。 他们发明了 MLA、DSA、CSA、HCA,以降低 KV Cache 需求,并让随着上下文增长而增加的计算需求接近恒定。 他们发明了 Engram,用内存换计算。 他们发明了 mHC,以实现随着模型规模增长而稳定训练。这个清单还在继续…… 在“英雄之旅”这种最普遍的故事结构中,英雄从来不会一开始就决定自己的旅程是什么。他会边走边学,逐渐发现自己的伟大使命,并在重重阻碍下完成它。他会遇到许多诋毁者,但会无视他们。他会遇到许多恶意行为者。他有巨大的缺陷或短板,但会克服它们来完成使命。他会面对看似无法逾越的挑战,但会想办法结盟,并明智地使用珍贵资源。...

May 25, 2026 · 4 min · fisherdaddy

解码 AI TOPS:理解 AI 芯片的关键指标与性能对比 • Ernest Chiang

(插图: 幕后付出了诸多努力。 Le Bouchon Ogasawara,位于东京涩谷。 图片来源:Ernest) tl;drTOPS (每秒万亿次运算, Trillions of Operations Per Second) 是衡量 AI 芯片和 NPU 芯片计算能力的重要指标,它表示处理器每秒能执行的万亿次运算次数。我们可以用“煎鸡蛋”来形象理解 TOPS: 普通 CPU 就像一位每次只能煎一个鸡蛋的厨师,而高 TOPS 值的 AI 芯片则像一位可以同时煎无数鸡蛋的超级厨师。TOPS 是对比 AI 芯片性能的重要参考,但在评估 AI 硬件时,我们还应该综合考虑能效、内存带宽等因素。 此外,TOPS 值通常代表的是理论峰值性能,实际性能还需要结合具体应用场景进行评估。什么是 TOPS(通俗易懂版)TOPS,全称 每秒万亿次运算 (Trillions of Operations Per Second),是衡量人工智能 (AI) 芯片或神经处理单元 (NPU) 计算能力的关键指标。它表示处理器每秒能够执行的最大运算次数,以万亿为单位。 随着计算能力的不断提升,未来可能会出现更大的单位来替代 “万亿”。 为了更直观地理解 TOPS,我们可以用一个生活化的例子来解释: 将 AI 计算 想象成 煎鸡蛋的过程,而 数据 则是 待煎的鸡蛋。 一个普通厨师(相当于普通 CPU)可能一次只能煎一个鸡蛋,而一个超级厨师(相当于 AI 芯片)则可以同时煎一万亿个鸡蛋! TOPS 就好比衡量这位 “超级厨师” 能力的指标,告诉我们他每秒可以 “处理” 多少个 “数据鸡蛋”。 TOPS 是理解和比较 AI 芯片性能的重要参考之一,但并非唯一标准。...

January 9, 2025 · 10 min · fisherdaddy