(插图: 幕后付出了诸多努力。 Le Bouchon Ogasawara,位于东京涩谷。 图片来源:Ernest)


tl;dr

  • TOPS (每秒万亿次运算, Trillions of Operations Per Second) 是衡量 AI 芯片和 NPU 芯片计算能力的重要指标,它表示处理器每秒能执行的万亿次运算次数。
  • 我们可以用“煎鸡蛋”来形象理解 TOPS: 普通 CPU 就像一位每次只能煎一个鸡蛋的厨师,而高 TOPS 值的 AI 芯片则像一位可以同时煎无数鸡蛋的超级厨师。
  • TOPS 是对比 AI 芯片性能的重要参考,但在评估 AI 硬件时,我们还应该综合考虑能效、内存带宽等因素。 此外,TOPS 值通常代表的是理论峰值性能,实际性能还需要结合具体应用场景进行评估。

什么是 TOPS(通俗易懂版)

TOPS,全称 每秒万亿次运算 (Trillions of Operations Per Second),是衡量人工智能 (AI) 芯片或神经处理单元 (NPU) 计算能力的关键指标。它表示处理器每秒能够执行的最大运算次数,以万亿为单位。 随着计算能力的不断提升,未来可能会出现更大的单位来替代 “万亿”。

为了更直观地理解 TOPS,我们可以用一个生活化的例子来解释:

AI 计算 想象成 煎鸡蛋的过程,而 数据 则是 待煎的鸡蛋

一个普通厨师(相当于普通 CPU)可能一次只能煎一个鸡蛋,而一个超级厨师(相当于 AI 芯片)则可以同时煎一万亿个鸡蛋! TOPS 就好比衡量这位 “超级厨师” 能力的指标,告诉我们他每秒可以 “处理” 多少个 “数据鸡蛋”。

TOPS 是理解和比较 AI 芯片性能的重要参考之一,但并非唯一标准。

在评估 AI 硬件,例如 AI 手机或 AI 电脑时,我们还需要考虑其他因素,如能效、内存带宽和软件生态系统等。 通过 TOPS,我们可以比较不同 AI 芯片的计算能力,为选择适合特定应用的 AI 硬件设备提供参考。


什么是 TOPS(深入解析版)

在深入了解 TOPS 之前,我们首先需要理解什么是 “运算”:

在数字电路和计算机科学中,“运算” 通常指的是基本的数学或逻辑计算。 对于 AI 芯片或 NPU 来说,这些运算主要包括:

  1. 浮点运算: 例如加法、减法、乘法和除法。
  2. 矩阵运算: 大规模矩阵乘法是深度学习中最常见的运算之一。
  3. 向量运算: 包括点积(也称标量积)和叉积(也称向量积)等。
  4. 激活函数: 例如 ReLU,Sigmoid 和 Tanh 等。
  5. 卷积运算: 广泛应用于卷积神经网络 (CNN)。

这些运算通常以 FP32 (32 位浮点) 或 FP16 (16 位浮点) 格式进行。 部分 AI 芯片也支持精度更低的格式,例如 INT8 (8 位整数),以提高性能并降低能耗,这类格式通常用于推理。

TOPS 的计算公式可以简化为:

TOPS = (每个时钟周期的运算次数) × (时钟频率) / 1 万亿

举例来说,如果一个 AI 芯片在每个时钟周期可以执行 1000 次运算,且时钟频率为 1GHz,那么它的理论峰值性能就是 1 TOPS。

1000 次运算/周期 × 1GHz = 1000 × 10^9 次运算/秒 = 10^12 次运算/秒 = 1 TOPS

在理解 TOPS 时,需要注意以下几点:

  1. TOPS 通常代表的是理论峰值性能, 实际性能可能会受到内存带宽和芯片架构等因素的影响。
  2. 对于不同类型的运算 (如 FP32、FP16、INT8),TOPS 的数值可能会有所不同。
  3. 高的 TOPS 值并不一定意味着在所有 AI 任务中都有更好的表现,因为实际性能还取决于软件优化以及具体任务的特点。

TOPS 性能对比表

(请主要关注 “INT8 Ops” 列,左右滑动可查看更多数据) (包含 CES 2025 的信息)

INT8 OpsFP32 FLOps公司名称类型目标市场产品系列产品名称产品世代代号发布年份首次应用制造工艺CPUGPUNPU内存技术内存带宽TDP备注
73 TOPSn/aAMDSoCPCRyzen AI 300Ryzen AI 9 365n/aStrix Point2024n/aTSMC 4nm FinFETn/aAMD Radeon™ 880Mn/aDDR5-5600 或 LPDDR5X-7500n/a28.0- 总计 73 TOPS (NPU 提供 50 TOPS)。
80 TOPSn/aAMDSoCPCRyzen AI 300Ryzen AI 9 HX 370n/aStrix Point2024n/aTSMC 4nm FinFETn/aAMD Radeon™ 890Mn/aDDR5-5600 或 LPDDR5X-7500n/a28.0- 总计 80 TOPS (NPU 提供 50 TOPS)。
50 TOPSn/aAMDSoCHP 移动, PCRyzen AI 300Ryzen AI Max (PRO) 385n/aStrix Halo2025HP ZBook Ultra G1a, HP Z2 Mini G1a, ASUS ROG Flow Z13n/a(Zen 5) 8 核 (16 线程),L3 缓存 = 40 MBAMD Radeon 8050S 32 CUs (RDNA 3.5)XDNA 2 NPULPDDR5X-8000256 GB/sn/a
50 TOPSn/aAMDSoCHP 移动, PCRyzen AI 300Ryzen AI Max (PRO) 390n/aStrix Halo2025HP ZBook Ultra G1a, HP Z2 Mini G1a, ASUS ROG Flow Z13n/a(Zen 5) 12 核 (24 线程),L3 缓存 = 76 MBAMD Radeon 8050S 32 CUs (RDNA 3.5)XDNA 2 NPULPDDR5X-8000256 GB/sn/a
50 TOPSn/aAMDSoCHP 移动, PCRyzen AI 300Ryzen AI Max PRO 380n/aStrix Halo2025HP ZBook Ultra G1a, HP Z2 Mini G1a, ASUS ROG Flow Z13n/a(Zen 5) 6 核 (12 线程),L3 缓存 = 22 MBAMD Radeon 8040S 16 CUs (RDNA 3.5)XDNA 2 NPULPDDR5X-8000256 GB/sn/a
50 TOPSn/aAMDSoCHP 移动, PCRyzen AI 300Ryzen AI Max+ (PRO) 395n/aStrix Halo2025HP ZBook Ultra G1a, HP Z2 Mini G1a, ASUS ROG Flow Z13n/a(Zen 5) 16 核 (32 线程),L3 缓存 = 80 MBAMD Radeon 8086S 40 CUs (RDNA 3.5)XDNA 2 NPULPDDR5X-8000256 GB/sn/a
50 TOPSn/aAMDNPUn/aRyzenXDNA 2n/aAI2024Ryzen AI 9 HX 370n/an/an/an/an/an/an/a
1961.2 TOPS 3922.3 TOPS (带稀疏性)122.6 TFLOPSAMDGPU数据中心AMD 数据中心 GPU (AMD Instinct)MI300An/an/a2023n/an/an/an/an/aHBM35300 GB/s550.0
2614.9 TOPS 5229.8 TOPS (带稀疏性)163.4 TFLOPSAMDGPU数据中心AMD 数据中心 GPU (AMD Instinct)MI300Xn/an/a2023n/aXCD: TSMC N5 IOD: TSMC N6n/an/an/aHBM35300 GB/s750.0
2614.9 TOPS 5229.8 TOPS (带稀疏性)163.4 TFLOPSAMDGPU数据中心AMD 数据中心 GPU (AMD Instinct)MI325Xn/an/a2024n/aXCD: TSMC N5 IOD: TSMC N6n/an/an/aHBM3E6000 GB/s750.0
n/an/aARMIPn/aNeoverseNeoverse E1n/an/an/an/an/an/an/an/an/an/a
n/an/aARMIPn/aNeoverseNeoverse N1n/aAres2019Ampere Altra, AWS Graviton2n/an/an/an/an/an/a
n/an/aARMIP数据中心 (基础设施处理器)NeoverseNeoverse N2n/aPerseus2020Microsoft Azure Cobalt 100n/an/an/an/an/an/a
n/an/aARMIP数据中心 (基础设施处理器)NeoverseNeoverse N3n/aHermesn/an/an/an/an/an/an/an/a
n/an/aARMIP数据中心 (基础设施处理器)NeoverseNeoverse V1n/aZeus2020AWS Graviton3n/an/an/an/an/an/a- 首次公告来自 2018 年在圣何塞举行的 Arm TechCon 大会。
n/an/aARMIP数据中心 (基础设施处理器)NeoverseNeoverse V2n/an/a2022NVIDIA Grace, AWS Graviton4, Google Axionn/an/an/an/an/an/a
n/an/aARMIP数据中心 (基础设施处理器)NeoverseNeoverse V3n/aPoseidonn/an/an/an/an/an/an/an/a
825 TOPS ???n/a阿里巴巴SoC数据中心(AI 推理)含光含光 8001n/a2019n/a台积电 12nmn/an/an/an/an/a280.0- 16x PCIe gen4 - SRAM,无 DDR
n/an/a阿里巴巴SoC数据中心(基础设施)倚天倚天 7101n/a2021阿里云 ECS g8mN5128 Neoverse N2 核n/an/an/an/an/a
n/an/a亚马逊SoC数据中心(基础设施)(横向扩展)AWS GravitonGraviton1Alpine2018Amazon EC2 A1台积电 16nmCortex A72n/an/aDDR4-160051.2 GB/s95.0- 32 通道 PCIe gen3
n/an/a亚马逊SoC数据中心(基础设施)(通用)AWS GravitonGraviton 22Alpine+2019Amazon EC2 M6g, M6gd, C6g, C6gd, C6gn, R6g, R6gd, T4g, X2gd, G5g, Im4gn, Is4gen, I4g台积电 7nm128 Neoverse N1 核n/an/aDDR4-3200204.8 GB/s110.0- 64 通道 PCIe gen4
n/an/a亚马逊SoC数据中心(基础设施)(ML、HPC、SIMD)AWS GravitonGraviton 33n/a2021Amazon EC2 C7g, M7g, R7g; 带本地磁盘:C7gd, M7gd, R7gd台积电 5nm64 Neoverse V1 核n/an/aDDR5-4800307.2 GB/s100.0- 32 通道 PCIe gen5
n/an/a亚马逊SoC数据中心(基础设施)AWS GravitonGraviton 3E3n/a2022Amazon EC2 C7gn, HPC7gn/a64 Neoverse V1 核n/an/an/an/an/a
n/an/a亚马逊SoC数据中心(基础设施)(向上扩展)AWS GravitonGraviton 44n/a2023Amazon EC2 R8gn/a96 Neoverse V2 核n/an/aDDR5-5600537.6 GB/sn/a- 96 通道 PCIe gen5
63.3 TOPS0.97 TFLOPS亚马逊SoC数据中心(AI 推理)AWS InferertiaInferertia 11n/a2018Amazon EC2 Inf1台积电 16nm16 NeuroCore v1n/an/an/a50 GB/sn/a
380 TOPS2.9 TFLOPS亚马逊SoC数据中心(AI 推理)AWS InferertiaInferertia 22n/a2022Amazon EC2 Inf2台积电 5nm24 NeuroCore v2n/an/an/a820 GB/sn/a
380 TOPS2.9 TFLOPS亚马逊SoC数据中心(AI 训练)AWS TrainiumTrainium 11n/a2020Amazon EC2 Trn1台积电 7nm32 NeuroCore v2n/an/an/a820 GB/sn/a
861 TOPS6.57 TFLOPS亚马逊SoC数据中心(AI 训练)AWS TrainiumTrainium 22n/a2023Amazon EC2 Trn2台积电 4nm64 NeuroCore v2n/an/an/a4,096 GB/sn/a
n/an/a亚马逊SoCn/aAWS TrainiumTrainium 3n/an/a2025n/a台积电 N3 (?)n/an/an/an/an/an/a
11 TOPS748.8 GFLOPS苹果SoC移动AA14 Bionicn/aAPL1W012020iPhone 12台积电 N5Firestorm + Icestormn/an/aLPDDR4X-426634.1 GB/sn/a
15.8 TOPS1.37 TFLOPS苹果SoC移动AA15 Bionicn/aAPL1W072021iPhone 13台积电 N5PAvalanche + Blizzardn/an/aLPDDR4X-426634.1 GB/sn/a
17 TOPS1.789 TFLOPS苹果SoC移动AA16 Bionicn/aAPL1W102022iPhone 14台积电 N4PEverest + Sawtoothn/an/aLPDDR5-640051.2 GB/sn/a- 6GB LPDDR5
35 TOPS2.147 TFLOPS苹果SoC移动AA17 Pron/aAPL1V022023iPhone 15 Pro, iPhone 15 Pro Max台积电 N3B6 核 (2 个性能核 + 4 个能效核)Apple 设计的 6 核16 核神经网络引擎LPDDR5-640051.2 GB/sn/a- 8GB LPDDR5
35 TOPSn/a苹果SoC移动AA18n/an/a2024iPhone 16台积电 N3P6 核 (2 个性能核 + 4 个能效核)Apple 设计的 5 核16 核神经网络引擎n/an/an/a
35 TOPSn/a苹果SoC移动AA18 Pron/an/a2024iPhone 16 Pro台积电 N3P6 核 (2 个性能核 + 4 个能效核)Apple 设计的 6 核16 核神经网络引擎n/an/an/a
11 TOPS2.6 TFLOPS苹果SoC移动, PCMM1n/aAPL11022020n/a台积电 N5高性能 “Firestorm” + 高能效 “Icestorm”n/an/aLPDDR4X-426668.3 GB/sn/a
11 TOPS10.4 TFLOPS苹果SoC移动, PCMM1 Maxn/aAPL11052021n/a台积电 N5n/an/an/aLPDDR5-6400409.6 GB/sn/a
11 TOPSn/a苹果SoC移动, PCMM1 Pron/aAPL11032021n/a台积电 N5n/an/an/aLPDDR5-6400204.8 GB/sn/a
22 TOPS21 TFLOPS苹果SoC移动, PCMM1 Ultran/aAPL1W062022n/a台积电 N5M1 Ultra 由两个 M1 Max 单元组成,通过 UltraFusion 互连连接,总共有 20 个 CPU 核心和 96 MB 系统级缓存 (SLC)。n/an/aLPDDR5-6400819.2 GB/sn/a
15.8 TOPS2.863 TFLOPS, 3.578 TFLOPS苹果SoC移动, PCMM2n/aAPL11092022n/a台积电 N5P高性能 @3.49 GHz “Avalanche” + 高能效 @2.42 GHz “Blizzard”n/an/aLPDDR5-6400102.4 GB/sn/a
15.8 TOPS10.736 TFLOPS, 13.599 TFLOPS苹果SoC移动, PCMM2 Maxn/aAPL11112023n/a台积电 N5Pn/an/an/aLPDDR5-6400409.6 GB/sn/a
15.8 TOPS5.726 TFLOPS, 6.799 TFLOPS苹果SoC移动, PCMM2 Pron/aAPL11132023n/a台积电 N5Pn/an/an/aLPDDR5-6400204.8 GB/sn/a
31.6 TOPS21.473 TFLOPS, 27.199 TFLOPS苹果SoC移动, PCMM2 Ultran/aAPL1W122023n/a台积电 N5Pn/an/an/aLPDDR5-6400819.2 GB/sn/a
18 TOPS2.826 TFLOPS, 3.533 TFLOPS苹果SoC移动, PCMM3n/aAPL12012023MacBook Pro台积电 N3Bn/an/an/aLPDDR5-6400102.4 GB/sn/a
18 TOPS10.598 TFLOPS, 14.131 TFLOPS苹果SoC移动, PCMM3 Maxn/aAPL12042023n/a台积电 N3Bn/an/an/aLPDDR5-6400307.2 GB/s, 409.6 GB/sn/a
18 TOPS4.946 TFLOPS, 6.359 TFLOPS苹果SoC移动, PCMM3 Pron/aAPL12032023n/a台积电 N3Bn/an/an/aLPDDR5-6400153.6 GB/sn/a
38 TOPS3.763 TFLOPS苹果SoC移动, PCMM4n/aAPL12062024iPad Pro (第 7 代)台积电 N3E10 核 (4 个性能核 + 6 个能效核)Apple 设计的 10 核16 核神经网络引擎LPDDR5X-7500120 GB/sn/a
38 TOPSn/a苹果SoC移动, PCMM4 Maxn/an/a2024MacBook Pro M4 Max台积电 N3E14 核 (10 个性能核 + 4 个能效核) 16 核 (12 个性能核 + 4 个能效核)Apple 设计的 16 核 Apple 设计的 20 核16 核神经网络引擎LPDDR5X-8533409.6 GB/s (36GB), 546 GB/s (48GB, 64GB, 128GB)n/a
38 TOPSn/a苹果SoC移动, PCMM4 Pron/an/a2024MacBook Pro M4 Pro, Mac mini M4 Pro台积电 N3E12 核 (8 个性能核 + 4 个能效核) 14 核 (10 个性能核 + 4 个能效核)Apple 设计的 32 核 Apple 设计的 40 核16 核神经网络引擎LPDDR5X-8533273 GB/sn/a
n/an/a苹果SoC移动, PCMM5n/an/a2025n/a台积电 N3Pn/an/an/an/an/an/a- 2.5D 封装 (台积电 SOIC)
n/an/a谷歌SoC数据中心(基础设施)GCP CPUAxionn/aAxion2024GCP Compute Engine ???n/a?? Neoverse V2 核n/an/an/an/an/a
1.6 TOPSn/a谷歌SoC移动Google Tensor (Edge TPU)G11Whitechapel2021Pixel 6, Pixel 6 Pro, Pixel 6a三星 5 nm LPE八核: 2.8 GHz Cortex-X1 (2×) 2.25 GHz Cortex-A76 (2×) 1.8 GHz Cortex-A55 (4×)Mali-G78 MP20 @ 848 MHzGoogle Edge TPULPDDR551.2 GB/sn/a
n/an/a谷歌SoC移动Google Tensor (Edge TPU)G22Cloudripper2022Pixel 7, Pixel 7 Pro, Pixel 7a, Pixel Fold, Pixel Tablet三星 5 nm LPE八核: 2.85 GHz Cortex-X1 (2×) 2.35 GHz Cortex-A78 (2×) 1.8 GHz Cortex-A55 (4×)Mali-G710 MP7 @ 850 MHzGoogle Edge TPULPDDR551.2 GB/sn/a
27 TOPSn/a谷歌SoC移动Google Tensor (Edge TPU)G33Zuma (开发板:Ripcurrent)2023Pixel 8, Pixel 8 Pro, Pixel 8a三星 4nm LPP九核: 2.91 GHz Cortex-X3 (1×) 2.37 GHz Cortex-A715 (4×) 1.7 GHz Cortex-A510 (4×)Mali-G715 MP10 @ 890 MHzGoogle Edge TPU (Rio)LPDDR5X68.2 GB/sn/a
45 TOPSn/a谷歌SoC移动Google Tensor (Edge TPU)G44Zuma Pro2024Pixel 9, Pixel 9 Pro三星 4nm LPP八核: 3.1 GHz Cortex-X4 (1×) 2.6 GHz Cortex-A720 (3×) 1.92 GHz Cortex-A520 (4×)Mali-G715 MP10 @ 940 MHzn/aLPDDR5Xn/an/a- 8Gen3 = 45 TOPS, D9300 = 48 TOPS
n/an/a谷歌SoC移动Google Tensor (Edge TPU)G55Laguna Beach (开发板:Deepspace)2025Pixel 10, Pixel 10 Pro台积电 N3 + InFO-POP 封装n/an/an/an/an/an/a
23 TOPSn/a谷歌SoC数据中心(AI 推理)TPUTPUv11n/a2015n/a28nmn/an/an/aDDR3-213334 GB/s75.0- TPU 的核心:脉动阵列 - 矩阵乘法单元 (MXU):一个大型的脉动阵列 - PCIe Gen3 x16
45 TOPS3 TFLOPS谷歌SoC数据中心(AI 推理)TPUTPUv22n/a2017n/a16nmn/an/an/an/a600 GB/s280.0- 16GB HBM - BF16
123 TOPS4 TFLOPS谷歌SoC数据中心(AI 推理)TPUTPUv33n/a2018n/a16nmn/an/an/an/a900 GB/s220.0
275 TOPSn/a谷歌SoC数据中心(AI 推理)TPUTPUv44n/a2021n/a7nmn/an/an/an/a1,200 GB/s170.0- 32GB HBM2
393 TOPSn/a谷歌SoC数据中心(AI 推理)TPUTPUv5e5n/a2023n/an/an/an/an/an/a819 GB/sn/a
918 TOPSn/a谷歌SoC数据中心(AI 推理)TPUTPUv5p5n/a2023n/an/an/an/an/an/a2,765 GB/sn/a
n/an/a谷歌SoC数据中心(AI 推理)TPUTPUv6? Trillium?6n/a2024n/an/an/an/an/an/an/an/a
n/a31 TFLOPSGraphcoreSoC数据中心ColossusColossus MK1 GC2 IPU1n/a2017n/a台积电 16nm1216 个处理器核心n/an/an/a45,000 GB/sn/a
n/a62 TFLOPSGraphcoreSoC数据中心ColossusColossus MK2 GC200 IPU2n/a2020n/a台积电 7nm1472 个处理器核心n/an/an/a47,500 GB/sn/a
n/an/aGraphcoreSoC数据中心ColossusColossus MK3 (待定)3n/an/an/an/an/an/an/an/an/a
n/an/a英特尔SoCHP 移动, PCn/an/an/aArrow Laken/an/an/an/an/an/an/an/a
120 TOPSn/a英特尔SoCLP 移动Core UltraCore UltraSeries 2Lunar Lake2024n/a台积电 N3B (计算单元), 台积电 N6 (平台控制器单元)P 核:Lion Cove E 核:SkymontXe2NPU 4n/an/an/a- 总计 120 TOPS (NPU 4 提供 48 TOPS + GPU 提供 67 TOPS + CPU 提供 5 TOPS)。
34 TOPSn/a英特尔SoC移动Core UltraCore UltraSeries 1Meteor Lake2023n/aIntel 4 (7nm EUV, 计算单元), 台积电 N5 (图形单元), 台积电 N6 (Soc 单元, I/O 扩展单元)P 核:Redwood Cove E 核:CrestmontXe-LPGNPU 3720n/an/an/a- 总计 34 TOPS (NPU 提供 11 TOPS + GPU 提供 18 TOPS + CPU 提供 5 TOPS)。
0.5 TOPSn/a英特尔NPUn/an/aNPU 11n/a2018n/an/an/an/an/an/an/a
7 TOPSn/a英特尔NPUn/an/aNPU 22n/a2021n/an/an/an/an/an/an/a
11.5 TOPSn/a英特尔NPUn/an/aNPU 33n/a2023n/an/an/an/an/an/an/a
48 TOPSn/a英特尔NPUn/an/aNPU 44n/a2024Lunar Laken/an/an/an/an/an/a
n/an/a联发科SoC移动天玑天玑 90009000n/a2021Redmi K50 Pro OPPO Find X5 Pro 天玑版 vivo X80 / X80 Pro 天玑版台积电 N41× Cortex-X2 @ 3.05 GHz 3× Cortex-A710 @ 2.85 GHz 4× Cortex-A510 @ 1.8 GHzMali-G710 MP10 @ 850 MHz联发科 APU 590n/an/an/a- 5G NR Sub-6GHz, LTE
n/an/a联发科SoC移动天玑天玑 9000+9000n/a2022小米 12 Pro 天玑版 华硕 ROG Phone 6D Ultimate iQOO Neo 7 OPPO Find N2 Flip台积电 N41× Cortex-X2 @ 3.2 GHz 3× Cortex-A710 @ 2.85 GHz 4× Cortex-A510 @ 1.8 GHzMali-G710 MC10联发科 APU 590n/an/an/a- 5G NR Sub-6GHz, LTE
n/an/a联发科SoC移动天玑天玑 92009000n/a2022vivo X90, vivo X90 Pro OPPO Find X6 OPPO Find N3 Flip台积电 N41× Cortex-X3 @ 3.05GHz 3× Cortex-A715 @ 2.85GHz 4× Cortex-A510 @ 1.8GHzMali-Immortalis-G715 MP11 @ 981 MHz联发科 APU 690n/an/an/a- 5G NR Sub-6 GHz, 5G mmWave, LTE
n/an/a联发科SoC移动天玑天玑 9200+9000n/a2023iQOO Neo8 Pro vivo X90s Redmi K60 至尊版台积电 N41× Cortex-X3 @ 3.35 GHz 3× Cortex-A715 @ 3.0 GHz 4× Cortex-A510 @ 2.0 GHzMali-Immortalis-G715 MC11联发科 APU 690n/an/an/a- 5G NR Sub-6 GHz, 5G mmWave, LTE
n/an/a联发科SoC移动天玑天玑 93009000n/a2023vivo X100, vivo X100 Pro OPPO Find X7台积电 N4P1× Cortex-X4 @ 3.25 GHz 3× Cortex-X4 @ 2.85 GHz 4× Cortex-A720 @ 2.0 GHzMali-Immortalis-G720 MC12 @ 1300 MHz联发科 APU 790n/an/an/a- 5G NR (Sub-6 GHz & mmWave), 4G LTE, 四频 GNSS (BeiDou, Galileo, GLONASS, GPS, NavIC, QZSS), Bluetooth 5.4, Wi-Fi 7 (2x2)
n/an/a联发科SoC移动天玑天玑 9300+9000n/a2024vivo X100S, vivo X100X Pro台积电 N4P1× Cortex-X4 @ 3.4 GHz 3× Cortex-X4 @ 2.85 GHz 4× Cortex-A720 @ 2.0 GHzMali-Immortalis-G720 MC12 @ 1300 MHz联发科 APU 790n/an/an/a- 5G NR (Sub-6 GHz & mmWave), 4G LTE, 四频 GNSS (BeiDou, Galileo, GLONASS, GPS, NavIC, QZSS), Bluetooth 5.4, Wi-Fi 7 (2x2)
n/an/a联发科SoC移动天玑天玑 94009000n/a2024vivo X200, OPPO Find X8 / Pro台积电 N31× Cortex-X925 @ 3.63 GHz 3× Cortex-X4 @ 2.8 GHz 4× Cortex-A725 @ 2.1 GHzMali-Immortalis-G925 MC12 @ ??? MHzn/an/an/a
n/an/a微软SoC数据中心(基础设施)Azure CobaltCobalt 1001n/a2024Azure VM Dpsv6, Dplsv6, Epsv6n/a128 Neoverse V2 核n/an/aLPDDR5 ???n/an/a- PCIe gen5 - CXL 1.1 - 从项目启动到芯片仅用 13 个月。
1,600 TOPSn/a微软SoC数据中心(AI 推理)Azure MaiaMaia 1001n/a2024Microsoft Copilot台积电 N5 + CoWoS-Sn/an/an/an/a18,000 GB/s ???500.0- 32Gb/s PCIe gen5x8 - 设计 TDP = 700W - 实际 TDP = 500W
988 TOPS (494?)30.9 TFLOPSNVIDIASoC桌面GeForce RTX 50GeForce RTX 5070Blackwelln/a2025n/a台积电 4NP (定制 N4P)6,144 192:96:48:192GB205-300n/aGDDR7672 GB/s250.0
1406 TOPS (703?)43.9 TFLOPSNVIDIASoC桌面GeForce RTX 50GeForce RTX 5070 TiBlackwelln/a2025n/a台积电 4NP (定制 N4P)8,960 280:140:70:280GB203-300n/aGDDR7896 GB/s300.0
1801 TOPS (900?)56.3 TFLOPSNVIDIASoC桌面GeForce RTX 50GeForce RTX 5080Blackwelln/a2025n/a台积电 4NP (定制 N4P)10,752 336:168:84:336GB203-400n/aGDDR7960 GB/s360.0
3352 TOPS (1676?)104.8 TFLOPSNVIDIASoC桌面GeForce RTX 50GeForce RTX 5090Blackwelln/a2025n/a台积电 4NP (定制 N4P)21,760 680:340:170:680GB202-300n/aGDDR71792 GB/s575.0
n/a15.1 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4060n/aAD107-4002023n/a台积电 N4n/an/an/aGDDR6272 GB/s115.0- PCIe 4.0 x8
n/a22.1 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4060 Tin/aAD106-3512023n/a台积电 N4n/an/an/aGDDR6288 GB/s160.0- PCIe 4.0 x8
n/a29.1 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4070n/aAD104-2502023n/a台积电 N4n/an/an/aGDDR6X504 GB/s200.0- PCIe 4.0 x16
n/a35.48 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4070 Supern/aAD104-3502024n/a台积电 N4n/an/an/aGDDR6X504 GB/s220.0- PCIe 4.0 x16
n/a40.1 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4070 Tin/aAD104-4002023n/a台积电 N4n/an/an/aGDDR6X504 GB/s285.0- PCIe 4.0 x16
n/a44.10 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4070 Ti Supern/aAD103-2752024n/a台积电 N4n/an/an/aGDDR6X672 GB/s285.0- PCIe 4.0 x16
n/a48.7 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4080n/aAD103-3002022n/a台积电 N4n/an/an/aGDDR6X717 GB/s320.0- PCIe 4.0 x16
n/a52.22 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4080 Supern/aAD103-4002024n/a台积电 N4n/an/an/aGDDR6X736 GB/s320.0- PCIe 4.0 x16
n/a82.6 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4090n/aAD102-3002022n/a台积电 N4n/an/an/aGDDR6X1008 GB/s450.0- PCIe 4.0 x16
n/a73.5 TFLOPSNVIDIAGPU桌面GeForce RTX 40GeForce RTX 4090 Dn/aAD102-2502023n/a台积电 N4n/an/an/aGDDR6X1008 GB/s425.0- PCIe 4.0 x16
n/a124.96 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)A10Amperen/a2021n/an/an/a1× GA102-890-A1n/aGDDR6600 GB/sn/a
624 TOPS312.0 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)A100Amperen/a2020n/a台积电 N7n/a1× GA100-883AA-A1n/aHBM21555 GB/s400.0
n/a73.728 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)A16Amperen/a2021n/an/an/a4× GA107n/aGDDR64x 200 GB/sn/a
n/a18.124 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)A2Amperen/a2021n/an/an/a1× GA107n/aGDDR6200 GB/s60.0
n/a165.12 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)A30Amperen/a2021n/an/an/a1× GA100n/aHBM2933.1 GB/sn/a
n/a149.68 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)A40Amperen/a2020n/an/an/a1× GA102n/aGDDR6695.8 GB/sn/a
3500 TOPS (3.5 POPS)n/aNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)B100 (SXM6 卡)Blackwelln/a2024n/a台积电 4NP (定制 N4P)n/an/an/aHBM3E8000 GB/s700.0
4500 TOPS (4.5 POPS)n/aNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)B200 (SXM6 卡)Blackwelln/a2024n/a台积电 4NP (定制 N4P)n/an/an/aHBM3E8000 GB/s1000.0
n/an/aNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)B300 (从 B200 Ultra 重命名)Blackwelln/a2024n/a台积电 4NP (定制 N4P)n/an/an/aHBM3E8000 GB/s (待定)n/a
n/a756.449 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)H100 (PCIe 卡)Hoppern/a2022n/a台积电 4N (定制 N4)n/a1× GH100n/aHBM2E2039 GB/sn/a
1980 TOPS (1.98 POPS)989.43 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)H100 (SXM5 卡)Hoppern/a2022n/a台积电 4N (定制 N4)n/a1× GH100n/aHBM33352 GB/s700.0
1980 TOPS (1.98 POPS)67 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)H200 (SXM5 卡)Hoppern/a2023n/a台积电 4N (定制 N4)n/an/an/aHBM3E4800 GB/s1000.0
n/a121.0 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)L4Ada Lovelacen/a2023n/an/an/a1x AD104n/aGDDR61563 GB/sn/a
n/a362.066 TFLOPSNVIDIAGPU数据中心Nvidia 数据中心 GPU (Nvidia Tesla)L40Ada Lovelacen/a2022n/an/an/a1× AD102n/aGDDR62250 GB/sn/a
n/a2.774 TFLOPS高通SoC移动骁龙 8骁龙 8 Gen 38n/a2023n/a台积电 N4P1× 3.30 GHz Kryo Prime (Cortex-X4) + 3× 3.15 GHz Kryo Gold (Cortex-A720) + 2× 2.96 GHz Kryo Gold (Cortex-A720) + 2× 2.27 GHz Kryo Silver (Cortex-A520)Adreno 750 @ 903 MHzn/aLPDDR5X76.8 GB/sn/a
n/a1.689 TFLOPS高通SoC移动骁龙 8骁龙 8s Gen 38n/a2024n/a台积电 N4P1× 3.0 GHz Kryo Prime (Cortex-X4) + 4× 2.8 GHz Kryo Gold (Cortex-A720) + 3× 2.0 GHz Kryo Silver (Cortex-A520)Adreno 735 @ 1100 MHzn/aLPDDR5X76.8 GB/sn/a
45 TOPS4.6 TFLOPS高通SoCPC骁龙 X骁龙 X EliteXn/a2023n/a台积电 N4OryonAdreno X1HexagonLPDDR5X-8448 @ 4224 MHz135 GB/sn/a- 总计 75 TOPS (NPU 提供 45 TOPS)。
45 TOPS3.8 TFLOPS高通SoCPC骁龙 X骁龙 X PlusXn/a2024n/a台积电 N4OryonAdreno X1-45 1107 MHz (1.7 TFLOPS) Adreno X1-45 (2.1 TFLOPS) Adreno X1-85 1250 MHz (3.8 TFLOPS)HexagonLPDDR5X-8448 @ 4224 MHz135 GB/sn/a
45 TOPSn/a高通NPUn/aHexagonHexagonn/an/an/a骁龙 X Plusn/an/an/an/an/an/a- Hexagon 是高通公司一系列数字信号处理器 (DSP) 和后来的神经处理单元 (NPU) 产品的品牌名称。Hexagon 也被称为 QDSP6,代表“第六代数字信号处理器”。
n/a2.1 TFLOPS高通GPUn/aAdrenoAdreno X1-45XAdreno 726n/an/a台积电 N4n/an/an/aLPDDR5X-8448 @ 4224 MHz 或 LPDDR5X-8533 @ 4266.5 MHz125.1 GB/s 或 136.5 GB/sn/a- Adreno X1-45 内部称为 Adreno 726,表明它是骁龙 7+ Gen 2 中 Adreno 725 的升级版。
n/a4.6 TFLOPS高通GPUn/aAdrenoAdreno X1-85XAdreno 741n/a骁龙 X Plus台积电 N4n/an/an/aLPDDR5X-8448 @ 4224 MHz 或 LPDDR5X-8533 @ 4266.5 MHz125.1 GB/s 或 136.5 GB/sn/a- Adreno X1-85 内部称为 Adreno 741,表明它是骁龙 8 Gen 1/8+ Gen 1 中 Adreno 730 的升级版。

参考资料

REF: https://www.ernestchiang.com/en/notes/general/tops-comparison-table-by-brand/