AMD Radeon 和 Nvidia 495 项 GPU 技术参数分析数据集

Read this post in other languages:

关于 Dataset

Datalore 中我们组建了一个 dataset (数据集) 其中包含 495 台 Nvidia 和 AMD Radeon GPU 的相关技术资料。 让我们来了解一下这些硬件随着时间的推移是如何逐渐进步的。

GPU model analysis

如何在 Datalore 中打开 Notebook?

Datalore 是由 JetBrains 托管的一款在线 Jupyter Notebook,并提供智能编码辅助。 Datalore 自带智能代码编辑器和强大的计算工具。

在此 Notebook 中点击右上角的 “Edit” 按钮。

数据集概览

该数据集包含 495 个 GPU 型号的详细信息:

  • GPU 制造商
  • GPU 类型
  • 名称
  • 发布年份
  • Fab = 制造工艺 (nm),这定义了处理程序中晶体管的大小
  • 晶体管数量(百万)
  • 裸芯片尺寸
  • 内存大小,以兆字节(MB)为单位
  • GFLOPS = 每秒数十亿次浮点运算(32 位精度)
  • TDP(热设计功率)= 计算机芯片或组件产生的最大热量。

晶体管的摩尔定律

摩尔定律说,集成电路中的晶体管数量每 2 年就会增加一倍。 我们来看看它是否也适用于 GPU!
从下面的图中我们可以看到,摩尔定律在 2019-2020 年仍然有效,但在 2006-2018 年,增长几乎是线性的。
然而,摩尔定律对于晶体管密度几乎是正确的。 您可以根据下图,发现它大约每 3 年就会增加一倍。

Number of transistors across years
Smoothing function for the number of transistors

GPU 功率消耗和散热效果

GPU 的功率消耗和散热效果也是一个有趣的话题。

这个数据集将 GPU 分为三组:

  • 消费级 GPU,如 Nvidia GeForce 和 AMD Radeon R 系列。
  • 工作站 GPU,如 Nvidia Quadro 和 AMD Radeon FirePro。
  • 服务器 GPU,如 Nvidia P/V/T 系列和 AMD Radeon Instinct。

让我们来显示 3 组 GPU 的 TDP(热设计功率)的分布情况。 我们将绘制精确的统计集,并添加一个平滑线近似值。

💡 见解:

虽然服务器 GPU 比消费级和工作站 GPU 更热、更强大,有趣的是有很多低功耗工作站 GPU。 这些不是用于 3D 图形或并行计算,而是为了管理显示面板和视频墙。

GPU power consumption and heating

制造工艺和 TDP 分布

在接下来的图中,我们看到 GPU 模型分布如何根据两个制造商的制造工艺和 TDP 而变化。

💡 见解:

  • 制造商和芯片 TDP 之间没有明显的相关性,制造工艺和 TDP 之间也没有明显的相关性。
  • 虽然晶体管的功耗会随着晶体管的体积变小而降低,但芯片上晶体管数量的增加抵消了这种影响。

Fabrication process and TDP distribution

各类 GPU 的 TDP 分布

让我们来展示一下 TDP 在各个类别和制造商之间的分布情况,忽略制造工艺。

TDP distribution across GPU classes

各类 GPU 的裸芯片尺寸和 TDP 关系

从下面的图中,我们可以看到 TDP 和硅的实物量(包括裸芯片尺寸)之间的线性关系。

Die size and TDP relation across GPU classes

GFLOPS 进度

GFLOPS 是指每秒数十亿次浮点的数量, 它决定了 GPU 的计算能力。 让我们来看看这些年这个数字是如何增加的。

GFLOPS improvement across years

我们还将计算一个额外的特征 – 每百万个晶体管的 GFLOPS 数量。

成对关系

在下图中,我们可以看到年份、晶体管/mm2、GFLOPS/晶体管和 TDP 参数之间的关系。

💡 见解:

  • 250 W TDP 左右的峰值是由 AMD 和 Nvidia 的顶级芯片中普遍存在这个数值造成的。 不过,Nvidia RTX 30 GPU 比前代产品更高温:RTX 3080 和 3090 的 TDP 分别为 320 W和 350 W,AMD RX 6800 XT 为3 20 W。
  • 虽然 Nvidia 的芯片一般都比 AMD 大,他们的芯片尺寸差距在 2020 年比以往更大,因为新的 54 亿晶体管 A100 芯片现已发布。 不过有趣的是,AMD 在小尺寸芯片上的 GFLOPS 和 TDP 与大尺寸芯片差不多。

Number of transistors increase across years

Pairwise relations

晶体管和 GFLOPS 的关系

从下面的图中我们可以看到,Nvidia A100 和 Radeon MI100 尽管拥有约 2 倍的晶体管,但其 FP32 GFLOPS 与 2020 年和 2019 年的其他顶级 GPU 大致相同。 但它们仍然明显慢于桌面级 RTX 3090,后者的 GFLOPS 数量几乎是其两倍。

然而,A100 和 MI100 具有明显更快的 FP32 稀疏和 FP16 模式。 例如,RTX3090 的 FP16 产量只有 35.6 TFLOPS,而 MI100 的可以高达 184.6,A100 在处理结构稀疏矩阵时可以达到 624。 这似乎是由新的多实例 GPU 技术造成的,该技术允许 A100 被分隔成 7 个 GPU 实例。

最后一个有趣的观察是,每个晶体管数量的 GFLOPS 几乎没有增长。

Transistors and GFLOPS relation

💡 最后一个有趣的观察是,
每个晶体管数量的 GFLOPS 几乎没有增长。

GFLOPS/Transistors across years

查看 Datalore 中的总结图!

打开 Notebook

欢迎点击这里获取我们的 GPU 数据集。请注明 Datalore 团队是数据集的来源。 我们很乐意看到并与我们的社区分享你的作品。

image description

Discover more