AI行业跟踪报告(一)：光铜共进通讯带宽是AI重要迭代方向

作者：admin 发布时间：2024-04-09 11:38 分类：资讯浏览：31 评论：0

导读：AI大模型对带宽提出更高要求。算术强度（ArithemticIntensity）代表模型计算过程中，从内存中读取的每个字节进行浮点计算的次数。以TransformerDecod...

AI 大模型对带宽提出更高要求。算术强度（Arithemtic Intensity）代表模型计算过程中，从内存中读取的每个字节进行浮点计算的次数。以TransformerDecoder为基础的模型如GPT，其算术强度显著低于CNN模型和以TransformerEncoder 架构为基础的模型（如BERT），对访存带宽提出了更高要求。

英伟达新架构通讯带宽再上台阶。英伟达最新数据中心GPU 架构Blackwell，相比上一代的Hopper 架构，带宽在多个维度显著提升：1）HBM迭代至HBM3e（带宽8TB/s），相比H100 的HBM3（带宽3TB/s）实现翻倍以上提升；2）NVLink 带宽提升至1.8TB/s，相比Hopper 架构翻倍；3）支持PCIe 6.0，带宽提升至256GB/s，相比Hopper（PCIe5.0 128GB/s）翻倍。

AI 拉动芯片，降低系统损耗（LPO 相比可插拔光模块功耗下降约50%）和成本（800G LPO 总成本下降约8%）；2）CPO 缩短光引擎和芯片之间距离，减小尺寸、降低功耗、提高效率；3）硅光结合CMOS 工艺超大规模、超高精度和光子技术超高速率、超低功耗（CPO/LPO 架构下）的优势等。

GB200 拓展Scale up 边界，降低客户TCO 水平，拉动铜连接需求。英伟达最新机架解决方案GB200 性能大幅提升，相同GPU 数量下，训练速度可达H100 的4 倍；GB200 NVL36 可实现万亿大模型推理，吞吐量达H100 集群的30 倍以上。相比GH200，GB200 的CPU:GPU 配比由1:1 降低至1:2，客户TCO（Total Cost of Ownership，总拥有成本）得以进一步降低。随着GB200 在下游放量，背板连接器、铜缆等核心零部件有望受益增长。

AI行业跟踪报告(一)：光铜共进通讯带宽是AI重要迭代方向

风险提示：AI需求不及预期、新技术迭代不及预期、份额不及预期等。

标签：共进迭代跟踪带宽方向

上一篇：社保基金长线坚守74只股
下一篇：知乎上线动物保护日专题，“灯塔计划”资助中国野生动物科普

AI行业跟踪报告(一)：光铜共进通讯带宽是AI重要迭代方向

相关推荐

取消回复欢迎你发表评论:

AI行业跟踪报告(一)：光铜共进 通讯带宽是AI重要迭代方向

相关推荐

取消回复欢迎 你 发表评论:

AI行业跟踪报告(一)：光铜共进通讯带宽是AI重要迭代方向

取消回复欢迎你发表评论: