AI行业跟踪报告(一):光铜共进 通讯带宽是AI重要迭代方向
作者:admin 发布时间:2024-04-09 11:38 分类:资讯 浏览:31 评论:0
AI 大模型对带宽提出更高要求。算术强度(Arithemtic Intensity)代表模型计算过程中,从内存中读取的每个字节进行浮点计算的次数。以TransformerDecoder为基础的模型如GPT,其算术强度显著低于CNN模型和以TransformerEncoder 架构为基础的模型(如BERT),对访存带宽提出了更高要求。
英伟达新架构通讯带宽再上台阶。英伟达最新数据中心GPU 架构Blackwell,相比上一代的Hopper 架构,带宽在多个维度显著提升:1)HBM迭代至HBM3e(带宽8TB/s),相比H100 的HBM3(带宽3TB/s)实现翻倍以上提升;2)NVLink 带宽提升至1.8TB/s,相比Hopper 架构翻倍;3)支持PCIe 6.0,带宽提升至256GB/s,相比Hopper(PCIe5.0 128GB/s)翻倍。
AI 拉动芯片,降低系统损耗(LPO 相比可插拔光模块功耗下降约50%)和成本(800G LPO 总成本下降约8%);2)CPO 缩短光引擎和芯片之间距离,减小尺寸、降低功耗、提高效率;3)硅光结合CMOS 工艺超大规模、超高精度和光子技术超高速率、超低功耗(CPO/LPO 架构下)的优势等。
GB200 拓展Scale up 边界,降低客户TCO 水平,拉动铜连接需求。英伟达最新机架解决方案GB200 性能大幅提升,相同GPU 数量下,训练速度可达H100 的4 倍;GB200 NVL36 可实现万亿大模型推理,吞吐量达H100 集群的30 倍以上。相比GH200,GB200 的CPU:GPU 配比由1:1 降低至1:2,客户TCO(Total Cost of Ownership,总拥有成本)得以进一步降低。随着GB200 在下游放量,背板连接器、铜缆等核心零部件有望受益增长。
风险提示:AI需求不及预期、新技术迭代不及预期、份额不及预期等。
相关推荐
你 发表评论:
欢迎- 资讯排行
- 最新留言
-
- 我默默的回帖,从不声张!http://je4jyk.05ausg2.cn/
- 好东西,赞一个!http://s4r.dkeyrjj.cn/
- 勤奋灌水,天天向上!http://lu5.a8nmq54.cn/
- 楼主的文笔不错!http://vi9n.zhengshanwang.cn/
- 这里的资源非常丰富,帮助我解决了很多问题。http://ow2j.xmona.com.cn/
- 这么好的帖子,应该加精华!http://egi.lm75.cn/
- 坚持回帖!http://0ooh.xpmona.com.cn/
- 收藏了,楼主加油!http://em95.0233l1b.cn/
- 没人理我,好伤心啊!http://suwcqj.xmona.cn/
- 楼主内心很强大!http://l74k8.x856.cn/