【四海读报】20260522–超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级

【原报告在线阅读和下载】:20260522【MKList.com】超节点行业:从计算托盘角度拆解英伟达VR NVL72,通信速率三重升级,超级网卡价值显著提升 | 四海读报

【迅雷&夸克批量下载】:四海读报网研究报告网盘批量下载-资源清单社区-认知清单-四海清单

image

 

1. 一段话总结

英伟达Vera-Rubin NVL72是全球领先的Scale up架构AI超节点平台,通过NVLink-C2C 1.8TB/sPCIe Gen6 768GB/s800G以太网实现通信速率三重升级,ConnectX-9超级网卡集成PCIe交换与Spectrum-X交换逻辑成为核心枢纽,平台训练性能达前代3.5倍、AI软件性能提升5倍、MoE模型训练GPU用量降至1/4;国内在高速互联、超级网卡、高速PCB等领域存在技术代差,五大国产替代主线具备显著投资价值。


2. 思维导图

image

 


3. 详细总结

一、VR NVL72:全球顶尖Scale up AI超节点平台

1. 核心定位与性能

  • 架构类型:Scale up高密度算力集群(区别于Scale out分布式),资源利用率80%+,延迟百纳秒级。

  • 硬件组成:6款全新芯片(Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6)。

  • 性能提升:

    • 训练性能:前代Blackwell的3.5倍
    • AI软件性能:提升5倍
    • MoE模型训练:GPU数量减少至1/4

2. 机柜配置

  • 计算托盘:18个,每托盘2×Vera CPU+4×Rubin GPU
  • 交换托盘:9个,每托盘4×NVSwitch 6
  • 总规模:72颗Rubin GPU、36颗Vera CPU、36颗NVLink 6

二、通信速率三重核心升级(关键数据)

通信层级 技术方案 核心带宽 对比前代/行业 材料/硬件升级
CPU-GPU互联 NVLink-C2C 双向1.8TB/s GB200(900GB/s)×2;PCIe Gen5(128GB/s)×14 硬件缓存一致性,统一内存池
CPU-网卡互联 PCIe Gen6 双向768GB/s 48 Lane×64Gbps CCL:M7→M8/M9;铜箔→HVLP4;石英材料
网卡-外部互联 800G以太网/IB 单端口800G CX-8以太网仅2×400G 1.6T/800G OSFP光模块
  • 实现硬件级缓存一致性,CPU与GPU内存统一寻址。
  • 延迟降至纳秒级,消除计算等待瓶颈。

2. PCIe Gen6:高速总线换代

  • 传输距离达500mm,对PCB与材料提出极高要求。
  • 覆铜板、铜箔、玻纤布全面升级,价值量显著提升

3. 800G以太网:外部互联迈入新时代

  • ConnectX-9支持单端口800G以太网,无需链路聚合。
  • 光模块方案:4×1.6T OSFP 或 8×800G OSFP。

三、ConnectX超级网卡:价值大幅提升

1. 产品定位:SuperNIC(超级网卡)

  • ConnectX-8:单端口800G IB,双端口400G以太网
  • ConnectX-9:单端口800G以太网,实现重大突破。

2. 核心能力

  • 内置PCIe Gen6 48通道交换模块,替代独立交换机。
  • 集成Spectrum-X交换逻辑,与交换机端到端协同。
  • 为GPU提供50GB/s IO带宽,NCCL直接转发流量。

3. 性能增益(端到端优化)

  1. 有效带宽:×1.6
  2. 集合通信带宽:×1.3
  3. All-reduce带宽:×2.2
  4. All-to-all带宽:×1.3
  5. 遥测采集速度:×1000

四、投资策略:五大国产替代主线

  1. 高速网卡:裕太微、盛科通信
  2. 高端光模块:中际旭创、新易盛、天孚通信
  3. 高速交换芯片:盛科通信、紫光股份、锐捷网络
  4. 高速PCB/覆铜板:胜宏科技、生益科技、深南电路
  5. 国产超节点整机:浪潮信息、中科曙光、工业富联

五、风险提示

  1. 技术代差:与英伟达存在全栈差距。
  2. 生态割裂:国产超节点生态协同不足。
  3. 地缘政治:供应链与技术受限风险。

4. 关键问题

问题1:英伟达VR NVL72的“通信三重升级”分别是什么,核心带宽指标有多大?

答案:三重升级分别是:

  1. NVLink-C2C:CPU-GPU互联,双向带宽1.8TB/s,较GB200提升1倍;
  2. PCIe Gen6:CPU-网卡互联,双向带宽768GB/s
  3. 800G以太网:网卡-外部互联,单端口800G
    三大环节全面重构AI算力内部与外部通信体系。

问题2:ConnectX-9超级网卡相比传统网卡,核心创新点与价值体现在哪里?

答案:核心创新有两点:

  1. 内置PCIe Gen6交换模块,替代独立PCIe交换机,消除IO瓶颈;
  2. 集成Spectrum-X交换逻辑,与交换机端到端协同,使有效带宽提升1.6倍、遥测速度提升1000倍
    它从单纯“接口卡”升级为连接GPU集群的核心ASIC枢纽,价值量大幅提升。

问题3:为何Scale up架构成为AI大模型训练的主流方向,与Scale out有何关键差异?

答案:大模型训练需要极高带宽、极低延迟、强同步,Scale up更适配:

  • Scale up:数十至千卡级,利用率80%+,延迟百纳秒级,统一内存,定制化;
  • Scale out:万卡级,利用率30%-50%,延迟微秒级,独立内存,标准化。
    Scale up能解决大模型训练中“通信等待吞噬算力”的痛点,因此成为VR NVL72这类高端训练平台的首选架构。
© 版权声明
THE END
如本文“对您有用”,欢迎随意打赏作者!
点赞13打赏作者 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容