【四海读报】20260527–超节点系列报告三:阿里超节点,全栈AI布局,自研AL128、UPN512补全AI基础设施

【原报告在线阅读和下载】:20260527【MKList.com】电子行业深度报告:超节点系列报告三:阿里超节点,全栈AI布局,自研AL128、UPN512补全AI基础设施 | 四海读报

【迅雷&夸克批量下载】:四海读报网研究报告网盘批量下载-资源清单社区-认知清单-四海清单

image

 

1. 一段话总结

阿里云以IaaS+PaaS+MaaS构建全栈AI体系,通过自研磐久AL128超节点、UPN512单层光互连系统、真武M890 AI芯片补全AI算力基础设施;依托全球29区域94可用区、3200+CDN节点3年3800亿元资本开支实现客户与财务双共振,在中国AI云市场以35.8%份额稳居第一AL128支持128-144卡高密度部署、UPN512实现512颗xPU全光互联并降本30%,带动高速互联、算力芯片、光模块等产业链爆发,行业维持增持评级。


2. 思维导图

image

 


3. 详细总结

一、阿里云全栈AI布局与核心优势

1. 全栈AI架构

  • IaaS层:芯片→超节点服务器→高性能网络→智算集群
  • PaaS层:百炼平台,一站式模型服务
  • MaaS层:通义千问大模型,开源300+全模态模型

2. 客户与基础设施优势

指标 数据
全球地理区域 29个
可用区 94个
全球CDN节点 3200+
覆盖国家/地区 70+

3. 财务与资本开支

  • 3年投入3800亿元加码AI与云基建
  • FY26Q3阿里云收入433亿元,同比+36.4%
  • AI相关产品连续10个季度三位数增长

4. 市场龙头地位

市场 份额 排名
中国公有云IaaS 26.1% 第一
中国公有云PaaS 24.4% 第一
中国AI云市场(25H1) 35.8% 第一

二、阿里云自研核心硬件产品

1. 磐久AL128机柜级超节点

  • 硬件规格

    • 双宽机柜,支持128-144颗GPU
    • 供电350kW,散热500kW
    • 正交架构,FRU更换从小时级→分钟级
  • 三层网络架构

    1. 域内Scale Up:单级交换,单GPU带宽最高28Tb
    2. 域间Scale Out:整柜带宽25.6T-51.2Tbps
    3. DCN网络:打通算力与数据中心存储/数据链路
  • 核心芯片

    • 平头哥真武M890:144GB显存,性能提升3倍
    • ICN Switch 1.0:吞吐量25.6Tbps,64卡全互联

2. UPN512单层光互连解耦系统

  • 定位:域内Scale Up高性能网络,与HPN形成互补

  • 核心能力

    • 支持512颗xPU全光互连,可扩至1K+
    • 采用LPO/NPO光互连,成本-30%,可靠性×3
    • 标准19英寸机柜即可部署,解耦高密依赖
  • 在网计算:支持INT32/Float8/16/32等主流计算

3. 光互连方案对比

方案 成本 可靠性 带宽密度 标准化
FRO
LPO
NPO
CPO

三、技术架构协同

  • HPN:负责万卡/十万卡级Scale Out跨域互联
  • UPN512:负责512/1024卡Scale Up域内互联
  • 形成“域内Scale Up+跨域Scale Out”完整算力网络

四、投资建议与风险

1. 重点推荐

  • 盛科通信-U、海光信息、澜起科技

2. 建议关注

  • 中兴通讯、万通发展(数渡科技)

3. 风险提示

  • AI应用进展不及预期
  • 超节点/光互联技术落地不及预期
  • 云计算行业竞争加剧

4. 关键问题与答案

问题1:阿里云自研超节点的核心战略价值是什么?为何能大幅领先同行?

答案:核心价值是实现AI算力基础设施全栈自主可控,补齐高密度算力与高速互联短板。领先原因:①全栈垂直整合,从芯片、超节点到网络、模型全覆盖;②3800亿巨额资本开支支撑硬件迭代;③存量客户与全球节点快速迁移,降低落地成本;④中国AI云市场35.8%份额形成生态正循环。

问题2:磐久AL128与UPN512分别解决什么痛点?两者如何协同?

答案AL128解决单机柜高密度算力部署痛点,支持128-144卡、350kW供电,满足超大模型训练;UPN512解决多机柜大规模卡间互联痛点,实现512颗xPU全光互联、降本30%。协同关系:UPN512负责域内Scale Up高速互联,HPN负责跨域Scale Out大规模调度,构成完整万卡级智算集群。

问题3:UPN512采用LPO/NPO光互连的核心优势是什么?对产业链有何影响?

答案:核心优势:①成本降低30%+;②可靠性提升约3倍;③带宽密度更高、时延更低;④解耦高密机柜,标准机柜即可部署。产业链影响:直接利好光模块、光引擎、交换芯片、高速互联设备,推动LPO/NPO方案加速渗透,利好国产高速互联与光器件厂商。

© 版权声明
THE END
如本文“对您有用”,欢迎随意打赏作者!
点赞13打赏作者 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容