GPU通信能力出众，沐曦股份可应对超大规模算力需求

超级管理员
2025-11-26 10:21:50
超级管理员

随着大模型参数规模指数级增长，单卡有效算力难以应对超大规模的算力需求，高带宽、低延迟的卡间互连技术成为关键竞争要素，对GPU集群互连拓扑结构也提出了更高要求，驱动了纵向扩展（Scale-up）与横向扩展（Scale-out）网络架构的技术演进。于10月24日IPO过会的沐曦集成电路（上海）股份有限公司（以下简称“沐曦股份”）则凭借着领先的技术优势，在通信算力难题中交出了亮眼的答卷。

据了解，沐曦股份具备国内稀缺的高带宽、超多卡互连能力，自主研发的MetaXLink高速互连技术支持GPU全互连，突破了传统PCIe总线在带宽和延迟方面的限制，缩短了GPU之间数据传输时的通信时间，为大规模AI模型训练提供了充足的通信带宽保证。同时，MetaXLink根据GPU之间数据交互需求优化传输协议并且支持MetaXLink端口之间数据直接转发，可以灵活适配大模型发展及其不同切分方式下对于互连延时和带宽的特定需求，满足训练和推理等不同应用场景。基于前述参数对比，沐曦股份GPU产品的互连带宽达到了与英伟达4nm制程工艺下旗舰产品（H200）相当的性能，代表了国内先进的互连技术水平。

在互连拓扑结构方面，通过创新的架构设计，沐曦股份单颗GPU芯片拥有7个高速MetaXLink互连接口，支持Full-Mesh、Hybrid Cube Mesh等多种复杂互连拓扑结构。通过MetaXLink各端口不同连接形式，沐曦股份GPU产品支持2卡、4卡、8卡全互连拓扑，为千亿参数规模AI大模型应用高频使用到的AllReduce、AllToAll等集合通信原语提供单机内的更优拓扑形态与行业内更低时延支持。同时，凭借协议层设计创新，MetaXLink具备较强的互连拓扑重构能力，能够根据应用需求灵活调整互连拓扑，最大化接口带宽的利用效率。

除此之外，沐曦股份GPU产品通过超节点架构可灵活适配16卡、32卡、64卡等系统规模，满足从中小型训练到超大规模集群的差异化需求，为构建高密度算力和大规模集群、处理更为复杂的人工智能任务提供了关键技术支撑。为进一步提高智算集群算力密度，沐曦股份联合合作伙伴研发并落地了高密度液冷整机柜，突破性实现单机柜128卡超高密度部署。丰富的超节点架构和超多卡拓扑结构的设计能力彰显了沐曦股份在GPU通信能力方面领先的技术实力，为未来更大规模的GPU集群部署奠定了技术基础。

微信分享