华为创始人任正非表示,第四次工业革命的基础就是大算力,点明了AI大模型时
代“得算力者得天下”的逻辑。华为在全联接大会2023上发布了引人注目的新产
品:Atlas 900 SuperCluster。这款全新架构的昇腾AI计算集群具备支持超万亿参数的大模
型训练的能力,为人工智能领域带来了巨大的发展潜力。
据悉,华为全新升级CloudFabric 3.0超融合数据中心网络,以超强性能、超稳可靠、超快
部署、超智运维四大能力,为通算和智算提供大规模、高吞吐、高可靠网络,为AI时代注
入无限动能。 推出了业界全新高运力AI智算交换机,包括CloudEngine XH16800、
CLoudEngine XH8100和CloudEngine XH8200,实现AI算力运得多、运得快、运得稳。
运得快: 独创AI加速器(网络级负载均衡NSLB算法)实现网络一键调优,网络吞吐由
50%提升98%,AI训练效率提升20%;
其中,Atlas 900 SuperCluster新集群可支持超万亿参数的大模型训练,采用了全新的华
为星河AI智算交换机CloudEngine XH16800,借助其高密的800GE端口能力,两层交换网
络即可实现2250节点(等效于18000张卡)超大规模无收敛集群组网。
为了加速大模型的创新,华为发布了更加开放、易用的CANN7.0。该版本不仅兼容业
界的AI框架、加速库和主流大模型,还深度开放底层能力,使AI框架和加速库能够更直接
地调用和管理计算资源,让开发者能够自定义高性能算子。
注:CANN是一种异构计算架构,功能类似英伟达CUDA,可释放AI硬件的极致性能,支撑快速部署神经网络。
随着人工智能进入大模型时代,大算力已经成为人工智能发展的核心引擎。华为通过
改变传统的服务器堆叠模式,运用系统架构创新,从器件级、节点级、集群级和业务级的
改进,构建了具备整合算力、运力和存力设计的AI集群,为克服大算力的瓶颈带来了突
破,大模型训练的稳定性从天级提升到了月级,为中国打造坚实的算力底座。
菲菱科思:主营网络设备的生产和销售,为品牌商提供交换机、路由器、无线和通信设
备组件等产品,是华为园区网交换机、路由等网络设备代工厂商。
盛科通信:是国内领先的以太网交换芯片设计企业,深耕于以太网交换芯片及配套产品
的研发、设计和销售,有望收益于华为新一代算力产品的推出。