登录注册
“鲲鹏+昇腾”,打造华为坚实的算力底座之二(2)
一苇渡大江
2023-10-08 10:58:23
     

       华为创始人任正非表示,第四次工业革命的基础就是大算力,点明了AI大模型时

代“得算力者得天下”的逻辑。华为在全联接大会2023上发布了引人注目的新产

品:Atlas 900 SuperCluster。这款全新架构的昇腾AI计算集群具备支持超万亿参数的大模

型训练的能力,为人工智能领域带来了巨大的发展潜力。

 

据悉,华为全新升级CloudFabric 3.0超融合数据中心网络,以超强性能、超稳可靠、超快

部署、超智运维四大能力,为通算和智算提供大规模、高吞吐、高可靠网络,为AI时代注

入无限动能。 推出了业界全新高运力AI智算交换机,包括CloudEngine XH16800、

CLoudEngine XH8100和CloudEngine XH8200,实现AI算力运得多、运得快、运得稳。


 

  •        运得多: CloudEngine XH16800支持576*400GE接口,AI组网规模是业界的4倍;
  •        运得快: 独创AI加速器(网络级负载均衡NSLB算法)实现网络一键调优,网络吞吐由

  • 50%提升98%,AI训练效率提升20%;

  •        运得稳: 独家网络数字地图一体化运维,一键诊断通信异常,实现训中排障效率提升90%。

 

 

    其中,Atlas 900 SuperCluster新集群可支持超万亿参数的大模型训练,采用了全新的华

为星河AI智算交换机CloudEngine XH16800,借助其高密的800GE端口能力,两层交换网

络即可实现2250节点(等效于18000张卡)超大规模无收敛集群组网。


      

      为了加速大模型的创新,华为发布了更加开放、易用的CANN7.0。该版本不仅兼容业

界的AI框架、加速库和主流大模型,还深度开放底层能力,使AI框架和加速库能够更直接

地调用和管理计算资源,让开发者能够自定义高性能算子。

          注:CANN是一种异构计算架构,功能类似英伟达CUDA,可释放AI硬件的极致性能,支撑快速部署神经网络。​

 


         随着人工智能进入大模型时代,大算力已经成为人工智能发展的核心引擎。华为通过

改变传统的服务器堆叠模式,运用系统架构创新,从器件级、节点级、集群级和业务级的

改进,构建了具备整合算力、运力和存力设计的AI集群,为克服大算力的瓶颈带来了突

破,大模型训练的稳定性从天级提升到了月级,为中国打造坚实的算力底座。​

 

    

     菲菱科思:主营网络设备的生产和销售,为品牌商提供交换机、路由器、无线和通信设


备组件等产品,是华为园区网交换机、路由等网络设备代工厂商


     盛科通信:是国内领先的以太网交换芯片设计企业,深耕于以太网交换芯片及配套产品


的研发、设计和销售,有望收益于华为新一代算力产品的推出。

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内可能择机卖出。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
菲菱科思
S
盛科通信
S
高新发展
工分
5.97
转发
收藏
投诉
复制链接
分享到微信
有用 3
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据