登录注册
AI超算下的光互联:光模块、AOC与DAC
八卦猫
公社达人
2023-07-10 08:58:33

摘要

通过深入研究AI算力巨头英伟达近年的AI超算方案,我们注意到,通信网络是制约数据中心算力高低的关键因素。在多线程并行计算下,通信成为制约算力的短板,只要有一条交换链路出现网络阻塞或丢包,就会产生I/O延迟。因此,AI超算对于网络层数据传输速率和延时要求非常苛刻,需要高带宽、高速率的交换机和通信链路匹配。


交换网络的连接方案多样,AI超算和DCI场景中,主流是光模块+光纤、AOC(Active Optical Cables,有源光缆)和DAC(Direct Attach Cables,直连电缆),DAC也可分为有源ACC、AEC和无源DAC。


光模块+光缆最为主流,本身衍生出众多传输速率和封装类型,可以广泛、灵活应用于多种场景中,例如长距离电信传输网、中距离接入网和DCI、服务器架顶交换机皆可看到光模块家族的身影;光模块的I/O端口也可以广泛适配各种光纤连接器,传输距离灵活可控。


AOC将光模块和光缆集成化,避免光口被污染的可能性,以提升可靠性。AOC是成本与性能折中的一种优化设计方案,减少光器件数、去除DDM(数字诊断)功能,专用于超短距离的架顶以太网或InfiniBand交换机的互联场景,通常是100米传输距离。因为传输距离超短,所以AOC使用的光模块通常是VCSEL多模方案。


DAC没有光电转换模块,线缆两头是简单的电缆连接头,因此成本非常低。DAC可以进一步细分为有源ACC、AEC和无源DAC,有源ACC、AEC相比无源DAC传输距离更长。由于铜的物理性能限制,DAC传输距离极短,且带宽越大,有效传输距离就越短。在速率从400G向800G升级中,其传输距离将从3m缩短到2m。


三种方案各有所长,适用场景各不相同。在传输场景上,光模块+光缆范围最广,从电信汇聚前传、中传网络,到数通交换机都可以使用;AOC则适用于百米距离的大带宽架顶交换机互联;DAC适用于服务器和GPU连接到架顶交换机。从成本看,光模块+光纤成本较高,但组网灵活,从全成本角度考虑仍是海外云厂商最主流方案;AOC因为是集成化设计,因此成本次之;DAC无需光电转换,成本最低,但高速率下传输距离距离极大受限,我们认为,电信接入网的“光进铜退”也将在AI超算中上演,此前因为高速率光模块成本原因,AOC方案优势不明显,但随着高速率光模块成本的降低,AI超算时代DAC方案有望加速向AOC方案升级。


算力——
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。

算力设备:中兴通讯、紫光股份、锐捷网络、菲菱科思、恒为科技、工业富联、寒武纪、震有科技。

云算力:光环新网、奥飞数据、数据港、润泽科技、科华数据。

液冷:英维克、申菱环境、高澜股份、佳力图。

边缘算力承载平台:美格智能、广和通、移远通信、初灵信息、龙宇股份、网宿科技、佳讯飞鸿。


数据要素——
运营商:中国电信、中国移动、中国联通。

数据可视化:浩瀚深度、恒为科技、中新赛克。

BOSS系统:亚信科技、天源迪科、东方国信。


风险提示:AI发展不及预期,算力需求不及预期。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
中际旭创
工分
1.91
转发
收藏
投诉
复制链接
分享到微信
有用 1
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 小韭🈶名44020420
    明天一定赚的散户
    只看TA
    2023-07-11 07:56
    旧闻   隔壁7月2日就发布了
    0
    0
    打赏
    回复
    投诉
  • 1
前往