ai算力应用中的光模块产品 -凯发k8国际手机app下载

以chatgpt为代表的ai大模型应用普及将推动算力需求快速增长,服务器产业链是其中重要的受益环节之一,ai计算的普及将推动服务器产业链光模块向800g升级提速。

算力网络驱动下光模块市场需求预测

光模块是数据中心内部互连和数据中心相互连接的核心部件。100g和400g是主流产品,800g过去主要用在超算等领域。据lightcounting预计,2023年800g全球普及率仅0.62%。而以chatgpt为代表的ai大模型,对数据中心内外的数据流量都提出了新要求,有望推动光模块加速向800g升级。800g光模块将从2025年底开始主导光模块市场。

光模块市场

根据lightcounting的数据,2016年至2020年,全球光模块市场规模从58.6亿美元增长到66.7亿美元,预测2025年全球光模块市场将达到113亿美元,为2020年的1.7倍。从结构上看数通市场占60%,电信市场占40%左右。

光模块市场

 

ai算力场景光模块应用情况

首先我们以英伟达的superpod为例测算单颗gpu与光模块的比例。测算仅考虑ib网络对应的光模块需求。以140个节点的集群为例,每台举例服务器需要8颗gpu芯片,共需140×8=1120颗芯片;集群中每20台服务器组成一个su(scalable units,可扩展单元),共7个su。ib网络架构下实现了完整的胖树(fat-tree)拓扑结构,胖树架构在训练场景中最优的配置是上下行端口数一样,即无阻塞的网络,具体来看:

  1. 第一层:每个su 中配置8台叶交换机,共有56台叶交换机;
  2. 第二层:每10台脊交换机组成一个交换机组spine group( sg),每个su 的第一个叶交换机连接到sg1中的每个交换机,每个su的第二个叶交换机连接到sg2中的每个交换机,共有80个脊交换机;
  3. 第三层:每14台核心交换机组成一个交换机组core group(cg),对应共28个核心交换机。

使用系统的对应计算侧和存储侧线缆全部采用aoc有源光缆,因此每个端口对应一个光模块,即每条光缆对应2个光模块,因此计算侧和存储侧共需要(1120 1124 1120)×2 (280 92 288)×2=8048个光模块,即单颗gpu对应所需200g光模块数量约为1:7.2

dgx gh200超级计算机搭载256个超级芯片,每个超级芯片可视为一个服务器,通过交换机进行互联。从结构上来看,超级计算机采用两层的胖树拓扑结构,第一、二层分别使用96个、36个交换机,每台交换机拥有32个速率为800g的端口;此外超级计算机还配备了24个ib交换机用于ib网络。按照端口进行估算,l1层距离较近因此假定使用铜缆进行连接不涉及光模块,l2层36个交换机在无收敛胖树架构下,第二层交换机端口向下与l1层交换机上行端口互联,因此共需要36×32×2=1152个800g光模块;ib网络架构下,24台交换机需要24×32=768个800g光模块;则dgx gh200超级计算机共需要1152 768=1920个800g光模块,对应每颗芯片12个800g光模块。则gpt-3单日完成训练需要8万颗以上200g光模块,如果考虑到flops的利用率约为20%-30%,则需要光模块的数量将约为35万颗。

易飞扬应用于算力场景的光模块

ai发展促进了海量光模块需求,易飞扬则已于2023年完成800g/400g ai应用光模块产线建设任务,新建成的生产线主要用于4×100g pam4和8×100g pam4光模块和有源光缆的生产。

易飞扬光模块

易飞扬光模块

得益于供应链的支持,易飞扬的系列ai光模块量产顺利,公司本身的产品多样化设计能力、订单能力和供应链能力形成了较好的匹配关系。可以为中小客户提供灵活有效的需求交付和样品测试。

网站地图