AIGC 将对光模块行业产生深刻影响 | 北拓研究
2023-12-07 18:00
北拓资本
2023-12-07 18:00
订阅此专栏
收藏此文章


光模块的应用场景主要分为两大领域:4G/5G 无线网络、固定宽带 FTTX、传输与数通网络等为代表的电信领域;承载 AR/VR、人工智能、元宇宙等应用的数据中心领域。这两大应用场景的规模增速是影响光模块需求景气度的核心指标。随着 AIGC 时代的到来,海量数据需要更强劲的算力支撑大规模计算,云计算中心即将向算力中心演变,本文浅析在新一波技术浪潮下,光模块市场将会迎来怎样的机会与挑战。

01
数据中心迎来周期向上拐点,光模块景气度上升


数据中心作为数据存储和计算的中心,其在各个时期承载的主要功能有所差异。自 2000 年以来全球数据中心先后从计算中心过渡到信息中心,再过渡至云计算中心,目前正由云中心向算力中心演变。数据中心产业整体发展周期呈现出“四中心三拐点”的特征,在 AI 算力的驱动下产业正迎来第三次上升拐点。
云计算中心阶段,光模块速率经历了由 10G/25G 向 40G/100G 的过渡。云数据中心不仅为客户提供管理服务,还提供计算和存储环境。其托管的不再是客户的设备,而是计算和带宽能力。2012-2019 年的云中心阶段,全球数据中心产业市场规模 CAGR 为 17%,相比信息中心阶段增速有所下降。这一阶段,光模块主流速率经历了由 10G/25G 向 40G/100G 的过渡,2012 年北美市场以 10G 为主。2014 年开始步入 40G,2016 年 100G 开始规模化应用。
算力中心阶段,光模块速率开始向 400G/800G 过渡,目前已有不少龙头厂商开始研发 1.6T 系列。2019 年以来,数据中心产业开始步入算力中心阶段。AI、物联网、大数据等新数字技术的加速发展显著驱动了数据云存储及智能算力需求的增长,2019-2022 年 CAGR 约为 20%。2021 年光模块厂商下游客户开始对 800G 产品进行验证测试,2022 年实现批量应用。2023 年以来包括中际旭创在内的多家龙头厂商开始加码 1.6T 系列的研发。
图 1:近 20 年全球数据中心行业发展呈现“四中心三拐点”的特征
资料来源:《数据中心产业发展白皮书(2023)》、开源证券研究所
我国数据中心产业起步相对北美较晚,体现在光模块应用端层面,性能相对北美同期较为落后。目前我国数据中心产业处于云中心深化阶段,落后美国 3-5 年,仍处于增长阶段,预计“十四五”期间 CAGR 维持 25% 左右。2021 年在数字经济、“东数西算”的推动下,行业增速出现向上拐点。2023 年以来行业发展夹杂多重因素的影响,一方面“东数西算”对 PUE、上架率等指标约束愈发趋严,另一方面 AI 的崛起引致算力需求大幅扩张,预计“十四五”期间行业整体增速维持高企。自 2020 年起,我国数据中心开始步入算力中心阶段,三大运营商资本开支由 5G 网络向算力网络倾斜。2022 年 ChatGPT 开启 AIGC 这一全新业态,推动 AI 发展进入以多模态和大模型为特色的 AI2.0 时代,需求向“云计算大型、超大型 IDC+ 智能计算本地化中型数据中心 + 边缘计算小微型 IDC”三级转变,规模化智算与行业智算并行的需求特征显现。从资本支出的角度来看,三大运营商向互联网和算力网络大幅倾斜。根据中国电信 2023 年资本支出预算,产业数字化占比将由 2022 年的 29.3% 大幅提升至 38.4%。
图 2:我国数据中心市场规模(亿元)
 资料来源:《数据中心产业发展白皮书(2023)》、开源证券研究所
2021 年以来数据中心增长的逻辑主要在于算力需求的扩张。从国内来看,高新技术、数字化转型、智能终端等多样化算力需求场景不断涌现,算力为数据中心增长赋能。通用算力的数据中心占市场规模主体,智算及超算中心空间广阔。按照机架规模统计,目前通用算力数据中心占比超过 90%。随着人工智能应用场景的丰富,算力由基础算力向智算演化,算力由 1.0 时代向 2.0 过渡。算力 2.0 由新型数据中心提供大规模数据处理和高性能算力。在此背景下,“十四五”期间智算中心增速有望维持高企。根据 IDC 预测,预计 2026 年我国智能算力规模或达 1271.4EPLOPS,2021-2026 年 CAGR 达 52.3%,而同期通用算力规模 CAGR 为 18.5%。综合以上因素判断,当前国内数据中心的建设正处于周期向上的拐点,智能算力将驱动新一轮资本开支增长。
图 3:不同场景下的异构算力需求
 资料来源:《数据中心产业发展白皮书(2023)》
在 AI、无人驾驶、物联网等智能算力应用场景的推动下,总体推断 2023-2025 年全球数据中心规模增速或保持上升的趋势。在网络流量不断增长、叶脊架构广泛应用的背景下,数通光模块需求增速预计进入上升通道;同时交换机之间的设备交换容量不断提升促进了高速率产品的规模化应用,数通产品平均单价呈现上升趋势,综合导致了光模块产业进入量价齐升的周期。
图 4:2022 年以来 400G 数通光模块加速部署
资料来源:《数据中心产业发展白皮书(2023)》、中际旭创公司公告、开源证券研究所

02
AIGC 蓬勃发展是光模块需求增益的重要源泉
AIGC 的运行以海量的数据参数为基础。以 ChatGPT 为例,其作为 AIGC 的代表性分支,需要强大的模型和大数据支撑,才能在多个应用场景下生成高质量的内容。OpenAI 在 2018 年推出的 GPT 参数量为 1.17 亿,预训练数据量约 5GB。2020 年推出的 GPT-3 参数量大幅提升至 1750 亿,预训练数据量高达 45TB。GPT-4 的体系结构由 16 个不同的专家模型组成,每个模型都有 111B 个参数,总计约 1.76 万亿个参数。海量的数据参数对应大规模的算力需求,进而带动以上百亿计的算力基础设施投入。ChatGPT 的总算力消耗约为 3640PF-days(假如每秒计算一千万亿次,需要计算 3640 天)。按 2023 年在宜昌落地的国家先进计算产业创新中心为参照物(算力 500P 耗资 30.2 亿),若要支持 ChatGPT 的运行,需要 7-8 个这样数据中心支撑,基础设施投入需以百亿计。

表 1:Open AI 大模型参数量及预训练数据量逐代提升 

数据来源:百旺信云数据中心、开源证券研究所
算力的提升要求 AI 数据中心的网络架构发生相应的改变。算力的增长对网络端的带宽提出更高的要求,由此 AI 数据中心的网络价格发生一定的变化。传统的大型数据中心,网络通常是三层结构,包括接入层、汇聚层和核心层。接入层用于连接计算节点与机柜交换机,提供数据中心与国际互联网、其他数据中心的连接。汇聚层交换机连接接入层交换机,同时提供其他的服务,例如防火墙,SSL offload,入侵检测,网络分析等。核心层是数据中心内部各个网络之间的统一数据交换中心,交换机为进出数据中心的包提供高速的转发,为多个汇聚层提供连接性。传统的树形网络拓扑中,带宽是逐层收敛的,树根处的网络带宽要远小于各个叶子处所有带宽的总和。
图 5:传统数据中心内部网络为三层架构
料来源: CSDN
东西向流量占比提升推动网络架构向扁平化发展。随着东西向流量占比的提升,传统三层 Clos 架构的诸多缺陷逐渐体现出来。包括:成本高,根部交换机必须要有足够大的带宽来满足下层服务器之间的通信;性能有瓶颈,无法满足数据中心内部大规模的 MapReduce 和数据拷贝。叶脊两层网络架构适应数据流量发展,带动光模块需求提振。Spine-Leaf 架构可以提供高带宽、低延迟、非阻塞的服务器到服务器连接。其架构中的设备基本都是双向流量,输入设备同时也是输出设备。除了两层叶脊架构,还有五级 Clos 架构,为 Facebook 等超大型数据中心所应用。Facebook 将 leaf 交换机称为 TOR,在 TOR 和 Spine 之间增加一层 Fabric 交换机。Facebook 将一组 Fabric、TOR 和对应的服务器组成一个 POD 集群,每个 POD 由 48 个 TOR 和 4 个 Fabric 组成。

图 6:两层叶脊架构

 资料来源:CSDN
不同组网架构对光模块的耗用量有所差异,光模块的实际用量取决于网卡型号、交换机型号和单元数量。
根据君实财经和硅基研习社数据显示,预计 2023 年英伟达 H100 出货量 50 万颗,A100 出货量 125-130 万颗;2024 年 H100 出货量 150-200 万颗,A100 出货量 130 万颗。根据上述测算所依据的假设条件,我们预计英伟达 H100/A100 GPU 的出货或将在 2023 年带来 520/50/75 万个 200G/400G/800G 光模块潜在需求;在 2024 年带来 520/150/225 万个 200G/400G/800G 光模块潜在需求。
假设 2023 年 200G/400G/800G 光模块单位售价分别为 200/400/1000 美元 / 只,2024年单位售价下降至 100/300/800 美元 / 只。由此我们预计由英伟达 H100/A100 GPU 出货引致的 2023 年 200G/400G/800G 光模块新增潜在需求或达 10.4/2/7.5 亿美元,2024 年新增潜在需求或达 5.2/4.5/18 亿美元。

表 2:模型测算由英伟达高端算力芯片销售带来的光模块需求增益

数据来源:华工科技公司公告、芯智迅官网、开源证券研究所
根据 Lightcounting 预测,光模块的全球市场规模在 2022-2027 年或将以 CAGR11% 保持增长,2027 年有望突破 200 亿美元,其中前五大云公司的光模块采购预计从 2021 年的 32 亿美元增加到 2027 年的 72 亿美元, CAGR 达 14%。

03
基于 IC 工艺,围绕 TOSA/ROSA 构建的光电转化体系
光通信器件指应用于光通信领域的光电子器件以及配套集成电路。光通信器件按照在信息流中的不同作用可以分为五大类,包括光信号的产生、调制、传输、处理以及探测。光收发模块在信息流中对应着光信号的产生、调制和探测;光分路器和光放大器对应着信号处理。光通信器件按照物理形态的不同分为芯片、光有源器件、光无源器件、光模块与子系统四类。其中有源光收发模块的产值在光通信器件中占比最高,其性能主导着光通信网络的升级换代。

图 7:信息流包括光信号的产生 / 调制 / 处理 / 探测等

资料来源:中国光电子器件产业技术发展路线图(2018-2022 年)

表 3:光通信器件按照物理形态可分为芯片、有源 / 无源器件与光模块子系统

资料来源:中国光电子器件产业技术发展路线图(2018-2022 年)、开源证券研究所

光模块是实现光信号输入过程中光电转换和电光转换功能的光电子器件。所有信息通信信号初始状态都是电信号(模拟 / 数字),否则 IC 芯片无法处理。要实现光纤通信,信号发射端需要将电信号转换为光信号,通过光纤传输到远端。信号接收端,光探测器接收到光信号,并转化成可处理的电信号。光模块可按照速率、距离、封装方式等多种类型进行分类。从封装来看,光模块有多种封装形式,适配不同尺寸、功耗和速率需求。目前光模块的封装以可插拔形式为主,具备小尺寸、低功耗的优势,部分长距高速相干领域追求高性能,仍采用不可插拔形式。随着交换容量增大、端口密度变大、功耗增加等挑战日益严峻,LPO/CPO 成为行业重要的技术创新。
图 8:光模块可按照速率、距离等进行分类
 资料来源:《高速光模块关键技术方案及标准化进展》,吴冰冰,2022
光模块的结构使得其具备光电转换的功能。光模块通常由光发射器件(TOSA,含激光器)、光接受器件(ROSA,含光探测器)、功能电路、光(电)接口、导热架、金属外壳等部分组成。从发射端来看,驱动芯片对原始电信号进行处理,然后驱动半导体激光器(LD)发射出调制光信号;从接受端来看,光信号进入接收端端后,由光探测二极管(PD)转变为电信号,经前置放大器后输出。功能电路集成了时钟、数据恢复芯片以及激光器驱动芯片等。
图 9:光模块主要由 TOSA、ROSA、功能电路等组成
 
电芯片、主控芯片、TOSA、ROSA 在光 / 电转换过程中起着重要的作用。以 4x25Gps 光模块通信方案为例,通过 MCU 控制芯片与电接口利用 I2C 引脚进行数据交互,将 4 路速率高达 25Gbps 的电信号传送给时钟和数据恢复芯片 CDR;然后 MCU 控制芯片将经过 CDR 处理后的 4 路电信号发送给驱动激光器,使得 4 通道的驱动激光器能够驱动 TOSA 组件,从而让 TOSA 组件发出一路速率为 100Gbps 的光信号;通过光纤传输达到光接口的 100Gbps 光信号进入到 ROSA 组件中;MCU 控制芯片与电接口进行数据交换,让 ROSA 组件将这一路 100Gbps 光信号转换成 4 路 25Gbps 的电信号发送给 TIA;TIA 将这 4 路电流信号处理成一定幅度的电压信号,经过 CDR 处理后通过电接口输出。

图 10:4x25Gps QSFP28 光模块基本原理框图

 
04
算力时代下光模块降本降耗趋势凸显
数据中心的高能耗问题由来已久,算力背景下该问题愈显突出。工信部数据显示,2023 年我国数据中心耗电量预计将达到 2,667.92 亿千瓦时,占社会总耗电量的 3%。在此背景下我国多地区发布了对数据中心能效指标 PUE 的限制。在工信部印发的《新型数据中心发展三年行动计划(2021-2023 年)》中要求,到 2023 年底新建大型及以上数据中心 PUE 需降低到 1.3 以下。算力需求提升带动网络带宽成倍提速,数据中心能耗呈指数型增长。根据 Digital Information World 发布的最新报告,数据中心为训练 AI 模型产生的能耗将为常规云工作的三倍。据咨询机构 Tirias Research 建模预测,到 2028 年数据中心功耗将接近 4250MW,比 2023 年增加 212 倍,数据中心基础设施加上运营成本总额或超 760 亿美元。

图 11:算力和带宽高速发展带动数据中心功耗大幅提升

数据来源:华为官网
数据中心的能耗主要体现在 IT 设备和制冷设备。IT 设备主要包括服务器和网络设备等。服务器承载了计算和存储业务,搭载了 CPU、内存等硬件。网络设备包括交换机、路由器以及防火墙等。IT 设备占数据中心整体的能耗达 45%,其次为制冷系统,占比达 43%。具体到 IT 设备,其中服务器类约占 50% 左右,存储系统约占 35%,网络通信设备约占 15%。
图 12:典型数据中心的能耗主要分布于 IT 和制冷设备
数据来源:人民政协网、开源证券研究所
数据中心带宽提升,带动高性能交换芯片和高速率光模块的应用。数据中心交换芯片的演变趋势基本处于每两年翻一番的快速增长,25.6T 交换芯片用 7nm 工艺,51.2T 则需要选择 5nm 工艺节点,预计 2025 年 3nm 工艺节点可实现,并支持交换芯片实现 102.4T 的容量。对于光接口而言,25.6T 交换芯片对应 64 个 400G 光模块,已于 2021 年实现。2023 年随着 64 个 800G 模块的推出,支持交换机升级到 51.2T。对于 102.T 的交换容量,则需要 1.6T 光模块,光口每波长速率达到 200G。
高性能交换芯片和光模块的使用导致网络设备功耗大幅增加。光模块速率的提升带来功耗大幅增加。400G 早期功耗为 10-12w,预计长期功耗为 8-10w,800G 功耗约为 16w。以英伟达 QM9700 交换机为例,具有 64 个 400G 端口,若满载光模块,单台交换机对应的功耗就高达 640w 以上。
除了网络设备功耗大幅提升,服务器的散热功耗也非常可观。根据 CCID 数据统计,2019 年中国数据中心能耗中,约有 43% 是用于 IT 设备的散热,基本与 45% 的 IT 设备自身的能耗持平。服务器散热需求带动液冷行业的发展。引入液冷,可以降低数据中心能近 90% 的散热能耗。数据中心整体能耗,则可下降近 36%。

部分交易 

黑芝麻智能|ClickPaaS|第四范式|讯能集思探维科技不停科技 PROPHESEE|本末科技开为科技|华瑞指数云 群脉科技|云蝠智能|九四智能盎锐科技|大麦地|星辰空间|星测未来|星空动力|九天微星|范特科技|薪人薪事|优蓝国际|颐圣智能|超维知药|知行合一|微密医疗|乐准智芯硅基智能极芯通讯恒百锐信迈医疗博志研新诺领科技新通药物普罗亭零犀科技深蓝航天达利凯普九天微星瑞莱生物三盟科技驭势科技江行智能

北拓研究 


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

北拓资本
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开