国盛通信 | 800G LPO:AI 时代最具潜力的技术路线
2023-05-17 11:08
吉时通信
2023-05-17 11:08
订阅此专栏
收藏此文章

摘要

LPO 方案:低功耗、低延迟、低成本、可插拔。LPO 通过线性直驱技术替换传统的 DSP,将其功能集成到交换芯片中,只留下 driver 和 TIA 芯片。LPO 光模块中用到的 TIA、driver 芯片性能也有所提升,从而实现更好的线性度。


目前主流方案有进一步性能提升空间。目前主流的 PAM4+DSP 解决方案具有较好的信号处理能力,表现在电口适应性强、光电性能好等,但在功耗和成本上有进一步提高空间。在 400G ZR 中 DSP 模块功耗占比 49%。在成本上,DSP 价格较高,400G 光模块中,DSP 的 BOM 成本约占 20-40%。


LPO 方案解决了高功耗、高成本、高延迟的问题。LPO 功耗相较可插拔光模块下降 50%,与 CPO 接近。根据 Macom 的数据,具有 DSP 功能的 800G 多模光模块的功耗可超过 13W,而利用 MACOM PURE DRIVE 技术的 800G 多模光模块功耗低于 4W。延迟上,去掉 DSP 芯片后,系统减少了对信号复原的时间,延迟大幅降低。另外,相比于 CPO,LPO 采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。


AI 算力需求爆发带动 800G 光模块放量。大模型、大数据、大算力日益成为 AIGC 应用的核心制约。大模型和数据集是 AIGC 发展的软件基础,而算力是最为重要的基础设施。AI 以并行计算为主,核心处理器主要为 GPU,但除了 GPU 性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI 服务器对于底层数据传输速率和延时要求非常苛刻,需要高速率的光模块匹配。


我们认为,LPO 技术是 800G 时代最具潜力路线。DSP 芯片由 7nm 制程向 5nm 制程演进,设计、制造成本水涨船高。而 LPO 方案能够大幅降低功耗和延时,并具有成本优势。而其系统误码率和传输距离较短的缺陷,在 AI 计算中心短距离应用场景下也得到弥补。因此,LPO 方案能够高度契合 AI 计算中心短距离、大带宽、低功耗、低延时的需求。


LPO 有望在 2024 年底迎来量产。LightCounting 预计业内将在 2024 年底首次部署 LPO 光模块。目前新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信推出 800G 线性互联光缆。高线性度的 TIA、Driver 芯片作为 LPO 技术的核心零部件,目前有 Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前,剑桥科技与 Macom 深入合作,且正在向微软供货高速光模块,我们认为,北美云厂商正在积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受 LPO 方案,建议持续关注。


风险提示:光模块市场需求不及预期;相关技术研发进度不及预期。



一、800G LPO:AI 时代最具潜力的技术路线

LPO 简介:LPO(linear drive pluggable optics,线性驱动可插拨光模块),主要运用于高速光模块领域,就是通过线性直驱技术替换传统的 DSP,实现系统降功耗、降延迟的优势,但系统误码率和传输距离有所牺牲。该技术适用于数据中心等短距离传输场景。

 

LPO 技术主要用于高速率光模块中。光模块传输速率涵盖很大的范围,根据传输速率的不同,光模块可分为 155M、622M、1.25G、2.5G、8G、10G、16G、25G、32G、40G、50G、100G、200G、400G 等。传输速率越高的光模块,结构越复杂。根据封装类型的不同,光模块可分为 SFP、eSFP、SFP+、XFP、SFP28、QSFP28、QSFP+、CXP、CFP、CSFP 等。



400G 及以上速率的光模块主要有 QSFP-DD、CFP8 和 OSFP 封装。随着 5G 建设、数据要素规模的演进以及 AIGC 对海量数据传输的需求,电信、数通领域需要更强性能的光交换机,也因此需要更高速率的光模块。目前主流的 200G/400G/800G 的产品都是基于 PAM4 技术 +DSP 芯片来实现高速信号的调制、传输和恢复。



PAM4(4-Level Pulse Amplitude Modulation,四电平脉冲幅度调制)是一种调制技术,采用 4 个不同的信号电平来进行信号传输,每个信号周期可以传输 2bit 信息。而传统数字信号通过不归零编码(Non-Return-to-Zero,NRZ)来传输信号,只有高、低电平代表 1、0 两种信号,每个信号周期能够传输 1bit 信息。这样一来,PAM4 就能携带 NRZ 两倍的信息量,从而实现传输速率的倍增。PAM4 的优势在于可以在不增加带宽的情况下提高传输速率,缺陷在于对噪声更敏感,其眼图开口更小,难以将原始信号区分开来。



PAM4 的调制方法包括基于 DSP 的数字 DAC 实现方法和基于模拟的组合方法。主流模拟模式可以通过添加两个 NRZ 信号通道来工作,数字模型基于高速 DAC,可实现 0/1/2/3 电平的快速输出。DSP 是数字信号处理技术,主要用于解决光通信系统中的数字时钟恢复、色散、带宽不足引起的低通滤波效应、偏振旋转等问题,消除噪声和非线性干扰。对于 100G 以上的单波应用,目前的电驱动芯片和接收端光器件无法达到 50GHz 以上的带宽,相当于在发射端引入低通滤波器,造成码间干扰,使得接收器无法恢复正确信号。引入 DSP 后,信号可以在发送端进行压缩,在接收端通过自适应非递归(FIR)滤波器恢复,从而减少对光器件带宽的要求。PAM4+DSP 解决方案具有较好的信号处理能力,表现在电口适应性强、光电性能好等,但具有更高的功耗和成本。下图可以看到,在 400G ZR 中 DSP 模块功耗占比 49%。



LPO 方案相较于 PAM4+DSP 有何优势?


为了降低 DSP 的功耗和延迟,LPO 概念应运而生。LPO 技术去掉了 DSP 芯片,将其功能集成到交换芯片中,只留下驱动(Driver)和跨阻放大(Transimpedance Amplifier,TIA)芯片。LPO 光模块中用到的 TIA、driver 芯片性能有所提升,从而实现更好的线性度。但是,LPO 的系统误码率和传输距离有所影响,因此这项技术只适用于短距离的应用场景,例如数据中心服务器到架顶交换机的链接。



LPO 技术具有以下几个优点:

(1)低功耗。LPO 功耗相较可插拔光模块下降 50%,与 CPO 接近。图表 8 显示采用 Linear-drive 方案后,硅光、VCSEL、薄膜铌酸锂功耗均下降 50% 左右。根据 Macom 的数据,具有 DSP 功能的 800G 多模光模块的功耗可超过 13W。而利用 MACOM PURE DRIVE 技术的 800G 多模光模块功耗低于 4W,下降 70%。低功耗不仅节省电能,而且能够减少模块内组件的发热。

(2)低延迟。去掉 DSP 芯片后,系统减少了对信号复原的时间,延迟大幅降低。DSP/ 重定时功能增加了延迟,以 MACOM PURE DRIVE 技术为例,因采用信号串行方案,LPO 光模块可以做到皮秒级别的延迟时间。

(3)低成本。DSP 价格较高,400G 光模块中,DSP 的 BOM 成本约占 20-40%;LPO 的 Driver 和 TIA 里集成了 EQ 功能,成本会较 DSP 上浮少许,但 LPO 方案还是可以将光模块成本下降许多。

(4)可热插拔。相比于 CPO,LPO 没有显著改变光模块的封装形式,采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。



半导体厂商 Macom 已发布 LPO 解决方案 MACOM PURE DRIVE,与标准的 DSP 架构相比具有以下优势:(1)将光互连功耗降低 50% 以上;(2)最小化链路延迟,对机器学习和人工智能应用至关重要;(3)消除了成本高昂且冗余的信号重定时模块;(4)解决了独立的 DSP 芯片发热的问题;(5)简化了模块实现,具有更大的灵活性;(6)减少占地面积以满足空间受限的设计要求;(7)可扩展至 1.6T 速率。


LPO 产业进度:国内外并驾齐驱。LPO 作为一种新技术,预计 2024 年年底量产,目前新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信宽带推出 800G 线性互联光缆。高线性度的 TIA、Driver 芯片作为 LPO 技术的核心零部件,目前有 Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前,剑桥科技与 Macom 深入合作,且正在向微软供货高速光模块,我们认为,北美云厂商正在积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受 LPO 方案,建议持续关注。



值得注意的是,LPO 方案需要和交换机进行配合,对光模块厂商在产业内上下游合作协同要求更高,龙头公司如中际旭创、新易盛将更加具备优势。



二、行业:量产将至,800G 光模块最具潜力方案

AI 算力需求爆发带动 800G 光模块放量。随着 AI 技术的发展,大模型、大数据、大算力日益成为 AIGC 应用的核心制约。大模型和数据集是 AIGC 发展的软件基础,而算力是最为重要的基础设施。AI 以并行计算为主,核心处理器主要为 GPU,但除了 GPU 性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI 服务器对于底层数据传输速率和延时要求非常苛刻,需要高速率的光模块匹配,因此 AI 服务器对 800G 光模块的需求很大。以英伟达 DGX H100 服务器为例,H100 + NVLink Network + IB 架构中,一个服务器对应 5+4+4+5 个连接外部的 4xNVLink 通道,即 18 个 800G 光口,36 个 800G,即一张 H100 在该架构下,用于显存互联的部分就需要 4.5 个 800G 光模块。



LPO 技术是 800G 时代最具潜力的方案。随着 DSP 芯片由 7nm 制程向 5nm 制程演进,DSP 芯片的设计、制造成本也水涨船高。而 LPO 方案在光模块中去掉 DSP 芯片,能够大幅降低功耗和延时,并具有成本优势,而其系统误码率和传输距离较短的缺陷,在 AI 计算中心短距离应用场景下也得到弥补。因此,LPO 方案能够高度契合 AI 计算中心短距离、大带宽、低功耗、低延时的需求。LightCounting 预计业内将在 2024 年底首次部署 LPO 光模块。



短距离传输场景高景气,潜在市场巨大。新一代的大型数据中心为了应对数据流量的增长以及兼顾更灵活的扩容升级和备份功能,普遍开始采用叶脊网络架构,数据中心内部的数据交换和吞吐能力更强,同时网络结构也更加扁平化。在一个典型的叶脊架构数据中心内部交换网络中,大多数场景的传输距离都小于 2km,叶脊方案用短距离、密集布线替代传统三层拓扑结构的中长距离、相对稀疏的布线,因此带来了短距离光模块的可观需求量。短距离场景下,LPO 无需考虑误码率问题,同时 LPO 凭借低功耗低成本优势,未来有望率先抢占数据中心内部交换网络这一庞大市场。


三、风险提示

光模块市场需求不及预期。

光模块受到 AIGC 催化算力需求发展而拉高光模块需求弹性,如果 AIGC、算力发展不及预期,将影响云厂商光模块采购量。


相关技术研发进度不及预期。

LPO 作为一种正在小范围开发、测试和应用的新技术路线,本身具有不确定性。若 LPO 量产失败,或者市场主动放弃这一方案,将可能影响相关个股的行情走势。



本文节选自国盛证券研究所已于 2023 年 5 月 16 日发布的报告《国盛通信 800G LPO:AI 时代最具潜力的技术路线,具体内容请详见相关报告。


宋嘉吉

S0680519010002

songjiaji@gszq.com

黄瀚

S0680519050002

huanghan@gszq.com
赵丕业

S0680522050002

zhaopiye@gszq.com

特别声明:《证券期货投资者适当性管理办法》于 2017 年 7 月 1 日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

 

重要声明:本订阅号是国盛证券通信团队设立的。本订阅号不是国盛通信团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。


本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

 

版权所有,未经许可禁止转载或传播。


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

吉时通信
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开