容亿行研|光互联需求爆发,相干通信下沉引变局

2024-12-18 12:07


何敏

容亿高级投资经理,清华大学工科本硕,重点关注半导体、汽车电子、新能源等领域。

赵炬  

容亿投资高级合伙人,重点关注芯片器件、智能硬件、新能源、新材料。



导语

在生成式AI等新型应用的驱动下,算力需求持续高速增长,数据中心光互联成为近几年业界的热门话题。相干通信技术正在从电信市场下沉到数通市场,并随着开放解耦的持续推进,市场格局将迎来更多变化和机会,新玩家有望快速切入。




  • 相干oDSP是相干光模块的核心电芯片,从研发难度和工艺制程来看都可谓光通信领域皇冠上的明珠。随着速率升级和规模扩大,相干oDSP的成本和功耗持续优化,相干传输从中长距离下沉至中短距离成为行业共识,在ZR+(500-1000km)、ZR(80km)、LR(2km)等领域被寄予厚望。

  • AI的高速发展驱动算力基础设施需求扩张,而电力供应逐渐成为建设瓶颈,数据中心分布式互联成为业内首选方案。DCI互联帮助智算中心向跨楼和跨域互联演进,作为互联载体的可插拔相干光模块需求迎来快速爆发,与之配套的高性能相干oDSP将变得炙手可热。

  • 相干下沉促使电信和数通市场趋于统一,代际升级和开放解耦进一步打开市场大门,市场格局有望迎来新的变化。叠加近两年大规模并购事件频发,高阶相干oDSP的供应更加集中和受限,市场期待新的破局者。


相干oDSP是光通信领域皇冠上的明珠

“相干” VS “ IMDD”

光模块是光信号传输过程中实现光电转换和电光转换功能的光电子器件。光模块主要由光芯片和电芯片等部件构成。其中,光芯片包括激光器、调制器、探测器等芯片,用于实现对光信号的发射、调制和接收,电芯片则主要用来处理复杂的数字信号,为光芯片工作提供配套支持。其中oDSP芯片是成本和功耗占比最高的核心电芯片,主要用于处理和调节传输过程中衰减的光信号,是保证传输距离与信号质量的重要手段。

图:光模块产业链

光模块可以按照不同的标准进一步划分为多种类型。根据传输速率的不同,目前主流的光模块主要是100G、200G、400G、800Gbit/s等,1.2T、1.6Tbit/s也已经有样品推出。根据传输距离的不同,光模块主要分为SR(100m)、DR(500m)、FR(2km)、LR(10km)、ER(40km)、ZR(80km)等。从调制格式来看,目前短距离传输使用的光模块主要采用PAM4的强度调制格式,一般也即IMDD(强度调制,直接检测)光模块,具有低成本、低功耗优势;长距离传输使用的光模块则需要采用QPSK、8QAM、16QAM等更复杂的相位调制格式,以确保长距离、高带宽、高质量的光传输,一般也叫做相干光模块,价格比IMDD光模块更为昂贵。

图:光模块的基本分类(来源:知网)

具体而言,相干光模块是指在发射端采用高阶调制技术、在接收端采用相干检测技术而具备干涉放大能力的光模块。在相干光通信系统中,除了可以对光进行幅度调制之外,还可以进行频率调制或相位调制,一般使用基于马赫-曾德尔调制器(MZM)的IQ调制器,实现高阶调制格式(例如PSK、QPSK、QAM等),将信号调制到光载波上发送出去,并通过与本地振荡器激光的干涉放大进行检测。

图:几种高阶调制的星座图


相干光模块相比IMDD光模块有如下优点:1)灵敏度高:相干光通信能够进行相干探测,经相干混合后的输出光电流的大小,与信号光功率和本振光功率的乘积成正比,因此输出光电流大幅增加,检测灵敏度也就随之提升,有助于延长传输距离。2)传输距离更长:由于其高灵敏度,相干光通信支持更长的中继距离。3)通信容量大:支持更高的带宽和更复杂的调制方式,从而提升了通信系统的容量。4)波长选择性好:相干光通信能够在不同波长上进行有效的调制和探测,从而提高了频谱利用率。

图:相干光模块与非相干光模块的主要差异(来源:德科立招股书)

光模块数字信号处理技术(oDSP)是相干光模块的核心难点之一,相干oDSP芯片是光通信领域皇冠上的明珠。不同于IMDD,相干oDSP采用高阶调制和相干接收,数字信号的处理更为复杂,涉及概率整形(PCS)、高性能前向纠错(CFEC、OFEC等)、数字副载波调制(DSCM)等核心算法难点,仅少数厂商能提供的高速Serdes和ADC/DAC也是核心能力之一,完整的芯片需要有多年经验积累和精深实战研究的老司机来操刀,很多PAM4的开发人员很难切入相干oDSP的研发,反之则相反。从工艺制程来看,对性能和功耗的不懈追求推动相干oDSP走在了时代前沿,目前业内最领先的芯片产品制程已经来到3-5nm,最新的基于3nm工艺的芯片也呼之欲出。因此,从研发难度和制程工艺来看,相干oDSP都可谓是光通信领域皇冠上的明珠,能够竞逐的玩家也必须是身经百战的不俗之辈。

图:相干光模块结构示意图(来源:Acacia)


相干下沉成共识

开放解耦促统一

  • 电信领域正处于400G升级迭代阶段

相干系统相比IMDD更为复杂,长期以来主要应用在电信领域的长途传输,目前骨干和城域正从100G向400G迈进,以服务东数西算工程。100G是电信市场过去10年的主流,200G也有少量应用。技术进步和市场需求正在推动电信市场向400G演进,尤其是骨干网和城域网正在积极尝试,且代际演进有望加速。中国移动2023年发布了世界最长距离的400G光传输现网技术试验网络创新成果,2024年年初打通了首条“东数西算”400G OTN链路,2024-2025年将推动所有算力枢纽节点全面部署400G OTN网络。可以看到,骨干网正逐步实现长距400G运力升级,预计2025年之后将陆续进入数据中心互联的大规模升级阶段。

图:电信领域高速光传输演进历史(来源:中国联通公开演讲)

  • 相干在数通领域应用潜力巨大

短距离数通则领先于长距离电信一代,且迭代更快,目前处于从400G向800G甚至1.6T迈进的过程中,相干技术的突出优势使其在数通领域也将愈发具备竞争力和想象力。一方面,与IMDD相比,相干技术的色散容限更高,且能够在C波段利用光放大和DWDM(密集波分复用)等的性能优势不可忽视,而IMDD向更高波特率和更多调制符号数发展则面临接收机灵敏度劣化、引入过大非线性噪声等问题;另一方面,随着相干oDSP技术的持续改进,其单位功耗和成本无限接近于PAM4的oDSP,这也成为相干下沉到短距离传输的关键吸引力。

图:2018-2028年全球数通光模块不同速率市场空间拆分(单位:百万美金)(来源:LightCounting,Coherent预测,光大证券整理)

功耗方面:随着芯片的制程工艺由7nm演进到5nm,甚至接下来的3nm,相干oDSP不仅传输速率会得到提升,降功耗的表现也将越来越优异。从过去十多年的发展情况来看,相干oDSP单位功耗的降速远快于IMDD的oDSP。在100G速率时IMDD的功耗比相干模块低将近10倍,但这种差异在使用5nm工艺的800G速率时,已经不那么明显,预计在2025年左右1.6T时期将达到与IMDD相近的~10+pJ/bit水平。这也意味着相干技术将很有可能凭借更优的功耗快速下沉到短距离传输领域,向ZR(80km)、LR(10km)甚至FR(2km)等领域渗透。

图:相干和IMDD的单位bit功耗演变趋势(来源:公众号“光通信女人”)

成本方面:相干和PAM4 oDSP单位带宽的价格随着工艺进步持续下降,并且相干oDSP价格的预期下降速度有望随着规模的进一步扩大而加快。根据LightCounting的数据,目前相干oDSP的价格在2-3美元/Gbps,PAM4的价格则为0.2-0.3美元/Gbps,预计在2026年之后随着相干下沉规模扩大,相干oDSP价格降低速度有望加快,从而更好地满足市场需求。在市场需求数量方面,二者都呈现高增长的态势,PAM4的oDSP数量比相干oDSP高一个数量级,但在2026年之后相干oDSP的需求增速可能会超过PAM4的增速。因此,整体而言,相干oDSP和PAM4 oDSP是两个体量相近的大市场,而且随着相干下沉的来临,相干oDSP的价格降幅和市场需求将会更加值得期待。

图:PAM4和相干DSP的单位售价和发货数量预测(来源:LightCounting)

总之,在100G(电信)和400G(数通)时代,IMDD直调直检凭借功耗和成本优势主导短距光互联(<80km),相干凭借性能优势主导中长距光传输(≥80km)。随着接口速率增长和技术持续进步,相干正不断向中短距传输下沉,IMDD和相干的界限逐渐模糊,电信和数通市场逐步趋于统一。

图:相干应用下沉至LR(来源:Ciena)

从标准化进程来看,OIF(国际标准组织光网络论坛)一直在各个标准组织中引领400G和800G相干光系统的标准化工作,对ITU-T和IEEE 802.3也产生了重要影响,相关标准持续得到完善。目前400ZR已大规模商用,OIF等已经制定了400ZR、OpenROADM 和 OpenZR+等协议标准,800ZR和1600ZR的标准化也在快速推进中。不仅800G ZR和800G ZR+受到广泛关注,800G LR也成为相干光模块的又一重点应用领域,将把相干的应用范围下沉至2-10km,部分头部企业正在紧锣密鼓地推进相干在LR园区级的研发应用。


图:Meta 1.6T coherent lite@10km立项(来源:Meta)

  • 开放解耦是电信和数通的共同诉求,DCI是重要抓手

在运营商层面,开放解耦是降本的重要手段,系统正在从黑盒封闭走向开放解耦,开放解耦的 DCI (Data Center Interconnect)互联波分已经实现正式商用。在过去的网络运营体系中,系统厂商提供整套解决方案,系统整体类似于封闭的黑盒,不同厂家的硬件、软件均不具备兼容互通的可能性,不仅难以控制成本,而且难以适应网络智能化和业务云化的发展趋势。近几年来,运营商尝试自研以推动光电开放解耦,三大运营商正积极推动开放式 DCI 互联波分的正式商用,运营商对各功能部件将有更大的选择权,独立采购光模块案例也陆续出现。中国电信在今年7月份的公开招标中首次要求厂商光电解耦、支持混合组网,打破了延续多年的OEM设备厂商包办组网模式,市场将有望变得更加开放而具有活力。

在云厂商层面,开放解耦是追求更优性能和更高性价比的必然选择,阿里、腾讯等大厂已纷纷“自研光模块”以掌控供应链,DCI 互联波分也已被大量采用。百度相关负责人在公开演讲中就曾表示,其在实验室120km内实现了5家厂商光模块在3家厂商交换机之间的互通,打破了传统IP和光分立运维的壁垒,大大提升了运维效率。云厂商普遍采用多方JDM模式,大厂与芯片厂商直接讨论规格需求和成本需求,以及一些定制化功能,芯片厂商根据大厂的需求进行优化或者重新开发,同时模块厂商结合芯片的设计,与大厂联合设计模块方案,最后由模块厂商负责生产制造,从而帮助云厂商实现真正的端到端的成本竞争力。

图:腾讯自研光模块以“打破生态”(来源:腾讯公开资料)


相干市场规模百亿

DCI等下沉市场增量显著

  • 相干光模块或有百亿美金的市场规模

根据Cignal AI的统计和预测,未来几年相干光模块的市场规模将呈现15%左右的年均增速,市场规模将从50亿美元逐步逼近100亿美元。其中,2023 年相干光模块的收入由于市场波动而有所下降,整体规模略低于50亿美元,100G和200G整体也呈下行趋势。但是随着市场出货量的恢复,以及新技术(例如400G ZRx、800G ZRx、1.2T+、1.6T ZRx)的引入,预计到2028年,全球相干光模块市场规模将接近100亿美元。若粗略按照当前2美元/Gbps来算,对于400G相干光模块而言,相干oDSP的价格也在800美金左右,在相干光模块的总体成本中占比预计在30%-40%,因此整个相干oDSP的市场规模也十分可观。

图:相干光模块市场预测(数据来源:Cignal AI)

  • ZRx包括ZR和ZR+等新兴需求

上图中ZRx主要包括ZR和ZR+等新型相干光模块,是相干通信下沉和行业互联互通背景下的必然产物,也是未来相干光模块增长和迭代的重要方向。

ZR相干光模块主要用于数据中心互联(DCI),传输距离80-120km。根据中国信通院的报告,当前最先进的智算基础设施单柜能耗已达 50+kw,10 万 GPU 集群的功率超过 150MW,一年的耗电量近 16 亿度,相当于一个大型电站的发电规模,电力需求难以得到监管审批。随着算力需求不断增长,单个数据中心的电力瓶颈越来越突出,未来将转向更大规模的“数据中心集群”,这意味着更多的数据中心将向分布式布局发展,因此数据中心之间的互联需求也将日益强劲。



图:全球能耗TOP50的数据中心市场(来源:Cushman&Wakefield)

长距离 DCI 网络可为数据中心提供高可靠、低延迟的数据传输能力,从而支持大规模的AI训练和推理,是连接数据中心集群的重要桥梁。随着数据中心直接流量的增长,自建 DCI 也成为大型互联网公司的优选。今年7月Lumen 和微软公布的重大合作,就让我们看到 AI 产业发展对 DCI 网络扩展的实际需求。

ZR+意味着长距离(500~1000km)、高发射功率、低功耗的可插拔光模块,是一种在互联互通标准下更加灵活可靠的产品形态。此类光模块可以直接插入交换机端口,接入开放光层设备,实现IP over WDM的业务承载,可以实现不同供应商的ZR/ZR+模块支持与不同厂商生产的符合相同协议规范的光模块进行互联互通。今年9月,Marvell、Lumentum与Coherent携手宣布率先成功验证了800G ZR+光模块在500公里的互操作性,国内旭创、华工等厂商也纷纷推出800G ZR/ZR+的光模块样品,这意味着在高速发展的人工智能时代,国内外的云运营商将很快能够高效可靠地扩展其区域分布的数据中心互联(DCI)。

图:Orion系列相干oDSP产品(来源:Marvell)


相干能力举足轻重

企业价值颇受认可

根据Cignal AI的统计,在过去几年间,相干oDSP逐步从30GBaud演进到60、90、120甚至200GBaud,市场格局也在悄然发生变化。其中用于60-200GBaud高速相干领域的oDSP芯片研发难度更高,主要玩家是Ciena、Acacia、Marvell和华为。2019年Ciena在60-200GBaud的相干oDSP市占率高达85%,2020年以后,Acacia和Marvell快速追赶,华为在艰难的形势下也保持了一定的市占率。Infinera和Nokia两家合计占10%左右,NEL则主要与日本客户合作,市场份额较低。

图:相干光模块oDSP的历史格局演变(来源:Cignal AI)

最近几年,随着光互联的快速发展,相干下沉可见的光明前景越来越无法忽视,并购事件频频发生充分体现了大厂对相干oDSP的重视程度。2021前后,半导体巨头Marvell以100亿美元的估值收购了Inphi,以此强化自身在光模块oDSP及其他光电芯片的能力。同样在2021年前后,老牌网络设备公司Cisco以45亿美元的估值收购了Acacia,以此巩固其在光传输领域(含光模块和oDSP)的行业地位。2024年,Nokia也宣布将以23亿美元的估值收购Infinera,合并后Nokia将在规模上更加接近第一梯队厂商。从这三次重量级的并购事件可以看到,光电芯片是核心能力,芯片产品能力极强的Inphi(含相干和PAM4 oDSP)被并购的价值最高,即使在亏损状态下获得了也比另外两家相对更高的并购价格。

图:最近三起光模块oDSP相关的并购事件分析

然而,对于旭创(Innolight)、Coherent、光迅(Accelink)等光模块厂商来说,上述收购之后的相干oDSP供给形势似乎更加严峻,市场上几乎没有可选的独立第三方oDSP公司。一方面,在相干和PAM4 oDSP都强势领先的Marvell(Inphi)也同时是光模块市场上的重要竞争对手;另一方面,Ciena、Cisco(Acacia)、华为(海思)等厂商则几乎不单独对外售卖oDSP芯片,而更倾向于销售整套解决方案。因此,近年来的一系列oDSP公司并购事件实质上进一步削弱了众多光模块厂商的供应链,面向接下来快速增长的相干下沉,如何寻求供给突破是各家难题。

图:全球前十名光模块厂商(来源:LightCounting)


AI基建强劲爆发

新玩家机会正当时

AI的快速发展将带来强劲的光互联需求,拉动光模块及其配套oDSP芯片的快速发展。Marvell于今年4月AI day投资者交流会的相关演讲中提到,在缩放定律(Scaling Law)下,大模型规模越来越大带来交换网络层数提升,光模块的配比有望提升,光互联 TAM 增速将高于 GPU 增速,这里的光互联就包括数据中心内部互联和数据中心外部互联等。更多的互联数量和更高的互联速率奠定了光模块广阔的市场空间,因此,我们长期看好光模块及oDSP的产业发展前景,尤其是在相干下沉和开放解耦背景下,能力突出的oDSP厂商将会大有可为。

图:GPU数量与光互连数量比较(来源:Marvell)

在需求旺盛且供不应求的背景下,新玩家导入恰逢其时。根据Marvell今年4月份的评估,其在互联业务的潜在市场空间将从2023年的34亿美金增长到2028年的111亿美金,其中数据中心内部互联光互联(DCI)的市场空间将从10亿美金增长到30亿美金,CAGR为25%。紧接着在今年10月份,Marvell宣布自2025年1月1日起将对其全线产品实施涨价,这次大规模涨价也是光电产品强劲增长、供不应求的直接结果。

图:Marvell测算的其互联业务的潜在市场空间(来源:Marvell)

智者伺机而动,勇者乘势而为,眼下具备产品竞争能力的新玩家将有机会快速导入,成为支撑AI基础设施建设的有效补充。我们期待光模块oDSP的新势力抓住市场机遇脱颖而出,为行业的持续发展和进步注入新鲜的活力!







END

长三角汽车电子产业园

中国杭州5G创新谷

依托核心团队深厚的产业背景和产业资源,容亿投资致力于成为聚焦科技产业的领军投资机构。
容亿投资重点投资科技大赛道,集丰富的产业、人才和政府等资源,助力创业企业快速成长为行业龙头。
容亿投资,让创业更容易。
商业计划书,请投递至邮箱:BP@winreal.vc,我们将仔细阅读,并尽快与您取得联系。