算力革命:泛在、绿色与生态
2023-02-0922:34
吉时通信
2023-02-09 22:34
吉时通信
2023-02-09 22:34
收藏文章
订阅专栏


摘要

我国东数西算战略、美国对英伟达高算力芯片的禁运均指向了被市场忽略的概念——算力。为什么我们当前重视算力革命?如何看待这场 IT 变革?


为何当前要关注算力?每一轮的 ICT 创新革命都是“通信 + 计算 + 存储”三位一体协同升级,5G 作为数据传输的“超级高速公路”,必然将匹配更快的“跑车”,当我们将视野从短视频等拓展到 AR、VR 乃至元宇宙时,其对计算、渲染、AI 的需求将剧增,同时智能汽车、可穿戴的兴起将推动计算能力将从云端向“云—边—端”延伸,多元算力时代即将到来。在 5G 网络基本建设完成后,算力对社会的贡献将逐步体现,据华为《泛在算力》报告测算,1 美元的算力投入,可以带来 4.7 美元的社会产出。


泛在算力:“云—边—端”的共存。市场此前将算力等同于 IDC,而今在算力需求百倍增长下,处理器单核性能与多核提升边际递减存在,大型数据中心的算力提升有限。而由于网络性能,带宽成本等制约,对于分布式需求愈发明显。边与端的设备将迎来从“功能机”向“智能机”的升级。


绿色算力:双碳制约下的等式转换。通过芯片和算法,我们实现了“能源 + 算力——>价值 + 热量”的转换,随着算力应用的普及,能源将是终极制约因素。对 IDC 而言,大型化、智能化和散热技术成为标配;对于芯片和器件而言,ARM 架构通过成本和效率的优化占据服务器市场一席之地,而提升光传输密度是降低器件功耗的主攻方向,CPO 共封装光学呼之欲出。


算力生态:构建汽车 / 元宇宙 / 机器人等多场景共荣生态。元宇宙的宏大愿景、虚拟人的 AI 灵魂、智能汽车的丰富互动、AR/VR 的立体展示将带来对算力提出随时、随地、随需、随形的能力要求。从投资角度看,汽车智能化催生的算力需求有望明后年最快爆发,以解决人机交互、辅助驾驶等实用功能,而未来的无人驾驶场景则更需算力支撑,因此车型升级中更易“预埋”算力,需求确定性最强。而元宇宙、Web3 面向 C 端用户的虚拟世界构建则代表了远期最具爆发力的需求。


投资建议:抓住“光与云”的确定性,探索“边缘 + 绿色”的广阔空间。1)边缘算力:美格智能、移远通信、广和通;2)通信设备:亨通光电、长飞光纤、中天科技、天孚通信、中兴通讯、新易盛、中际旭创、光库科技、太辰光;3)芯片:NVDA、AMD、QCOM。


1. 投资要件

为何当前要关注算力?


通信板块在经历了 5G 建设周期后,投资者始终在问三个问题:

1、5G 的杀手级应用是什么?

2、5G 驱动的硬件升级还有哪些?是否会在架构上有所创新?

3、5G 之后通信看什么?


总所周知,每一轮的 ICT 创新革命,均是“通信 + 计算 + 存储”三位一体同步升级,5G 作为数据传输的“超级高速公路”,必然将匹配更快的“跑车”,当我们将视野从短视频等拓展到 AR、VR 乃至元宇宙时,其对计算、渲染、AI 的需求将剧增,同时计算能力将从云端向“云—边—端”延伸,多元算力时代即将到来。我国在 5G 网络建设上取得了领先地位,未来算力资源将成为全球科技领域的新高地,8 月 31 日美国芯片设计公司英伟达称被美国政府要求限制向中国出口两款被用于加速人工智能任务的最新两代旗舰 GPU 计算芯片 A100 和 H100,似乎也佐证了算力在未来全球科技竞赛中的地位。


按照国盛通信团队的研究框架,如图 1 所示,在过去三年,我们关注了以运营商投资驱动的 5G 周期、以云厂商投资驱动的 IaaS 周期、以及今年的“通信 +”转型周期,未来在 5G 网络投资趋于平缓后,我们将聚焦于算力大周期,而泛在、绿色与生态将是三个核心视角,我们后文将逐一展开。



从终端市场需求来看,在国内外数据流量迅速增长以及公有云蓬勃发展的背景下,近 10 年来全球算力的增长明显滞后于数据的增长。同时,伴随智能汽车、人工智能、机器学习催生的大量数据需求,算力缺口持续显现。


5G 网络的不断建设和完善,带动万物互联加速推进,同时更大带宽和更低延时的多场景显现,海量数据持续涌现,数据结构从单一模式变为多模式,非结构化数据日益增加,对海量复杂数据的实时处理要求更高。在未来 5-10 年将是数据量指数级增长的井喷临界点,算力供给需要持续扩张。


未来在自动驾驶、机器人等多个方向,对于算力的消耗会呈指数级增长,深度学习、机器学习的场景越来越丰富,通用芯片和专用芯片的关系会发生动态变化。各大巨头纷纷转向以 ARM、FPGA、ASIC 等为核心的低功耗计算架构,避免对单一架构的过度依赖。


同时,传统以计算为中心的冯氏架构下,在 CPU 存储之间以及存储和存储间的数据搬运带来了延迟功耗,通过把部分算力下通到存储,在拥有足够好性能器件支撑的前提下,就能减少功耗和延迟,提升芯片的算力。


作为支持数字经济以及智能化的核心基座,以数字新基建为代表的算力革命,正在催生出前所未有的新机遇。国内也在着手搭建算力网络,包括东数西算、全光网等。已解决当前网络实时性缺乏保障、宽带不足、能源供给不匹配等问题。同时,在操作系统、服务器高端芯片、算力数据库等领域,依旧较多受外部因素制约,实现国内算力网络资源的自主可控仍然任重道远。




2. 算力革命

。近年来,“算力”两字,随着社会智能化的程度提升,越来越多的被提及。其实“算力”一词并非新鲜事物,从中国古代的算盘到如今的超级计算机,算力作为人类认知能力的延伸,是见证与辅助人类社会实现跨越式发展的重要生产力。面向未来,随着当下智能驾驶、AI 等场景下爆发的百倍算力需求。我们认为,当前以传统计算集群为主的算力发展模式已经不能满足未来需要,一场“由集中到泛在”,“以能源消耗为边界”,“云、边、端一体化”的算力革命已经迫在眉睫。


2.1.算力的发展

2018 年诺贝尔经济学奖获得者威廉·诺德豪斯将算力定义为“设备根据内部状态的改变,每秒可处理的信息数据量”。目前行业中普遍用“FLOPS”,即每秒所执行的浮点运算次数,来衡量算力大小。


从最原始的算盘到当今的超级计算机,人类社会的算力发展经过了诸多阶段,根据华为算力报告,这些阶段可以划分为人力化、机械化、电气化、集成电路化和当下所展现的移动化。



基于人力的算盘,是中国古代劳动人民发明创造的一种工具,虽能一定程度上简化计算,但其最终是人力推动,效能有限。到 1642 年,在算盘原理的基础上,第一台机械式计算器被发明,解放了人力并提高了计算效率。1937 年,世界第一台基于电子的计算机


“阿塔纳索夫 - 贝瑞计算机”被发明,实现了计算介质的改变。后续随着晶体管与集成电路的走向成熟,算力载体的物理体积得到大幅缩减,集成电路计算机被运用到各行各业之中,实现了算力的再一次爆发。1993 年,随着 IBM 公司推出第一步移动智能手机 Simon,算力“移动化”时代正式到来。时至今日,随着通信网络的发达,移动芯片的进化,移动端算力载体已经进化为包括“云端数据中心”、“边缘设备”、“智能手机”、“智能模组”等多种形式,“算力泛在”的初步环境得以实现。


2.2.算力对全球经济的促进作用

算力以及其背后代表的设备链条,是具有高附加值的高科技产业。算力作为一种新技术进步因素脱颖而出,成为挖掘数据要素价值,推动数字经济发展的核心支撑力和驱动力。对于“算力”设备的投资,可以为社会带来从直接到间接的丰厚经济收益。根据《2021-2022 全球计算力指数评估报告》的结论,算力资本可与传统物质资本形成互补效应和协同效应;算力资本增长会产生正网络外部性效应和溢出效应;算力资本对经济发展具有倍增效应。



在华为的《泛在算力》报告中,对算力产生的经济效益做了更加明确的划分,一是直接受益,二是行业杠杆收益,三是国家整体竞争力收益。


直接收益,以公有云投资为例,在选取戴尔 PowerEDGER940 服务器的条件下,以服务器的出厂价 25,100 美元,云服务器的使用周期为 5 年,云服务器实现 75% 利用率,

服务器的租金收入 118,586 美元计算,1 美元的投入,可以带来 4.7 美元的产出。


除上述以租金收入计算的直接收入外,随着算力加速部署,各行各业的智能化程度加深,将会为社会带来更加显示显著的额外收益。根据美国劳工部数据,随着智能机器人等基于高算力的智能设备加速应用,未来讲给美国智能制造业带来 1700 亿美元的额外经济产值提升。同时,根据华为《泛在算力》报告数据,智能化程度提升,将会为包括制造业。交通业、农业等多个业态带来数倍回报。



根据 IDC 于 2021 年发布的结论,十五个重点国家的计算力指数平均每提高 1 点,国家的数字经济和 GDP 将分别增长 3.5‰和 1.8‰,预计该趋势在 2021-2025 年将继续保持。同时,通过针对不同梯队国家的计算力指数和 GDP 进行进一步的回归分析后,研究发现:当一个国家的计算力指数达到 40 分以上时,国家的计算力指数每提升 1 点,其对于 GDP 增长的推动力将增加到 1.5 倍,而当计算力指数达到 60 分以上时,国家的计算指数每提升 1 点,其对于 GDP 增长的推动力将提高到 3.0 倍,对经济的拉动作用变得更加显著。



由此可见,算力已经成为衡量国家综合竞争力的重要指标之一,根据罗兰贝格发布的全球主要国家人均算力与瑞士洛桑国际管理发展学院发布的《世界竞争力报告》,人均算力水平与国家智能化程度呈现高度相关性。包括美国、新加坡、英国在内的当前智能化水平较高的国家,人均算力水平同样呈现较高的水平;而泰国、印度尼西亚等较低智能化水平的国家,人均算力水平同样位于中等以下。


2.3.算力革命正在发生的原因:供需错配


当下,国内投资者对于算力的认识尚处于较为初级的阶段,目光局限于“IDC”+“服务器”两大产业链中,短期由于国内互联网产业“过冬”,2020 年 IDC 行业扩建等影响,国内投资者对于“算力”过剩的担忧影响了对于“算力革命”迫切性的认识。我们认为,一来算力并不能仅用大型 IDC 需求表征,其只代表集中式算力的规模;二来随着自动驾驶,智能机器人,人工智能等新需求的快速成熟,边缘侧与终端侧算力需求涌现,全球现有算力将快速进入“供不应求”的局面,算力革命已经迫在眉睫。


究其根本,“算力革命”爆发的根本原因在于“供需失衡”,供给方面主要受到 CPU 发展极限、流量成本、碳排放等因素制约,集中式算力的边际性价比正在减弱。需求方面,受到车联网、AI 等同时需要“海量数据处理”+“低延时”的行业带动,算力需求将在未来呈现指数型爆发式增长。本篇报告,我们将从供需出发,分条阐述“算力革命”爆发的必然性与急迫性,并给出相关的投资建议。


供给端 1:受到量子隧穿效应影响和商业化成本影响,硅基单核芯片制程将在 3nm 达到极限。硅基芯片晶体管的栅长在低于 3 纳米时极易发生量子隧穿效应(其原理为,当栅长缩小到一定程度的时候,即使没有加电压,源极和漏极都接近互通,晶体管便失去了开关的作用,因而无法实现逻辑电路)。因此,通过更加先进的纳米制程工艺提升单核芯片性能将面临技术上的严峻挑战。


由于量子隧穿效应的存在,3 纳米后,单芯片成本将会急剧上升,根据华为与罗兰贝格数据显示,3 纳米制程手机端旗舰级 SoC 单芯片(以高通骁龙 855 为例)成本较 7 纳米显著增加约 200 美元,高昂的成本将会极大程度制约终端客户需求,最终降低算力供给的增加。



即使在能够接受较高成本的大型数据中心等用户中,处理器性能的提升依旧受到制约,受存储、系统、软件限制(性能)和单位算力功耗显著上升(功耗)两大因素影响,芯片核心数量将在 128 核达到上限。根据罗兰贝格数据,现有的冯·诺依曼架构下,通过拟合不同核心数量的芯片计算能力样本数据,我们发现多核处理器随核数增长,算力增长的倍数快速下滑:从 2 核增至 4 核时,总算力可提升 1.74 倍,而当核数由 128 核增至 256 核时,总算力水平仅能提升已跌破 1.2 倍(1.16X),已显著丧失经济性。



在单核性能以及多核提升带来的双重压制下,大型数据中心带来的增量算力边际增量将会迅速递减,而兴建大型数据中心需要的土地,人力,时间成本将在海量算力时代制约“集中式”的算力发展。


供给端 2:算力爆发的背景下,网络性能限制和成本将会导致数据中心的算力难以满足复杂场景下的需求。网络带宽及网络时延共同决定了网络信道的传输质量,影响到网络算力的发挥。具体而言,“网络化”算力的使用需要经历终端与云端的数据双向传输过程,这段过程是通过网关、基站、数据中心等不同网节点之间的信道所实现的,其中信道的容量决定了传输的速率(带宽),信道的长度与材质决定了数据传输的时延,两者共同影响了数据传输的效率。



即使随着当今 5G 网络加速完善,无论从时延以及容量都相较于 4G 网络出现了较大程度提升,但相对于未来社会的海量数据需求来看,完全依靠 IDC 提供算力支撑仍是效率较低的选择,无论是智能驾驶对于时延的要求,亦或是传输高清视频图像等带来的大额带宽成本,都将进一步加剧“集中式”算力与“分布式”需求的错配。


供给端 3:算力高能耗与全球双碳目标之间的矛盾


随着芯片制成逐渐接近量子隧穿效应发生的制程,当前主流芯片的能效比正在逐渐接近极限。单位算力功耗在过去 10 多年间经历了显著下降,但随着硅基芯片工艺制程提升的难度凸显,其进一步下探幅度有限,这意味着,等量算力的提升,即将对应等量能耗需求的提升。面对未来百倍的算力需求,高能耗问题将成为人类算力发展过程中的重要瓶颈。


同时,随着我国双碳目标的提出,对于数据中心的耗电量,PUE 值都提出了更严格的要求,截至 2020 年底,中国数据中心耗电量已经突破 2000 亿千瓦时,能耗占全国总用电量的 2.7%,随着数据中心进一步扩容,算力需求进一步提升,解决数据中心能耗问题的需求也愈发迫切。在可见的未来,具备低时延特性的核心城市 IDC 供给将进一步被压缩,如何通过有效的边缘侧处理手段,使得有限的核心城市算力资源得到充分利用,也是本轮“算力革命”急需解决的难题。


需求端:智能化社会大潮下,对应百倍流量增长需求。随着以人工智能、物联网、区块链、AR/VR 等关键信息技术逐渐成熟,社会中大量智能化场景将得到实现。根据罗兰贝格报告,人工智能技术将推动无人驾驶、智能办公、智慧医疗等场景的有效落地,物联网技术将推动智能消防、智慧工厂、智慧农场、智能家居等场景落地,区块链技术将推动应用于数字证书、信息加密等场景落地,AR/VR 技术则可推动智慧商场、游戏、智慧课堂等场景落地。这些场景未来将在产业领域实现跨越式发展、助力各产业创新、增强产业数字化程度并增强市场活力,在政务领域帮助政府提升运行效率、提高城市管理水平、加强居民生活幸福度,在民生领域推动社会民生保障、创造宜居空间、实现可持续化发展,共同推动社会向智能社会发展。



根据华为《泛在算力报告》,在人工智能、物联网、区块链、AR/VR 四大领域,到 2030 年,相比 2018 年,都将出现百倍到千倍的算力需求增长,同时对于网络的延迟也提出了更高的要求。



从算力需求看,人工智能技术对于算力的核心拉动点在于未来各应用场景内单设备芯片算力的增长和人工智能技术的行业渗透率的进一步提升,物联网主要通过低算力物联网设备的普及、配套云端计算中心和边缘端计算单元的增加共同拉动算力增长,区块链因安全问题要求的算力持续增长和应用场景的快速普及将带动以云服务器为主的算力增长,VR/AR 设备的普及和普及需要的云计算中心和边缘计算设备算力配套将共同推动整体算力的增长。


从时延要求看,L3 级别的自动驾驶对于传输时延的要求在 10-20 毫秒,在进入 L4&L5 级别后,对于传输时延的要求进一步提高到 10 毫秒以下;使用物联网建设智慧工厂对车间内部的局域网络带宽需要达到 Gbps 级别,最高时延须控制在 5ms-10ms 以内;在 VR/AR 游戏中,端到端的时延至少需要小于 20 毫秒,才能保证在使用过程中避免感知到明显的图像滞后而导致的眩晕。


随着人类对于 AI、智能价值、虚拟现实等超大算力、超低时延需求场景和应用的探索愈发深入,当先算力的需求端将会出现指数型爆发,我们将在第五章更加深入的展开讨论这些面向未来的场景需求和他们当下的发展情况。


2.4.算力革命关键词:“泛在”、“绿色”与“生态”

基于以上供需矛盾,我们提出了“算力革命”的三大关键词,“泛在”、“绿色”与“生态”。


算力革命核心词 1:泛在

前文提到,在算力需求百倍增长下,由于处理器单核性能与多核提升边际递减存在,大型数据中心的算力提升有限。同时,由于网络性能,带宽成本等制约,对于分布式需求愈发明显。因此,将运算能力进行“泛在”,在边缘侧或者设备本身直接进行,将有效的降低集中式数据中心的负载,同时也能够极大的提升网络的传输能力。


算力泛在,我们认为,就是实现“云、边、端”算力的融合,纵观当今算力发展,进入集成电路时代以来,经历了单核,多核,网络化三个阶段,单核受限于芯片性能与成本、多核受限于核心效应边界与功耗,网络化受限于时延与成本。因此,算力泛在,即实现三者的“融合”。




当下,5G 网络逐步完善,MEC 等边缘计算设备加速发展,同时,随着以智能手机、智能汽车等终端设备的快速进化,边缘侧计算与云端计算相结合的网络和硬件条件正在逐步完善,算力“泛在”的整体环境已经初步建立。我们将在第三章,分为“中心”与“边缘”;两个环节,更加详细的讨论算力“泛在”的进展与背后的投资机会。


算力革命核心词 2:绿色


前文提到,制约算力供给端的因素之一,是全球双碳趋势下,数据中心高能耗与全球碳中和之前的矛盾,因此我们认为,算力革命的第二个关键词是“绿色”,我们通过芯片和算法实现了如下的等式:


能源 + 算力——>价值 + 热量


目前,以 GSMA 为首的全球移动通信系统协会已开始在此方面积极践行,其在《巴黎协定》中制定了移动产业气候行动路线图倡议,提出在 2050 年之前实现温室气体净零排放目标。此后,GSMA 下逾 50 家成员单位(包括沃达丰、西班牙电信等)加入倡议,已陆续开始公布年度能源消耗情况,制定每年的能源消耗削减目标及策略计划,从而实现对其数据中心的能源消耗控制。


算力革命中的“绿色”,我们认为应从两方面入手,第一方面,通过更加高效的机房散热设备,探索液冷、海底数据中心等新型散热形式,降低数据中心的 PUE 水平,实现能源的高效利用。另一方面,要积极提高绿色能源在机房用电中的占比,实现数据中心真正意义上的“碳中和”。我们将在第四章,更加详细的讨论“绿色”这一算力革命方向带来的投资机会。


算力革命核心词 3:生态


算力并非孤立的存在,而是与通信、存储能力并存,服务于各类应用的一体化 IT 能力。以常见的物联网模组为例,市场认为模组仅是提供单一的无线通信能力,而当下游需求丰富起来之后,模组还需支持操作系统、多媒体、本地算力等应用,且在智能家居、智能汽车、无人机、VR 元宇宙等领域的需求各不相同。当然,就算力硬件本身而言,除了芯片外,也需要编程语言、API、各类常用库(如 NVIDIA CUDA)、集群管理等,皆是多年与行业应用共同发展的结果。




3.  泛在:“云—边—端”的共存

IDC 统计数据显示,预计到 2025 年,创建的数据会达到 175ZB,相当于 2022 年的两倍的的数据量,其中视频为主的非结构化数据将占到 80% 以上。而其中数据的创建正在更多的趋向于边缘,同样的数据的存储也会向中心和边缘转变,终端的占比会下降。但是数据的处理一直在中心,数据的使用和消费在端侧,就出现了算力错位。算力错位会导致产生大量的算力搬运成本。


云计算是现在计算的一个主流,开创了云端算力的模式,把云端算力投射到终端上,当下云计算基于中心的超大规模 IDC,计算集中在核心节点,中心化的布局在算力需求进一步大幅提升的背景下可能将遇到瓶颈,需要进一步的发展,所以就产生了下沉的需求。


近二十年,以数据为基础、以网络为媒介、以计算为核心的科技以迅雷不及掩耳的速度急速发展,全球进入移动互联网时代,产生的数据量相当于过去数世纪的数据量总和,并持续以指数级的数量增加。2006 年亚马逊正式推出 EC2 服务标志着人类进入了云时代,经过十多年的发展,云服务已经影响到企业和个人生活的方方面面。随着全球范围 5G 的加速落地、物联网高速的发展以及以云为基础的数字化升级大趋势下,IDC 作为核心信息基础设施在需求侧和供给侧均发生边际变化,其作用和价值正在不断凸显。




近期,市场对国内 IDC 及其产业链景气度问题存在一定预期差,对于 IDC 市场,主要是因为互联网行业发展暂缓,对于光模块等产业链公司,主要对于动荡环境下的北美宏观环境担忧。我们认为,认识到 IDC 及其产业链的核心价值,应当回归到算力发展的本质上来,其本质是人类对于更加智能,更加美好的生活的追求,算力需求的增长具有高度的确定性,IDC 作为云端中心算力的唯一载体,其长期发展前景依旧光明。


3.1.国内 IDC:行业底部出清,需求曙光初现,反转只欠东风


从短期来看,当下受到国内互联网大厂业务收缩,2020 年 IDC 行业建设浪潮影响,近年来,供需格局较弱。不过随着相关平台经济扶持政策出台,以及 IDC 行业底层并购出清加速,我们认为国内 IDC 行业正在走出短期困境。



从长期来看,随着国内 5G 网络全面建成,我国 DOU 长期增长的趋势不会变,随着在 4G 向 5G 升级的过程中,长短视频成为新的风口,抖音、火山小视频、快手、B 站为首的短视频,以及爱奇艺、腾讯视频为主的长视频逐渐成为新潮流。而直播也发展出了更多形式,以淘宝、拼多多为主的电商逐渐进入直播带货时代,抖音、快手也凭借其在短视频的流量优势涉足电商领域。用户的习惯开始转向以视频和直播为主的应用和媒介,而视频直播又意味着流量相较过去有了数十倍的爆发。



随着以智能驾驶、人工智能、物联网为标志的智能化场景加速渗透,我国的流量需求也会加速释放。面对未来百倍的算力需求,作为云端算力的载体,数据中心在未来算力网络中仍将占据半壁江山,只待国内存量需求消化。


3.2.全球 IDC 市场:需求持续强劲,景气度存在预期差


今年以来,国内投资者对于北美数通产业链景气度预期进行了明显的下修,以光模块为代表的数通产业链标的估值创出历史新低。我们认为,从 Q2 云厂商资本支出、后续资本支出展望、以及数通产业链各家中报业绩来看,市场对于北美数通的预期存在过分悲观的情况。在宏观不确定性下,龙头大厂依旧逆势加码云基建,说明数字化,云化依旧是当下最具潜力的行业赛道。


我们认为,从中短期来看,北美数据中心的需求仍然非常旺盛。从云计算业务来看,北美三大云厂商 AWS、Google Cloud、Azure Q2 依旧保持了良好的高速增长。AWS 营收同比增长 33%、Google cloud 营收同比增长 36%,Azure 营收同比增长 40%



从 Q2 资本支出来看,各家云资本支出仍然景气,亚马逊指引由全年同比微降低上修到微升,全年云资本支出将占比由去年的 40% 提升至 50%;谷歌表示 2022 年资本开支将会出现“有意义的”上涨,服务器与 IDC 是投资重点;微软表示将会维持温和的资本开支增长;Meta 则 2022 年资本支出由 290-340 亿上修到 300 亿 -340 亿,用于支撑元宇宙转型下的数据中心、AI、机器学习支出。



从设备商角度,尽管英伟达、AMD 等公司 Q2 业绩表现出现了一定程度下滑,但主要原因来自于全球 PC 需求下降与加密货币市场寒冬。两者的数据中心业务依旧维持了较高的景气度。英伟达数据中心业务 Q2 营收 38.1 亿美元,同比增长 63.1%,环比增长 1%,连续 11 个季度创历史新高,成为公司第一大业务,从趋势上看将逐渐拉开与游戏业务距离。



AMD 在 Q2 实现营收 65.5 亿美元,同比增长 70%,公司于 Q2 首次公布了数据中心部门的营收,2022Q2 数据中心部门营收为 15 亿美元,同比增长 83%,是公司营收增长最快的部门。根据公司公开交流,公司本季度 EPYC 处理器需求强劲,云计算和企业客户均同比显著增长。在云计算方面,AWS、百度、谷歌、微软 Azure 和甲骨文在本季度推出了 60 多个基于第三代 EPYC 处理器的新实例。


从数通设备商 Arista 最新季度财报同样可以看到数通市场的景气度。Arista 在 Q1 实现营收 8.78 亿美元,同比增长 31.4%,环比增长 6.4%。尽管供应链受到冲击,对交付造成一定影响,公司依旧实现高质量增长,对下一季度收入指引在 9.5-10 亿美元之间。公司在数据中心交换机市场份额持续提升中,公司预计整个数据中心市场还将持续增长,整个数据中心市场到 2026 年将发展至 240 亿美金市场规模,其中美国 top5 云厂商需求将成主要驱动力。



我们通过以上三家具有代表性的科技公司近期业绩可以大致看到,数据中心市场景气度依旧保持高位,且根据指引预期来看,未来还将继续保持高景气增长。结合北美头部云厂商一季度增速及云厂商全年资本开支指引,即便下半年面临短期波动,中期北美数据中心产业景气度可见。


从长期来看,作为全球云计算的领先市场,同时伴随 Meta、苹果等巨头在元宇宙、AR/VR 领域的加速探索,北美流量长期增长的态势不会改变,数据中心在作为算力发展的核心支撑,将在全球智能化过程中继续扮演举足轻重的作用。


纵观 IDC 产业投资机会,我们认为当前主要集中在两方面,第一是底部出清的国内优质 IDC 龙头公司,第二是存在预期差的北美 IDC 产业链,第三是国产算力芯片、设备厂商。


国内优质 IDC 龙头公司目前已经底部出清,从 2020 年开始纷纷进行资本运作与产能扩张。同时,随着国内互联网企业基本面出回暖迹象,因此国内 IDC 的需求端情况有望逐渐改善。



目前市场对北美宏观经济情况持谨慎态度,从而影响到 2022 年中期的北美 IDC 市场需求。不过,从北美 IDC 下游主要厂商自 2018 年以来逐渐爬升的资本开支情况来看,尽管市场担心 22H2 在美国加息周期中,大厂投资会存在波动,但我们仍对此中长期市场需求持较乐观的态度,一旦加息预期出现拐点(加息周期影响云厂商业务收入,同时不利于中长期加杠杆),北美市场的 IDC 中下游企业将存在一定的预期差。



最后看国产数通市场情况。目前服务器国产替代之风较之前更为流行,因此我们看好综合能力较强、市场份额靠前的国内网络设备厂商,如紫光股份、星网锐捷,以及目前 A 股唯一的网络设备 ODM/OEM 企业菲菱科思。上半年受政府采购节奏影响,Q2 相对呈现业绩低点,期待明年的改善。



3.3 边缘计算:方兴未艾,未来可期

前文提到,由于未来社会算力爆发下产生的海量数据传输需求,完全依靠 IDC 提供中心化算力支撑乃是效率较低的选择,无论是智能驾驶对于时延的要求,亦或是传输高清视频图像等带来的大额带宽成本,都将进一步加剧“集中式”与“分布式”需求的错配。



在此背景下,边缘计算便成为了传统云端算力的很好补充,云计算聚焦非实时,长周期数据的大数据分析,能够在周期性维护,业务决策支撑等领域发挥特长。边缘计算聚焦实时、短周期数据的分析,能更好的支撑本地业务的实时智能化处理与执行。算力“泛在”的模式也将随着边缘计算的加入得到完善。


当前时点,边缘计算产业正处于起步前期,部分行业应用开始涌现并走向成熟,本段将从边缘计算的定义、优势、行业空间、应用案例、产业链玩家、A 股相关标的来剖析边缘计算的当前现状与未来机会、


边缘计算的定义


根据边缘计算产业联盟的定义,边缘计算是在靠近物或者数据源头得到网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷联接,实时业务、数据优化、应用智能、安全与隐私保护封方面的关键需求。




边缘计算的发展最早可以追溯到 1998 年,AKAMAI 公司在当年首次提出了 CDN 网络,再到 2012 年思科公司正式提出雾计算概念,2013 年美国太平洋西北国家实验室首次提出边缘计算。



在相关理论加速成熟的同时,行业联盟也在加速建立,目前主流的边缘计算联盟包括了思科、ARM、英特尔、戴尔、微软、普林斯顿大学等 6 家机构成立的开放雾计算联盟、华为、沈自所、信通院、因特尔、ARM、软通动力等 6 家机构联合发起成立了边缘计算产业联盟、IEC/ISO JTC1 SC41 成立的边缘计算研究组、IIC 成立边缘计算技术工作组和 IEEE 成立的雾计算网络架构工作组等。



从功能由简到繁来分析,边缘计算的发展总体可以分为三个结算,即联接、智能、自治。


联接阶段,边缘计算主要解决终端及设备的海量、异构与实时连接,网络自动部署与运维,并保证联接的安全、可靠与互操作性。这一阶段的典型应用包括了自动抄表等


智能阶段,在该阶段,边缘侧将会引入数据分析与业务自动处理能力,智能化执行蹦迪业务逻辑,大幅提升效率,降低成本。这一阶段的典型应用包括了各种设备的自我状态监测等。


自治阶段,在该阶段,随着 AI 等技术引入,边缘侧不仅可以自主进行业务逻辑分析与计算,还能够动态实时的自我优化,调整和执行策略,该阶段的典型应用是各类无人工厂和智能化设备。


边缘计算的优势


我们认为,在 5G,AI、物联网等技术与环境的加持下,边缘计算体现出了 5 大应用价值,分别是低延时、低带宽、更经济的智能、数据可控、高可靠。


低时延:低时延是提高用户体验甚至是使得某些应用能够工作的重要因素。一方面,边缘计算通过在网络边缘进行数据处理,降低了因数据在终端和云端之间多跳传输产生的时延。另一方面,利用优化的边缘算力进行数据处理,也比利用有限的终端算力进行数据。


低带宽:物联网设备产生的数据具有体量大、价值密度较小的特性。如果把原始数据直接传输到云端进行处理,很大程度上造成网络拥塞,为了保证带宽所需的成本代价也极高。边缘计算对海量原始数据进行预处理和分析挖掘,将产生的高价值洞察传送到云端,极大程度降低了对带宽的依赖。


更经济的智能:视频监控、语音识别、图像分析等人工智能应用越来越广泛地被应用于满足行业的业务需求。AI 模型的训练需要非常强大算力的支持,不可避免地要在云端进行。但基于实时数据进行模型推理如果也在云端进行,网络成本会非常高。同时,普通的终端设备无论从算力还是能耗角度都无法支持模型的推理。边缘计算将 AI 模型推理卸载到边缘节点,在边缘节点上通过 GPU、加速硬件虚拟化等机制提高模型推理的并发能力,以一种经济有效的方式实现应用智能。


数据可控:企业往往对将自己的生产数据传输到云端进行处理有很大顾虑。边缘计算能实现敏感数据不出工厂,不出园区,直接在本地对数据进行清洗、预处理、聚合、筛选,避免了数据传输过程中可能的泄露、遗失、篡改等风险。此外,云计算数据中心对数据的安全控制力度并不是十分理想,API 访问权限控制以及密钥生成、存储和管理方面的不足都可能造成数据泄漏,并且还可能缺乏必要的数据销毁政策。边缘计算可以实现更可控的本地数据存储和管理,降低数据风险。


高可靠:靠近数据生产或者使用的场所往往物理环境复杂、网络条件不稳定、潜在的攻击窗口众多。边缘计算硬件专为严苛的物理环境设计,具有紧凑、坚固、抗高温高湿等物理特性。边缘计算软件平台通过云边协同来保障端到端的 SLA,边缘节点在断网期间能实现自治,继续支撑其上应用的运行,在网络恢复之后,还能自动与云端更新数据、状态。边缘计算软件平台还支持应用跨节点部署及多实例运行等能力,当某个节点发生故障时,可快速实现负载迁移,避免对业务的影响。



边缘计算与 5G


随着 5G 时代的到来,5G 的广连接、低时延、高带宽三大特性完美契合了边缘计算设备需要的网络指标。根据 5GPPP 发布的白皮书《5G empowering vertical industries》5G 通过边缘计算技术将应用部署到数据侧,而不是将所有数据发送到集中的数据中心,满足应用的实时性。白皮书认为,智慧工厂、智能电网、智能驾驶、健康医疗、娱乐和数字媒体是未来最具商业规模且排名靠前的边缘计算需求场景,极具典型性,并且运营商也在这些领域与行业客户紧密合作,基于用户需求,共同推动边缘计算的发展,为用户提供安全可靠的边缘计算业务。


我们认为,5G 对于边缘计算的推动主要在于两方面,一是网络架构的升级,推动边缘计算快速成熟。5G 网络将原先 4G 核心网经云化拆分成 5G 核心控制层面和核心用户层面,实现了用户面与 MEC 同时下沉,有利于边缘侧的融合。二是 5G 后期以小基站为主的部署形式,有望在物理层面加速边缘计算网络的拓展。



当前,5G 网络下的边缘计算主要分为两类,第一是广域 MEC,第二类是局域 MEC。


广域 MEC 场景


低时延业务的百公里传输引入的双向时延低于 1ms,但是基于广域 MEC 的 5G 公网,已经能够为大量垂直行业提供 5G 服务。MEC 部署在安全可控的汇聚机房是当前运营商广域 MEC 的主力方案,可用于权衡应用对接、运维复杂度、设备和工程成本等多种因素。



广域 MEC 的主要应用场景包括:大网 OTT 连接(Cloud VR/ 云游戏)、大网集团连接(公交广告 / ௿通安防)、大网中的 URLLC 专网(电力等)、大网专线连接(企业专线)等。通过将 MEC 部署在汇聚机房,满足这些应用场景下的低时延的业务诉求。


局域 MEC 场景


将 MEC 部署在园区有利于安全与隐私保护高敏感的行业,以满足数据不出园的要求。


港口龙门吊的远程操控,钢铁厂的天车远程操控,以及大部分的制造、石化、教育、医疗等园区 / 厂区都是局域 MEC 的典型场景。局域 MEC 部署场景可以满足 URLLC 超低时延业务,同时支持企业业务数据本地流量卸载(LBO),为园区客户提供本地网络管道。通过增强隔离和认证能力,防止公网非法访问企业内网,构建企业 5G 私网。



通过 DNN、切片等方案组成企业子网,只允许无线终端接入园区内网络;

通过机卡绑定、企业 AAA 二次鉴权等手段,只允许特定终端访问园区网络;

通过基站广播园区专用 PLMN ID+NID 或者 CAG ID,只允许企业终端接入园区专用网络。


边缘计算的行业规模


根据 IDC 数据统计,到 2020 年,全球有超过 500 亿的终端与设备联网,未来超过 50% 的数据需要在网络边缘侧分析。处理与存储。根据思科发布的全球云指数数据,2021 年全球产生 106ZB 的流量,其中数据中心流量仅占 21ZB,全球超过 70% 的流量空间需要边缘侧设备的支持。


根据国际数据公司 (IDC) 发布的《全球边缘计算支出报告》,预计到 2022 年,全球在边缘计算方面的支出将达到 1760 亿美元,比 2021 年增长 14.8%。企业和服务提供商在边缘解决方案的硬件、软件和服务上的支出预计将持续到 2025 年,这一增长速度将达到近 2740 亿美元。


从地理角度来看,美国将成为优势解决方案的最大投资者,预计到 2022 年支出将达到 765 亿美元。西欧和中国将是第二大地区,支出总额分别为 306 亿美元和 208 亿美元。在未来五年的预测中,中国将以 19.7% 的复合年增长率成为支出增长最快的国家,其次是拉美,其复合年增长率为 19.4%。




边缘计算产业玩家分析


当前家边缘计算市场上的玩家众多,来自不同阵营的力量正在以不同的路线共同推动边缘计算的快速发展。主要分为四类,主要为公有云厂商、运营商、CDN、以及 ICT 厂商。


公有云厂商:将云计算能力向设备和用户侧延伸,扩充云数据中心的外延,将云原生的统一编程模式通过边缘网关的能力应用到设备构成的边缘云,主打云边协同一体化。


代表:亚马逊、百度、阿里


运营商:运营商将 IT 能力同基础网络承载与业务运营融合,提供基站的边缘计算服

务及 5G 网络接入管理。


CDN 公司:以原有 CDN 网络为基数,逐步搭建边缘计算平台,并基于该平台提供从数据安全到流量分析的全套增值服务。


代表:网宿科技、Cloudflare


ICT 厂商:将基础软硬件及技术服务同边缘计算场景融合,实现软硬一体的边缘计算私有化部署,并力推云网融合从而达到 5G 云化网络与边缘计算的充分结合,以满足各类行业智能化应用所急需的新型边缘侧高性能网络与计算资源。


代表:联想、浪潮、新华三、中兴、华为、初灵信息




边缘计算主流应用


当下边缘计算较为成熟的应用主要集中在预测性维护、能效管理、智能制造,面向未来,我们认为自动驾驶、AI、AR/VR 等需要高算力、低延时的场景会逐渐成长为边缘计算的主流场景,这些场景我们会在第五节中进行展开。


预测性维护


传统的维护方式主要是事后维护和预防性维护,事后维护会导致业务中断,预防性维护采用人工例行检修,导致维护成本大幅度上升,以梯联网为例,全球有超过 1500 万部电梯在网运行,电梯维保和售后服务正式成为电梯行业的“新蓝海”,越来越多的电梯厂商转向整合产业链、依靠维保服务增加企业收入,但电梯通过事后维护和预防性维护的成本很高,且首次维护成功率低于 20%。为实现商业模式创新,电梯厂商必须通过数字化改造提升运维效率、降低运维成本。通过引入边缘计算,可以助力电梯厂商从传统的预防性维护升级到新一代实时预测性维护,从而实现产品向服务的价值延申:


预测性维护,降低维护成本

以电梯为例,基于电梯内大量的传感器,可以对电梯运行状态实时感知。通过本地的边缘计算融合网关可以提供数据分析能力,第一时间发现设备潜在故障。同时提供本地存活,一旦与云端联接故障,数据可以本地保存,联接恢复后,本地收敛数据自动同步到云端,确保云端可以对每部电梯形成完整视图。


安全保障

提供覆盖终端、网关芯片、网关 OS、网络、数据的多重安全保护。


产品向服务的延伸

可以帮助电梯厂家研发改善产品质量、售后提升服务满意度;可以开放给楼宇物业等,帮助提供紧急救援等服务;可以为广告厂商等提供媒资传播平台。典型行业应用场景:电梯、特种车、数控机床、二次供水设备、能源预测性维护等。


能效管理


随着世界经济的发展,发展需求与能源制约的矛盾愈加明显,能耗水平反映了一个国家或地区的经济发展水平和生活质量,在能源需求日趋紧张的情况下,如何实现建筑能耗量化以及效果评估,降低建筑物(包括空调、路灯照明、办公设备等)运行过程中消耗的能量,从而降低运行成本,同时提高用户使用满意度,满足各大企业从提供产品向提供服务转型,成为各大企业或组织机构最为关注的问题。以路灯为例,世界 80% 的路灯厂商都准备向智能路灯转型,通过智能路灯节能减排,相关国家和国际组织也逐步在法律中明确建设绿色节能标准,如全球气候组织呼吁十年完成全球路灯智能化改造、实现能耗减半。


通过引入边缘计算,能够为能效管理带来以下提升:


更低的能源消耗

通过实时能效控制有效降低建筑能耗,节约能源方面的开支,据澳大利亚墨尔本项目客户提供的数据,楼宇能效解决方案部署后有效降低了能耗的 80%;


更低的维护成本

实现能源信息采集自动化,节省人工采集费用,降低维护成本,智能路灯解决方案部署后有效降低了 80% 的维护成本;


更高的可靠性

多级可靠保证,控制计划和策略同步并储存在边缘侧,在云端控制出现异常的时候,保证正常工作和管理,同时边缘侧能够实时监测路灯、开关、空调等采集设备的状态,进行可预测性维护,在设备可能出现故障时实时进行策略调整。典型行业应用场景:楼宇能效管理、智能路灯等。


智能制造


随着消费者对产品需求的日益增高,产品的生命周期越来越短,小批量多批次,具有定制化需求的产品生产模式将一定程度替代大批量生产制造模式,先前制造体系严格的分层架构已经无法满足当前的制造需求,以某消费电子类产品的制造生产线为例,采用 PLC+POC 的模式构建,由于订单种类增加,单批次数量减少,导致平均每周的切单转产耗时 1~2 天;新工艺升级每年至少 3 次、设备更替每年近百次,导致的控制逻辑 / 工序操作重置、接口配置耗时约 5~12 周,严重影响了新产品上线效率。另外制造智能化也是中国,美国,德国等世界主要制造大国未来 10 年的发展方向,以中国为例,到 2025 年,制造业重点领域全面实现智能化,试点示范项目运营成本降低 50%,产品生产周期缩短 50%,不良品率降低 50%,制造智能化首先需要加强制造业 ICT 系统和 OT 系统之间的灵活交互,显然先前的制造体系也无法支撑全面智能化。



边缘计算能够推动智能制造的实现。边缘计算在工业系统中的具体表现形式是工业 CPS 系统,该系统在底层通过工业服务适配器,将现场设备封装成 web 服务;在基础设施层,通过工业无线和工业 SDN 网络将现场设备以扁平互联网的方式联接到工业数据平台中;在数据平台中,根据产线的工艺和工序模型,通过服务组合对现场设备进行动态管理和组合,并与 MES 等系统对接。工业 CPS 系统能够支撑生产计划灵活适应产线资源的变化,旧的制造设备快速替换与新设备上线。


通过引入边缘计算,能够为制造业带来以下提升:


设备灵活替换

通过 web 互操作接口进行工序重组,实现新设备的即插即用,实现损坏设备的快速替换。减少人力投入 50%(取消了 OPC 配置工作,工作量下降一半),实施效率提升 1 倍;


生产计划灵活调整

通过生产节拍、物料供给方式的自动变化来适应每天多次的计划调整,消除多个型号的混线切单,五六路径切换导致的 I/O 配置时间损耗;


新工艺 / 新型号快速部署

通过 web 化的工艺模型的自适应调整消除新工艺部署带来的 PLC(涉及数百个逻辑快、多达十几层嵌套判断逻辑)重编程、断电启停、数百个 OPC 变量修改重置的时间,新工艺部署时间缩短 80% 以上。


典型行业应用场景:软件定义的可重构制造系统




资料来源:边缘计算产业联盟白皮书,国盛证券研究所


边缘计算 A 股上市公司


当前,边缘计算产业链在 A 股主要集中于 CDN 公司以及 ICT 厂商,我们在下表中罗列了当前 A 股中的主要边缘计算公司以及他们的边缘计算布局。




4. 绿色:双碳制约下的算力网络

算力发展高速发展过程中将不得不面临能耗问题,云端、边缘、终端以及网络传输要求的持续提升,势必带来能耗激增的问题,硅基芯片工艺制程提升的难度凸显,单位算力功耗进一步下探幅度有限,能耗的增长将挑战数字智能时代社会的可持续发展,在双碳大背景下,构建绿色算力网络生态逐渐成为新的挑战和机遇。


我们提出算力能耗公式:


能源 + 算力——>价值 + 热量


短期看,芯片和算法是转换的核心,但随着算力价值的凸显,能源将是算力市场的终极制约因素。


4.1. 算力需求指数及增长,数据中心能耗要求越发严格


算力规模持续大规模增长,单位算力功耗逼近极限。功耗是影响算力水平发展的重要因素之一,在单位算力功耗呈现出逐年递减,且正向着极限逼近的态势下,算力的整体量级却仍然随着其广泛的应用而持续大规模增长。一方面必须依托算力的大规模使用以实现智能社会的演进,而另一方面这一进程又必将伴随着碳排放的提升而导致全球气候的不可预测性显著增加,这一双手互博式的矛盾综合体正在引起越来越高的关注。



硅基芯片工艺制程提升的难度凸显,单位算力功耗进一步下探幅度有限。随着工艺制程的进步,输出单位算力所需要的功耗水平 ( W/GFLOPS ) 从 90 纳米制程开始呈现出了指数级下降的趋势,发展到当下 7 纳米制程的先进处理器芯片时已开始趋近于О WIGFLOPS,下探难度愈发增大。从原理来看,由于功耗水平下降的核心驱动力来自于芯片制造工艺的低制程化,而这一趋势正受到硅基芯片上晶体管栅长缩减引发的量子隧穿效应挑战,一旦到达临界制程可能将造成晶体管闭合功能的全面无效化。因此在没有新型材料替代的条件下,单位算力功耗难以进一步下降。



数据中心用电量占比持续提升,制冷及 IT 设备占比达 80%。在芯片单位算力功耗下降幅度有限的背景下,智能社会应用的广泛普及无可避免,势必导致算力功耗总量的进一步提升。根据工信部数据,随着人工智能、物联网、区块链等技术的发展,我国数据中心总用电量为 1609 亿千瓦时,占中国全社会用电量的 2.35%,已经显著超过上海市 2018 年全社会用电量。面问未来,数据中心算力将在信息技术产业的大力发展下继续增长,2023 年将较 2019 年增长 66%,年均增长率将达到 10.64%。从数据中心内部来看,我国数据中心电力成本占运营成本的 60% 以上,数据中心耗能部分主要包括制冷系统、IT 设备、供电系统和照明系统,其中制冷系统和 IT 设备合计占总能耗的 80%。



2021 年 7 月,工信部印发《新型数据中心发展三年计划(2021-2023 年)》的通知:明确用三年时间基本形成布局合理、技术先进、绿色低碳、算力规模与数字经济增长相适应的新型数据中心发展格局,数据中心能耗要求更加苛刻,对于新建和改造项目均存在明显机遇。



超大型数据中心符合绿色趋势。数据中心 PUE 优化的一大核心方向在于建立更多超大型 (>10000 个标准机架可共置至少 100000 台服务器)和大型数据中心 (>3000 个标准机架可共置放至少 30000 台服务器),从而带动整体数据中心 PUE 值优化。超大型 / 大型数据中心会更加系统地从基础设施和管理系统层面来进行优化,降低功耗,且通常会采用能耗比更加优秀的服务器、数通设备、节能型供电和冷却配套硬件解决方案



4.2. 大型化、智能化和散热技术创新是绿色数据中心关键点


以百度云计算(阳泉)中心为例,其设计容纳 16 万台服务器,采用了先进的整机柜服务器,以模块化设计将供电、散热系统与服务器置于同一机柜内,针对每个机柜服务器的实际运行及功耗进行个体化调节,同时辅以高压直流+市电直供的供电模式,实现传极高的能源效率。


在数据中心运营管理软件层面,大型数据中心会采用基于 Al 的智能化管理系统对供电、冷却系统的运营状态进行自适应的动态化调整。如华为廊坊数据中心所采用的 iCooling 数据中心能效解决方案,通过 AI 对历史运营数据分析,寻找供电、通风、冷却等影响能耗的不同关键因素,建立预测模型并对相应系统进行动态调整,降低 PUE,实现能耗优化。



互联网和云计算高速发展,对应其大型数据中心建设如火如荼,间接蒸发冷却是当前最有效的自然资源冷却方案,比传统冷冻水系统节约能耗 30% 左右。英维克在节能散热领域深度布局,间接蒸发冷却产品技术领先,就冷水板方面而言,可提供从热源测传热到外部冷源的全链条产品,产品广泛应用在大型数据中心或运营商机房中。



除散热创新外,UDC 是数据中心的未来新方向。海底数据中心(简称 UDC)由岸站、海底光电复合缆、海底分电站及海底数据舱组成,主体结构为罐体结构,电气设备、冷却系统均布置在罐体内部,罐体顶部为海水冷却系统。通过庞大的海水流冷却数据舱,有效降低能耗,单舱 PUE 可低于 1.1,是高效利用海洋资源(海上风能,波浪能、潮汐能)的成功典范,海底 IDC 解决方案需求将与日俱增,尤其在华南沿海城市,市场潜力无穷。


UDC 优势主要体现在降低成本上。UDC 使用海水冷却,无压缩机运行,能够有效降低能耗,在 25MW 典型规模情况下,UDC 综合成本降低 29%,运维成本降低 22%,且岸站占地少,只有 1/3,不需要冷却塔,罐体内为惰性气体,故障率低,单机柜 15-35KW,算力密度高,模块化生产,部署效率高,90 天内完成从工厂安装、调试到实际运行。



4.3. 芯片功耗提升空间有限,低功耗和云边端一体是主旋律


芯片领域,ARM 和 X86 架构正在碰撞出更多火花。ARM 与 x86 的竞争本质上是两种不同思路的指令集系统的竞争。指令集系统在发展过程中,分化出复杂指令系统计算(Complex instruction set computing, CISC)和精简指令系统计算(Reduced instruction set computing, RISC),后者被使用在 ARM 上。RISC 是相对于 CISC 而言的,其通过精简指令集来减少硬件设计的复杂程度,同时每条指令集长度均相等,因此可以提升指令集执行效率,所以相同计算量下,效率往往比 CISC 更高。事实上,Intel、AMD 的新款 x86 产品也在向精简指令迈进,仅底层运行 CISC 指令。



功耗压力大,ARM 在服务器领域正在兴起。CISC 的复杂性决定 x86 架构的 CPU 需要更高的单核主频、更多的线程才能有更强性能,在摩尔定律逐渐接近瓶颈的现代,x86 的芯片设计、制程要求变得苛刻,因此生态变得极为封闭,目前市场仅剩 Intel、AMD 两位玩家。ARM 走“众人拾柴火焰高”的路线,2021 年已授权 530 家合作伙伴,授权数量达到 1910 件。ARM 赛道玩家众多,在商用服务器 CPU 领域,华为海思、凯为半导体、高通、安培和飞腾均有代表性产品。


2018 年以来,以 AWS 为首的一众云服务厂商纷纷推出各自的 ARM 架构云服务。目前以 AWS 的 Graviton 系列市场份额最高,2021 年 12 月推出的 Graviton 3 比 2020 年的 Graviton 2 在性价比上较 2020 年同代 x86 芯片高出 65%。据集邦咨询的消息,AWS 在 2021 年 ARM 架构处理器的部署已达其整体服务器建设的 15%,并将于 2022 年超过 20%。



ARM 入局服务器领域并非制程工艺、主频&核心数竞赛的结果,而是下游需求转变促使 ARM 芯片能够在服务器中发光发热。ARM 得到云计算大厂青睐,主要有以下几个原因:


1)边缘计算及微型 IDC 需求增加,ARM 依靠低成本占据优势。受国际形势及各国加强数据主权的影响,各大云计算厂商都在积极向市场投放微型数据中心,微型数据中心体积相对较小,对能源的需求较低,以便帮助集中式数据中心完成一部分边缘计算任务,同时,边缘计算往往数据多元化、计算负载变化大,因此 ARM 架构 CPU 是部署微型数据中心建立分布式业务的更好选择。例如,同代的 ARM Cortex-A72 与 x86 Broadwell 对比单核物理面积,前者仅 1.15mm2,是后者的约七分之一。



2)ARM 架构的“众核”、单线程架构保证了更高的效率。以 Oracle 公司 OCI 云服务的 AmpereA1 CPU 为例,相比于同代、相似性能 x86 架构的 IntelXeon Optimized 3,AmpereA1 在执行 H.264 视频处理计算任务时花费 1 美元处理的帧数提升了 98%,相比 AMDEPYCE4 提升了 22%。ARM 架构 CPU 拥有更低的单位成本,一是因为 ARM 的专用计算单元与异构计算技术结合,处理速度更快,二是因为 x86 架构 CPU 单核主频高、线程多,处理任务时功耗较高,而 x86 的多核优化往往难以在不同计算任务中都得到保证。



3)异构计算时代到来,ARM 的可定制特性获得青睐。在没有云服务的时代,x86 这种通用性、兼容性强的架构可以满足绝大部分计算需求,同时,摩尔定律在过去可以持续生效,提升主频频率、增加核心数便可以使芯片性能突飞猛进;而如今硬件虚拟化、云计算兴起,同时芯片制程迎来瓶颈,让计算机引入特定计算单元变成必然趋势,异构计算成为串 / 并联特定种类的计算机的混合系统,因此以定制化见长的 ARM 架构便有了用武之地。


4)云端一体化趋势已现,打通生态 ARM 前景可期。2020 年,苹果公司首次发布基于 ARM 的 M1 芯片取代 Macbook 系列 intel X86 芯片, M1 芯片提升专用计算性能(如 macOS 擅长的视频剪辑、图像处理)仅是苹果自研 ARM 芯片的其中一个小目标,其最重要的目标在于统一不同设备的芯片架构,创造出设备从底至顶的完全互联互通, M1 芯片的 macOS 设备现在可以运行一部分 iOS、iPadOS 的 App,未来后两者也有望运行 macOS 原先专有的 App。无独有偶,在移动端和物联网领域,ARM 生态市占率明显领先,手机、物联网终端设备、电动车智能座舱等越来越多领域使用高通或其他 ARM 架构芯片,云端一体化趋势下,ARM 生态前景值得期待。



以大数据搜索、云游戏等为代表的场景,其提出了高并发性、端云协同性等要求。然而,依托现有的以 X86 为主的架构难以针对各类场景都提供有效支持,因而提出了对于以 ARM 为代表的 RISC 等更多类架构芯片发展、同时实现端到端的适配要求,即算力生态多样化。


目前我们使用 x86 和 ARM 服务器时不存在特别的感受,是因为厂商在研发时已经尽可能地将其封装成黑盒产品,以避免兼容性问题;但是未来随着大部分算力都有望搬上云端,x86 厂商则必须重新审视云端与终端的异构兼容效率。从各厂商的研发动向来看,Nvidia 发布了基于 ARM 的 AI 计算 CPU,大幅突破了云端深度学习与终端 Nvidia GPU 的数据传输瓶颈;微软正在自研 ARM 处理器,将率先使用在自家 Azure 上;Intel 进军与 ARM 同源的 RISC-V,从另一个方向入局精简指令集生态。我们认为,ARM 架构的芯片有望逐渐成为主流服务器芯片之一,从底层硬件的层面解决云端与终端的生态壁垒问题。



4.4. 提升光传输密度是降低器件功耗的主攻方向


在基站设备及数据中心内部,芯片 /Serdes/ 光电转换模块等关键器件的功耗在整机功耗占比达 60%-80%。通过提高光模块速率,或者芯片出光、光交换,实现设备能效显著提升。光模块速率提升单位功耗明显降低,而共封装光学 ( CPO) 把光收发器与设备芯片集成在一个 CMOS 衬底上,省去 CDR、DFE/CTLE/FFE 等功能,有望提升 80% 的 Serdes 能效。


光模块速率提升单位功耗明显降低,高速率大势所趋。传输速率是光模块重要的技术指标,随着光通信行业的不断发展,高速率产品是光通信行业的发展趋势,高速率产品在单位能耗上也更具优势,符合绿色化大趋势。目前,针对数据中心&以太网的产品方案包括 10G、25G、40G、100G、200G、400G、800G 光通信模块。以中际旭创产品为例:10G 光通信模块能耗小于 1.8W;25G 光通信模块能耗在 1W~1.5W 区间。40G 光通信模块能耗为 1.5W~3.5W。100G 光通信模块能耗在 2.5W~4.5W 区间。200G 光通信模块:能耗为 5.5W~6.5W。400G 光通信模块:能耗在 12W。800G 光通信模块:能耗在 16W。数据中心使用光模块单 Gbit/s 的能耗呈现向不断减小的趋势发展。



CPO 方案有望大幅降低能耗。传统交换机的光模块在前端面板,距离交换机 ASIC 较远,由此产生的物理效率损耗逐渐成为交换机速率进一步提升的瓶颈,传统交换机速率达到 51.2T 以上时将迎来功耗墙。共同封装光组件(CPO)交换机将交换机芯片(或 XPU)ASIC 和光引擎共同封装在同一基板上,光引擎的位置尽量靠近 ASIC,以最大程度地减少高速电通道损耗和阻抗不连续性,从而可以使用速度更快、功耗更低的片外 I/O 驱动器,功耗墙问题迎刃而解。CPO 已经成为业界的替代封装方案。



我们预测,到 2025 年之前,CPO 共封装光学有望实现商用。一些学术机构也正在研究可以替代电交换网的光 Cell 交换技术,预计到 2030 年之前将出现采用光总线和光 Cell 交换技术的设备级光电混合产品。在更远的未来,产业还将出现采用光计算和光 RAM 内核与通用计算内核混合的芯片级产品。


4.5. 结合使用绿色能源是算力可持续发展之路


我国绿色能源资源丰富。降低数据中心 PUE 的手段除了在制冷散热上,还可提高运营中可再生能源的覆盖率,通过减少传统化石燃料消耗,以达到减排目的。我国可再生资源丰富,太阳能、风能、水能等可再生能源使用将显著降低碳排放,瞄准可再生能源是算力可持续发展的必经之路。



SAI 是一家横向整合算力、热力和电力行业的全球算能运营商和清洁能源科技公司。不少公司近年来在算力余热综合应用领域进行探索,例如 SAI 采用独家的液冷和余热回收技术,循环利用芯片余热为潜在客户提供清洁热力服务,同时降低数字资产算力基础设施的运营成本。目前大多数比特币采矿中心仍然由煤电厂提供电力,而可再生能源的使用在带来新的机遇同时也使电网运营商面临着一个棘手的问题:人们无法控制太阳能发电和风力发电所产生的电力数额。当产生的电力过少时,运营商可以通过启动水力或化石燃料发电机来进行补偿。但处理过多的能源则是一个复杂的挑战。而 SAI 作为一家提供清洁算力服务的企业,通过将算力整合到能源领域,着手致力于解决类似的困境。



从清洁计算业务的角度来看,SAI 有四个主要技术领域。SAIHEAT(芯片余热利用)、SAIWATT(清洁能源消耗)、SAIBYTE(计算云网络系统)和 SAICHIP(新型计算芯片)。


SAIHEAT 通过提供 "液体冷却 + 余热利用"的一体化解决方案,将计算过程中产生的余热收集起来,进行再利用,在用清洁能源替代传统热源的同时,帮助大幅度降低电费。SAIWATT 利用水电、风电、废气发电等闲置能源进行计算发电,实现闲置能源消耗和削峰填谷,并为能源所有者和作为运营商的 SAI 降低成本。SAI 还提供计算能力云服务和新型芯片材料,共同降低计算行业的成本。通过前沿的基于清洁能源的计算和能源中心,以及余热利用技术和功耗技术,SAI 可以在计算过程中减少高达 30% 的能源消耗成本,同时减少基础设施投资,从而为公司及其合作伙伴带来高利润率。



在追求低碳环保的大背景下,绿色算力的全球化趋势已现,SAI 将在世界各地建立计算和能源中心,为更多客户提供清洁能源解决方案。一方面随着核心业务的落地,未来 SAI 将进一步融入国际资本市场。通过跟更多国际投资者的合作,共同开拓全球化的业务,实现共赢。另一方面 SAI 计划在更多的国家落地试点项目。项目的场景应用将更多样化,为工业、商业甚至大棚、居民区等提供算力的余热再利用项目,同时也为整个市场提供更加清洁、高性能和更高性价比的算力服务。


秦淮数据 IDC-- 物尽其用,重用光伏。产业基地一期位于山西省大同市,可再生能源使用率 100%。PUE 常年稳居 1.5 以下,根据当地政府的可再生能源优先发电计划可优先使用大同本地丰富的风能、光伏可再生能源,成为能源利用的典范。实际上,在 IDC 减排路途中,光伏发电作为一种较为普遍易取的方案,成为大多数据企业的合适选择,光伏市场或迎来新的一波客户需求。



奥飞数据是国内首家严格按照国内外碳排放核算情况下自运营开始就提供零碳绿色的数据中心的 IDC 公司。公司拟采用的节能减排措施包括采用磁悬浮制冷设备等新型节能技术、加装自动调节压缩机启动等节能装置、选用低功耗变频设备、搭配使用太阳能光伏发电系统等,务求逐步降低公司数据中心的 PUE 值。公司低碳策略一直走在行业前列,今年 7 月制定《广东奥飞数据科技股份有限公司数据中心碳中和及新能源战略规划》,强调公司日后要加大研发投入,健全核查标准建立,扩张光伏发电,以巩固、放大目前“绿色”优势,加快主营业务收入增长率。



润建股份中标《山东移动 2022-2023 年基站光伏发电改造采购项目》,公司将为为山东移动 2778 个基站加装光伏发电设施,项目所发电能由基站优先自用,实现企业节能降耗目标,剩余电能接入公共电网。项目建成后,山东移动将与公司签订用电协议,按协议规定的付款方式向公司支付电费。润建股份作为通信信息网络与能源网络的管理和运维者,此次中标项目是公司通信综合能源管理业务的标杆项目,为通信基站加装光伏发电设施,并采取合同能源管理模式进行结算,实现了通信基础设施节能降碳,具有良好的经济效益。



4.6. 构建全光智能算力网络,“东数西算”实现资源最优解


在算力未来需求持续增加的情况下,网络带宽和时延限制 ( 性能)和网络带宽成本限制 ( 成本 ) 导致的算力需求错配问题将进一步突出,运营商作为算力网络的底层构建者,将承担越来越重要的责任,构建全光智能算力网络,通过资源调配如东数西算实现资源最优解,不仅有助于降低能耗,更是有助于实现对网络、算力资源、需求等综合的最优解。


在“网络化”算力有效补充了单设备无法满足的大部分算力需求后,仍然有部分算力需求受不同类型网络带宽及时延限制,仍然无法满足低时延、大带宽、低传输成本的算力需求场景,如智慧安防网络、CDN 加速等,算力需求与算力输出由于网络因素影响导致错配,造成算力潮汐效应。


全光底座的建设首次提出于第 28 届中国国际信息通信展览会的“中国之光高峰论坛”上,中国移动通信集团广东有限公司规划技术部总经理蔡伟文提出建设全光底座,打造粤港澳大湾区的全光网城市群。全光网的特点是全光接入、全光互联、全光交换,又可以分为全光底座、全光业务和光网大脑三个部分。用个简单的比喻,全光底座相当于高速铁路,是全光网的物理基础,具备架构极简、链路超宽以及经济节能的特点;全光业务则相当于高铁列车,是全光网的业务载体,提供超清视频、精品专线、5G 等全业务的极致承载体验;光网大脑相当于高铁的调度中心,是全光网的智能支撑,提供全光底座及全光业务的智慧运营。”




根据中国联通研究院与华为技术有限公司联合发布的《云时代的全光底座白皮书》,要打造面向品质业务和云化转型的坚实全光底座,那么全光底座应该具备如下关键能力:


架构稳定,极简,大宽带,可扩展:全光组网,一跳直达,稳定低时延。传输容量持续演进,组网能力持续提升,灵活扩展,确保全光底座架构稳定。

全光锚点,全业务接入:支持 ETH/SDH/PON/OTN/WDM 等多种接入技术,兼容现网,平滑演讲。

广电协调,确定性承载,安全隔离:基于 L0/L1 的硬管道技术,按需灵活协同调度,满足高品质业务的确定性承载及高安全业务的物理隔离需求。

端到端切片,一网多业务差异化 SLA 服务:通过端到端切片,为家宽、移动、专线等不同品质需求的业务,提供不同 SLA 等级的承载服务。

光协调,业务灵活如云:通过与云网关的业务和保护层面对接,实现新型云化业务的云网协同部署和运维,品质成本双优。



国家信息中心发布的《全光智慧城市发展报告 2.0》中提出,在城市数字化转型过程中,全光底座一方面服务产业应用,如计算机视觉、智能语音、自然语言处理、知识图谱等,另一方面赋能其他产业转型升级,如智能制造、智慧能源、智慧交通、智慧金融、智慧教育、智慧医疗等行业。根据中国联通研究院发布的《算力时代的全光底座白皮书》,全光算力网络的典型场景如下:



超算类业务:超算类业务需求不确定,在需要传输数据时,需要高速可靠的完成,如在 HPC,渲染类场景,提升计算效率的关键是低成本的大算力资源,这些计算资源往往不在本地,在进行计算前经常需要 100T 级别的数据传输,采用 OTN 弹性管道能大幅提升整体工作效率。


本地计算:算力资源少,一次计算需要 10 天。

西部算力资源池 + 普通专线:算力资源丰富,计算仅需 1 天;采用 100M/GE 专线,传输数据需要 5 天,整体 6 天。

西部算力资源池 + 弹性 OTN 专线:算力资源丰富,计算仅需 1 天;OTN 专线弹性调整到 100G,分钟级数据搬迁;整体 1 天,效率提升 90% 以上。


存贮类业务:典型的存贮类业务,如视频业务的东数西存,企业 IT 类业务的 2 地 3 中心,存贮类业务需要 OTN 大带宽,采用 OTN 连接,在确保传输质量的同时,比按流量计费的模式成本更优。


视频监控类业务东数西存:视频监控类是冷数据,存在西部可节省 30% 左右的算力成本;视频数据需要无收敛实时传输到东部,如深圳超过 100 万个摄像头,如果深圳视频数据存贮在西部集群,每个摄像头 4M 带宽,总计就需要 4T 以上带宽;视频监控数据如果采用互联网流量计费模式,按每 G 流量 0.5 元计算,一个摄像头年数据传输费用就需要 6 万左右,100 万摄像头年数据传输费用就是天文数字。采用 OTN 专线模式,在保障品质连接的同时,按带宽计费,传输费用可以节省 90% 以上。


两地三中心:企业 IT 类业务经常采用两地三中心模式,一地两中心可以开展双活业务,开展双活业务的 2 个 DC 间时延要保障在 1-2ms 内,以确保计算性能,对此种场景,仅 OTN 连接能保障低时延与带宽的稳定性;对于另外一地的备份中心,与主地的数据中心要保持数据同步,需要 DC 间采用 OTN 进行品质连接,以保障数据的可靠、安全传输。


ToH 品质连接需求:不确定性疫情爆发致使居家远程成为新常态,典型需求如下:

远程教育:网课、课堂、教师直播。

远程办公:会议、监控等。

居家娱乐:游戏、视频、直播。


家庭网络对特定品质业务提升体验成为刚性需求,需要 OTN/OSU 提供品质连接。


我们认为,社会发展势必将对算力网络需求有持续高速增长,对应势必能耗及其他资源需求将持续提升,如何统筹甚至预判资源和需求,优化资源将是未来发展的核心。运营商作为算力网络的底层构建者,通过构建全光智能算力网络,结合东数西算等进行资源调配,实现资源最优解,不仅有助于降低能耗,更是有助于实现对网络、算力资源、需求等综合的最优解。




5.生态:汽车 / 元宇宙 / 机器人等多场景共荣的算力生态如何构建?

当前社会发展已经全面进入数字智能时代,伴随科技创新浪潮的推进,不断涌现出算力的新应用场景,且需求量持续激增,在 AI 和深度学习的深度赋能下,包括智能汽车、自动驾驶、元宇宙、AI 机器人等场景正在持续迭代升级,都将对算力提出新的需求,多场景共荣算力生态正在成型。



我们参考华为对科技创新浪潮下算力的定义:未来人工智能、物联网、区块链、AR/VR 技术发展将带来对算力随时、随地、随需、随形 (Anytime、Anywhere、Any Capacity、Any Object) 的 4A 能力要求。


在随时层面,未来算力发展将关注低时延与连续性,低时延要求算力对数据处理的及时反馈,而连续性要求算力不间断的支撑。以自动驾驶汽车场景为例,面对复杂多变的路况信息,自动驾驶汽车需要确保针对行驶过程中的任何突发性状况进行实时反映。同时在行驶的旅途中始终如一地保证算力对于路况、车况监控的的“专注度”。未来 L4&L5 级别对网络带宽的需求将大于 100Mbps,时延要求达到 5-10 毫秒的水平。



在随地层面,高速增长的技术应用场景与终端设备使得算力需要大量应用在不同地点。因此在未来社会中,算力将因为智能应用场景的不断涌现而无处不在。无论是应用在政务领域的人脸识别、智能安防,民生领域的智能出行、移动支付,亦或是产业领域的智慧工厂、智慧农业,所有智慧场景都与算力密不可分。


在随需层面,未来的算力应能够满足任意量级场景与终端设备的算力需求,并按照实际需求进行自适化的调配。如自动驾驶领域的算力需能够同时满足车辆出行低峰期与高峰期的算力需求。



在随形层面,未来算力形态将不仅限于人脑,同时算力将在以大型数据中心、数据中心为代表的云端,以智慧路桩、边缘计算单元为代表的边缘端,以人脑、自动驾驶汽车、loT 设备、个人电脑、AR/VR 一体机为代表的终端,形成算力“云、边、端”泛在算力部署架构。


5.1. 人工智能核心驱动,算力发展没有天花板


AI 近年来实现了长足的发展,算法和算力的持续发展,为下游应用创造了更多的可能。AI 依托云边端的整体架构,通过算力协同的模式下,云端云中心承担模型训练任务,端侧的各设备进行模型推理,二者之间的边缘侧负责通用模型的转移学习,释放对带宽、算力、存储空间的持续压力。边缘计算向算力集群异构设计发展,其异构化程度将会高于传统的数据中心,异构设计的突破将会进一步提高端边云的整体计算效能,进而加速 AI 模型的训练与推理。



人工智能作为一项底层技术,几乎可以渗透到各个领域,本文后续还将就重点领域展开。IDC 预测到 2025 年,人工智能涉及的场景规模将达到 2081 亿美金,并在自动驾驶、智慧金融、智慧医疗、智慧零售、文娱等领域大显身手。人工智能技术对于算力的核心拉动点在于未来各应用场景内单设备芯片算力的增长和人工智能技术的行业渗透率的进一步提升,带动对云计算中心、边缘设备和终端算力的巨大需求。整体预计在 2030 年,人工智能相关领域对于算力的需求将达到 16000EFLOPS,相当于 1600 亿颗高通骁龙 855 内置的人工智能芯片所能提供的算力,依旧有数百倍的增长空间,可以说算力发展没有天花板。




5.2. 智能网联车——自动驾驶和智能座舱,算力争霸制高点


智能网联车是汽车电动化的大趋势,众多新老车企纷纷瞄准电动车市场,瞄准完全自动驾驶,把车打造成第二智能场所。从智能的角度看,我们可以聚焦在两个方面,分别是实现全面自动驾驶和实现全面的智能座舱影音娱乐上,二者对算力均有强大的需求,是智能网联车算力争霸的制高点。


首先自动驾驶场景为例,根据自动驾驶等级,对算力需求可以分为以下几个阶段:


1)在自动驾驶初级阶段如 L2 阶段,对于算力的要求较低,仅需要满足 1-3 个 720P 车载摄像头、1-2 个雷达所产生的数据量即可,且无需对所有进行实时分析。

2)在自动驾驶的中级阶段,以目前完全达到 L3 级别的最新特斯拉汽车(搭载 Full Self-driving Computer 系统)为例,其使用的 AI 自动驾驶芯片上的神经网络处理器(NPU)通过提供强大算力支持,在匹配其专属的 Autopilot 3.0x 系统后,能够同时处理安装在车头和车身上的总计 8 个高清摄像头和 10+ 雷达产生的数据量,使得特斯拉汽车可以对行驶路线、车辆状态、路况安全等情况进行快速分析并持续作出反应,实现有条件自动驾。

3)在自动驾驶的高级阶段,以能够满足 L4 级别自动驾驶算力需求的华为 MDC 系统(Mobile Data Center)为例,其通过整合最新的 AscendCPU 芯片、Al 芯片、ISP 芯片与 SSD 控制芯片在提供低时延(小于 200 毫秒的端到端延时,小于 1 毫秒的 ROS 内部延时,小于 10 微秒的内核调度延时)的背景下,能够满足 16 个摄像头、16 个超声波雷达、8 个激光雷达、6 个毫米波雷达等车载传感器同时工作而产生的庞大数据流量。除此之外,英伟达预测,L4 级别的自动驾驶汽车需要面临更为复杂的驾驶条件、更冗杂的安全纠错机制、更多层级的软件框架,在无法完全靠优化算法的情况下,对车载算力约有 50 倍的提升要求。

4)最后,在自动驾驶的终极阶段,即完全自动驾驶阶段 L5,车载芯片将会面临来自非标准公路、山路、复杂路况下的路况苛刻识别需求,在与 L4 级别汽车的数据传输量相似的情况下,对车载芯片的复杂数据处理能力和快速分析和决策能力提出了更高要求,预计有约 10 倍的计算能力增长需求。


单车算力需求几何级数增加,随着自动驾驶的等级提升,L4/5 级自动驾驶汽车的数据量产生速率需要具有强大的车载芯片算力增长 5000 倍予以匹配。



随时、随形的算力将成为硬需求。自动驾驶场景落地实现需要在不同位置实现对多层次、多来源的环境信息进行随时响应,需要边缘服务器部署以应对高级别自动驾驶阶段毫秒级时延响应要求。在未来自动驾驶的场景中,如果行车安全的核心信息,如路况环境、行人密度等需传输到数百公里的云端服务器进行处理,延时和可靠性难以保证。从自动驾驶汽车的等级提升对延迟的要求角度来看。L3 级别的自动驾驶对于传输时延的要求在 10-20 毫秒,在进入 L4&L5 级别后,对于传输时延的要求进一步提高到 10 毫秒以下。


因此基于单车智能、依赖车网通信的自动驾驶路线图在 5G 网络发展背景下仍然无法保障传输时延与稳定性,所以未来以车路通信(边缘侧部署 RSS、边缘计算平台等计算单元,RSS 提供路测融合感知,边缘计算平台协同数据收集、路由和分发)为代表的算力边缘化部署解决方案将为自动驾驶场景提供计算能力和传输时延的双重保障。



2040 年,搭载 L4/L5 级自动驾驶汽车的普及将拉动自动驾驶领域整体算力快速增长。借助人工智能技术自动驾驶汽车可以避免因为驾驶员人为失误而造成的交通事故,有效提升道路交通的安全性。通过与周围车辆、道路、信号灯等环境信息的实时互联,实现更加及时的路线预判和路况识别,降低交通拥堵。



全球自动驾驶渗透率将快速提升,根据华为数据,2020 年 L1/L2 级功能渗透率将达 40%,L3 级功能也逐渐开始量产,2020 预计渗透率将达 5%,L4 级别自动驾驶汽车将在 2025 年左右实现量产。至 2040 年,所有新车都将配备不同级别的自动驾驶功能,其中 L4/L5 级别自动驾驶在新车销售中的渗透率将超越 30%。未来将有约 2 亿辆搭载具有不低于 300-500 TFLOPS 算力的自动驾驶汽车上路,驱动整体算力需求增长。同时,由于交通存在高峰时间与低峰时间,在人们出行方式不发生巨大改变的前提下,每天不同时间的自动驾驶车载算力巨大需求波动需要大量的云端和边缘端计算设备提供弹性的算力支持。


此外,实现自动驾驶需要大量数据进行神经网络训练,对算力的需求也十分巨大。特斯拉在 2021 年 8 月的 AI DAY,着重介绍了在人工智能领域的软件和硬件进展,尤其是神经网络上训练系统的 Dojo 超级计算机。它采用特斯拉自研 Dojo D1 超级计算机芯片,用于车辆自动驾驶数据的运算和分析,能够自动地学习和识别标记道路上的行人、动物、坑洼地等数据,将海量的数据汇聚于 Dojo,然后通过自动化深度神经网络训练,以此不断加强算法进化,最终实现以纯视觉为基础的完全自动驾驶(FSD)。



特斯拉 Transformer 神经网络学习方法创造了空间特征的词典,可以用来查询各个点位的位置信息,基于大量的多机位摄像头视频素材的训练,通过激光雷达校正(特斯拉激光雷达车队,对基于纯视觉神经网络学习感知的数据进行校准),基于算法的优化和持续的学习,纯视觉模拟雷达的算法精度在持续提升,越来越接近雷达的精度。下图蓝色代表最新的纯视觉算法的结果,绿色是雷达的结果,图中上半部分是深度检测,下半部分是速度检测,可以看到纯视觉几乎达到了雷达的精准度。




英伟达作为人工智能领域的领跑者,深度参与了自动驾驶,具备从芯片到软件到训练框架全栈的平台能力。根据英伟达 2022 年投资者大会的信息,到 2030 年,整个乘用车和商用车将超过 10 亿辆,电动车渗透率将达到 50% 以上,L2 和 L3 的车辆渗透率将从 10% 提升到 50%,单车 FSD 价值量将持续高速增长到 1.2 万美元量级,图像处理需求将增长 10 倍以上,整个自动驾驶市场空间将达到 3000 亿美金以上。


英伟达全面赋能助力自动驾驶革命。当前各车企大多选择将自动驾驶当做核心竞争力,选择自研,而自动驾驶难度大,需要具备极高的研发能力。英伟达帮助企业提供端到端的开发流程,从数据收集、数据标签处理、驱动器映射、模型开发、NCAP、自动泊车等提供全流程。英伟达与 30 家电动车企中的 20 家,10 家电动卡车企业中的 7 家,10 家自动出租企业的 8 家,以及为所有自动驾驶数据中心赋能,主导了自动驾驶革命。




其次,随着近年来电动车的高速发展,带动整个汽车行业向智能化持续升级,除自动驾驶外,整车智能化也是另一个维度的竞争焦点和用户痛点,智能座舱作为人车互动的核心中枢,其智能程度高低充分体现了整车智能化的程度。



在过去几十年中,汽车电子电气架构一直遵循着“一个功能一个盒子”的分布式架构模式,信息娱乐系统、车身系统、车辆运动系统、动力总成系统各自独立,通过中央网关实现连接。不同于传统汽车电子电气架构面向信号的架构,面向服务的软件架构有标准化的服务接口,松耦合的服务机制,以及可组合拓展的服务特性,整体架构更加集中,主要分为运动域、ADAS 域、娱乐域。



智能座舱作为整车娱乐智能核心,持续高速发展中。智能座舱作为人车交互的核心,其智能化程度代表了整车的智能化,也是当前车企竞争的核心领域。当前智能座舱大多采用可插拔式模块设计,放置在中控屏下方,可根据客户需求及产品迭代持续升级,智能座舱逐渐向一芯多屏、多屏联动,分布式外设、AR 实景、5G 实时在线和高清娱乐升级,语音、触控、视觉、3D camera 等多种交互方式,对算力、存储的要求也越来越高,当前 20 万以上的车型大多配备新型智能座舱。


对投资者而言,此前大家预期中的车用物联网模组主要实现车车通信、车路协同的功能,而今随着智能座舱功能的复杂化,5G 将搭载各类应用在车内呈现,对着算力的需求陡增,车用物联网模组已从“功能机”时代进化到“智能机”时代,预计随着明年更多中高端车型的面世,车用智能化模组将迎来爆发。



我们参照特斯拉过去数年车型智能座舱发展来看,特斯拉智能座舱共有三代,其第一代智能座舱方案时间为 2012 年,采用英伟达 tegra3,1GB 内存,4GB 运存,算力 12.4GFLOPS。第二代智能座舱时间为 2018 年,采用英特尔 Atom A3950,4GB 内存,64GB 运存,算力 187GFLOPS。第三代智能座舱时间为 2021 年,采用 AMD Ryzen 定制方案,16GB 内存,256GB 运存,算力 10TFLOPS。可以看到三代产品在算力层面实现了指数级增长。



特斯拉引领智能化,车企纷纷布局升级智能座舱。过去多年汽车智能座舱配置简单,功能和互动性较为单调,而汽车行业相对稳定的格局,让车企并没有足够的动力去持续迭代升级产品。特斯拉通过强大的产品力在全球范围内赢得了消费者认同,智能座舱也在特斯拉的引领下持续升级,逐渐成为整车互动影音娱乐的核心,包括蔚来、小鹏、理想在内的新势力,以及以比亚迪为主的国产厂商纷纷瞄准智能座舱,为消费者提供更加卓越的体验。


此前受“车规”要求限制,智能座舱配置升级较慢,其智能化程度远低于智能手机的进化速度,随着“油改电”的推进,电动车渗透率快速提升,从“车规”到“工规”甚至“消规”级的进化将大力推进智能化需求迭代。



高通发力智能座舱,占据半壁江山。高通在车领域有着领先的布局,在通信领域有着深刻积累,凭借在移动端的广泛成功经验,高通将骁龙系列芯片拓展至汽车座舱领域。当前除特斯拉具备极强的供应链管理和自研能力选择定制化方案,大多数车企在智能座舱领域选择了高通平台,包括新势力车企蔚小理在内的众多车企选择了高通 8155 方案打造智能座舱。考虑到智能座舱主要负责影音娱乐,需要联网与外界实现通信,而高通本身在移动通信端拥有深刻积累,其 soc 往往具备基带通信能力,能够为车企提供完整的解决方案或者丰富的选择。我们以 8155 为例,其具备 CPU、GPU、NPU,并且可选配通信基带、GNSS、蓝牙 WIFI,能够帮助车企快速打造智能座舱。



蜂窝通信成为标配,模组厂商迎来持续高速发展。在国五之前,汽车并不强制需要配置网络通信功能,随着移动网络的持续高速发展,以及汽车安全性的标准要求提升,汽车具备通信功能成为必备。当前主流方案主要 2 种,一种是座舱 soc 不具备通信功能,需要 tbox 来实现通信功能,tbox 厂商需要向模组厂商采购蜂窝通信模组进行集成。另一种是 soc 可选择或者具备基带的,可直接实现通信功能。车企可选择是 soc 集成基带,还是选择 soc 不集成基带,通过外挂 tbox 来实现。



智能模组兴起,逐渐成为智能座舱新选项。过去蜂窝通信模组只负责数传,随着智能化的兴起,逐渐衍生出了自带操作系统(安卓、鸿蒙)、自带算力(1-30T)、自带 5G 蜂窝通信功能的智能模组解决方案。在中控下,只需要一个高度集成模块化的智能模组,即可实现整个智能座舱的通信、操作系统以及算力需求,无需通过外挂 TBOX。此方案集成度更高,符合汽车智能化趋势,且能够为车企降低成本,产品迭代速度也更快,符合当前发展趋势,某头部车企率先使用智能模组的智能座舱方案后,引起行业广泛关注,并在今年在其主要车型大规模放量,我们预计未来智能模组方案将被越来越多的车企选择和接受。



5.3. 元宇宙:算力即权力


算力是构建元宇宙最重要的基础设施,元宇宙内容与交互方式的发展都离不开算力的提升。元宇宙并不是网络游戏,但与游戏类似的是,元宇宙是一个承载活动的虚拟世界。相较于游戏所看重的娱乐性,元宇宙的重点更在于这个虚拟时空的体验,和人们在其中的社交与活动。但与游戏类似的是,元宇宙也需要图形显示、成熟的显示技术作为支撑。



算力是元宇宙可触达性的门槛,虚拟世界的图形显示离不开算力的支持。计算机绘图是将模型数据按照相应流程,渲染到整个画面里面的每一个像素,因此所需的计算量巨大。现在用户设备里显示出来的 3D 的画面,其实是通过多边形组合出来的。无论是玩家的各种游戏,还是精细的 3D 模型,里面的模型,大部分都是通过多边形建模(Polygon Modeling)创建出来的。实际这些人物在画面里面的移动、动作,乃至根据光线发生的变化,都是通过计算机根据图形学的各种计算,实时渲染出来的。这个渲染过程需要经过顶点处理、图元处理、栅格化、片段处理以及像素操作这 5 个步骤:


1、顶点处理:将三维空间的模型顶点为主,转换到显示器的二维空间。建模越精细,需要转换的顶点数量就越多,计算量就越大。


2、图元处理:要把顶点处理完成之后的各个顶点连起来,变成多边形。其实转化后的顶点,仍然是在一个三维空间里,只是第三维的 Z 轴,是正对屏幕的“深度”。


3、栅格化处理:把多边形转换成屏幕里的一个个像素点。



4、片段处理:计算出每一个像素的颜色、透明度等信息后,给像素点上色。


5、像素操作:把不同的多边形的像素点“混合(Blending)”到一起,调整像素信息以达到显示效果。


算力支撑着元宇宙虚拟内容的创作与体验,更加真实的建模与交互需要更强的算力作为前提。游戏创作与显卡发展的飞轮效应,为元宇宙构成了软硬件基础。游戏产业每一次重大的飞跃,都源于计算能力和视频处理技术的更新与进步。游戏 3A 大作往往以高质量的画面作为核心卖点,充分利用甚至压榨显卡的性能,形成“显卡危机”的游戏高质量画面。游戏消费者在追求高画质高体验的同时,也会追求强算力的设备,从而形成游戏与显卡发展的飞轮效应,这在极品飞车等大作中已有出现。



游戏画质提高的同时,游戏显卡的算力在近半个世纪取得了巨大的进步。1996 年的 Nintendo 64 算力为 0.2GFLOPS,仅过了 26 年,2022 年的 GEForce RTX 3090Ti 显卡的算力便达到了 39,997GFLOPS,为前者的 20 万倍。但这面对元宇宙时代下 VR 对于算力的巨大需求仍显得捉襟见肘。



元宇宙应用所需要的 VR 交互,对于算力要求达到了新的高度。根据华为预测,预计到 2025 年,AR/VR 涉及的场景规模将达到 596 亿美金,设备端计算能力的提升、VR/AR 设备的普及和普及需要的云计算中心和边缘计算设备算力配套将共同推动整体算力的增长。整体预计在 2030 年,物联网技术相关领域对于算力的需求将达到 3900 EFLOPS,相当于 21 亿台索尼顶级游戏机 PS4 所提供的算力。



AR/VR 技术对算力的核心拉动方式主要有 3 点:


1、单设备芯片算力需求提升:

4K/8K 的 VR 视频设备需要更为强大的算力支持。大渲染量、高级特效、低延时要求对负责输出 VR 视频的 GPU 算力和相配套的云端、边缘设备的算力提出了近乎苛刻的要求,图形处理器 GPU 性能要达到>100TFLOPS,这是目前最顶级的 GPU 也做不到的。


2、VR 设备的普及将提升云 / 边端计算的需求:

伴随以 Oculus、Hololens 为代表的高清设备和以优质应用的涌现,据 IDC 预测,2023 年终端出货量将达到 3670 万台,年均复合增长率超过 51.3%,未来 VR/AR 设备在商业、医疗、教育、影视娱乐等行业的渗透率会急剧增长。此外,随着 5G 网络的普及,大量高清 VR 内容将会实现像现在网络视频一样的在线点播,需要云端提供编码和渲染支持、边缘端算力提供编码、拼接、渲染支持。

3、VR 应用对低延迟的要求更高:

高质量的虚拟现实体验对于要求带宽和时延能够满足至少 180Mbps 带宽和 20 毫秒时延。为了在三维全景下达到理想的沉浸式体验效果,VR/AR 设备需要实现更高的视网膜分辨率、更广的观察视角、更精准的位置感应等,这对带宽的需求至少 180Mbps。而为了保证在使用过程中避免感知到明显的图像滞后而导致的眩晕,在 VR/AR 游戏中,端到端的时延至少需要小于 20 毫秒。


同时,在内容供给端,以算力为支撑的 AI 技术能够辅助用户创作,生成更加丰富真实的内容。构建元宇宙最大的挑战之一是如何创建足够的高质量内容,专业创作的成本高的惊人,3A 大作往往需要几百人的团队数年的投入,而 UGC 平台也会面临质量难以保证的困难。为此,内容创作的下一个重大发展将是转向人工智能辅助人类创作。虽然今天只有少数人可以成为创作者,但这种人工智能补充模型将使内容创作完全民主化。在 AI 工具的帮助下,每个人都可以成为创作者,这些工具可以将高级指令转换为生产结果,完成众所周知的编码、绘图、动画等繁重工作。除创作阶段外,在元宇宙内部也会有 NPC 参与社交活动。这些 NPC 会有自己的沟通决策能力,从而进一步丰富数字世界。



面对元宇宙算力需求的新高度,以英伟达为首的算力基础设施供应商也推出了解决方案。英伟达的云计算平台正在为 AI、高性能计算 (HPC) 和图形方面的下一代功能提供动力来不断突破可能的界限。同时,借助可在所有顶级云平台上使用的 NVIDIA 的 GPU 加速解决方案,各地的创新者都可以轻松按需访问海量计算能力。



英伟达云计算平台目前主要用于人工智能培训、人工智能推理、高性能计算和图形化计算四个方向。具有按需使用且不受限的计算能力、IT 管理简化性、易更新性和定价灵活性等特点,助力智能活动并推动科学突破。



WebGL 协议能够使开发者实现在浏览器中更复杂的图形渲染。WebGL(全写 Web Graphics Library)是一种 3D 绘图协议,这种绘图技术标准允许把 JavaScript 和 OpenGL ES 2.0 结合在一起,通过增加 OpenGL ES 2.0 的一个 JavaScript 绑定,WebGL 可以为 HTML5 Canvas 提供硬件 3D 加速渲染,这样 Web 开发人员就可以借助系统显卡来在浏览器里更流畅地展示 3D 场景和模型了,还能创建复杂的导航和数据视觉化。显然,WebGL 技术标准免去了开发网页专用渲染插件的麻烦,可被用于创建具有复杂 3D 结构的网站页面,甚至可以用来设计 3D 网页游戏等等。


如何通过架构和通信提升云边端一体化的渲染效率?目前提升渲染效率的方法包括 AI 去重与重建、基于 FOI 渲染、以及在传输中使用 HARQ(混合自动重传请求)。通过在架构和算法的优化,能够有效提升渲染效率,渲染效率能够达到传统方式的数十倍。


1、AI 去重与重建

通过人工智能实现画面去重与 3D 场景的重建能够有效降低网络复杂度。人工智能的目的在于通过计算机与算法来学习人的思维、模拟人的行为,可以在大量数据中发现蕴藏在数据背后的逻辑关系。对于大脑视觉来说,大脑的可视皮层是分级的,当人眼观测到图像,会先提取一些边缘特征,接着会将这些边缘组合成局部特征,到大脑的最上层,会将这些局部特征整合为总体特征,从而使人类能够准确地区分不同物体。CNN(卷积神经网络)借鉴了人类处理信息的过程,通过多层卷积网络来提取图像特征,模仿人类对信息接收和处理的模式,并且减少了参数数量,降低了网络的复杂度,因此被广泛用于图像问题中。



2、基于关键点渲染

在图像渲染中,通过关键点(Features of Interest)对对象的特征提取能够有效减少数据量处理。关键点是什么?关键点是图像中可识别性高的点,例如物体边界方向突然改变的点,或两个或多个边缘段之间的交点,它在图像空间中具有明确的位置或很好地定位。即使图像存在光照和亮度变化等的扰动,关键点仍然是稳定,可以被重复可靠地计算出,并且能提供有效的验证。特征提取是指将原始数据转换为可以处理的数字特征,同时保留原始数据集中的信息的过程。最初的数据有大量的变量,并需要大量的计算资源来处理,而通过划分初始集可以使得数据组更易管理。因此,通过选择变量并将其组合成特征,有助于从这些大数据集中获得最佳特征,从而有效地减少冗余数据量。



3、 HARQ 混合自动重传请求

在混合自动重传请求 (Hybrid Automatic Repeat reQuest,HARQ) 机制下,能够有效减少云计算的网络延迟。HARQ这项技术是 5G 实现超高可靠和低时延传输的关键技术。在传统的 ARQ 机制下,接收端通过校验如果发现数据包中有错误,会将数据包整个抛弃,并等待接收新的数据包。如果数据包一直存在错误,接收端就永远无法收到正确的数据包,从而产生丢包的现象。而在 HARQ 机制下,如果发现数据传输错误,接收方并不会抛弃出现错误的数据包,而是把他们暂时存储起来,并与下一次接收的重传数据包进行对比,这样即使重传的数据包仍然是有错误的,只要两个数据包的错误区域没有重叠,HARQ 就依然可以通过相互弥补的方式获得一个正确的数据包。HARQ 机制一方面由于大幅度减少了重传请求的次数从而降低了传输延迟,另一方面也由于大大降低了重传次数超过上限的概率,从而大大降低了丢包率,这样就有效地提升了传输信道的可靠性。



5.4. Web3 时代,算力将是重要技术支撑

NFT、Gamefi 作为 Web3 的典型应用,在追求体验的背后也离不开渲染技术的支持。渲染也被称为图像合成,是将 2D 或 3D 计算机模型转换为逼真的图像或场景。随着数字化时代的大爆发,渲染被各行各业所需求。不仅在视频制作的特效,游戏的渲染可以增强画面的交互式体验,制造业通过渲染将成像方式从原来的 3D 可视化转变为智能 3D 模拟,医疗影像引入高级渲染将大大提高保真度,VR 和混合现实等人工智能场景更是需要渲染营造身临其境的逼真感。同时 NFT、和 gamefi 方向对渲染也是必不可少,高品质的 NFT 和 gamefi 都需要大量的 3D 场景的变化,这个时候就需要大量对画质的渲染。



以区块链技术为核心的 Web3 领域,为算力带来了新的需求和商业模式。算力 + 智能合约有望打造更低门槛、更高效的算力交易市场。


高精度的渲染成本较高,初创期的 Web3 项目往往难以筹建自己的渲染能力。一组 3DNFT 多达上万份模型,而 Gamefi 的渲染需求更高,作为初创团队不会有大量资金来筹建自己的渲染能力,大多数会选择外包这项工作。在传统的模式下,大量的渲染工作都需要专业渲染公司来完成,但单个光场渲染可能就要花费数万美元,并且会使集中式供应商的区域 GPU 网络饱和。例如电影《加勒比海盗 3》特效费用高达 2 亿美元。对于大部分需要渲染的项目或者艺术品,如此高昂的成本使他们对其望而却步。



Render Network 是第一个基于区块链网络的渲染算力市场,用户通过代币可以自由交易算力来渲染作品。不仅利用了闲置资源来使算力提供者得到了收入,也是需求算力来渲染作品的用户,提高了质量和降低了水平。Otoy 是全球图像渲染领域的权威公司之一,在 2017 年率先应用了区块链技术,推出了区块链项目 Render Network( 渲染网络 ) 并发行了加密货币 RNDR。Render Network 总体是去中心化的网络,由艺术家和 GPU(图形处理单元)算力提供者组成,能够为全球用户提供渲染功能。



在这 RenderNetwork 上,个人用户也可以通过为渲染任务贡献空闲的显卡算力来赚取代币回报。用户可以用赚取的代币在该网络上处理自己的渲染项目,也可以在交易所出售盈利。对于需要渲染的创作者来讲,可以在这 RNDR 上创建高分辨率的媒体内容,并且能够作为一个公共数据库,在创作的过程中 RNDR 渲染网络也内置了的数字版权确定机制,这对解决共享三维场景下场景状态的持续变化问题至关重要,且其还用到了加入时间戳的版权证明和再创作权管理,创作者还可以有效地跟踪和管理数字媒体资产的所有权。RNDR 使用的 OctaneRender 渲染器,能够减少大量成本的同时不降低渲染质量和速度。与此同时,RNDR 通过将 GPU 渲染任务分配给成千上万的 P2P 节点,可让创作者获得高质量的渲染质量,并以更低的成本实现渲染,而参与渲染的节点也可获得 RNDR 代币奖励。


区块链技术与算力的融合为算力行业带来了新的商业模式,从而降低算力的使用门槛和投入成本。RenderNetwork 面向有渲染需求的影视、游戏、工程等客户,以及愿意提供出自己空闲算力的用户。用户在链上建立智能合约达成算力出租意向,RNDR 在链下通过专用网络将用户空余的 GPU 资源整合,通过云计算制作出用户所需求的渲染作品。并且所有的作品都会被加密上传进行安全的云存储,完成渲染后使用团队即可立即访问。RNDR 渲染网络的渲染成本要远低于中心化云服务,而个人闲置的算力也能够得到使用。


5.5. 万物互联:物联网高速发展,终端智能化赋能千行百业


随着 5G 的不断普及,以及需求的持续兴起,物联网正高速发展,以智慧安防、智慧物流、智能零售、智慧工厂、智慧家具为主的众多下游行业正加速向智能化升级。根据 ZON 预测,预计到 2025 年物联网技术涉及的场景规模将达到 1580 亿美金,通过智能物联网设备的普及、配套云端计算中心和边缘端计算单元的增加将共同拉动算力增长。整体预计在 2030 年,物联网技术相关领域对于算力的需求将达到 8500 EFLOPS,相当于 79 亿台当下高端边缘设备使用的 EPYC7401 芯片所提供的算力。



以蜂窝通信市场为例,根据 Techno Systems Research 数据显示,2020 年全球物联网蜂窝通信模块出货量超过 2.5 亿片,预计到 2022 年将增长到 3.1 亿片。美国高通预计在 2026 年物联网(包括蜂窝和 LPWA M2M 机器对机器)连接数将超过 60 亿,蜂窝通信模组市场广阔,下游应用场景丰富,包括智慧城市、智慧健康、智慧零售、智慧工厂、自动驾驶等众多场景需求将持续提升,整个市场在未来数年将处于确定性增长期。



以智慧工厂场景为例,其包括的物联网设备有红外传感器,光电传感器,超声波传感器等,需要以华为 Boudica 1504 为代表的物联网芯片提供算力支撑。到 2025 年,应用在工业物联网相关领域上的智能设备将达到 137 亿台,其余物联网设备分布在家庭、电网等多种不同类型的场景下。


在智慧工厂场景下,只有具有强大算力的云端服务器和边缘侧服务器才能对工厂内制造生产的各个环节中数十万物联网设备每天产生的数百 GB 数据(包括但不限于机器名称、材料编号、编程名称、标准参数、生产统计、生产合格 / 不良计数、机器状态、指示灯和告警代码信息等)进行集中分析处理。强大的算力可以为智慧工厂运营带来两大效益,第一是通过网络实时反馈到相关屏幕上,帮助工厂管理人员掌控整体工厂运行情况,及时处理问题。第二是作为工厂自动化的基础,为整个生产线从原材料供应、仓储、零部件生产组装、装配到最终的商品运送环节提供基本数据及机器状态等关键数据,结合云端数据分析与智能判断能力,实现智慧生产。


大量物联网数据信息的实时上传对车间内部网络的时延和带宽要求较高。在生产制造的过程中,任何设备节点上网络传输的延迟都可能造成整条生产线的停机,影响生产延续性和生产效率,甚至会威胁到人员的生命安全。同时智慧工厂内除了数据本身量级的加大(数千上万台物联网设备),数据交互频率也较以往大幅提升,对带宽要求进一步增强,因此,建设智慧工厂对车间内部的局域网络带宽需要达到 Gbps 级别,最高时延控制在 5ms-10ms 以内。



内生需求 + 外部技术与政策驱动,产业智能化升级空间巨大。工业企业面临的人口红利消失、研发投入不足与产品急需升级换代、产能过剩三大难题亟需工业互联网破解,而政策与技术的逐步落地进一步加快工业互联网发展。近年来,我国工业互联网市场规模增长迅速。2019 年中国工业互联网规模达 6080 亿,2015-2019 年每年增速均超过 12%。据前瞻产业研究院测算,预计 2020 年规模可达 6990 亿,较 2015 年增长近一倍。此外,2019 年我国工业互联网下游渗透率仅 2.76%,具有较大的想象空间。



多方面融合互通,加速产业转型升级。智能制造升级所需重点投入的领域主要包括云、网和端三大领域,云即云计算和工业大数据,网即覆盖产业链整体的工业互联网,端即与工业互联网融合一体的智能控制设备、工业机器人、智能机床等终端设备。工业互联网是连接智能制造产业云和端的连接枢纽,通过平台、软件、数据、算法将设备和信息互联,提升制造业智能化水平。根据新基建的定义,工业互联网能够与其他新基建形成良好的融合,通过与 5G、物联网、人工智能、云计算等其他新基建融合赋能,加速产业转型升级是工业互联网技术演进大趋势。



云 + 边 +AI 有机融合,大幅提升行业效率。据市场研究机构 IDC 预测,2020 年全球超过 50% 的物联网数据将在边缘处理。而边缘设备只能处理局部数据,无法形成全局认知,因此实际应用中仍然需要借助云计算平台来实现信息的融合。现阶段大型工厂在数字化、智能化改造的过程中面临的核心问题之一是如何规模化提升产品质量和良品率,从而降低原材料消耗和人工成本投入。企业通过创建基于云边协同的计算平台,将 AI 和深度学习等技术应用于工厂产品质量检测,根据英特尔的工业互联网案例显示,相较于人工操作,云边协同能将效率提升至少 5 倍,产品缺陷类型的检测率也提升到了 100%。



5.6. 算力时代的自主可控正成为核心焦点


8 月 31 日,英伟达向 SEC 披露了一份 8K 文件,2022 年 8 月 26 日,美国政府通知 NVIDIA,对公司的 A100 和即将推出的 H100 集成电路芯片,今后向中国(包括香港)和俄罗斯的任何出口提出了新的许可要求,立即生效。同时,许可证的要求范围还会覆盖到未来的一些 NVIDIA 集成电路产品,只要新品的一切性能等于或高于 A100 以及包含这些电路的任何系统,都要遵守此次许可。AMD 也称收到了相关的禁止命令。


A100 是英伟达于 2020 年发布的 GPU 旗舰产品,基于 Ampere 架构,采用的是先进的台积电 7nm 工艺,拥有 540 亿个晶体管,GPU 的最大功率达到 400W。此外还有一款 A100X,提供比 A100 更高的性能。这款作为通用型工作负载加速器,主要应用在 AI 领域。



被封锁的产品是有足够双精度计算能力的高端 GPU,低端 GPU 暂时不受影响。具备较高双精度计算能力的高端 GPU 主要用于高性能计算领域,包括科学计算、CAE(计算机辅助工程)、医疗等方面。其中,超级计算中心主要满足国家高科技领域和尖端技术研究的需求。而企业级数据中心,也经常采购 NVIDIA 消息中的 A100、H100 产品,这些产品都是有足够双精度计算能力的高端 GPU,上述断供行为如果落实,造成的波及范围会比较大。


这意味着,美国开始对出口人工智能相关应用所需的先进芯片施加新的限制,也就是说从此前的对“超算相关单位进入实体清单”升级为“可为超算提供服务的相关产品直接禁售”,将受影响的范围从超算领域扩大到互联网领域。



GPU 架构是现代异构计算的完美集合。从应用领域通用性角度看,GPU 应用场景可分为 HPC 高性能并行计算、AI 训练和推理、HDV 高速视频编解码、3D 图形和视觉计算等领域,单一市场应用和综合市场应用主要的差别在 GPU 能力的应用上,能力融合的产品应用领域更为广泛。英伟达的整个 GPU 领域的集大成者,技术实力最全面,而芯片的综合能力非常重要,往往跑分和实际应用差异较大、



市场实践证明,NVIDIA 的统一硬件架构(One Architecture)战略是成功的,任何产品都是完整的 GPU,包含了通用计算核心、几何图形计算加速、音视频编解码加速和显示,一款架构可以应用于几乎所有场景,包括数据中心、自动驾驶、PC、AI 云边端计算等


AMD 将 GPU 产品(RX,基于 RDNA 架构)和 GPGPU 产品(Instinct,基于 CDNA 架构)分开,增加了应用移植的难度。GPGPU 和 AI 芯片在大量实际应用场景(如云游戏、视频直播、无人驾驶、智慧城市)中需要依赖其它芯片才能高效完成综合应用任务,不但增加硬件成本和空间成本,数据在芯片间转移将成为主要性能瓶颈,抵消了专用加速芯片带来的好处。GPU 相对 GPGPU 用不超过 10% 的额外芯片面积大大提升了应用范围的广度和深度



中国拥有全球最大 GPU 消费市场,但自主 GPU 领域存在空白。中国 GPU 市场规模和潜力非常大,庞大的整机制造能力意味着巨量的 GPU 采购。虽然近些年,计算机整机和智能手机产量增长都出现瓶颈,但由于这两类产品体量庞大,2019 年国内智能手机出货量为 3.72 亿部,电子计算机整机年产量达到 3.56 亿台,GPU 的需求量大且单品价值非常高,市场规模依然非常可观。


同时,服务器 GPU 伴随着整机出货的快速成长,需求量增长也较为迅速。据统计,2018 年国内服务器出货量达到 330.4 万台,同比增长 26%,其中互联网、电信、金融和服务业等行业的出货量增速也均超过 20%。另外国内在物联网、车联网、人工智能等新兴计算领域,对 GPU 也存在海量的需求。但自主 GPU 领域存在极大空白,市场对国产替代产品的需求迫切。



国产替代空间巨大,产业链正高速发展中。我国算力芯片领域近年来正在持续追赶,整个 AI 芯片市场竞争特点呈多样性,国际巨头仍采用拿手的 GPU 板卡方案,互联网巨头打造闭环生态,初创公司采用低端 ASIC 板卡和算法解决方案。而国产 GPU 领域也正在冒出一批独角兽公司,包括壁仞科技、天数智芯、沐曦集成、摩尔线程等在内的国产 GPU 厂商正在持续追赶,产品切入主要以 GPGPU 为主,针对算力需求和新创领域提供国产替代产品。




6.Dell'Oro 报告:全球光传输设备市场未来五年累计收入将达 810 亿美元

6.1 集中算力投资:“光与云的确定性”


以云端算力为代表的集中式算力产业链,即 IDC、服务器、光器件、光传输等细分赛道,经过多年发展,已经形成了较为完整的产业体系。但这并不意味着集中侧投资机会的减少。当前来看,集中式算力投资呈现一定的周期性,国内经历了 19/20 年的建设高峰,近年来需求侧有所减少。但目前随着国内运营商“双千兆”工程加速启动,东数西算布局蓝图初现,我们较为明显的看到以光纤光缆为代表的部分集中式算力领域赛道已经开始从周期底部复苏。从海外侧来看,尽管市场对于北美经济下行预期较为担忧,但正如前文所述,海外云大厂的云基建资本支出仍然体现出了极强的增长韧性。同时,海外较为老旧的固网系统与疫情带来的在线工作与社交需求之间的错配愈发明显,海外固网升级在今年也呈现了明显的由需求带动的加速态势。


长远来看,随着智能驾驶、AR/VR、元宇宙等新兴应用的上升,流量爆发具有较强的确定性,而集中式算力,作为支撑整个算力网络的基石,将会确定性受益于流量爆发带来的扩建与升级需求,相比于方兴未艾的各类边缘侧设备和解决方案来看,目前集中式算力的硬件体系、升级路线呈现出较强的可预见性和确定性,建议投资者中短期关注复苏周期 + 产业升级的光传输赛道,中长期关注如长周期确定性高的光器件、IDC 等细分赛道。



6.2“边缘 + 绿色”,无限可能的大空间机会


如前文所述,“泛在 + 绿色”是当下算力革命两大关键词。当下边缘计算呈现出“方兴未艾、百花齐放”的特点,各类新技术方案与新应用形式加速产生。我们认为,边缘侧投资主要分为设备与解决方案两条线路。设备侧,包括了边缘计算网关、DPI 设备、物联网模组等,解决方案侧主要是边缘计算平台,物联网平台等 PaaS、SaaS 类产品。我们建议投资者中短期内关注受益“设备智能化升级 + 智能驾驶渗透率提升”双重刺激的物联网模组行业,我们认为物联网模组作为老牌通信制造业代表,将在“边缘计算时代”迎来新生,无论是边缘侧对于通信能力的海量需求,亦或是“通信 + 算力”带来的模组升级,都将给模组行业带来量价齐升的景气周期。从中长期看,我们认为随着“双碳”推进以及全球减排进程,对于“绿色算力”的需求将会加速增长,带动储能、液冷等“绿色算力”产业链发展。同时,边缘侧网络对于接入网扩容,流量监测,边缘计算平台需求也将在未来加速释放。





7. 风险提示

美国科技封锁拖延国内新技术发展:从美国近期限制英伟达高端算力芯片出口可见该领域的敏感性,大算力诸多领域都依赖英伟达、AMD 的算力产品,美国的科技封锁或影响国内供应链。


算力应用市场发展缓慢:目前算力市场方兴未艾,尤其是面向 C 端及元宇宙等前沿应用未取得显著突破,将影响对算力服务的需求。





本文节选自国盛证券研究所已于 2022 年 9 月 13 日发布的报告《国盛通信 |算力革命:泛在、绿色与生态,具体内容请详见相关报告。

宋嘉吉

S0680519010002

songjiaji@gszq.com

特别声明:《证券期货投资者适当性管理办法》于 2017 年 7 月 1 日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

 

重要声明:本订阅号是国盛证券通信团队设立的。本订阅号不是国盛通信团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。


本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

 

版权所有,未经许可禁止转载或传播。



【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

专栏文章
查看更多
数据请求中

推荐专栏

数据请求中

一起「遇见」未来

DOWNLOAD FORESIGHT NEWS APP

Download QR Code