AI算力报告:算力大时代,AI算力产业链全景梳理

今天分享的是AI算力专题系列深度研究报告:《算力大时代,AI算力产业链全景梳理》。

(报告出品方:中信建投证券)

报告共计:98页

核心观点

生成式 AI取得突破,我们对生成式 A 带来的算力需求做了上下游梳理,并做了交叉验证,可以看到以chatGPT 为代表的大模型训练和推理端均需要强大的算力支撑,产业链共振明显,产业链放量顺序为:先进制程制造->以chiplet 为代表的2.5D/3D 封装、HBM->AI 芯片->板卡组装->交换机->光模块-液冷->AI 服务器->IDC 出租运维。综合来看,大模型仍处于混战阶段,应用处于渗透率早期,AI板块中算力需求增长的确定性较高,在未来两年时间内,算力板块都将处于高景气度阶段,重点推荐 AI算力产业链各环节相关公司。

摘要

生成式 AI取得突破,实现了从0到1的跨越,以ChatGPT为代表的人工智能大模型训练和推理需要强大的算力支撑。自2022 年底 OpenAl正式推出ChatGPT后,用户量大幅增长,围绕ChatGPT 相关的应用层出不穷,其通用性能力帮助人类在文字等工作上节省了大量时间。同时在Transformer 新架构下,多模态大模型也取得新的突破,文生图、文生视频等功能不断完善,并在广告、游戏等领域取得不错的进展。生成式A将是未来几年最重要的生产力工具,并深刻改变各个产业环节,围绕生成式A,无论是训练还是推理端,算力需求都将有望爆发式增长。

训练和推理端 AI算力需求或几何倍数增长。首先是训练侧参考 OpenAl论文,大模型训练侧算力需求=训练所需要的token数量*6*大模型参数量。可以看到从GPT3.5到GPT4,模型效果越来越好,模型也越来越大,训练所需要的token 数量和参数量均大幅增长,相应的训练算力需求也大幅增长。并且,与GPT4相关的公开论文也比较少,各家巨头向GPT4迈进的时候,需要更多方向上的探索,也将带来更多的训练侧算力需求。根据我们的推算,2023年-2027年,全球大模型训练端峰值算力需求量的年复合增长率有望达到78.0%,2023年全球大模型训练端所需全部算力换算成的 A100 芯片总量可能超过200万张。其次是推理侧,单个 token 的推理过程整体运算量为2*大模型参数量,因此大模型推理侧每日算力需求=每日调用大模型次数*每人平均查询 Token 数量*2*大模型参数量,仅以 Google 搜索引擎为例,每年调用次数至少超过2万亿,一旦和大模型结合,其A1算力需求将十分可观。随着越来越多的应用和大模型结合,推理侧算力需求也有望呈现爆发增长势头。根据我们的推算,2023年-2027年,全球大模型云端推理的峰值算力需求量的年复合增长率有望高达113%。

算力产业链价值放量顺序如下:先进制程制造->以chiplet为代表的 2.5D/3D封装、HBM->AI芯片->板卡组装->交换机->光模块->液冷->AI服务器->IDC 出租运维。

先进封装、HBM:为了解决先进制程成本快速提升和“内存墙”等问题,Chiplet 设计+异构先进封装成为性能与成本平衡的最佳方案,台积电开发的CoWos封装技术可以实现计算核心与HBM 通过 2.5D封装互连,因此英伟达 A100、H100等A1芯片纷纷采用台积电CoWos封装,并分别配备40GBHBM2E、80GB的HBM3内存。全球晶圆代工龙头台积电打造全球 2.5D/3D 先进封装工艺标杆,未来几年封装市场增长主要受益于先进封装的扩产。先进封装市场的快速增长,有望成为国内品圆代工厂商(中芯国际)与封测厂商(长电科技、通富微电、甬矽电子和深科技)的新一轮成长驱动力。

AI芯片/板卡封装:以英伟达为代表,今年二季度开始释放业绩。模型训练需要规模化的算力芯片部署于智能服务器,CPU不可或缺,但性能提升遭遇瓶颈,CPU+xPU异构方案成为大算力场景标配。其中GPU并行计算优势明显,CPU+GPU成为目前最流行的异构计算系统,而NPU在特定场景下的性能、效率优势明显,推理端应用潜力巨大,随着大模型多模态发展,硬件需求有望从GPU扩展至周边编解码硬件。A1加速芯片市场上,英伟达凭借其硬件产品性能的先进性和生态构建的完善性处于市场领导地位,在训练、推理端均占据领先地位。根据 Liftr nsights 数据,2022年数据中心 A1 加速市场中,英伟达份额达 82%。因此 A1 芯片需求爆发,英伟达最为受益,其 Q2收入指引 110亿美金,预计其数据中心芯片业务收入接近翻倍。国内厂商虽然在硬件产品性能和*业链生态架构方面与前者有所差距,但正在逐步完善产品布局和生态构建,不断缩小与行业龙头厂商的差距,并且英伟达、AMD对华供应高端 GPU芯片受限,国产算力芯片迎来国产替代窗口期。当前已经涌现出一大批国产算力芯片厂商:1)寒武纪:国内人工智能芯片领军者,持续强化核心竞争力:2)海光信息:深算系列GPGPU提供高性能算力,升级迭代稳步推进:3)龙芯中科:自主架构CPU行业先行者,新品频发加速驱动成长;4)芯原股份:国内半导体IP龙头,技术储备丰富驱动成长:5)工业富联:提供GPU芯片板块组装服务。

交换机:与传统数据中心的网络架构相比,A1数据网络架构会带来更多的交换机端口的需求。交换机具备技术壁垒,中国市场格局稳定,华为与新华三(紫光股份)两强争,锐捷网络展现追赶势头,建议重点关注。

光模块:AI 算力带动数据中心内部数据流量较大,光模块速率及数量均有显著提升。训练侧光模块需求与GPU 出货量强相关,推理侧光模块需求与数据流量强相关,伴随应用加速渗透,未来推理所需的算力和流量实际上可能远大于训练。目前,训练侧英伟达的 A100 GPU 主要对应 200G光模块和 400G光模块,H100 GPU 可以对应 400G或 800G光模块。根据我们的测算,训练端 A100和 200G光模块的比例是1:7,H100和800G光模块的比例是 1:3.5。800G 光模块 2022年底开始小批量出货,2023 年需求主要来自于英伟达和谷歌。在 2023 年这个时间点,市场下一代高速率光模块均指向 800G光模块,叠加 AIGC 带来的算力和模型竞赛,我们预计北美名大云厂商和相关科技巨头均有望在 2024年大量采购800G光模块,同时2023年也可能提前采购。

光模块上游--光芯片:以 AWG、PLC等为代表的无源光芯片,国内厂商市占率全球领先。以 EEL、VCSELDFB 等激光器芯片、探测器芯片和调制器芯片为代表的有源光芯片是现代光学技术的重要基石,是有源光器件的重要组成部分。以源杰科技、光库科技为代表的国内光芯片厂商不断攻城拔寨,在多个细分产品领域取得了较大进展,国产替代化加速推进,市场空间广阔。

液冷:AI大模型训练和推理所用的 GPU服务器功率密度将大幅提升,以英伟达DGXA100服务器为例,其单机最大功率约可达到6.5kw,大幅超过单台普通CPU服务器500w 左右的功率水平。根据《冷板式液冷服务器可靠性白皮书》数据显示,自然风冷的数据中心单柜密度一般只支持8kW-10kW,通常液冷数据中心单机柜可支持 30kw 以上的散热能力,并能较好演进到 100kW 以上,相较而言液冷的散热能力和经济性均有明显优势。司时“东数西算” 明确 PUE(数据中心总能耗/T 设备能耗)要求,枢纽节点 PUE要求更高,同时考虑到整体规划布局,未来新增机柜更多将在枢纽节点内,风冷方案在某些地区可能无法严格满足要求,液冷方案渗透率有望加速提升。目前在 A 算力需求的推动下,如浪潮信息、中兴通讯等服务器厂商已经开始大力布局液冷服务器产品。

AI服务器:预计今年 Q2-03开始逐步释放业绩。具体来看,训练型AI服务器成本中,约7成以上中 GPU构成,其余 CPU、存储、内存等占比相对较小,均价常达到百万元以上。对于推理型服务器,其 GPU 成本约为2-3成,整体成本构成与高性能型相近,价格常在 20-30万。根据IDC数据,2022年全球 A1服务器市场规模 202亿美元,同比增长 29.8%,占服务器市场规模的比例为16.4%,同比提升 1.2pct。我们认为全球 AI 服务器市场规模未来3年内将保持高速增长,市场规模分别为395/890/1601亿美元,对应增速96%/125%/80%。根据IDC数据,2022年中国A1服务器市场规模67亿美元,同比增长24%。我们预计,2023-2025年,结合对于全球 A1 服务器市场规模的预判,以及对于我国份额占比持续提升的假设,我国A服务器市场规模有望达到 134/307/561亿美元,同比增长101%/128%/83%。竞争格局方面,考虑到AI服务器研发和投入上需要更充足的资金及技术支持,国内市场的竞争格局预计将继续向头部集中,保持一超多强的竞争格局。重点推荐:1)浪潮信息:全球服务器行业龙头厂商,其 AI服务器多次位列全球市占率第一:2)工业富联:为英伟达提供 H100 等芯片组装,以及 A服务器生产:3)紫光股份:子公司新华三A服务器在手订单饱满,同时可以提供交换机、路由器等:4)中科曙光:高性能计算及国产化服务器龙头;5)中兴通讯:服务器业务快速增长;6)拓维信息:华为昇腾+鲲鹏核心合作伙伴:7)联想集团:全球领先的ICT设备企业。

报告共计:98页

精选报告来源/公众号:海选智库
本文仅供参考,不代表我们的任何投资建议。海选智库整理分享的资料仅推荐阅读,如需使用请参阅报告原文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/306664.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络—HTTPS协议详解:工作原理、安全性及应用实践

🎬慕斯主页:修仙—别有洞天 ♈️今日夜电波:ヒューマノイド—ずっと真夜中でいいのに。 1:03━━━━━━️💟──────── 5:06 🔄 ◀️ ⏸…

Linux上下载部署zentao v15.5及具体的使用

1.先查询一下Linux的操作系统的位数,确保下载的文件位数与os的一致 [rootlocalhost xiaoming]# uname -m x86_64 [rootlocalhost xiaoming]# getconf LONG_BIT 64 2.下载zentao的Linux压缩包 wget https://www.zentao.net/dl/zentao/15.5/ZenTaoPMS.15.5.zbox…

【QT教程】QT6 Web性能优化

QT6 Web性能优化 使用AI技术辅助生成 QT界面美化视频课程 QT性能优化视频课程 QT原理与源码分析视频课程 QT QML C扩展开发视频课程 免费QT视频课程 您可以看免费1000个QT技术视频 免费QT视频课程 QT统计图和QT数据可视化视频免费看 免费QT视频课程 QT性能优化视频免费看 免费…

MySQL选择普通索引还是唯一索引(2/16)

普通索引和唯一索引 基本概述 MySQL中可以创建普通索引与唯一索引,这两种索引的区别是: 普通索引(Non-Unique Index),也称为非唯一索引,它允许索引中的条目具有重复的键值。普通索引的主要目的是加快查询…

【MATLAB源码-第44期】基于matlab的2*2MIMO-LDPC系统的误码率仿真。

操作环境: MATLAB 2022a 1、算法描述 2x2 MIMO(多输入多输出)和LDPC(低密度奇偶校验码)编码是在通信系统中常用的技术,它们通常用于提高无线通信系统的性能和可靠性。 1. 2x2 MIMO: 2x2 MIM…

宁波宠物展|2024中国(宁波)国际宠物用品博览会

中国(宁波)国际宠物用品博览会 地点:宁波国际会展中心 时间:2024年11月14-16日 主办单位:凤麟展览(宁波)有限公司 协办单位:浙江省宠物产业协会 宁波市跨境电子商务协会 宁波欧德国际商务咨询服务有限公司 宁波扬扬会议展览有限公司 20000方展览…

[RK3399 Linux] 使用ubuntu 20.04.5制作rootfs

一、ubuntu base ubuntu base是用于为特定需求创建自定义映像的最小rootfs,是ubuntu可以运行的最小环境。 1.1 下载源码 下载ubuntu-base的方式有很多,可以从官方的地址:ttp://cdimage.ubuntu.com/ubuntu-base/releases。 也可以其它镜像地址下载,如清华源:https://mi…

动态规划|70.爬楼梯

力扣题目链接 class Solution { public:int climbStairs(int n) {if (n < 1) return n; // 因为下面直接对dp[2]操作了&#xff0c;防止空指针vector<int> dp(n 1);dp[1] 1;dp[2] 2;for (int i 3; i < n; i) { // 注意i是从3开始的dp[i] dp[i - 1] dp[i - 2…

emmet语法--快速生成html标签

emmet语法介绍 可以直接把它理解为快捷键。 通过一定简略的缩写配合快捷键&#xff0c;直接生成我们想要的html代码。 vscode中已经内置了emmet语法&#xff0c;可以直接使用。 emmet的核心就是tab键&#xff0c;我们输入关键词然后按下tap就可以直接生成我们要的代码。 标…

Linux的学习之路:8、Linux调试器-gdb使用

摘要 本章主要是说一下gdb的使用&#xff0c;以及把使用指令放入放个指令手册。 目录 摘要 一、背景 二、使用 1、产生debug文件 2、进入gdb 3、使用指令 三、思维导图 一、背景 Linux调试器gdb的背景主要涉及到Linux程序发布方式和调试需求。 在Linux中&#xff0c…

手把手教你创建新的OpenHarmony 三方库

创建新的三方库 创建 OpenHarmony 三方库&#xff0c;建议使用 Deveco Studio&#xff0c;并添加 ohpm 工具的环境变量到 PATH 环境变量。 创建方法 1&#xff1a;IDE 界面创建 在现有应用工程中&#xff0c;新创建 Module&#xff0c;选择"Static Library"模板&a…

如何使用SQL注入工具?

前言 今天来讲讲SQL注入工具&#xff0c;sqlmap。如何使用它来一步步爆库。 sqlmap官方地址如下。 sqlmap: automatic SQL injection and database takeover tool 前期准备&#xff0c;需要先安装好docker、docker-compose。 一个运行的后端服务&#xff0c;用于写一个存在…

探索Java中的栈:Stack与Deque(ArrayDeque和LinkedList)

文章目录 1. 栈&#xff08;Stack&#xff09;1.1 定义方式1.2 特点1.3 栈的层次结构 2. 双端队列&#xff08;Deque&#xff09;2.1 定义方式及继承关系2.2 特点&#xff1a;2.3 ArrayDeque2.4 LinkedList2.5 Deque 的各种方法2.6 如何选择ArrayDeque和LinkedList 3. 如何选择…

从0开始创建单链表

前言 这次我来为大家讲解链表&#xff0c;首先我们来理解一下什么是单链表&#xff0c;我们可以将单链表想象成火车 每一节车厢装着货物和连接下一个车厢的链子&#xff0c;单链表也是如此&#xff0c;它是将一个又一个的数据封装到节点上&#xff0c;节点里不仅包含着数据&…

JVM参数列表

-client :设置JVM使用client模式,特点启动较快(神机不明显(I5/8G/SSD)) -server :设置JVM使用server模式。64位JDK默认启动该模式 -agentlib:libname[options] :用于加载本地的lib -agentlib:hprof :用于获取JVM的运行情况 -agentpath:pathnamep[options] :加载制定路径的本…

我企业的业务需要制作企业网站吗?11个支持的理由以及5个反对的理由!

如果你的企业经营得还不错&#xff0c;你可能会找出很多理由&#xff0c;说明为什么一个高效的网站对你来说并不那么重要。确实&#xff0c;你明白企业需要在互联网上有一定的存在感&#xff0c;但你可能并不认为一个高效的网站会对你的特定业务产生太大的影响——尤其是当你已…

程序员搞副业你可以这样做

程序员搞副业你可以这样做 文章目录 程序员搞副业你可以这样做01/开发外包项目02/开源项目赢取打赏盈利模式之一&#xff1a;多种产品线盈利模式之二&#xff1a;技术服务型盈利模式之三&#xff1a;应用服务托管&#xff08;ASP&#xff09;盈利模式之四&#xff1a;软、硬件一…

算法——链表(二)

T04BF &#x1f44b;专栏: 算法|JAVA|MySQL|C语言 &#x1faf5; 小比特 大梦想 此篇文章与大家分享链表专题的第二篇,大部分知识在第一篇中已经呈现 对于归并排序在我个人主页专栏 <排序> 有详细的介绍 如果有不足的或者错误的请您指出! 4.合并K个升序链表 题目:合并k个…

蓝桥杯嵌入式(G431)备赛笔记——DMA+UART

目录 CubeMX配置&#xff1a; 代码配置: DMA通道接收&#xff1a; DMA通道发送&#xff1a; 注意&#xff1a; 主函数中记得开启串口接收回调函数&#xff1a; 加了DMA的UART接收通道和一般的区别&#xff1a; 加了DMA的UART发送和一般的区别&#xff1a; CubeMX配置&…

贪心算法|53.最大子序和

力扣题目链接 class Solution { public:int maxSubArray(vector<int>& nums) {int result INT32_MIN;int count 0;for (int i 0; i < nums.size(); i) {count nums[i];if (count > result) {result count;}if (count < 0) count 0;}return result;} …