AIGC接下来的研究思路 | AIGC
原创 科技周竖人 科技周竖人 2023-04-26 23:22 发表于上海
文 | 科技周竖人
欢迎关注同名公众号获取更详细内容
写在前面:AIGC全称生成式AI(AI Generated Content),与传统AI最大的区别体现在其强大的创造性。传统AI侧重于从现有的数据中识别出模式,其建立在具有判别力的统计模型之上。而生成式AI不仅仅是输出分析答案,其侧重于从底层数据集的基础上创造与生成全新的内容,主要为文字、图像、音频、视频、代码等等。它使得人能够通过自然语言而不是机器语言与计算机之间进行通信与交互。因此,AIGC与传统AI存在较大的差别,这也是本轮行情中投资者最容易混淆的地方。
本文将主要围绕对目前行情的看法、计算机行业研究框架简述、未来AIGC领域研究方向三大主题展开。
**
01 对目前AIGC主题下市场的看法
**
产业趋势较为明确,短期面临回调,不改长期向上趋势。从宏观环境来看,经济呈现弱复苏态势,景气行业稀缺,科技TMT在AIGC大产业主题下具备相对配置优势。政策层面,政府多次强调经济转型升级与“数字经济”,多项政策陆续发布,国家数据局成立,信创、数据要素、数字经济具备强政策支撑。产业层面,AIGC被定义为人工智能的“iPhone时刻”。不同于元宇宙、AR/VR当下受限于基础设施(设备)高昂价格以及目前性能的局限性,应用场景相对比较狭窄,短时间内很难得到广泛的应用。而AIGC在国外已经落地了一些商业应用场景和盈利模式。国内大模型的研发成功与否是具备战略意义的,并且国内是有能力和储备能做出大模型的,产业趋势较为明确。
下一轮行情板块内标的将形成分化,第一轮普涨的走势将不再延续,需要从不确定性中寻找确定性较强、真正能出业绩的标的。科技行业从某种程度上来说是供给创造需求的行业,技术的变革推动新兴产业的发展,产业链上下游形成闭环生态,产能与成本持续优化,价格下降加速需求的提升与行业的渗透。
比如现在大家都在说这轮行情有点像2013年移动互联网浪潮,新的技术的诞生,并且产生了落地的应用场景,对技术将会形成产业趋势这一观点市场似乎是达成了共识。但现阶段来看,业绩的兑现与验证不会那么快,因为国内可用、可大规模商用的大模型本身最快也要今年底或明年初才能拿出来,后续的商业模式与应用的落地会相对更晚一些。因此,AI后续走势不会像现在第一轮行情这样普涨,所有沾边的都涨,而是大浪淘沙,一些具备相对确定性的标的才能笑到最后,同时也会淘汰掉一批本轮普涨带动下涨幅较大的标的。
**
02 从计算机行业研究框架来看AIGC
**
AI技术其实属于计算机技术中的一项分支,其商用落地与投资机会同样不能脱离计算机整体的投资框架。
2.1 投资跨度角度
计算机行业的投资跨度不外乎也分为短中长期,其主要来源于三大催化因素。第一,基础技术的变革带来的长期时代性的投资机会,投资跨度一般在10年以上。比如互联网技术与PC的诞生促使Windows和Intel的Wintel体系称霸多年,云计算的诞生使得亚马逊从电商公司变为IT基础设施巨头等。这种技术变革主导下的投资机会往往率先在美国诞生与落地,国内与海外存在着以年为单位的时间差。这种时间差的长短由技术的不同而不同,但从整体来说,时间差在逐步缩小。因此,此类投资机会对美国技术的进步迭代与产业落地的情况跟踪极为重要,对国内有着对标属性的研究意义。第二,应用场景与应用模式的改变带来的中期投资机会,投资跨度一般在5-10年区间。例如移动互联网的诞生下,催生出了移动支付、短视频、外卖等商业模式。此类投资机会具备一定的本地适配属性,底层技术的升级可能来自于美国,但具体的应用模式与商业模式却在中国得到了极大的创新。第三,微观或阶段性因素带来的短期机遇,投资跨度一般在1-3年。一般来自于行业需求、竞争格局、公司自身的一些变化。主要有以下几个方面:政策层面的强制性造成的阶段性需求拉升;经营层面的下游边际改善、市场延展或市场扩充,公司管理层的良性变革等;资本层面的股权激励、增发、并购等;竞争格局的持续优化下,少量头部厂商业绩的边际抬升等。
2.2 产业链与产业图谱角度
从计算机的产业链来看,计算机行业上游主要有芯片等硬件与IT工程师。从计算机行业本身来说主要有硬件、软件、软硬件共同组成的解决方案与IT服务。从下游客户来说,主要有政府(G)、企业(B)与个人(C)。
▽计算机行业产业链上下游
计算机行业的主要分类方式主要有几种,按业务类型划分,分为硬件、软件、服务与集成、互联网;按下游客户类型划分,分为2G(政府)、2B(企业)、2C(个人);按下游客户所属行业划分:分为金融IT、医疗IT、工业软件等;按热点主题或技术类型划分,分为云计算、人工智能、智慧城市、在线教育等。
人工智能作为一个技术其实是计算机行业一个较为成熟的主题概念,其投资机会的寻找离不开整个产业链图谱的摸排。从上游来说,AIGC大模型的训练与推理离不开算力的支撑,算力靠由基础硬件构成的AIDC机房提供。从软件层面来说,第一是AIGC大模型本身的落地,第二是训练好的大模型如何对垂直或者通用的行业领域进行赋能,使得企业或者个人能够降本增效。
▽计算机行业架构与产品图谱
**
03 大模型本身的落地与后续商业模式 入场券门槛极高,大厂的舞台与必争之地
**
国内大模型落地之争进入白热化,鱼龙混杂,其实还是大厂的舞台。大模型的原材料是算力、数据和程序员,从程序员储备、技术储备、资本能力对算力成本的支撑去看,能够做出大模型同样最有动力去做的主要就是几家大厂,百度、腾讯、阿里、华为、字节以及专注AI领域多年的特殊存在–商汤。
从算力层面来说,以GPT3为例,需要约10000张英伟达V100卡。目前国内需要做出类GPT3.5级别的大模型同样至少需要10000张A100/A800卡,单张卡的单价大概在10万人民币左右,预计至少需要10个亿的投入,加上各家厂商担心芯片供货问题,至少会提前进行囤货储备2-3年,预计未来1-3年至少投入10-20亿。
程序员算法工程师方面,以OpenAI为例,自然语言算法工程师大概在百人以上,3-8年经验工程师平均薪酬约100万,叠加国内肯定会出现一些抢人的情况,预计人员薪酬投入2亿以上。叠加大厂在过去已经有很多AI方面的技术积累,所以我认为大模型本身方面只有大厂能够做出来。对于国内大厂来说,AIGC的全新技术将带来商业模式的全新玩法,传统的一些商业模式可能被颠覆,行业竞争格局将发生巨大改变,抢滩登陆势在必行。
大模型落地后的商业模式:
大模型的落地后商业模式应该主要通过AI-aaS的方式进行提供,将AI的能力进行云化通过API接口的方式赋能出去。主要有两种方式,一是直接将通用模型云化提供给下游行业领域进行应用,也就是Model-aaS,另一种是将AI里面细分领域的能力通过云化接口提供出去,比如视觉识别APIs、语音识别APIs、自然语言NLP APIs等分项能力。下游应用层面的厂商可根据自身需求进行选择,付费方式也将有所不同。
**
04 上游算力需求
**
计算机行业主要集中在服务器领域
计算机算力部分主要是服务器部分,对服务器市场带来多少增量,未来1-3年测算:
假设现在有8家左右大厂需要做大模型的预训练,每个大模型需要至少10000张芯片,总共需要80000张芯片。每个AI服务器可以放下4-8张芯片卡,那么需要服务器的数量约1-2万台,取均值1.5万台。预计大厂考虑到美国管制芯片供应的情况,将按照2-3倍的量去做备货。那么需求量区间为3-4.5万台。价格方面,按照均值6卡去算,对应收入约80万一台。预计未来1-3年,AI服务器市场空间新增240-360亿。(一个算法,希望对大家有启发)
一个插曲:因为国内大模型研发的迫切性,从目前GPU选择上来说,英伟达仍然是主流,目前上面提到的几家国内互联网大厂外加商汤均拥有一万块英伟达GPU,用于目前的研发应该问题不大,外加A800的陆续到货,未来两年在追赶上面GPU应该还没到卡脖子的地步。国产芯片可能在后续推理部分能够起到一定作用。
**
05 下游商业模式
**
①基础层与平台层(IaaS & PaaS)
AI IaaS(计算机里的卖水人):AIDC算力租赁,需求来自于一是用于大模型的研发支持,二是应用软件厂商在细分场景的小模型研发。同时还可以提供小模型训练支持,其中包括模型训练服务,提供GPU等硬件资源和深度学习框架,模型部署服务供客户使用。
目前AI IaaS在云计算领域其实已经较为成熟,和传统IaaS并没有太大差异,预计未来竞争格局的演进方式也类似。美国的主流玩家主要依然是AWS、微软、谷歌、IBM,英伟达在今年4月发布会上也宣布加入这一赛场。国内主流玩家目前主要还是阿里云、百度云、腾讯云、华为云、商汤等,创业玩家与运营商目前在AI芯片和服务器上受限。根据IDC预测,AI公有云将在2024年达到增速的最高点,在180%左右。从2024年之后,增速会维持在一个比较稳定的水平上,也会在100%以上。AI公有云前四位分别为百度智能云、阿里云、华为云和腾讯云,份额分别为28.1%、28%、20.5%、16.6%。
这一领域可紧密跟踪海外与国内互联网大厂的资本性开支与AI IaaS收入情况。
▽国内 AI IaaS 公有云市场竞争格局
见同名公众号
数据来源:IDC
②应用层(SaaS)
应用层承接上文大模型本身的商业模式,主要有两种模式,一个是大模型+下游细分赛道小模型或者说是大模型与具体任务相结合的方式,另一个是下游有强能力的厂商在所在细分领域直接做出小模型。
大模型+细分赛道场景小模型/大模型与具体任务的结合:大模型厂商通过开放API接口向下游细分赛道应用软件厂商开放大模型的使用,大模型主要提供通用的生成与交互模式,具体赛道的知识理解的小模型则由具体行业软件公司来提供。AIGC赋能下的应用软件厂商可以通过提高原有产品价格或者促使新品SKU的产生来增加收入。大模型在通用语义与创作的能力上远高于小模型,但在细分领域的知识理解能力上较为欠缺,细分应用领域大+小的模式应该是未来的趋势。
细分赛道小模型:具备较强AI能力的应用软件厂商也可以自己训练小模型。从海外来看,3月份,在彭博发布的论文中验证了这一模式的可行性。BloombergGPT是LLM在垂直金融场景的落地加速的象征。BloombergGPT聚焦于金融场景,将其多年积累的金融领域报告术语等对LLM进行训练,相较普适性类ChatGPT产品,其对金融术语的理解更为高效与准确。
BloombergGPT采用500亿参数与7000亿数据集规模对大模型进行训练,远小于GPT3的1750亿参数与45TB数据量。其数据集主要包含两个部分,一个数据量占比49%的通用型文本数据集,主要包括The Pile、C4、Wikipedia等通用常识类数据集,另一个数据量占比51%的金融预料数据集,主要包含括新闻、研究报告、公司财报、网络爬取的金融文件以及提取到的社交媒体消息等内容。BloombergGPT在通用领域能力与GPT3几乎持平,但在金融垂直领域文本撰写和问答能力更为突出。BloombergGPT LLM预训练的成功说明LLM在垂直领域应用的可用性和训练成本可控的可行性。
细分赛道的选择上,主要有三个参考指标,下游行业IT支出空间是否够大、信息化程度渗透较低、行业竞争格局较优。海外大模型领先于国内2年左右,细分行业软件的落地也将先于国内。因此海外目前落地的应用场景可以对大模型的应用落地具备一个参考意义。(下次强调!是AIGC+而不是AI+ !!!🙂)
▽一些不完全海外应用场景对标A股公司
③多模态
视觉采集:海康威视、大华股份
交互设备:萤石网络
回到最开始,AIGC与传统AI具备一定区别,其侧重于创造性与人机交互,从这个角度来看,一些传统的AI公司在本轮浪潮下,完全有被替代的风险,需要根据其从事具体业务进行分析,投资有风险,入市需谨慎。
微信扫一扫
关注该公众号