AIGC接下来的研究思路 生成式AI投资研究框架

AIGC接下来的研究思路 | AIGC
原创 科技周竖人 科技周竖人 2023-04-26 23:22 发表于上海
图片

文 | 科技周竖人
欢迎关注同名公众号获取更详细内容

写在前面:AIGC全称生成式AI(AI Generated Content),与传统AI最大的区别体现在其强大的创造性。传统AI侧重于从现有的数据中识别出模式,其建立在具有判别力的统计模型之上。而生成式AI不仅仅是输出分析答案,其侧重于从底层数据集的基础上创造与生成全新的内容,主要为文字、图像、音频、视频、代码等等。它使得人能够通过自然语言而不是机器语言与计算机之间进行通信与交互。因此,AIGC与传统AI存在较大的差别,这也是本轮行情中投资者最容易混淆的地方。

本文将主要围绕对目前行情的看法、计算机行业研究框架简述、未来AIGC领域研究方向三大主题展开。

**

01 对目前AIGC主题下市场的看法

**

产业趋势较为明确,短期面临回调,不改长期向上趋势。从宏观环境来看,经济呈现弱复苏态势,景气行业稀缺,科技TMT在AIGC大产业主题下具备相对配置优势。政策层面,政府多次强调经济转型升级与“数字经济”,多项政策陆续发布,国家数据局成立,信创、数据要素、数字经济具备强政策支撑。产业层面,AIGC被定义为人工智能的“iPhone时刻”。不同于元宇宙、AR/VR当下受限于基础设施(设备)高昂价格以及目前性能的局限性,应用场景相对比较狭窄,短时间内很难得到广泛的应用。而AIGC在国外已经落地了一些商业应用场景和盈利模式。国内大模型的研发成功与否是具备战略意义的,并且国内是有能力和储备能做出大模型的,产业趋势较为明确。

下一轮行情板块内标的将形成分化,第一轮普涨的走势将不再延续,需要从不确定性中寻找确定性较强、真正能出业绩的标的。科技行业从某种程度上来说是供给创造需求的行业,技术的变革推动新兴产业的发展,产业链上下游形成闭环生态,产能与成本持续优化,价格下降加速需求的提升与行业的渗透。

比如现在大家都在说这轮行情有点像2013年移动互联网浪潮,新的技术的诞生,并且产生了落地的应用场景,对技术将会形成产业趋势这一观点市场似乎是达成了共识。但现阶段来看,业绩的兑现与验证不会那么快,因为国内可用、可大规模商用的大模型本身最快也要今年底或明年初才能拿出来,后续的商业模式与应用的落地会相对更晚一些。因此,AI后续走势不会像现在第一轮行情这样普涨,所有沾边的都涨,而是大浪淘沙,一些具备相对确定性的标的才能笑到最后,同时也会淘汰掉一批本轮普涨带动下涨幅较大的标的。

**

02 从计算机行业研究框架来看AIGC

**

AI技术其实属于计算机技术中的一项分支,其商用落地与投资机会同样不能脱离计算机整体的投资框架。

2.1 投资跨度角度

计算机行业的投资跨度不外乎也分为短中长期,其主要来源于三大催化因素。第一,基础技术的变革带来的长期时代性的投资机会,投资跨度一般在10年以上。比如互联网技术与PC的诞生促使Windows和Intel的Wintel体系称霸多年,云计算的诞生使得亚马逊从电商公司变为IT基础设施巨头等。这种技术变革主导下的投资机会往往率先在美国诞生与落地,国内与海外存在着以年为单位的时间差。这种时间差的长短由技术的不同而不同,但从整体来说,时间差在逐步缩小。因此,此类投资机会对美国技术的进步迭代与产业落地的情况跟踪极为重要,对国内有着对标属性的研究意义。第二,应用场景与应用模式的改变带来的中期投资机会,投资跨度一般在5-10年区间。例如移动互联网的诞生下,催生出了移动支付、短视频、外卖等商业模式。此类投资机会具备一定的本地适配属性,底层技术的升级可能来自于美国,但具体的应用模式与商业模式却在中国得到了极大的创新。第三,微观或阶段性因素带来的短期机遇,投资跨度一般在1-3年。一般来自于行业需求、竞争格局、公司自身的一些变化。主要有以下几个方面:政策层面的强制性造成的阶段性需求拉升;经营层面的下游边际改善、市场延展或市场扩充,公司管理层的良性变革等;资本层面的股权激励、增发、并购等;竞争格局的持续优化下,少量头部厂商业绩的边际抬升等。

2.2 产业链与产业图谱角度

从计算机的产业链来看,计算机行业上游主要有芯片等硬件与IT工程师。从计算机行业本身来说主要有硬件、软件、软硬件共同组成的解决方案与IT服务。从下游客户来说,主要有政府(G)、企业(B)与个人(C)。

▽计算机行业产业链上下游
在这里插入图片描述

计算机行业的主要分类方式主要有几种,按业务类型划分,分为硬件、软件、服务与集成、互联网;按下游客户类型划分,分为2G(政府)、2B(企业)、2C(个人);按下游客户所属行业划分:分为金融IT、医疗IT、工业软件等;按热点主题或技术类型划分,分为云计算、人工智能、智慧城市、在线教育等。

人工智能作为一个技术其实是计算机行业一个较为成熟的主题概念,其投资机会的寻找离不开整个产业链图谱的摸排。从上游来说,AIGC大模型的训练与推理离不开算力的支撑,算力靠由基础硬件构成的AIDC机房提供。从软件层面来说,第一是AIGC大模型本身的落地,第二是训练好的大模型如何对垂直或者通用的行业领域进行赋能,使得企业或者个人能够降本增效。

▽计算机行业架构与产品图谱
在这里插入图片描述

**

03 大模型本身的落地与后续商业模式 入场券门槛极高,大厂的舞台与必争之地

**

国内大模型落地之争进入白热化,鱼龙混杂,其实还是大厂的舞台。大模型的原材料是算力、数据和程序员,从程序员储备、技术储备、资本能力对算力成本的支撑去看,能够做出大模型同样最有动力去做的主要就是几家大厂,百度、腾讯、阿里、华为、字节以及专注AI领域多年的特殊存在–商汤。

从算力层面来说,以GPT3为例,需要约10000张英伟达V100卡。目前国内需要做出类GPT3.5级别的大模型同样至少需要10000张A100/A800卡,单张卡的单价大概在10万人民币左右,预计至少需要10个亿的投入,加上各家厂商担心芯片供货问题,至少会提前进行囤货储备2-3年,预计未来1-3年至少投入10-20亿。

程序员算法工程师方面,以OpenAI为例,自然语言算法工程师大概在百人以上,3-8年经验工程师平均薪酬约100万,叠加国内肯定会出现一些抢人的情况,预计人员薪酬投入2亿以上。叠加大厂在过去已经有很多AI方面的技术积累,所以我认为大模型本身方面只有大厂能够做出来。对于国内大厂来说,AIGC的全新技术将带来商业模式的全新玩法,传统的一些商业模式可能被颠覆,行业竞争格局将发生巨大改变,抢滩登陆势在必行。

大模型落地后的商业模式:
大模型的落地后商业模式应该主要通过AI-aaS的方式进行提供,将AI的能力进行云化通过API接口的方式赋能出去。主要有两种方式,一是直接将通用模型云化提供给下游行业领域进行应用,也就是Model-aaS,另一种是将AI里面细分领域的能力通过云化接口提供出去,比如视觉识别APIs、语音识别APIs、自然语言NLP APIs等分项能力。下游应用层面的厂商可根据自身需求进行选择,付费方式也将有所不同。

**

04 上游算力需求

**

计算机行业主要集中在服务器领域

计算机算力部分主要是服务器部分,对服务器市场带来多少增量,未来1-3年测算:

假设现在有8家左右大厂需要做大模型的预训练,每个大模型需要至少10000张芯片,总共需要80000张芯片。每个AI服务器可以放下4-8张芯片卡,那么需要服务器的数量约1-2万台,取均值1.5万台。预计大厂考虑到美国管制芯片供应的情况,将按照2-3倍的量去做备货。那么需求量区间为3-4.5万台。价格方面,按照均值6卡去算,对应收入约80万一台。预计未来1-3年,AI服务器市场空间新增240-360亿。(一个算法,希望对大家有启发)

一个插曲:因为国内大模型研发的迫切性,从目前GPU选择上来说,英伟达仍然是主流,目前上面提到的几家国内互联网大厂外加商汤均拥有一万块英伟达GPU,用于目前的研发应该问题不大,外加A800的陆续到货,未来两年在追赶上面GPU应该还没到卡脖子的地步。国产芯片可能在后续推理部分能够起到一定作用。

**

05 下游商业模式

**

①基础层与平台层(IaaS & PaaS)

AI IaaS(计算机里的卖水人):AIDC算力租赁,需求来自于一是用于大模型的研发支持,二是应用软件厂商在细分场景的小模型研发。同时还可以提供小模型训练支持,其中包括模型训练服务,提供GPU等硬件资源和深度学习框架,模型部署服务供客户使用。

目前AI IaaS在云计算领域其实已经较为成熟,和传统IaaS并没有太大差异,预计未来竞争格局的演进方式也类似。美国的主流玩家主要依然是AWS、微软、谷歌、IBM,英伟达在今年4月发布会上也宣布加入这一赛场。国内主流玩家目前主要还是阿里云、百度云、腾讯云、华为云、商汤等,创业玩家与运营商目前在AI芯片和服务器上受限。根据IDC预测,AI公有云将在2024年达到增速的最高点,在180%左右。从2024年之后,增速会维持在一个比较稳定的水平上,也会在100%以上。AI公有云前四位分别为百度智能云、阿里云、华为云和腾讯云,份额分别为28.1%、28%、20.5%、16.6%。

这一领域可紧密跟踪海外与国内互联网大厂的资本性开支与AI IaaS收入情况。

▽国内 AI IaaS 公有云市场竞争格局
见同名公众号

数据来源:IDC

②应用层(SaaS)
应用层承接上文大模型本身的商业模式,主要有两种模式,一个是大模型+下游细分赛道小模型或者说是大模型与具体任务相结合的方式,另一个是下游有强能力的厂商在所在细分领域直接做出小模型。

大模型+细分赛道场景小模型/大模型与具体任务的结合:大模型厂商通过开放API接口向下游细分赛道应用软件厂商开放大模型的使用,大模型主要提供通用的生成与交互模式,具体赛道的知识理解的小模型则由具体行业软件公司来提供。AIGC赋能下的应用软件厂商可以通过提高原有产品价格或者促使新品SKU的产生来增加收入。大模型在通用语义与创作的能力上远高于小模型,但在细分领域的知识理解能力上较为欠缺,细分应用领域大+小的模式应该是未来的趋势。

细分赛道小模型:具备较强AI能力的应用软件厂商也可以自己训练小模型。从海外来看,3月份,在彭博发布的论文中验证了这一模式的可行性。BloombergGPT是LLM在垂直金融场景的落地加速的象征。BloombergGPT聚焦于金融场景,将其多年积累的金融领域报告术语等对LLM进行训练,相较普适性类ChatGPT产品,其对金融术语的理解更为高效与准确。

BloombergGPT采用500亿参数与7000亿数据集规模对大模型进行训练,远小于GPT3的1750亿参数与45TB数据量。其数据集主要包含两个部分,一个数据量占比49%的通用型文本数据集,主要包括The Pile、C4、Wikipedia等通用常识类数据集,另一个数据量占比51%的金融预料数据集,主要包含括新闻、研究报告、公司财报、网络爬取的金融文件以及提取到的社交媒体消息等内容。BloombergGPT在通用领域能力与GPT3几乎持平,但在金融垂直领域文本撰写和问答能力更为突出。BloombergGPT LLM预训练的成功说明LLM在垂直领域应用的可用性和训练成本可控的可行性。

细分赛道的选择上,主要有三个参考指标,下游行业IT支出空间是否够大、信息化程度渗透较低、行业竞争格局较优。海外大模型领先于国内2年左右,细分行业软件的落地也将先于国内。因此海外目前落地的应用场景可以对大模型的应用落地具备一个参考意义。(下次强调!是AIGC+而不是AI+ !!!🙂)

▽一些不完全海外应用场景对标A股公司
在这里插入图片描述

③多模态
视觉采集:海康威视、大华股份
交互设备:萤石网络

回到最开始,AIGC与传统AI具备一定区别,其侧重于创造性与人机交互,从这个角度来看,一些传统的AI公司在本轮浪潮下,完全有被替代的风险,需要根据其从事具体业务进行分析,投资有风险,入市需谨慎。

微信扫一扫
关注该公众号

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18791.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搜索趋势:微软必应新版集成AI和实时搜索

微软必应的新版已经集成了AI和实时搜索了,而且已经加入基于ChatGPT聊天的搜索功能,新必应上线48小时申请数破百万人申请加入了。大家可以先看看,下文有访问地址。 微软的新版搜索工具必应推出近一周,陆续有用户通过内测申请。与Ch…

年底量产交付 图森未来的生死一搏!

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 2023年3月28日,全球自动驾驶科技公司图森未来(Nasdaq: TSP)正式发布基于英伟达DRIVE Orin SoC芯片设计开发的域控制器产品(TDC - TuSimple Domain Controller)。 来…

云从科技从容大模型:大模型和AI平台什么关系?为什么造行业大模型?

原创:亲爱的数据 2023年5月18日,坐标广州南沙,来自云从科技的“云从从容大模型”正式亮相。 自此,云从科技从CV四小龙“进阶”成为一家AI大模型公司,同时,别忘记云从还有一个身份常被人提起:首家…

基于Avalonia 11.0.0+ReactiveUI 的跨平台项目开发1-通用框架

基于Avalonia 11.0.0ReactiveUI 的跨平台项目开发1-通用框架 Avalonia简介: Avalonia是.NET的一个跨平台UI框架,提供了一个灵活的样式系统,支持广泛的操作系统,如Windows、Linux、macOS,并对Android、iOS和WebAssemb…

一文讲清RabbitMQ、Apache Kafka、ActiveMQ

本文分享了关于Kafka、RabbitMQ和ActiveMQ三个流行的异步通信消息队列,以及三者的区别。 微信搜索关注《Java学研大本营》 如果你正在准备Java开发面试,除了Spring Boot和Microservices,你还应该准备关于 Messaging brokers(消息代理)、Kafk…

小米大数据运维管理体系的建设与实践

作者 | 刘志杰 责编 | 王子彧 出品 | 公众号「BigData 之路」 前段时间,很荣幸能参加云栖大会,并和大家分享了《小米大数据运维管理体系的建设和实践》,给议题分为两个部分,第一部分是聊聊大数据运维数字化转型相关的内容&a…

淘宝网上线 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 5 月 10 日,在 1975 年的今天,索尼推出了 Betamax 盒式磁带录音机。Betamax 在与更便宜的 JVC VHS 设备竞争中失利,最终被淘…

LLM 赋能的 BizDevOps 工具链:扩大端到端触点,内建流程与规范

在本系列的前两篇文章《LLM 赋能的研发效能》、《LLM 赋能的软件架构》里,介绍了我们在 LLM 结合 BizDevOps、软件架构的一系列试验。围绕于这两大类探索,我们构建了两个开源 LLM 工具:AI 辅助编程工具 AutoDev(IDEA 插件 &#x…

Zilliz @ GOTC:大模型的记忆体——向量数据库的现在与未来

近日,2023 全球开源技术峰会(Global Open-source Technology Conference,以下简称 GOTC 2023 ) 在上海张江科学会堂召开,Zilliz 创始人兼首席执行官星爵、Zilliz 合伙人兼技术总监栾小凡以及 Zilliz 开发者关系及市场运…

大模型更需要大数据,星环科技的跃升之路

针对AI大模型,又一家中国公司果断出手了! 在5月26日上海举行的“向星力未来数据技术峰会”(FDTC)上,星环科技创始人、CEO孙元浩亲自宣布了业界首创的金融大模型“无涯”、大数据分析大模型SoLar“求索”等行业大模型的…

智能仿写软件-智能伪原创改写软件

智能仿写工具:营销创意的必备利器 在当今快节奏和不断发展的商业环境中,企业营销人员需要在短时间内产生大量有创意和高质量的内容。因此,智能仿写工具作为营销策略的一种创新方法而出现,可以帮助企业的写作团队更快速地生成文章…

从 ClickHouse 到 Apache Doris,腾讯音乐内容库数据平台架构演进实践

本文将为大家分享腾讯音乐内容库数据平台的数据架构演进历程与实践思考,希望所有读者从文章中有所启发。 作者 | 腾讯音乐内容库数据平台 张俊、代凯 责编 | 王子彧 出品 | CSDN(ID:CSDNnews) 腾讯音乐内容库数据平台旨在为…

【企业架构设计实战】6 数据架构

什么是数据架构? 数据架构将业务需求转化为数据和系统需求,并寻求管理数据及其在企业中的流动。 数据架构定义 根据 The Open Group Architecture Framework (TOGAF),数据架构描述了组织的逻辑和物理数据资产和数据管理资源的结构。它是企业架构的一个分支,包括管理组织中数…

数据平台之数仓模型设计

文章目录 前言一、维度建模基本概念1.1 事实表1.2 维度表 二、维度建模三种模式2.1 星型模型2.2 雪花模式2.3 星座模式 三、ChatGPT代替Sql Boy3.1 简单案例3.2 复杂案例 四、总结 前言 看到几篇不错的文章,自己总结合并了分享给小伙伴 金博尔和恩门共同开创的数仓…

数据迁移工具,用这8种就够了!

前言 最近有些小伙伴问我,ETL数据迁移工具该用哪些。 ETL(是Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业应用来说,我们经常会遇到各种数据的处理、转换、迁移的场景。 今天特地给大家汇总了一些目前…

Kyligence Zen 简直就是一站式指标平台的天花板

一、Kyligence Zen是什么? 1、Kyligence Zen是做啥的? Kyligence Zen是一款指标分析和管理的工具,是基于 Kyligence 核心 OLAP 能力打造,Kyligence Zen 提供集业务模型、指标管理、指标加工、数据服务于一体的一站式服务&#x…

一文讲清数据集市、数据湖、数据网格、数据编织

本文介绍数据仓库、数据集市、数据湖、数据网格和数据编织相关概念和使用案例,帮助你选择并利用好数据的力量来完成明智的决策。 微信搜索关注《Java学研大本营》 在今天的数字时代,企业每天都在应对来自四面八方的海量数据。随着对强大的数据管理和分析…

朱金宝:数据治理产品发展趋势及Datablau产品最新动态

在刚刚结束的2023数据治理新实践峰会上,Datablau数语科技联合创始人&CTO朱金宝先生分享了对数据治理产品发展趋势的深度思考及Datablau新产品预览,并在现场发布了两款最新工具。 以下是朱金宝先生的演讲实录,为了方便阅读,小…

AIGC文生图:stable-diffusion-webui部署及使用

1 stable-diffusion-webui介绍 Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Diffusion Stable Diffusion 是一个画像生成 AI,能够模拟和重建几乎…

Elastic 发布 Elasticsearch Relevance Engine™ — 为 AI 革命提供高级搜索能力

作者:Matt Riley 今天我们将向大家介绍 Elasticsearch Relevance Engine™(ESRE™),这是一种创建高度相关的 AI 搜索应用程序的新功能。ESRE 建立在 Elastic 在搜索领域的领导地位以及超过两年的机器学习研究和开发基础之上。Elas…