ChatGPT带动下的AI产业链发展趋势

来源 | 融中财经

(ID:thecapital)


从 2022 年下半年开始,随着深度学习的发展,以 Diffusion、ChatGPT 为代表的颠覆性 AI 应用破圈,标志着人工智能领域的重大突破,引发全球共振。不少人将 ChatGPT 的问世比喻为“蒸汽机”,人工智能就此走向“工业时代”。

上海人工智能产业投资基金作为上海市级产业投资基金,根据建设人工智能“上海高地”的战略部署,始终密切跟踪技术带来的 AI 产业链技术及商业模式变迁。下面是近期我们对 AI 技术及产业发展趋势的思考:

核心观点:

■ ChatGPT 展现了极强的语义理解、多轮沟通对话、推理演绎能力,代表了人工智能研究范式的改变。以 Transformer 为基础的软硬件标准化趋势的确立让我们有理由相信且为之振奋:我们正站在在 AI 工业化革命爆发的拐点——与其说 ChatGPT 证明了某一条 AI 研究路线的成功,倒不如说它更大的意义是证明了 AI 这些年不断收敛但依然存在多种选择的各类路线里,最终真的是会走出一条路:AI 工业技术革命终将到来。

■ 大语言模型使用自然语言交互,颠覆了原有的人机交互方式。从键盘鼠标、触摸屏、语音,人机交互方式的改变重塑了信息产业的形态。人工智能驱动的自然语言交换不仅加速虚拟世界的建立,带来了生产力的革命,也会重塑生产关系,现实世界的下游应用都有望被重构。

■ 伴随参数规模增速的不断提升,算力和训练成本仍存在瓶颈,大模型的性能天花板远未到来,甚至算法需要根据硬件优化,包括芯片级优化、数据中心架构优化、机器学习分布式框架在内的软硬件联合调优等算力创新将成为破局关键,转动起 AI 算力 -AI 应用的产业飞轮。

■ 大模型参数是社会底层知识、学习资料的承载,具有极高的社会、经济和文化价值。考虑到全球政策环境、企业私有化部署的需求、数据跨境的合规风险等因素,中国独立自主大模型构建的迫切性呼之欲出。道阻且长,行之将至。如何利用好AI工程化这一构建大模型的核心能力,以及利用中国的规模效应使大模型迅速普及并改进闭环,是破局的机会。

01

拐点将至:大模型研发范式的改变标志着 AI 真正走向了工业化生产道路

ChatGPT如何能力出众?

相比于之前的 Chatbot,我们可以看到一个惊人的 ChatGPT:极好的理解和把握用户意图,具有出良好的多轮沟通对话、记忆、归纳和演绎能力,会甄别高水准答案,知道如何一步一步解决用户问题,有逻辑和条理的输出回答结果。

ChatGPT背后的技术突围和能力养成?

任何 AI 技术都不是空中楼阁。在惊叹以 ChatGPT、Diffusion 为代表的 AIGC 所展现的惊人能力的同时,我们看到的是一次深度学习算法、算力提升、数据积累三浪叠加后的“大力 出奇迹”,以及背后长达几十年的酝酿。

大语言模型 (LLM) 标志着 AI 研究范式的改变:

拉长 NLP 技术发展时间周期,早期阶段 (2013年左右) 的 NLP 任务采用传统的“特征提取+机器学习”进行研究,第二阶段转变为“预训练模型+fine tune”范式,均致力于“大练模型”,即根据下游任务调整预训练模型,帮助机器理解人的意图。而在以 ChatGPT 为代表的 GPT3.0 “预训练模型+Prompt”范式中,通过“练大模型”大幅减小预训练的任务和下游任务之间的统计分布差距,让计算机适配人的习惯命令表达方式,提高整体任务的通用性和用户体验,从而使通用底座模型成为可能。

模型规模激发能力突变:

研究表明,大模型许多能力上的惊人突破,并非一个线性的过程,而是在模型尺寸达到一个量级时发生突然的“进化”(Scaling Law 即规模定律)。当 LLM 的参数量达到一定量时(比如 100 亿),模型的能力将发生突变。GPT 3.0 模型下 1750 亿参数量“涌现”出的强大智能表现,验证 ScalingLaw 生效,由此获得了存在于大模型而非小模型的涌现能力。更深度的人类活动信息变成可用数据,进一步激发模型-数据的飞轮效应。从神经网络角度看,人脑有约 100 万亿神经元。GPT-3 有 1750 亿参数,预计 OpenAI的 GPT-4 模型参数量将变得更大,但距离人脑的 100 万亿神经元尚远。随着算力的进步,参数规模提升能否带来新的特性值得期待,我们相信大语言 模型的新能力会随着参数和模型规模的激增而进一步解锁。

标准化趋势正在加速:

在算法层面。大模型的核心 Transformer 有统一算法的趋势,图像、自然语言理解、多模态的主要技术路线基本都基于 Transformer 实现。算法的收敛某种程度上使得硬件收敛成为可能,而 Transformer 加速引擎成为算力必选项。虽然目前算法、软件、硬件尚未实现完全标准化,但我们可以清楚的看到 LLM 标准化进程正在加速,逐渐显现出“通用目的技术”的三个特性即普遍适用性、动态演进性和创新互补性,有望成为驱动工业革命的增长的引擎。

02

革故立新:人机交互方式的改变引发生产力的工业化变革,产业链将被重构

回顾科技进步和产业变革的历史可以发现,历次科技革命和工业革命都带来了改变人类生产生活的技术、产品和服务。科技革命标志性的科学成就以及工业革命的主导技术往往具有颠覆性特征,无一不对解放生产力、推动人类文明演进产生了深远影响。

大语言模型所推动的本质变革在于改变了人机交互方式。自然语言成为了人机交互媒介,计算机可以理解人类自然语言,而不再依赖固定代码、特定模型等中间层。以手机、平板等为载体的人机交互方式可能在元宇宙场景下以更自然的方式展现,移动互联网时代的人工智能应用可能被重塑。

交互方式的改变将引发各行各业的生产力革命:

用以嫁接计算机与人类的软件“中间层”将不复存在,产品形态发生变化,软件可以迅速支持自然语言接口,而不必开发和调用 API 接口。劳动对象、生产关系随之变化,AI 软件开发的门槛降低,用户群扩大,企业内部研发和产品的界限将日益模糊;产品根据用户反馈进行直接调整,产业链进一步缩短,生产效率提高。新的需求、职业、市场空间、商业模式呼之欲出,数据-模型叠加的产业飞轮将彻底改变很多传统行业和产业格局。

规模工业化生产的格局有望体现:

生产方式从“农耕时代”走向“工业时代”,AI 产业生态将从过去每个垂直应用领域做各自模型,变成通过大模型做应用,通用性更强。AI 产业链将呈现底层基础设施(芯片/云服务商) - 大模型 - Prompt  Engineering Platform - 终端应用的水平化分工。我们大胆推测,由于预训练模型需要耗费大量的成本和技术投入,因此类似台积电之于英伟达,大模型/AI 平台的入门门槛高,一般参与的对象还是以大规模的互联网公司和行业巨头为主,未来可能只有 1-2 家公司是做 大模型底层基础设施。原本期望通过做垂直化、场景化、个性化模型和应用工具扩张成平台型企业的中间层企业们的竞争可能日益激烈;理解行业痛点并在大模型基础上快速抽取生成场景化、定制化、个性化的小模型,从而实现不同行业和领域的工业流水线式 部署的公司才能生存。靠近商业的应用型公司,依托 AI 将落地场景中的真实数据发挥更大价值。这某种程度上体现了规模工业化生产的特质,即产业分工,标准化和规模化。

所有的下游应用都有望被重构:

随着基础模型与工具层的崛起,构建应用的成本和难度将大幅降低。对于应用开发者来说,所有的下游应用值得被重构。传统企业(+AI)将享受低成本构建应用模型的便利,利用场景和行业 know-how 优势更快地拥抱数字化转型,大幅提升效率和体验;创业公司(AI+)聚焦高价值场景,颠覆现有业务,在自己擅长的方向上去做突围,比大厂先一步做出数据飞轮,形成壁垒。

03

超越摩尔定律:算力瓶颈下的软硬件联合调优成为破局关键

新工业革命的主导技术和产业不再呈现单一性特征,很有可能演变为由多个交叉技术组成的技术簇群,不断同步、掣肘、叠加和“纠缠”。回看人工智能产业的发展历史,每一波大发展都是与算力提升和数据爆发相结合。软件与算力供需的失衡、能力的追赶不断催生创新技术需求,一旦关键技术迎来突破,将会带动整个产业群的发展。

受制于摩尔定律,AI 训练成本高企,当前硬件算力的成本和供给远无法满足日益增长的内存和计算需求。

不仅仅是语言大模型参数规模呈指数增长。LLM 将更大范围更深度的人类活动信息直接转化为可用数据,引发全球数据量激增。根据 Google 统计,DNN 的内存和计算需求每年约增长 1.5 倍(2016-2020 内存增长 0.97-2.16,算力增长 1.26- 2.16);而算力供给却达不到。从 2016 至 2023 年,英伟达 GPU 单位美元的算力增长 7.5 倍(P100 4 GFLOPS/$ 到 H100 30 GFLOPS/$),GPU 算力提升约 69 倍(P100 22T FLOPS 到 H100 1513T FLOPS),GPU 效率提升约 59 倍(P100 73.3 TFLOPS/kw 到 H100 4322 TFLOPS/kw)。

虽然 GPU 在各种效率有明显提升,长期来看,算力需求每年约增长 1.5 倍存在一定的不可持续性,我们预计在最好情况下英伟达 GPU的算力供给每年增长 1 倍,按一般技术渗透规律,算力层面还需要一定程度的优化,否则很难和应用形成较好的正反馈效应,从而提升行业的渗透率。如何在 AI 算力上实现技术突破、降低成本、扩大规模,提升 AI 训练的边际效益,将成为技术创新的焦点。

催生的算力创新需求包括:

芯片级优化。

过去十年里芯片性能的提升,超过 60% 直接或间接受益于半导体工艺的提升,而只有17%来自于芯片架构的升级;而摩尔定律放缓,每 100m 栅极的成本将持续增加(比如从 28nm 的 1.3 美元提升到 7nm 的 1.52 美元),主要由制造这些芯片的复杂性增加所驱动——即制造步骤的增加,远远达不到经济效益。同时,制造难度增加,也将增加良率带来的损失,需要通过将大芯片分成更小的 Chiplet 提高产量/良率,降低制造成本。

数据中心架构优化。

据英伟达估计,到 2030 年数据中心能耗占全社会能耗 3-13%,而数据中心架构也在演进中,从原先的 CPU 作为单一算力来源,引入软件架构定义,再到增加 GPU、DPU,GPU、DPU 的引入使得数据中心三种计算芯片分工明确,从而提升整个数据中心的效率。

机器学习分布式框架。

大模型大算力一定需要多机多卡训练,以 ChatGPT 为例,训练一次需要 3.14×E23 FLOPS 算力。但从训练到推理的过程,模型参数数量不变,分布式框架加速优化的帮助显著。以英伟达 A100 为例,A100 早期训练效率只有 20%,经过分布式框架的优化,效率可以提升 30%~40%,整体效率提升至 50%~100%。

04

时不我待:中国自主大模型的必然、机会和挑战

以 OpenAI 、微软等为代表的发达国家巨头对科技创新和产业升级新一轮密集投入的效果逐步显现,科技革命和工业革命下新一轮“技术—经济范式”变迁也随之逐渐明朗。科技工业革命必然伴随理念、知识、制度,甚至社会价值观和国际话语权的深刻变革,引发新一轮的国际和经济竞争。ChatGPT 的出现意味着 AI 产业水平化分工的条件基本成熟,世界上并不需要很多个大模型,但大模型参数作为社会底层知识、学习资料的承载,具有极高的社会、经济和文化价值。基于全球政治环境、代表中国中大型企业私有化部署的需求、数据跨境的合规风险和安全考虑,我们认为,中国一定会有自己的 LLM (大模型) 。

将构建中国自主的大模型视为在 AI 领域全方位军备竞赛并不为过。这需要超大规模智算平台对芯片、系统、网络、存储到数据进行全盘系统优化,需要一个能自主掌控更多环节从而实现全局调优的方案。虽然目前我们在算力、高质量数据集、顶尖人才资源、应用生态方面与海外存在较大差距,但以百度、腾讯、阿里为代表的中国科技公司们在这个技术周期里所生长出来云、数据、芯片和复杂系统,已初步拥有了参与这场 ChatGPT 竞争的“入场券”。即使目前各环节依然存在不小的代际差,但我们深信基于多年积累的建模、训练和调参,加大长期的资本和人才投入,深度融合的数据和场景,底层训练数据,我们自主独立的大模型依然存在商业闭环的机会。

如何追赶?核心能力在于工程化能力和应用规模。作为系统工程,AI 需要依靠庞大的团队支撑。类比搜索引擎公司,搜索引擎壁垒不在于算法本身,而在于工程化的需求,例如谷歌搜索引擎、头条推荐,都需要强大的工程能力。OpenAI 的 GPT-1 到 GPT-3 再到现在的 ChatGPT ,模型结构没有发生任何变化(transformer decoder),单一产品仍需要几百名正式员工、上千名标注员打磨三年——AI 工程化恰是中国的机会。同时,中国基本上所有的互联网公司都是 AI 公司,中国的规模效应,有望让大模型迅速普及化的改进闭环,成为中国企业迎头追赶的机会。

人工智能有助于经济的自动化、智能化,AI 大模型的最终目标是 AGI(通用人工智能)。AI 大模型对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为可能。当这一目标实现的时候,人类各种经济活动产生的信息的生产、传输、分发、消费可实现编程化,万物智能成本无限降低,人类的生产力与创造力得到进一步的解放。

相信长期的力量。上海人工智能基金秉持长期主义,助力人工智能从业者们这场系统战、持久战中保持定力。上海人工智能产业基金是经上海市政府批准同意,由国盛集团、临港集团联合市区两级财政及市属大型产业集团共同发起,由上海临港科创投资管理有限公司担任基金管理人,旨在贯彻落实世界人工智能大会成果,加快推进上海人工智能高质量发展。基金聚焦人工智能核心技术和关键应用,同时关注优秀创业者陪护和生态资源的持续积累,致力于打造人工智能产业发展各类要素联通的“一站式”平台,助力建设人工智能“上海高地”,同时为产业升级变革创造长期价值。

ChatGPT 的能力展现为人工智能产业链注入了新活力,即使尚处于萌芽期,其展现的创造能力充满想象空间,有望带动 AIGC 类应用快速爆发。人工智能技术作为驱动数据经济的技术底层,有望迎来新的发展机遇,在数字时代赋能人类生产力与创造力进一步解放和革新。上海人工智能基金将持续通过技术引领与场景赋能双轮驱动,推动人工智能成为驱动新一轮科技革命和产业变革的重要力量。

END

欢迎加入Imagination GPU与人工智能交流2群

a63fc85c0a0b7bccb0287278f736bcc2.jpeg

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数字化转型

直播预告|TVM新增算子赛题讲解及在Imagination NNA上完成飞桨3D模型部署

51ca0f142cb7665f0c7ba23ea725b247.png

Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8509.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ai智能写作软件哪个好?分享这三款好用的软件

嘿,大家好吖!今天,我们要谈论一件非常有趣的事情——ai写作小说软件!是的,你没听错,现在连机器都能写小说了! 想象一下,以前我们只是觉得机器人能洗衣服、打扫房间已经很厉害了&…

AIGC学习,AI绘画、AI写作、国内外研究现状等

一、AI绘画 Midjourney 简介 Midjourney是一个由同名研究实验室开发的人工智能程式,可根据文本生成图像,于2022年7月12日进入公开测试阶段,使用者可透过Discord 的机器人指令进行操作,该研究实验室由Leap Motion的创办人大卫霍尔…

免费ai写作软件分享,ai写作软件大合集!​

免费ai写作软件分享,AI写作是指利用人工智能技术,让计算机程序自动生成文章、新闻、评论等文本内容,通过自然语言处理、机器学习、深度学习等技术,AI写作可以模仿人类写作过程,生成高质量、流畅的文本内容。AI写作的应…

快速简单对接【短信验证码】API接口

快速简单对接【短信验证码】接口 很多同学课程中都需要练习API接口对接,这里告知一个免费获取实名认证API接口的途径,也提供简单对接的使用方法。 整体过程说明: 1.下载postman软件 2.获取阿里云API接口的免费次数套餐 3.获取接口相关参数…

php 请求第三方接口发送短信验证码及注册手机号码

1:为什么要用短信验证码: 防范XSS和CSRF 2:php中怎样调用第三方接口(短信宝/京东万象/阿里云/容连云):post请求使用Curl();get请求使用file_get_contents() 服务端调服务端 前端调用后端接口 >ajax 3思路 第一步…

chatgpt赋能python:Python对接接码平台:提高效率的必备工具

Python对接接码平台:提高效率的必备工具 随着互联网技术的不断发展,越来越多的企业和个人都需要使用到短信、语音等类型的验证码进行验证,而接码平台则成为了这一领域的重要工具。Python作为一种最优秀的编程语言之一,其强大的功…

使用chatGPT + AI 绘图生成自己的专属头像

案例介绍 微信头像是朋友认识我们时的第一印象,或许是可爱、妖娆,或许是帅气、成熟,还有自然、厚重、调皮… 我们都有自己独特的故事,独特的思想,独特的爱好,对于头像当然有着自己独到的设计眼光。 接下来请允许我向大家展示如何使用chatGPT、AI绘图工具生成出自己的专属…

chatgpt赋能python:Python自动绘图实现教程

Python自动绘图实现教程 在数据可视化领域,绘图是必不可少的工具,可以帮助我们更好地理解和表达数据。而Python作为一种功能强大的编程语言,也自然可以实现自动绘图。 本篇文章将介绍如何使用Python自动绘图,包括以下内容&#…

简绘ChatGPT支持Midjourney绘图支持stable diffusion绘图

简绘ChatGPT支持Midjourney绘图支持stable diffusion绘图 配置前先看看你的PHP7.3有没有安装SG11扩展,有的话必须先卸载再进行环境配置 1.环境配置PHP7.3 2.PHP扩展安装redis3.安装运行组件 点击下载→ixed.7.3组件组件上传存放路径/www/server/php/73/lib/php/…

chatGPT AI对话聊天绘画系统开发:打开人工智能AI社交聊天系统开发新时代

人工智能技术的快速发展和普及,催生了众多创新应用,其中,AI社交聊天系统成为当下市场的热门话题,本文将详细介绍开发属于自己的ChatGPT的过程,并探讨当下市场因Chat AI聊天系统所带来的影响性。 AI社交聊天系统的潜力与…

如何构建您自己的 ChatGPT:无需代码的 AI

GPT-3(Generative Pre-trained Transformer 3)是2020年风靡全球的OpenAI开发的语言处理人工智能,具有类人文本生成、翻译、长文本总结等能力更多。几周前,OpenAI 发布了 ChatGPT,本质上是 GPT-3 的变体,它基本上破坏了互联网。正如预期的那样,很多人都在尝试使用经常崩溃…

独立产品灵感周刊 DecoHack #049 - 开发者如何学习UI设计

本周刊记录有趣好玩的独立产品设计开发相关内容,每周发布,往期内容同样精彩,感兴趣的伙伴可以 点击订阅我的周刊。为保证每期都能收到,建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。 💻 产品推荐 1. method.ac 这…

我们都需要刷新——读现任微软CEO萨提亚的《刷新》有感

“ Empathy(同理心、同情心)和 Growth Mindset(成长型思维)是重塑和变革微软文化的重要支点” 7月12日,我有幸参加在深圳的ArchSummit全球架构师峰会,在“汇丰架构转型实践——海量金融业务场景下的未来架构…

因果推断研究获2021诺贝尔经济学奖,图灵奖得主Judea Pearl祝贺并反对

晓查 发自 凹非寺量子位 报道 | 公众号 QbitAI 2021年诺贝尔奖最后一个奖项公布: 加州大学伯克利分校的David Card、麻省理工学院的Joshua D. Angrist和斯坦福大学Guido W. Imbens,共同获得了今年的诺贝尔经济学奖。 瑞典皇家科学院表彰他们在劳动经济学…

GPT-4创造者:第二次改变AI浪潮的方向

OneFlow编译 翻译|贾川、杨婷、徐佳渝 编辑|王金许 一朝成名天下知。ChatGPT/GPT-4相关的新闻接二连三刷屏朋友圈,如今,这些模型背后的公司OpenAI的知名度不亚于任何科技巨头。 不过,就在ChatGPT问世前,Ope…

【AI 工具】文心一言内测记录

文章目录 一、申请内测二、收到内测邀请三、激活内测四、开始使用1、普通对话2、生成图片3、生成代码4、写剧本5、生成小说 五、问题反馈 一、申请内测 到 https://yiyan.baidu.com/welcome 页面 , 点击 " 开始体验 " 按钮 , 申请试用 ; 申请时 , 需要填写相关信息 ;…

体验了一下类ChatGPT, 助力嵌入式开发

无意中在浏览CSDN时看到有介绍某类ChatGPT的内容,加上这个人工智能实在是太火爆了,国内的也越来越多的得到发展应用,据说这个的功能与最新的ChatGPT3.5相差无二,关键是免费!抱着怀疑的心态,今天就体验了一下…

Dubbo的基本使用

1.传统项目与互联网项目 相信很多小伙伴或多或少都接触过这两类项目,相较于传统项目,互联网的项目特点如下 客户多,用户多流量大!数据量大!安全性要求较高!变更迭代快!功能更复杂一些! 为什么…

用Express和Vue3实现ChantGPT搭建教程及前后端源码

ChantGPT很多,网上很多说的ChantGPT搭建及源码都是假的,无法使用的,自己研究了好几天,搞定了基于Vue3搭建ChantGPT前后端端源码及搭建教程,现在分享出来,有喜欢的朋友自行下载搭建,用的是openAP…

chatgpt赋能python:如何使用Python捕获所有异常

如何使用Python捕获所有异常 简介 Python是一种高级编程语言,它广泛应用于Web开发、数据分析、机器学习、人工智能等领域。但是,在编写代码时,难免会遇到各种各样的异常情况,如文件不存在、网络连接超时、空指针引用等等。这些异…