硅谷AI考察报告

4f081cd5c3a18f0353fa968c2a3a9f2c.gif

014f695574d872fe4ecdfee2598cb0ea.jpeg

我们从底层技术路径与算力、行业应用以及大模型与垂直模型的发展趋势三个方面来介绍硅谷AI学习考察之行的收获。

9f335753db548790826b71b9c1a5eacf.jpeg

作者:民生证券  吕伟/胡又文团队

为了近距离了解硅谷AI前沿发展最新动向和第一手信息,近期,我们专程前往硅谷学习考察,先后参观了微软、Google、英伟达、Meta等公司总部,与众多业内人士进行了深入交流,收获多多,感触颇深。通过交流过所了解到的很多关于算力和大模型的前沿认知,与国内目前资本市场的理解不尽相同,甚至天差地别,这些差异也许蕴含着重要的投资机遇。为此,特将此次学习考察收获第一时间与各位分享。

此行中我们最大的感受是,在美国AI已经不是刚开始引发好奇与争议的新鲜事物,而是像水和电一样融入到社会生产、公司经营和百姓生活的各个方面。同时,AI技术进步的速度处于一个“寒武纪”的时代,几乎每一周甚至每一天,都有让人兴奋的新技术或者新产品横空出世并且迅速应用到实际场景中,因而美国的VC、PE可以说是几乎无孔不入,深入到AI各个方面去寻找投资机会。

以谷歌为代表的全球科技巨头普遍认为,本次AI革命是人类未有之大变局,它是人类进步的一个空前的拐点。我们曾经指出,这一次,AI将计算机历史上最大想象空间的互联网最高流量入口、公有云最大的市场、统一万物的操作系统合三为一,即使这样我们可能仍然低估了它的意义:这或将是人类发展史上最伟大的科技革命!

我们从底层技术路径与算力、行业应用以及大模型与垂直模型的发展趋势三个方面来介绍硅谷AI学习考察之行的收获:

1  大模型的底层技术与算力需求

第一,GPT大模型的底层技术是谷歌的TransFormer,其核心的意义在于给定前文后推理出下一个最有可能的字符来进行输出,一些巨头的基础大模型差别在于解码单向结构还是编解码双向结构。ChatGPT可以支持对前文32000个字符分析再推理出下一个字,这已经是一个非常庞大的数量级,且ChatGPT只允许根据前文分析推理不允许加入后文来分析推理(decoder only)。谷歌最先推出的大模型Bard是前后文都可以用来分析推理(编解码双向结构),但后来改成与ChatGPT类似只能用前文推理的PaLM大模型,可能最终还是这种模式更接近于我们人类语言的方式。

第二,大模型本质上更像依赖AI基础设施的“炼丹”,是推理并不是认知;目前视频生成受制于对基础设施的高要求仍存在一定局限性。虽ChatGPT在QA、总结等领域表现令人震惊,但实际上还是推理而不是认知,包括生成图片其实本质上也是生成文本,但是在生成视频上AI推理难度很大,因为视频的每帧都是大量图片,需要非常强大的AI基础设施去支撑。形象地说,大模型训练就像炼丹,AI基础设施越好火力越旺,但是一开始都不知道大模型到底有没有用,有一定的运气的成分在里面。

第三,大模型后来者的追赶难度并没有大家想象那么大,中国大模型追赶海外也会比较快。OpenAI本身并不是技术绝对领先于其他科技巨头,核心在于专注于TransForemer往通用人工智能方向发展,而微软、谷歌、Meta都有很多赚钱的业务不太重视大模型。OpenAI做出来之后大公司发现AI有前途,自己资源更好肯定会加紧追赶。硅谷专家预测6个月到1年以后,全球大厂大模型水平基本看齐。中国大模型追赶海外也会比较快,中国本身是一个很好的市场,现在大模型所有的技术大家都了解,无非就是资源的集中堆积。OpenAI做这么好都“委身”给微软,本身就是因为训练太花钱。

第四,海外AI巨头算力储备A100芯片基本在50万片以上的量级,英伟达在把算力资源向云服务方向发展,同时也在布局自身大模型。目前海外巨头平均A100量级估计在50万片以上,H100可能每家一两百张,六七月份才能大规模上线。英伟达的实际优势是软硬件结合,它的硬件上面有一层框架tensor RT,英伟达有几百人的工程设计团队做框架,比如pytorch必须有Tensor RT才能跑,这个中间层软件一般硬件公司写不了。英伟达不止做硬件,做Tensor RT还要做下层的基础设施,未来英伟达有望形成一个云品牌,同时自己也在布局大模型,可能会对整个AI生态造成极大影响。

第五,推理芯片的市场远大于训练芯片,甚至也远大于训练市场加上云端推理市场的总和,中国在边缘AI算力市场空间非常大。边缘计算应用于物联网等小设备对制程要求不高,现在市场的格局分散,而推理芯片的市场远大于训练芯片,甚至也远大于训练市场加上云端推理市场的总和,中国可以借助自己的制造业优势,把物联网这一块的制程降低,然后专用一点的这种小体量低算力的AI推理芯片推向市场,这是巨大机会。其实终端设备的体量是极大的,世界上能够提供云服务的提供商,数据中心的量跟海量的终端设备的数量比,芯片需求也还是很小的,大概就是2/8的比例。

在大模型的底层技术与算力需求方面,我们认为:

1、算力需求没有天花板。当前大模型的主要算力需求来自于文字训练,未来从文字到图像再到视频,从训练到推理,从云端到边缘端,算力需求的持续高增长是确定性非常强的。

2、GPU芯片的市场格局或将发生变化,在微软等巨头的强力支持下,AMD较为薄弱的软件生态有望取得长足进步,AMD将对NVIDIA形成强有力的挑战。

3、芯片是中美竞争的最大鸿沟。两国达到一个数量级的算力储备既是目前亟待解决的瓶颈,也是未来确定的投资机遇。尤其是在边缘侧推理算力,既是被低估的远超训练算力的市场,也给了中国展现制造业优势的机会。

2 关于AI行业应用

第一,大模型适用于需要一定容错率的行业,ChatGPT开始做商业化付费使用plus其实并不赚钱,核心是为了挡掉一些乱用而把成本变得过高的用户。大模型应用在要求100%准确的行业目前难度比较大,更多的是比如客服咨询、艺术创作、会议记录、写文章、数据分析等。大模型的商业化在B端已经看到成果了,比如:微软的全家桶office,减少制作时间、提升完成度、提升复购率;客服:给地产公司、医疗公司节省前端客服的成本。视频制作:一键生成visla.us只能生成demo视频等工具,就不需要找工作室了,节约人力成本。GPT4到现在只有一个半月,市场还在讨论如何应用,再过六个月能看到更多更清晰的落地。

第二,微软M365 产品主要在大规模交付、隐私和安全方面发力。微软现在主要的目标是怎样去大规模的交付,尤其是解决一些个性化的AI特征,另外就是安全与隐私方面的准备。M365是微软现在最核心的产品。对于企业整个工作流,整个的协作平台,整个工具、存储、安全都在M365的目录下面。Copilot是对于现有的产品线的生产能力做大幅度的提升。M365有两套不同的运算,依托Azure的数据中心做全球的扩张,M365内部也有自己的数据中心;M365是把openAI嵌入产品,不是用公用的openAI。M365在中国落地技术上有难度:1)运算资源;2)法规:数据透明度、敏感信息的管理。

我们认为,在美国,AI技术的应用已经非常普遍,例如客服咨询、艺术创作、会议记录、写文章、数据分析等众多行业。但需要注意的是,目前大模型的应用应该定位在“副驾驶员”,需要一定的容错率而非确定性的决策工作。此外,以微软为代表的海外大模型应用目前进入中国仍存在较大难度,这些难度不仅仅是在数据安全与合规政策的要求方面,大模型与算力资源的本地化部署方面也面临诸多挑战。

3 大模型与垂直模型的发展趋势

第一,谷歌和微软的大模型大概率闭源,而Meta可能是最重要的开源“搅局者”。谷歌因为搜索会被大模型颠覆是没有退路的,再开源大模型就没有优势了,而且AI未来会成为重要赚钱工具,所以大概率闭源。微软则是完全依靠OpenAI,希望GPT赋能MS365 Copilot等效率办公工具和Bing搜索引擎,微软大概率也不会把AI开源。而 Meta最重要的业务是社交,AI可以作为聊天助手,Meta的思路是做出大模型然后开源,成为大模型里面的“搅局者”。比较来看,Meta的大模型1750亿参数,估计GPT4参数5000亿左右,Meta开源了超过650亿个参数的大模型,估计精确度比ChatGPT低20%左右。很多公司和学习使用Meta的开源模型做微调,在模型参数很小的基础下效果和GPT等差不多。开源的意义在于可以发动全世界上百万工程师一起参与微调。

第二,大模型走向移动端是个趋势。未来大模型开源生态中大公司做大模型,小公司做微调,大模型还会被简化到在各个移动终端上,比如原来的32位浮点运算改成INT8等,提升运算速度。大语言模型在开源中会有一个很好的生态圈,大语言模型就像水、电一样,在一些细分领域让开源生态做。开源社区有些聪明的人可以把模型蒸馏的很小,比如把36位浮点运算改成INT4,可以把体积缩小十倍,小到可以在电脑和手机端装,未来可能会有很多有创意的应用开发出来。未来iOS或者安卓可能会内置大模型,以后所有的移动端应用跑一次给苹果一定费用。

第三,大模型继续发展中参数量的增加核心要考虑ROI。处于科研角度,当然参数越多越好,但是处于商业使用的角度,每多一个参数就会增加成本,包含收集成本、训练成本。ChatGPT 3.0用了1750B的参数量,而GitHub上有一个仿GBT的模型只用了70B的参数就达到了90%GPT的效果。从商业应用层面,需要找ROI最高的参数。

第四,大模型最终会通吃一些通过互联网即可获得数据的垂直行业,可能无法覆盖某些数据无法获得的垂直领域模型。现在谷歌正在做一件事让AI像人一样实时学习互联网的内容,而数据在线下无法获得的领域,可能会出现线上的大模型和本地模型做交互的形式,但这个涉及难度比较大的耦合问题。

我们认为:

1、 中国可能是以Meta为代表的开源大模型的最大受益者。

2、我们对于国内大模型追赶全球领先水平的进度应该保持信心,在已经给定了技术路线方向与开源大模型基础上去追赶,实际上节省了从头开始的试错成本。尤其是对大模型通用性要求并不高的垂直行业龙头,借助开源大模型可以迅速搭建垂直大模型,加快垂直领域的应用落地。

3、大模型部署在边缘侧与移动端是一个必然的趋势,尤其在近期谷歌发布移动端大模型和ChatGPT在苹果手机上的App正式上线之后,这一趋势逐步被市场认知,大模型是非标准化的各类AIoT终端等待已久的统一操作系统。

特别声明:任何情况下相关内容不应被视为投资建议

分析师承诺

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

推荐阅读:

万字解读Meta转型元宇宙

元宇宙是「价值创造」经济

比尔·盖茨最新文章

区块链十年一梦

< END >68ebb74c98071036b21cebd720e70c0a.jpeg

f4c1d528645af410af5ccddba46f2e75.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41243.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解码国内外AI大模型现状——以中美为例

ChatGPT在全球掀起AI大模型的浪潮。 在美国&#xff0c;诸如OpenAI和Anthropic等初创企业&#xff0c;以及微软和谷歌等科技巨头&#xff0c;一同引领美国奋勇向前&#xff0c;在AI大模型的领域不断迈进。同时&#xff0c;在中国&#xff0c;美团的王慧文、阿里巴巴的贾扬清、…

〖程序员的自我修养 - 职业规划篇①〗- 大学生选择职业前的自我认知与剖析

人之所以会觉得迷茫&#xff0c;本质上是欠缺对自己的一个控制力、识别庞杂信息、去伪存真的独立思考能力与认知能力。 说明&#xff1a;该文属于 程序员的自我修养 专栏&#xff0c;购买任意白宝书体系化专栏可加入易编程社区&#xff0c;早鸟价订阅模式除外。福利&#xff1a…

Rokid发布超低延迟AR眼镜手势空间识别算法

昨日&#xff0c;Rokid内部开展了GLASS 软件产品演示分享会。公司XR和应用中心就包括新一代手势空间识别算法、远程协作V4.0及YodaOS C-Lite V1.3.0 PVT版本等在内的最新研发成果&#xff0c;进行了集中晾晒和演示。看着“披星戴月”的付出成就了AR眼镜上“灿若繁星”的各种功能…

AR智能眼镜tooz DevKit 20初体验

AR智能眼镜tooz DevKit 20初体验 AR&#xff08;Augmented Reality&#xff09;增强现实技术&#xff0c;是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术&#xff0c;将真实的物理环境和虚拟的信息&#xff08;如3D 模型、视频、文字等&#xff09;实时地叠加到同一个…

超详细的AR增强现实开发入门总结

最近有一些朋友在QQ群或者微信公众号后台问Relax关于AR应用开发如何入门的问题&#xff0c;我想后面肯定还有很多人会问这样的问题&#xff0c;干脆就自己所知道的&#xff0c;比较系统的写一篇入门文章出来&#xff0c;供大家参考一下。 这是AR应用开发入门的第一篇&#xff…

实现一个简单但有趣的AR效果(Web)

增强现实&#xff08;Augmented Reality&#xff0c;简称AR&#xff09;&#xff1a;是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术&#xff0c;这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。 本文将让你了解“如何通过 Web 技术实…

Facebook发布AR眼镜研究项目Project Aria

Facebook 来源&#xff1a;IEEE电气电子工程师 近日&#xff0c;在Oculus Connect直播活动中&#xff0c;Facebook宣布了Aria项目&#xff0c;这是一个专注于构建可穿戴增强现实设备的研究项目。但这些智能眼镜更像是一个研究平台&#xff0c;而不是为消费者提供的现成的小玩意…

用AR.js实现webAR(新手入门)

开发需要准备的东西: 1.域名 2.服务器 3.web前端的一些基本知识(这个不研究深的话也是可以没有的) 4.耐心,这个真的很重要,改配置是真的挺无聊的 开发WebAR注意事项: 1. WebAR 适用于哪些平台&#xff1f; 1.ios系统需要ios11以上的才能运行,用Safari浏览器,不支持腾讯内…

AR开发中快速检测图片的星级和识别率

网址&#xff1a;EasyAR -检测可识别度 在AR开发过程中&#xff0c;有图像识别这个模块&#xff0c;美术做好图片后不知道识别的等级如何&#xff0c;这个时候借助上方的网址就可以清楚的知道图片的识别等级了 五颗星是最好的&#xff0c;推荐识别图要达到三星以上为好 在制…

【周末闲谈】畅想AR,AR领域迎来新风口

个人主页&#xff1a;【&#x1f60a;个人主页】 系列专栏&#xff1a;【❤️周末闲谈】 周末闲谈 ✨第一周 二进制VS三进制 ✨第二周 文心一言&#xff0c;模仿还是超越&#xff1f; 文章目录 周末闲谈前言AR?&#x1f914;&#x1f914;&#x1f914;AR的发展&#x1f463;…

虹科干货 | 如何使用AR眼镜识别内容并展示3D模型?

AR-增强现实&#xff0c;有没有想过AR增强现实的效果是怎样的呢&#xff1f;本文将基于已有软件效果&#xff0c;展示识别图像并显示3D模型的Demo原理和实际应用场景。 AR显示效果预览 在Vuzix 官方 App Store 中展示的有一款软件&#xff1a;Sales Demo&#xff0c;它展示了虹…

初探AR技术

初探AR技术 AR概述概念定义&#xff1a;技术手段&#xff1a;参考实例&#xff1a; AR解决方案AR SDKARKit简介扩展 ARCore简介ARCore 的工作原理优缺点 Vuforia简介优缺点 Wikitude简介 EasyAR简介优缺点 Web AR 总结本文参考 AR概述 概念定义&#xff1a; 增强现实&#xff…

论理想的AR/VR广告应该什么样?

广告在我们生活中无处不在&#xff0c;如果未来出现在AR/VR这种穿戴式设备上&#xff0c;要怎么做才更容易被人们接受&#xff1f;是否可以像概念片《Hyper-Reality》中描述的那样&#xff0c;将广告等可视化信息铺天盖地显示在我们眼前&#xff1f;还是要与AR/VR界面、内容自然…

如何用AR引擎技术, 5步优雅实现物体识别和跟踪

AR技术让应用实现虚拟世界和现实世界的融合&#xff0c;让开发者的创意和脑洞能够拥有更多炫酷有趣的呈现方式。AR拍照、AR购物、AR教育、AR搜索等丰富应用场景&#xff0c;凭借着AR技术的加持&#xff0c;为用户带来更优质的沉浸式体验&#xff0c;为用户创造更多价值。 例如…

主流AR眼镜参数对比、AR SDK最全功能特性对比

1、主流AR眼镜参数对比 最近有好多小伙伴分享了干货&#xff0c;成员LalaLand分享了一个目前市场主流AR眼镜参数对比&#xff08;扫码可查看原文&#xff09;: 1、Hololens 2 2、Magic Leap 1 3、Nreal Light 4、Spectacles 2021 2、移动AR SDK 功能特性最全比较 本次…

web端实现AR人脸特效

前言 直播、短视频、在线会议等应用越来越多地进入人们的生活&#xff0c;随之诞生的是丰富的各类创意玩法与新鲜体验&#xff0c;其中大量应用了以AI检测和图形渲染为基础的AR技术。 而随着Web技术的不断成熟&#xff0c;AR技术在Web上的实现成为了一种可能。今天就总结了在…

DataFunCon:2021热点技术和未来趋势预测

12月18-19日&#xff0c;由DataFun主办的DataFunCon 2021&#xff0c;将如期而至&#xff01;本次大会由百度深圳研发中心自然语言处理部技术总监 何径舟、腾讯云大数据产品中心研发副总经理 雷小平、腾讯信息平台与服务业务线AI算法负责人 文镇、达摩院人工智能科学家 杨红霞等…

未来计算的十大趋势预测,你觉得能中几条?

作者 | Adrian Mouat 译者 | 平川 本文最初发布于 Container Solutions WASM 将无所不在&#xff1a;编译目标、部署目标、IoT、插件生态系统。这是正在发生的事。&#xff08;1 到 5 年&#xff09; Rust 的流行度将继续增加&#xff0c;未来几年有望在 RedMonk 排行榜上超…

未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的

文章目录 前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题 前言 随着ChatGPT的爆火&#xff0c;生成式AI&#xff0c;大模型的人工智能被越来越多的人注意到&#xff0c;同时他也带…

2023年五大趋势预测 | 大数据分析、人工智能和云产业展望

随着我们迈入2023年&#xff0c;大数据分析、人工智能和云产业将迎来蓬勃的创新和发展阶段 以下是我们预测的&#xff0c;将对行业格局产生重大影响的五大趋势&#xff1a; 世界在剧变&#xff0c;我们需要尽快寻找行业中的方向&#xff0c;迅速重回轨道 2023年&#xff0c;全…