大模型2024规模化场景涌现,加速云计算走出第二增长曲线

导读:2024,大模型第一批规模化应用场景已出现。

如果说“百模大战”是2023年国内AI产业的关键词,那么2024年我们将正式迈进“应用为王”的新阶段。

不少业内观点认为,2024年“百模大战”将逐渐收敛甚至洗牌,而大模型在千行万业的应用将从小规模试水,逐渐走向规模化落地。

展望2024,哪些场景更有可能率先实现大模型的规模化应用?

如果将大模型的应用场景分为互联网和政企两大类,基于产业观察,「智能进化论」认为:

在互联网领域,搜索增强、多媒体内容生成(AIGC推理)、智能NPC、量化投研有望成为第一批规模化应用的场景;

在政企领域,政企AI算力调度平台、智能驾驶、销售预测、柔性制造、国产化AI大模型中心等场景走得更快,同时中小企业大模型体验版也有相当大的潜力。

透过大模型在TOP场景的落地,我们不妨追问,这些场景之间有什么共同之处吗?谁在推动大模型跨越规模化应用的奇点?

TOP场景盘点,大模型下一个杀手级应用在哪?

——大模型在互联网领域的规模化应用场景——

在互联网领域,2023年国内诞生了众多聊天机器人、文生文、文生图AI应用。其实,从搜索引擎、多媒体内容到游戏,中国领先的移动互联网生态与大模型的碰撞藏着无限可能,大模型下一个杀手级应用也许就会从中诞生。

  • 搜索增强

搜索增强/检索增强生成技术(RAG)已成为当前最火热的LLM应用方案,被认为能够有效解决知识的局限性和时效性、幻觉等大模型应用的核心痛点。

此前大模型的知识来自训练数据集,而对实时性、非公开的或离线的数据是无法获取到的。搜索增强能够让大模型与实时互联网信息和垂直专业知识库连接,极大拓展了大模型的应用范围。

比如,过去搜索引擎通过关键词检索的方式返回结果,用户还需要花费大量时间精力去筛选原始网页和内容,才能找到想要的信息。通过搜索增强,大模型可以带来更精准的搜索结果,让搜索引擎变成集知识的发现、处理、分析和重新组织为一身的个人智能助理。

搜索增强同时具备检索和生成两种能力。如果将互联网信息比作一座拥有海量知识的图书馆,搜索增强融合了图书管理员和作家两种角色。图书管理员首先能够精准理解用户意图,然后快速从海量知识库中找到最相关的内容,再由作家将内容生成一个清晰易懂的答案,交付给用户。

搜索增强应用范围极广,包括搜索引擎网站、各类垂直APP内的搜索功能、千行百业的智能客服、企业内部知识库构建等等。

  • 多媒体内容生成(AIGC推理)

麦肯锡数据显示,中国生成式AI市场2020~2025年复合增速将达到84% ,2025年中国市场将占全球市场规模的14%。

多媒体内容生成是普通人最有感知的AI场景,也是大模型最火热的应用领域之一。2023年,从AI孙燕姿到妙鸭相机,多个热门AI应用和现象都来自这一场景。AIGC也推动了影像、设计相关领域公司收入大涨。譬如根据2023年上半年财报,在AIGC推动下,美图公司以VIP订阅为主的影像和设计产品业务成为第一大收入,公司实现净利润同比增长320.4%。

多模态大模型提供的文生图、图生图、文生视频、文生3D、数字人生成等能力,能够快速、生成海量高质量创意内容,颠覆了内容产业的商业模式。此外,大模型结合AI增强、云渲染等技术,还能广泛应用于生成高分辨率图片和视频、噪点消除、老片修复和上色、高精度3D建模和3维重建等场景。

值得注意的是,2023年5月几名B站UP主基于开源模型推出的AI孙燕姿,通过AI歌手演绎翻唱歌曲获得了巨大关注度。这也说明大模型爆款应用,可能不一定来自大公司,也有可能来自初创企业甚至技术达人。

  • 智能NPC

传统游戏中,NPC就像工具人,只能按部就班运行早已设定好的指令。如果NPC变成一个个智能体,具备不同的思想、性格和记忆,游戏世界该有多么精彩?是不是有种《西部世界》的感觉?

在大模型加持下,智能NPC能够在与玩家的交互过程中不断进化,发展出独特的游戏剧情,推动整个游戏世界的自我发展,重塑玩家体验。

目前,Ubisoft、网易等头部游戏公司已经尝试应用智能NPC。2023年,Open AI收购了一家名为Global Illumination的游戏公司,看重的正是其用ChatGPT驱动每个NPC角色的能力。

更重要的是,智能NPC让人们看到大模型+游戏产业背后更大的想象力,未来游戏中的其他元素,会不会也逐渐向AI生成的方向发展?

  • 量化投研

量化投研是指金融机构通过分析大量金融和市场数据,预测市场走势与价格波动,从而提供投资策略和建议。然而金融市场瞬息万变,传统的投研工作面临信息爆炸、数据碎片化、预测准确率低、时效性差等挑战。

大模型投研工具成为金融行业提升投研效率的新解法。2023年已有多家金融科技平台推出大模型投研工具,让投研工作更高效更轻松。量化投研大模型可以通过分析市场行情、量价关系、研究报告、企业财报、舆情和热点等海量数据,为专业人士快速提供投资组合建议和风险管理策略。

——大模型在政企领域的规模化应用场景——

大模型在政企领域的热门应用场景在政企领域,那些率先实现规模化应用的场景将围绕政企客户、重点行业与中小企业展开。

比如,政企AI算力调度平台能够实现本地算力与云上算力的统一管理调度,国产化AI大模型中心为政企客户提供从芯片到平台应用全栈自主可控的基础设施。

在新能源汽车、新零售、新制造等产业,智能驾驶、销售预测、柔性制造是大模型的热门落地场景。

为降低中小企业使用大模型的资金、技术、人才门槛,中小企业大模型体验版可以让中小企业通过快速训练推理出适合自己的大模型,实现跨越式发展。

云计算,大模型走向规模化应用的必经之路

尽管上述场景分散在各行各业,但如果非要找出这些场景的共同点,它们背后都有同一个不可忽视的驱动力,那就是云计算。

观察最头部的大模型应用创新,从ChatGPT到MidJourney,不难发现一流的大模型初创公司都背靠强大的云厂商。

如今,大模型领域的竞争已经转化为“云+AI”的体系化技术竞争。尤其是当大模型步入规模化应用阶段,云计算已经成为AI大模型创新发展的土壤。换句话说,大模型在千行万业能不能用得好,关键在于云计算。

我们也是时候重新认识云计算对于AI的价值了。

首先,弹性、可靠、高效的云上算力支持

大模型是算力无底洞,此前业界曾预测OpenAI训练GPT-4可能使用了大约10000-25000张GPU,这背后离不开微软云上算力的支撑。而且,大模型不仅需要海量算力,还要求算力具备灵活、弹性、可靠、高效等特性,云计算可以给到最佳解决方案。

国内云上AI算力供给,不得不提到华为云。华为云在贵安、乌兰察布、芜湖3大AI云算力中心及30多分节点,能够为企业提供澎湃昇腾AI算力。目前,昇腾AI算力可实现千卡训练30天长稳率达到90%,训练作业故障自动恢复,非自动场景下恢复时长小于30分钟,为千行百业使用大模型提供了稳定可靠、高质量的云底座。

此外,云上AI算力的可用性也是中国AI企业面临的新挑战。面对美国商务部抛出的“云上AI算力禁令”,华为云提供了充沛的昇腾算力,大大降低了中国企业云上AI算力被卡脖子的风险。

其次,基于系统级优化能力,实现降本增效

大模型也是吞金兽。大模型要想取得突破,消耗的算力资源每3-4个月就要翻一番。不久前,马斯克称参与AI军备竞赛的企业每年需要在AI硬件上投入数十亿美元,才能保持竞争力。

云计算是解决大模型成本问题的必由之路。一方面,云计算可以通过容器或Serverless技术,能够极大提升资源的复用率,让客户无需为闲置资源付费。另一方面,近年来云计算还在不断产生大量细分领域技术创新,专门针对AI、大模型的降本增效而生。

以前面提到的搜索增强场景为例,要构建搜索大模型增强能力,需要海量数据和AI算力资源,资金和时间成本巨大。解决这些痛点必须靠云基础设施层面的系统性优化。比如,华为云SFS Turbo可以大幅提升数据加载、训练数据读取速度,而且故障备份恢复快,实现千亿大模型ckpt文件秒级保存,让企业省钱更省心。华为云ModelArts AI加速套件,通过AI训练组网、集合通信算子及训练框架优化,可实现6千卡集群并行训练性能领先业界30%。

在AIGC场景下,华为云针对该场景的算子优化,能将整体性能提升30%。在某客户案例中,将图像生成模型迁移到昇腾后,通过AIGC生成一张图片的时间从6.2秒减少到5.2秒,并且通过AI渲染加速可以提升渲染效率2-4倍,大幅降低了内容生成时间和成本。


第三、海量AI应用创新的平台

云服务商不仅是底层资源的提供者,也是创新服务的构建者。如今越来越多的云厂商在MaaS新商业模式下不断探索,将AI和大模型能力作为创新云服务对外赋能。

比如,高峰期智能NPC每天都要面临海量玩家的实时交互,这让智能NPC对实时交互的时延和推理算力弹性扩缩容要求非常高。华为云与网易伏羲进行联合创新,通过网易伏羲构AI多云平台与华为云昇腾AI云服务的适配,在算子层和框架层进行大量性能优化。满足了交互场景的秒级时延要求,让智能NPC做到“忙时不慌,闲时不废”,保障了各时段玩家的体验。

Cloud for AI,云厂商破局的新机会

AI已经成为云计算产业发展的第二增长曲线。

得益于AI技术的发展,全球云计算行业实现再次加速。Synergy Research数据显示,全球企业2023年四季度在云计算的总支出达740亿美元,环比增长56亿美元,环比增速创下历史新高。预计2023年全球云计算行业收入将达到2700亿美元。

Synergy分析师John Dinsdale表示:“云计算是一个规模很大的市场,需要付出很大努力才能获得进展,但人工智能已经做到了这点。”他认为,在AI的助力下,接下来云计算市场规模还会继续增长。

2023年,大模型与生成式AI的火爆,让一个大趋势日益明晰:未来,几乎所有应用都会接入AI/大模型能力,我们将迎来一个AI原生应用的时代。

大模型给千行万业带来了新的生产方式、交互方式、业务范式、商业模式,未来各个产业对AI的需求(包括大模型产业链、云上算力、生成式AI)一定是大规模增长,这也给云计算产业带来了新的增长点。

在这样的大趋势下,Cloud for AI不仅是云厂商的新机会,也是必答题。纵观全球头部云厂商,都在探索如何基于AI重塑云计算技术和服务体系,开辟出全新的服务场景和服务内容。

国际云厂商方面,微软是AI助力云业务腾飞的典型案例。在2024财年第二财季(截至2023年12月31日),微软智能云Azure和其他云业务实现营收同比增长30%。目前,在微软智能云的5.3万名客户中,有三分之一都是2023年新加入的。

在国内,华为云则是Cloud for AI的深度践行者。华为云提供了从昇腾AI云服务、盘古系列大模型以及一系列AI研发工具套件在内的完整AI全栈技术平台。可以预见的是,在Cloud for AI的时代,AI将成为华为云一张独特的名片。

过去,大模型高高在上,很难落地。在经过一番痛苦的摸索与实践后,人们才发现,大模型落地的解法不在大模型本身,而在Cloud for AI。当Cloud for AI已就绪,当第一批TOP场景诞生,大模型才能真正驶向规模化应用的广阔星空。

文中图片来自摄图网

END

本文为「智能进化论」原创作品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/254053.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHPExcel导出excel

PHPExcel下载地址 https://gitee.com/mirrors/phpexcelhttps://github.com/PHPOffice/PHPExcel 下载后目录结构 需要的文件如下图所示 将上面的PHPExcel文件夹和PHPExcel.php复制到你需要的地方 这是一个简单的示例代码 <?php$dir dirname(__FILE__); //require_once …

YOLOv8改进 | 利用训练好权重文件计算YOLOv8的FPS、推理每张图片的平均时间(科研必备)

一、本文介绍 本文给大家带来的改进机制是利用我们训练好的权重文件计算FPS,同时打印每张图片所利用的平均时间,模型大小(以MB为单位),同时支持batch_size功能的选择,对于轻量化模型的读者来说,本文的内容对你一定有帮助,可以清晰帮你展示出模型速度性能的提升以及轻量…

基于Chrome插件的Chatgpt对话无损导出markdown格式(Typora完美显示)

刚刚提交插件到Chrome插件商店正在审核&#xff0c;想尝试的可以先使用&#xff1a; https://github.com/thisisbaiy/ChatGPT-To-Markdown-google-plugin/tree/main 我将源代码上传至了GitHub&#xff0c;欢迎star, IssueGoogle插件名称为&#xff1a;ChatGPT to MarkDown plus…

黑马头条 Kafka

我是南城余&#xff01;阿里云开发者平台专家博士证书获得者&#xff01; 欢迎关注我的博客&#xff01;一同成长&#xff01; 一名从事运维开发的worker&#xff0c;记录分享学习。 专注于AI&#xff0c;运维开发&#xff0c;windows Linux 系统领域的分享&#xff01; 知…

ArcGIS学习(六)地理数据库

ArcGIS学习(六)地理数据库 上个任务我们讲了一个非常重要的知识点一一坐标系。这个任务我们带来另外一个很重要的知识点一一地理数据库。 地理数据库的内容相比于坐标系简单很多! 首先,先让我们来学习下地理数据库的理论。 ArcGIS 中的地理数据库(Geodatabase)是一个用…

蓝桥杯训练-Huffman树(哈夫曼树)(day14)

一、题目 Huffman树在编码中有着广泛的应用&#xff0c;在这里&#xff0c;只关心Huffman树的构造过程。 给出一列数{pi}{p0,p1,...pn-1},用这列数构造Huffman树的过程如下&#xff1a; 1.找出{pi}中最小的两个数&#xff0c;设为pa和pb,将pa和pb从{pi}中删除&#xff0c;然…

【C#】.net core 6.0 设置根目录下某个文件夹可访问,访问创建的图片等资源

欢迎来到《小5讲堂》 大家好&#xff0c;我是全栈小5。 这是《C#》系列文章&#xff0c;每篇文章将以博主理解的角度展开讲解&#xff0c; 特别是针对知识点的概念进行叙说&#xff0c;大部分文章将会对这些概念进行实际例子验证&#xff0c;以此达到加深对知识点的理解和掌握。…

Fink CDC数据同步(六)数据入湖Hudi

数据入湖Hudi Apache Hudi(简称&#xff1a;Hudi)使得您能在hadoop兼容的存储之上存储大量数据&#xff0c;同时它还提供两种原语&#xff0c;使得除了经典的批处理之外&#xff0c;还可以在数据湖上进行流处理。这两种原语分别是&#xff1a; Update/Delete记录&#xff1a;H…

信创ARM架构QT应用开发环境搭建

Linux ARM架构QT应用开发环境搭建 前言交叉工具链Ubuntu上安装 32 位 ARM 交叉工具链Ubuntu上安装 64 位 ARM 交叉工具链 交叉编译 QT 库下载 QT 源码交叉编译 QT 源码 Qt Creator交叉编译配置配置 Qt Creator Kits创建一个测试项目 小结 前言 有没有碰到过这种情况&#xff1…

一文讲透Python函数中的形式参数和实际参数

函数参数包括形式参数和实际参数&#xff0c;简称形参和实参。其中形式参数即是在定义函数时函数后面括号中的参数列表&#xff08;parameterlist&#xff09;&#xff0c;比如上一个帖子的示例中的width, length&#xff1b;实际参数则是调用函数时函数后面括号中的参数值&…

Docker配置Portainer容器管理界面

目录 一、Portainer 简介 优点&#xff1a; 缺点&#xff1a; 二、环境配置 1. 拉取镜像 2. 创建启动容器 三、操作测试 1. 进入容器 2. 拉取镜像并部署 3. 访问测试 一、Portainer 简介 Portainer 是一个开源的轻量级容器管理界面&#xff0c;用于管理 Docker 容器…

开源免费的物联网网关 IoT Gateway

1. 概述 物联网网关&#xff0c;也被称为IOT网关&#xff0c;是一种至关重要的网络设备。在物联网系统中&#xff0c;它承担着连接和控制各种设备的重要任务&#xff0c;将这些设备有效地连接到云端、本地服务器或其他设备上。它既能够在广域范围内实现互联&#xff0c;也能在…

Docker部署前端项目

某次阿里云的自动流水线失败了&#xff0c;代码本地跑起来莫得问题&#xff0c;错误日志提示让我跑一下npm run build &#xff0c;但是俺忽然发现&#xff0c;我跑了&#xff0c;文件打包好了&#xff0c;但是往哪里运行呢&#xff1f;这涉及到要构建一个环境供打包文件部署吧…

RedissonClient妙用-分布式布隆过滤器

目录 布隆过滤器介绍 布隆过滤器的落地应用场景 高并发处理 多个过滤器平滑切换 分析总结 布隆过滤器介绍 布隆过滤器&#xff08;Bloom Filter&#xff09;是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是…

unity-ios-解决内购商品在Appstore上面已配置,但在手机测试时却无法显示的问题

自己这几天用 unity 2021 xcode 14.2 开发ios内购&#xff0c;appstore上面内购商品都已经配置好了&#xff0c;但是在手机里就是不显示&#xff0c;最后才发现必需得满足以下条件才行&#xff1a; 1. Appstore后台 -> 内购商品 -> 商品状态必需为『准备提交』以上状态…

Docker部署Grafana+Promethus监控Mysql和服务器

一、Grafana部署所需资源 Grafana 需要最少的系统资源&#xff1a; 建议的最小内存&#xff1a;512 MB建议的最低 CPU&#xff1a;1 官方文档&#xff1a;https://grafana.com/docs/grafana/latest/getting-started/build-first-dashboard/ 可以看到&#xff0c;我的这台服务…

放假--寒假自学版 day1(补2.5)

fread 函数&#xff1a; 今日练习 C语言面试题5道~ 1. static 有什么用途&#xff1f;&#xff08;请至少说明两种&#xff09; 1) 限制变量的作用域 2) 设置变量的存储域 2. 引用与指针有什么区别&#xff1f; 1) 引用必须被初始化&#xff0c;指针不必。 2) 引用初始…

Android中设置Toast.setGravity()了后没有效果

当设置 toast.setGravity()后&#xff0c;弹窗依旧从原来的位置弹出&#xff0c;不按设置方向弹出 类似以下代码&#xff1a; var toast Toast.makeText(this, R.string.ture_toast, Toast.LENGTH_SHORT)toast.setGravity(Gravity.TOP, 0, 0)//设置toast的弹出方向为屏幕顶部…

【Java八股面试系列】JVM-常见参数设置

目录 堆内存相关 显式指定堆内存–Xms和-Xmx 显式新生代内存(Young Generation) 显式指定永久代/元空间的大小 垃圾收集相关 垃圾回收器 GC 日志记录 处理 OOM JDK监控和故障处理工具总结 堆内存相关 Java 虚拟机所管理的内存中最大的一块&#xff0c;Java 堆是所有线…

汇编笔记 01

小蒟蒻的汇编自学笔记&#xff0c;如有错误&#xff0c;望不吝赐教 文章目录 笔记编辑器&#xff0c;启动&#xff01;debug功能CS & IPmovaddsub汇编语言寄存器的英文全称中英对照表muldivandor 笔记 编辑器&#xff0c;启动&#xff01; 进入 debug 模式 debug功能 …