科技云报到:人工智能时代“三大件”:生成式AI、数据、云服务

科技云报到原创。

就像自行车、手表和缝纫机是工业时代的“三大件”。生成式AI、数据、云服务正在成为智能时代的“新三大件”。加之全球人工智能新基建加速建设,成为了人类社会数字化迁徙的助推剂,让新三大件之间的耦合越来越紧密。从物理世界到数字世界跨越的分水岭已经出现。

4c1b78019d8fe41e3ce9ed6f3f776bcc.jpeg

近两年,以大模型为代表的生成式AI技术,成为引爆数字原生最重要的技术奇点,人们见证了各类文生应用的进展速度。Gartner预测,到2026年,超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用,这也将为产业发展带来巨大的机遇与挑战。

大模型、生成式AI的发展带动了人工智能领域的范式转换,推动人工智能基础设施建设进入密集投入期,投资规模、政策支持力度、产品应用规模均呈指数级增长。未来十年里,所有企业在战略里将充分利用三个原生(云原生、数字原生、AI原生)来颠覆自己的业务,构造自己的第二、第三增长曲线,重新编写自己的业务,在数字化时代实现企业跨越式的增长。


生成式AI在云端绽放盛开

毫无疑问,生成式AI已然成为当今技术发展和应用创新的重要引擎之一。

过去的一年多时间里,我们目睹了生成式AI是如何以移山倒海的力量,为诸多行业带来革命性乃至颠覆性的变革,帮助企业重塑生产力,已经对全球经济产生了显著的影响。

麦肯锡发布的《生成式人工智能的经济潜力:下一波生产力浪潮》报告显示,生成式AI能够大幅提高整个经济体的劳动生产率,每年为全球经济可以带来2.6万亿至4.4万亿美元的增长。

虽然,通用人工智能(AGI)的时代尚未到来,但生成式AI的未来已至,企业IT基础架构随之发生迭代革新。巨大算力增长背后其实是底层服务器、芯片、数据等重要能力的升级,而云正在重塑一切。

大模型如火如荼背后,底层的芯片、到中间的平台再到上层的应用,都与过去大为不同。如果企业继续采用传统的IT架构,CPU和加速器之间的接口会限制产品的性能水平,也就无法更好地支持生成式AI时代的新需求。同时,由AI模型带来的大量资源消耗,也是企业关注的重点问题。所以,满足未来需求的企业架构设计,一定会充分考虑到成本和可持续发展问题。

在中国市场,承载着生成式AI的智算服务正在为云计算塑造新的增长力。IDC最新发布的《中国智算服务市场(2024上半年)跟踪》报告显示,2024年上半年中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。其中,智算集成服务市场同比增长168.4%,市场规模达57.0亿元人民币;生成式AI IaaS市场同比增长203.6%,市场规模达52.0亿元人民币;Other AI IaaS市场同比缩减13.7%,市场规模为37.1亿元人民币。

目前,面向生成式AI的算力支出已经成为智算服务市场主阵地。以AI IaaS市场为例,生成式AI IaaS市场经历短短的一年半发展时间,市场规模就已经超过Other AI IaaS市场,占AI IaaS市场的比重达58%。在智算集成市场,增量新建的智算中心均是以生成式AI的未来需求为导向而设计的。

生成式AI不能单独创造价值,其工作负载的计算密集程度非常高,它需要底层更强大的数据和算力服务支持。因此,具有拥有高性价比的基础设施,是应用成功构建的关键要素之一。

另外,智能化系统之所以更具颠覆性,是因为在感知、理解、学习、推理、交互等方面具有更广泛的适应性,以及更友好的多模交互能力。所以,在架构设计上要充分考虑到可行性、可控性和通用性,才能满足多场景、多需求、多任务之间的快速切换。

智能化系统并不是只有一个大模型,架构设计者需要在根据不同业务场景的需求进行偏好对齐,具备多模索引、模型选择、模型算力调度和模型推理的能力。企业也要根据不同业务场景需求,以及不同技术支撑能力,选择适合的智能化架构升级路线。

AI交互的用户友好性、大模型开源及API价格的降低、插件服务带来的应用生态繁荣等,都使得AI技术或将成为像水、电、网络一样的基础设施,渗透并改变千行万业。

根据《2024年AIGC发展趋势报告》显示,在医疗领域,AI应用已能够精准辅助诊断,例如Google Health的深度学习模型,在乳腺癌筛查中的准确率已超越人类专家。利用强大的图像识别和模式分析能力,这些模型可以从成千上万的X光片中识别出极易被人眼忽视的细微变化。

金融领域也经历了由AI推动的变革。金融机构利用复杂的算法来预测市场趋势、管理风险,甚至自动执行交易。机器学习技术能够分析大规模的历史数据,识别出人类难以察觉的模式。例如,通过深度学习,AI可以在高频交易中捕捉到微小的市场变化,并在毫秒级做出反应,这是任何人类交易者所无法比拟的。

自动驾驶领域的AI应用,展示了AI能够在高度复杂和动态的环境中执行任务的能力。特斯拉Autopilot、谷歌Waymo,这些自动驾驶系统使用了先进的传感器阵列和AI算法,实现了车辆的自主导航和决策。它们的表现日益接近人类驾驶者,甚至在某些情境下超越了人类。


如何解锁生成式AI价值?

生成式AI的发展就像一场马拉松,现在还处于非常早期的阶段,不仅是一场长期竞争,更成为全球企业开展技术合作、携手探索未来科技世界的桥梁。

但具体到应用实践,在这场时代洪流中,企业应该怎么做?作为全球领先的云服务商,亚马逊云科技给出了自己的答案。

亚马逊云科技不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。只有这样全栈联动的大规模创新才能真正满足当今企业的发展需求,加速前沿技术的价值释放,助力各行各业重塑未来。

在近日举行的2024 re:Invent中国行北京站活动中,亚马逊云科技大中华区产品部总经理陈晓建表示,几乎所有的应用程序都可以分解成为几个核心的构建单元,亚马逊云科技所做的就是构建出非常优秀的核心单元,用户可以通过自由搭建这些核心单元,满足他们在特定场景下不同的业务需求。

490fdde0e54cec354b4319d25eba0d22.jpeg

亚马逊云科技大中华区产品部总经理陈晓建


陈晓建认为,2025年肯定会发生一个变化,很多企业将从原型验证阶段转化为生产阶段,这是必经之路。届时企业需求将更加复杂,不仅是选择模型,还需要各种技术支持。

今年,亚马逊云科技在生成式AI技术、数据战略及云服务三方面进行全面升级。生成式AI技术方面,亚马逊云科技全面强化基础设施、模型工具和应用三层技术栈,推出Amazon Nova系列基础模型,包括Nova Micro、Lite、Pro、Premier,以及专注于高质量图像生成的Nova Canvas和视频生成的Nova Reel,这些模型性能卓越且应用成本相比Amazon Bedrock中的顶尖模型降低至少75%。

去年4月,亚马逊云科技推出了第一代大模型Titan,只有语言单一模态。如果说Titan只是小试牛刀,那今天的Amazon Nova系列模型,是亚马逊的真本事和大动作。在这背后,亚马逊云科技有着怎样的考虑?

陈晓建表示,亚马逊云科技今年推出了包括六个不同定位模型的Nova系列,未来还会推出speech to speech和any to any等模型。推出这些模型的重点是为用户提供更好的选择,使其能与产品更好地结合,实现更好的集成。模型的推出基于逆向工作法,通过了解客户需求来确定,比如根据用户在Micro、Lite、Pro、Premier 等不同层面的诉求来构建模型,未来也会推出更多不同能力和定位的模型。

同时,亚马逊云科技还对Amazon SageMaker、Amazon Bedrock及Amazon Q等核心服务进行了强化,并提供更多样化的模型选项,深化应用场景的融合,降低训练与推理成本,致力于让企业更便捷、经济地将生成式AI技术融入业务实践,全面推动企业加快生成式AI的创新步伐。

Amazon Bedrock平台新增Luma AI和poolside模型,更新Stability AI的最新模型,并通过Bedrock Marketplace提供超过100个热门、新兴及专业模型的选择。此外,Bedrock还引入低延迟优化推理、模型蒸馏、提示词缓存等功能,显著提升推理效率,并通过GraphRAG等知识库功能增强数据利用能力,同时,自动推理检查功能和多智能体协作等创新也进一步增强AI的安全性和智能体的发展。

在底层模型训练方面,Amazon SageMaker AI的四项创新功能尤为引人注目,包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能,以及引入亚马逊云科技合作伙伴的热门AI应用。这些功能不仅帮助客户更快开始训练流行模型,还通过灵活的训练计划节省数周的时间,并将成本降低高达40%,为企业在生成式AI领域的探索提供强有力的支持。

针对数据战略,亚马逊云科技推出一系列创新举措,其中新一代Amazon SageMaker整合了数据、分析与AI功能,提供一站式解决方案,配备统一工作室,促进数据洞察与AI项目的协作。这些举措顺应客户将分析、机器学习和生成式AI融合以获取深度洞察的趋势,助力客户在数据驱动的时代中占据先机。

在云服务领域,亚马逊云科技在计算、网络、存储和数据库等核心领域不断突破。计算方面,推出搭载Trainium2和新型计算实例Amazon EC2 Trn2,以及专为万亿参数模型设计的实时推理超级服务器Amazon EC2 Trn2 UltraServers。存储服务方面,Amazon S3新增元数据功能,推出优化的S3 Tables存储类型,大幅提升查询和事务处理能力。数据库服务方面,推出无服务器分布式SQL数据库Amazon Aurora DSQL以满足客户跨多区域运行工作负载的高要求,并确保在多个区域间实现强一致性。这些更新,将为用户提供更强大的计算能力和更高效、更可靠的云服务体验,进一步巩固亚马逊云科技在云计算领域的领先地位。


生成式AI时代下的“底层架构师”

云服务是支持数字创新的关键生产力。不难发现,每一次技术进步的背后,云厂商都扮演着重要角色。

这一次AI浪潮背后,我们可以看见的是,云厂商为AI研发提供了基础设施、AI服务和应用工具,还在推动AI研究和实际应用方面发挥了积极作用。

亚马逊云科技即是如此。除了AI服务和应用工具,亚马逊云科技还为市场提供了丰富的计算资源和功能强大的云服务。

面对生成式AI时代带来的井喷式算力需求,亚马逊云科技通过自研芯片提供更好的性价比,通过各种丰富的计算、网络、存储等各种产品的组合优化算力成本,全面满足用户的多样化的算力需求。

云厂商不仅要扮演生成式AI时代的“底层架构师”,还必须克服数据安全和隐私保护等挑战,为用户提供安全、便捷的服务,使得生成式AI的应用能够更广泛、更深入地渗透到每一个行业和领域。

面对未来,我们期待云厂商能够持续发挥“底层架构师”的角色,引领生成式AI技术的发展,助力全社会发挥AI的巨大潜力。


【关于科技云报到】

企业级IT领域Top10新媒体。聚焦云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。原创文章和视频获工信部权威认可,是世界人工智能大会、数博会、国家网安周、可信云大会与全球云计算等大型活动的官方指定传播媒体之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/497766.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Node项目——从0开始构建且共享至Gitee

从0开始构建一个Node.js项目涉及多个步骤,包括设置开发环境、初始化项目、安装依赖、编写代码以及配置版本控制等。以下是一个详细的步骤指南: 1. 安装Node.js和npm 首先,确保你已经安装了Node.js和npm(Node Package Manager&am…

LabVIEW故障诊断中的无故障数据怎么办

在使用LabVIEW进行故障诊断时,可能会面临“无故障数据”的情况。这种情况下,缺乏明确的故障参考,使得系统难以通过传统对比法进行故障识别。本文将介绍应对无故障数据的关键策略,包括数据模拟、特征提取和基于机器学习的方法&…

3_TCP/IP连接三次握手与断开四次挥手

TCP/IP 通信是网络通信的基础协议,分为以下主要步骤: 1、建立连接(三次握手) 目的:保证双方建立可靠的通信连接。 过程: 1>客户端发送 SYN:客户端向服务器发送一个 SYN(同步&…

【黑马头条训练营】day02-黑马头条-App端文章展示

目录 描述app端首页从请求到数据显示的全部流程 描述文章微服务的组成及首页展示业务与实现 自己编写文章微服务关键逻辑 描述app端首页从请求到数据显示的全部流程 浏览器请求我们的app端 会通过nginx请求到我们app前端 app端输入手机号和密码 点击登录 请求 会到我们的…

算法进阶:贪心算法

贪心算法是一种简单而直观的算法思想,它在每一步选择中都采取在当前状态下最优的选择,以期望最终得到全局最优解。贪心算法通常适用于一些具有最优子结构的问题,即问题的最优解可以通过一系列局部最优解的选择得到。 贪心算法的基本思路是&a…

Windows 使用 非安装版MySQL 8

1.下载MySQL 8 https://cdn.mysql.com//Downloads/MySQL-8.0/mysql-8.0.40-winx64.zip 2.创建my.ini 下载解压后,发现根目录没有my.ini文件,需手动创建 my.ini # For advice on how to change settings please see # http://dev.mysql.com/doc/refma…

hadoop搭建

前言 一般企业中不会使用master slave01 slave02来命名 vmware创建虚拟机 打开vmware软件,新建虚拟机 典型 稍后安装系统 选择centos7 虚拟机名称和安放位置自行选择(最小化安装消耗空间较少) 默认磁盘大小即可 自定义硬件 选择centos7的i…

教师管理系统

大概功能: 1.显示所有教师 2.按姓名查找教师 3.按工号查找教师 4.增加教师 5.删除教师 6.退出 数据会保存到 txt 文件里面 姓名:必须是中文 手机号码:必须是11位,必须是数字 效果展示: 代码展示: Teache…

LLaMA详解

LLaMA 进化史 大规模语言模型(Large Language Model, LLM)的快速发展正在以前所未有的速度推动人工智能(AI)技术的进步。 作为这一领域的先行者, Meta在其LLaMA(Large Language Model Meta AI)系列模型上取得了一系列重大突破。 近日, Meta官方正式宣布推出LLaMA-3, 作为继LL…

BAPI_BATCH_CHANGE在更新后不自动更新批次特征

1、问题介绍 在CL03中看到分类特性配置了制造日期字段,并绑定了生产日期字段MCH1~HSDAT MSC2N修改批次的生产日期字段时,自动修改了对应的批次特性 但是通过BAPI:BAPI_BATCH_CHANGE修改生产日期时,并没有更新到批次特性中 2、BAPI…

JVM简介—3.JVM的执行子系统

大纲 1.Class文件结构 2.Class文件格式概述 3.Class文件格式详解 4.字节码指令 5.类的生命周期和初始化 6.类加载的全过程 7.类加载器 8.双亲委派模型 9.栈桢详解 11.方法调用详解 12.基于栈的字节码解释执行引擎 1.Class文件结构 (1)Java跨平台的基础 字节码是各…

【学生管理系统】权限管理之角色管理

目录 6.3 角色管理 6.3.1 查询所有角色 6.3.2 核心2&#xff1a;给角色授予权限(菜单) 6.3.3 添加角色 6.3 角色管理 6.3.1 查询所有角色 1&#xff09;后端【已有】 2&#xff09;前端 要求&#xff1a;左右分屏 <template><div><el-row><el-c…

ArrayList 和LinkedList的区别比较

前言 ‌ArrayList和LinkedList的主要区别在于它们的底层数据结构、性能特点以及适用场景。‌ArrayList和LinkedList从名字分析&#xff0c;他们一个是Array&#xff08;动态数组&#xff09;的数据结构&#xff0c;一个是Linked&#xff08;链表&#xff09;的数据结构&#x…

深度学习笔记(4)——视频理解

视频理解 视频理解的问题:视频太大了 解决方案:在切片上训练,低FPS,低分辨率 测试的时候:在不同的clips上运行模型,取平均预测结果 视频由图片序列组成: 单帧CNN模型 训练普通的2D CNN模型,对每一帧进行分类&#xff0c;通常是视频分类的一个非常强的基线方法。 Late Fusio…

前端项目 npm报错解决记录

1.首先尝试解决思路 npm报错就切换yarn &#xff0c; yarn报错就先切换npm删除 node_modules 跟 package-lock.json文件重新下载依 2. 报错信息&#xff1a; Module build failed: Error: Missing binding D:\vue-element-admin\node_modules\node-sass\vendor\win32-x64-8…

【AI大模型】探索GPT模型的奥秘:引领自然语言处理的新纪元

目录 &#x1f354; GPT介绍 &#x1f354; GPT的架构 &#x1f354; GPT训练过程 3.1 无监督的预训练语言模型 3.2 有监督的下游任务fine-tunning &#x1f354; 小结 学习目标 了解什么是GPT.掌握GPT的架构.掌握GPT的预训练任务. &#x1f354; GPT介绍 GPT是OpenAI公…

elasticsearch-java客户端jar包中各模块的应用梳理

最近使用elasticsearch-java客户端实现对elasticsearch服务的Api请求&#xff0c;现对elasticsearch-java客户端jar包中各模块的应用做个梳理。主要是对co.elastic.clients.elasticsearch路径下的各子包的简单说明。使用的版本为&#xff1a;co.elastic.clients:elasticsearch-…

前后端分离(前后端交互步骤)

1.设计数据库 /*Navicat Premium Data Transfer ​Source Server : localhost_3306Source Server Type : MySQLSource Server Version : 80037 (8.0.37)Source Host : localhost:3306Source Schema : studymysql ​Target Server Type : MySQL…

【VulnOSv2靶场渗透】

文章目录 一、基础信息 二、信息收集 三、漏洞探测 四、提权 一、基础信息 Kali IP: 192.168.20.146 靶机IP&#xff1a;192.168.20.152 二、信息收集 nmap -sS -sV -p- -A 192.168.20.152 开放了22、80、6667等端口 22端口&#xff1a;openssh 6.6.1p1 80端口&…

无需训练!多提示视频生成最新SOTA!港中文腾讯等发布DiTCtrl:基于MM-DiT架构

文章链接&#xff1a;https://arxiv.org/pdf/2412.18597 项目链接&#xff1a;https://github.com/TencentARC/DiTCtrl 亮点直击 DiTCtrl&#xff0c;这是一种基于MM-DiT架构的、首次无需调优的多提示视频生成方法。本文的方法结合了新颖的KV共享机制和隐混合策略&#xff0c;使…