做好“关键基础设施提供商”角色,亚马逊云科技加快生成式AI落地

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中,「生成式AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。在几天前的亚马逊云科技纽约峰会中,「生成式AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

206ccfb5938647bd9266dbfd7fe1c3b1.png

 

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的AI能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式AI新功能。

 

最强的生成式AI大模型,在这里轻松调用

今年4月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

 

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具,再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中,汇聚了来自一批顶级大模型供应商的最新成果:

 

目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式AI,撬动了一个全新的蓝海市场。

 

推动生成式AI走完落地的「最后一公里」

在今天,即使生成式AI模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了Amazon Bedrock Agents。

 

Amazon Bedrock Agents可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式AI应用程序,推动解决生成式AI落地的「最后一公里」问题。比如,企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

 

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

 

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库,兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。

 

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

 

让生成式AI落地多重加速

在这些重磅发布之外,为了加速生成式AI的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

 

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比,Amazon EC2 P5实例使得训练最高提速6倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

 

 

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累,在于对于超过10万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程,帮助到每一位开发者或创业团队。

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的AI能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式AI新功能。

 

最强的生成式AI大模型,在这里轻松调用

今年4月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

 

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的AI算力和工具,再结合自己的数据开始构建生成式AI应用。

在最新扩展后的Amazon Bedrock中,汇聚了来自一批顶级大模型供应商的最新成果:

 

目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问控制和治理策略中受益。

生成式AI让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同Amazon Bedrock这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式AI,撬动了一个全新的蓝海市场。

 

推动生成式AI走完落地的「最后一公里」

在今天,即使生成式AI模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。这恰恰是「生成式AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如ChatGPT此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了Amazon Bedrock Agents。

 

Amazon Bedrock Agents可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式AI应用程序,推动解决生成式AI落地的「最后一公里」问题。比如,企业可以使用Amazon Bedrock Agents创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

 

生成式AI时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式AI时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

 

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库,兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于Amazon OpenSearch Serverless的向量引擎。该向量引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。

 

该引擎由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

 

让生成式AI落地多重加速

在这些重磅发布之外,为了加速生成式AI的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

 

很多业界知名的生成式AI模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式AI落地速度的因素之一。

与上一代基于GPU的实例相比,Amazon EC2 P5实例使得训练最高提速6倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达40%的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhispere会直接在Amazon Glue Notebooks中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

 

 

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去20年在人工智能技术上的深厚积累,在于对于超过10万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式AI落地的征程,帮助到每一位开发者或创业团队。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/80399.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「从零入门推荐系统」22:chatGPT、大模型在推荐系统中的应用

作者 | gongyouliu 编辑 | gongyouliu 提示:全文2.5万字,预计阅读时长2小时,可以先收藏再慢慢阅读。 我们在上一章介绍了chatGPT、大模型的基本概念、核心技术原理等基础知识,有了这些背景知识的铺垫,下面我们来介绍ch…

[C++项目] Boost文档 站内搜索引擎(2): 文档文本解析模块parser的实现、如何对文档文件去标签、如何获取文档标题...

项目开始的准备工作 在上一篇文章中, 已经从Boost官网获取了Boost库的源码. 相关文章: 🫦[C项目] Boost文档 站内搜索引擎(1): 项目背景介绍、相关技术栈、相关概念介绍… 接下来就要编写代码了. 不过还需要做一些准备工作. 创建项目目录 所有的项目文件肯定要在一…

Linux系统---进程控制

文章目录 进程创建进程终止进程等待进程替换实现简单的mini-shell 一、进程创建 1.fork()函数 在linux中fork函数时非常重要的函数&#xff0c;它从已存在进程中创建一个新进程。新进程为子进程&#xff0c;而原进程为父进程。 #include <unistd.h> pid_t fork(void…

数据结构日记之《队列的定义》

队列的定义 一、队列的定义和特点二、队列的抽象数据类型定义三、例子 一、队列的定义和特点 队列 (queue) 是一种 先进先出(First In First Out, FIFO) 的线性表。它只允许在表的一端进行插入&#xff0c;而在另一端删除元素。这和日常生活中的排队是一致的&#xff0c;最早进…

Storm学习之使用官方Docker镜像快速搭建Storm运行环境

文章目录 0.前言搭建完的效果 1.教程1.1.docker 安装 zookeeper1.2. 安装 storm nimbus1.3.docker 安装 supervisor1.4.docker 安装 storm-ui1.5.查看已经启动的容器1.6.提交topology到 storm集群 2.总结3.参考文档 0.前言 Apache Storm 官方也出了Docker 镜像 https://hub.do…

Bootload U-Boot分析

Bootloader是在操作系统运行之前执行的一段小程序。通过这段小程序可以初始化硬件设备、建立内存空间的映射表&#xff0c;从而建立适当的系统软硬件环境&#xff0c;为最终调用操作系统内核做好准备。 对于嵌入式系统&#xff0c;Bootloader是基于特定硬件平台来实现的。因此…

SSE技术和WebSocket技术实现即时通讯

文章目录 一、SSE1.1 什么是SSE1.2 工作原理1.3 特点和适用场景1.4 API用法1.5 代码实现 二、WebSocket2.1 什么是WebSocket2.2 工作原理2.3 特点和适用场景2.4 API用法2.5 代码实现2.6 心跳检测 三、SSE与WebSocket的比较 当涉及到实现实时通信的Web应用程序时&#xff0c;两种…

记录--说一说css的font-size: 0

这里给大家分享我在网上总结出来的一些知识&#xff0c;希望对大家有所帮助 平常我们说的font-size&#xff1a;0&#xff1b;就是设置字体大小为0对吧&#xff0c;但是它的用处不仅仅如此哦&#xff0c;它还可以消除子行内元素间额外多余的空白&#xff01; 问题描述&#xff…

芒格之道——查理·芒格股东会讲话1987-2022

你越是认真生活&#xff0c;你的生活就会越美好&#xff01; 这里将读书过程划线的内容摘抄在这里&#xff0c;方便自己回顾。 书分为两部分&#xff0c;我先读了后半部分&#xff0c;而且是从后往前读&#xff0c;到了前半部分&#xff0c;我是从前往后读。书还挺贵&#xff…

K8S系列文章 之 容器存储基础 Volume

Volume Volume是容器数据卷。我们经常创建删除一些容器&#xff0c;但有时候需要保留容器中的一些数据&#xff0c;这时候就用到了Volume。它也是容器之间数据共享的技术&#xff0c;可以将容器中产生的数据同步到本地。实际就是把容器中的目录挂载到运行着容器的服务器或个人…

在 Ubuntu 上安装 Docker 桌面

Ubuntu 22.04 (LTS) 安装 Docker 桌面 要成功安装 Docker Desktop&#xff0c;您必须&#xff1a; 满足系统要求拥有 64 位版本的 Ubuntu Jammy Jellyfish 22.04 (LTS) 或 Ubuntu Impish Indri 21.10。对于非 Gnome 桌面环境&#xff0c;必须安装 gnome-terminal&#xff1a;…

Docker 安装 Tomcat

目录 一、查看 tomcat 版本 二、拉取 Tomcat Docker 镜像 三、创建 Tomcat 容器 四、访问 Tomcat 五、停止和启动容器 一、查看 tomcat 版本 访问 tomcat 镜像库地址&#xff1a;https://hub.docker.com/_/tomcat&#xff0c;可以通过 Tags 查看其他版本的 tomcat; 二、拉…

FreeRTOS的线程间通信

一、分类 FreeRTOS的线程间通信分为这几大类 由于我还在学习中&#xff0c;目前显从信号开始记录学习 二、逐块讲解 1、信号&#xff08;osSignalWait osSignalSet&#xff09; FreeRTOS从V8.2.0版本开始提供任务通知这个功能&#xff0c;每个任务多有一个32位的通知值&am…

windows环境下如何更改pip安装的默认位置

1.查看配置信息 python -m site2.查看配置文件位置 python -m site -help3.修改配置文件 USER_SITE "D:\\soft\\Anaconda\\Lib\\site-packages" USER_BASE "D:\\soft\\Anaconda\\Scripts"如果遇到文件无法保存情况&#xff0c;请给用户增加权限。 4.…

第十五章 定义 HL7 的 DTL 数据转换

文章目录 第十五章 定义 HL7 的 DTL 数据转换 第十五章 定义 HL7 的 DTL 数据转换 每个接口可能需要一定数量的数据转换。创建转换时&#xff0c;不要使用保留的包名称。 重要提示&#xff1a;请勿在数据转换中手动更改 HL7 转义序列&#xff1b;自动处理这些。 可以使用“数…

DNS部署与安全详解(上)

文章目录 一、DNS二、域名组成1. 域名组成概述2. 域名组成 三、监听端口四、DNS解析种类1. 按照查询方式分类&#xff1a;2. 按照查询内容分类&#xff1a; 五、DNS服务器搭建过程1. 先确保服务器的IP地址是固定的2. 安装DNS软件 一、DNS DNS全称Domain Name Service&#xff0…

pycharm打开terminal报错

Pycharm打开终端报错如何解决&#xff1f;估计是终端启动conda不顺利&#xff0c;需要重新设置路径。参考以下文章的做法即可。 Windows下Pycharm中Terminal无法进入conda环境和Python Console 不能使用 给pycharm中Terminal 添加新的shell&#xff0c;才可以使用conda环境 W…

前端安全XSS和CSRF讲解

文章目录 XSSXSS攻击原理常见的攻击方式预防措施 CSRFCSRF攻击原理常见攻击情景预防措施&#xff1a; CSRF和XSS的区别 XSS 全称Cross Site Scripting&#xff0c;名为跨站脚本攻击。为啥不是单词第一个字母组合CSS&#xff0c;大概率与样式名称css进行区分。 XSS攻击原理 不…

Vue缓存字典值减少网络请求次数,解决同样参数并发请求多次

前言 在一些项目里&#xff0c;我们可能有着大量的下拉框&#xff0c;而这些下拉框的数据就来源于我们后端接口返回的字典信息。于是&#xff0c;画风可能是这样的&#xff0c;每次下拉&#xff0c;你都需要请求一次字典接口拿到这些数据&#xff0c;于是每次组件刷新都会重复…