联想详解AI导向基础设施 “软硬一体”赋能四大场景

 

9月25日,联想在杭州举办以“全栈智能 全程陪伴”为主题的新IT思享会,集中展示了联想基于新IT架构的全栈智能产品与服务,引领行业智能变革的强大实力。

当前,以ChatGPT为代表的AI模型席卷全球,不仅实现了AI技术质变性突破,还推动AI应用与产业融合,加速AI落地千行百业。

在此背景下,联想中国区基础设施事业部架构师耿太平在会上,重点详细解读了联想AI算力战略,以及具体落地实践。他表示:“在实际业务实践中,联想AI导向的基础设施聚焦大模型训练、训推一体、AI For Science和AI生成四大AI应用场景,提供软硬件整体方案来落地联想AI算力战略。”

f50e9d12e5bc4047a1cf7610f3ec7565.jpeg

(联想中国区基础设施事业部架构师耿太平)

锚定AI算力,聚焦四大场景打造AI导向基础设施

全球人工智能发展汹涌澎湃,算力规模不断攀升。截止2021年,中国的算力规模达到203EFLOPS,仅次于美国位居世界第二,年增长率为53%,高于全球平均的增长率10个百分点。会上,耿太平表示,目前AI算力规模已经超过通用算力,未来预计到2026年,仅中国的AI算力规模就会达到1271.4 EFLOPS,年复合增长率达52.3%,AI算力成为算力发展的主要方向。

面对日益增长的AI算力需求,联想在今年8月,正式发布AI算力战略,全面打造以AI为导向的算力基础设施。耿太平介绍道,联想AI算力战略具备AI赋智和绿色赋能两大特征。其中,AI赋智为,100%算力基础设施产品支持AI,50% 基础设施研发投入在AI领域,全面AI技术覆盖全域AI应用;绿色赋能是指,全面布局和引领液冷技术,打造液冷集群方案灯塔,以绿色算力基础设施助推智算产业可持续发展。

5f40ff91e24c4bf4924a60e0cb8aee99.jpeg(联想全面打造AI导向的基础设施)

AI算力战略引导下,耿太平分享称,在实际的业务实践中,联想推出了AI算力全栈全域框架,聚焦四大应用场景,提供软硬件的整体方案来推动AI战略不断落地。具体来看,联想不仅提供丰富的AI算力所需的基础设施,还通过整合不同算力需求的AI软件平台,高效覆盖大模型训练、训推一体、AI for Science和AI生成四大应用场景,从而更好地赋能AI行业生态。

耿太平进一步阐述道:“AI大模型训练服务器和AI训推一体服务器+Lenovo AI Master软件的方案,可以覆盖大模型训练和训推一体场景的应用;科学计算异构服务器+LiCO软件的组合,可以覆盖AI for Science场景的应用;AI生成服务器+NVIDIA OVE软件的组合,可以覆盖AI生成场景的应用。”

截至目前,联想已成为全球第三大AI基础设施和服务器供应商,全面覆盖云端、边缘算力场景,同时满足AI大模型和传统模型的训练、推理需求,并实现AI应用场景的深度覆盖,目前已实现智慧制造、智慧医疗、地质勘探等领域的应用。

澎湃算力,构筑坚实AI基础设施底座

AI通用大模型以燎原之势席卷全球,带动算力需求和参数量呈指数级增长,构建满足其发展的AI算力最为紧迫。

第一大场景是AI大模型训练。会上,耿太平分析称,Open AI最新GPT-4模型算力需求是GPT-3的59倍,模型参数量是GPT-3的10倍以上。为满足大规模数据训练需求,AI算力基础设施需具备纵向高性能扩展和横向灵活扩展能力。联想在今年8月推出的联想问天WA7780 G3 AI大模型训练服务器很好的满足了这一需求,具有澎湃性能巨幅提升、灵活架构按需配比和扩展不同算力等特点。

9eded98da52a42c380bb30e5b1661e33.jpeg

(联想问天 WA7780 G3 AI大模型训练服务器)

性能方面,该服务器可提供32PFLOPS的AI算力,支持高达400Gb/s的高性能网络,拥有高达640GB的HBM3高速显存。由于搭载的H800GPU相较上一代的GPU AI性能有高达3.44倍的提升,同时升级了第4代Tensor Core和 Transformer的引擎,使得大模型AI训练提升9倍,大模型AI推理性能提升30倍。灵活架构方面,该服务器通过采用了GPU Direct Storage (GDS) 技术,让GPU与NVMe直接进行数据的通讯,同时实现GPU与NVMe 灵活配比(1:1或2:1),大幅提高程序载入数据的速度,提升大模型训练的性能。

第二大场景是训推一体场景。为应对大模型推理和传统训练以及云游戏、模拟仿真等多元算力需求,联想问天WA5480 G3 AI 训推一体服务器可支持业界主流的PCle规格的AI加速卡,可以按照场景要求模块化配置GPU算力。该服务器还支持丰富生态,通过对系统拓扑和结构的兼容性设计以及软件的调优,可支持Intel、寒武纪、摩尔等多元AI芯片。此外,该服务器安全可靠,通过N+N冗余的电源设计和动态的软件监控,可确保无间断运行和稳定的性能。

可以看出,联想问天WA7780 G3 AI大模型训练服务器和WA5480 G3 AI 训推一体服务器专为AI大模型而生,满足AI大模型所需的数据训练和推理需求。耿太平还表示,两款服务器在保证高性能的同时实现了低功耗运行。其中,联想问天WA7780 G3 AI大模型训练服务器通过创新三层独立风道设计,根据不同的部件,散热特征进行优化,可以节省散热功耗1000瓦。

绿色算力,加速AI技术高效利用

除了AI大模型蓬勃发展, AI技术与产业融合带动AI应用不断落地掀起产业智能化变革。联想不仅聚焦通用人工智能领域,还看重AI与产业深度融合,致力于为行业智能化变革打造算力“新基建”。

第三大场景是AI for Science,科学计算和AI在加速融合。一方面AI算法科学应用实现了创新发展。如在气象领域,ForecastNet模型可将气象预测的速度提升4.5万倍。在生命科学领域,Alpha Fold2可以帮助科学家精准预测蛋白质的结构。另一方面,针对计算密集型应用,原来在CPU上的科学算法在不断向异构计算进行迁移,如材料科学领域的VASP和冷冻电镜RELION,因此当前科学计算算力基础设施既需要满足传统的科学计算,又需要兼顾日益增长的AI需求。

基于此,联想推出了科学异构计算服务器——联想Think System SD650-I V3。这款服务器可实现异构多元,CPU和GPU的比例是1:2,可以进行最佳的异构计算。此外,GPU的双精度算力单节点额可达到210TFLOPS,GPU之间可通过XeLink进行高速互联。该服务器还具有极致高密和绿色节能的特点:42U整机柜可以支持多达144颗GPU,提供7.5PFLOPS的双精度算力; PUE小于1.1, 全水冷设计,零噪音,可支持余热回收。

a06f1d9b13884efa804e483f8a0934b3.png

(联想Think System SD650-I V3)

最后一个是AI生成场景,即 AI生成技术与各行各业深度结合,在未来数字工厂、数字孪生地球、火势蔓延模拟、5G信号模拟等虚拟应用场景加速落地,不断刷新AI创新行业的想象力。而这些应用背后都需要强大的AI算力支持,逼真且低延迟的渲染能力、整合离散的设计工具和协同多人在线实时工作能力等。

联想在这些领域进行了领先布局,推出了AI生成OVX基础设施方案。该方案包含高速全闪存储(DSS-G)用于存放海量的数据、国内首款OVX3.0认证的AI生成服务器,OVX SR675 V3,搭载英伟达 Omniverse Enterprise软件一起来提供AI+渲染能力,同时可实现多种软件工具和多人多地的在线实时协作,还包含高速的交换机,为纵向和横向的扩展部署提供便利。

0843fd1cf15b40a3b201af03b4dcdf0d.png

(联想AI生成OVX基础设施方案)

耿太平表示,在AI浪潮下,AI正加速与产业融合推动智能生产力重塑产业。联想将以AI赋智、绿色赋能全面打造AI导向算力基础设施建设,为助力AI赋能行业提供源源不断的发展动能。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/142616.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电路常见的通信接口

1,TTL/232/485/422简介 串口 串口通信(Serial Communication), 是指外设和计算机间,通过数据信号线 、地线、控制线等,按位进行传输数据的一种通讯方式。是我们在硬件调试过程中最常见的一种通信方式。比如开发板和电脑之间,想要…

如何更改注册表使系统暂停更新时间延长

1、创建一个文本文件,命名为:“stopupdate.reg”,然后用记事本或者代码编辑器打开,复制以下代码: Windows Registry Editor Version 5.00[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\WindowsUpdate\UX\Settings] "F…

高手必备!电脑剪辑视频的实用方法

随着数码时代的到来,越来越多的人开始使用电脑剪辑视频。电脑剪辑视频不仅可以为日常生活留下美好回忆,还可以为专业人士提供更多的创作可能性。在本文中,我们将介绍两种电脑剪辑视频的方法,不需要专业技能,只需要一台…

嵌入式MCU都有什么高级用法?

嵌入式MCU都有什么高级用法? 您举的几个例子,确实是MCU外设的一些高端玩法。只是不知道您是否想过,既然这些机制是被 人设计出来的,那它就是种标准用法。从微控制器的发展历程来看,许多硬件机制都是有了实际 需求后才…

工业RFID识别设备可以在哪些行业应用?

工业识别设备主要是用于工业领域的RFID读写设备,它可以在产线、工厂、仓储物流等领域应用,非接触的实时读取标签信息,并且将读取的信息上传到电脑信息管理系统中。 工业RFID识别设备可以在哪些行业应用? 1、汽车行业 汽车制造业的产品结构复…

USB转换方案介绍

随着科技的不断发展,我们的生活中出现了越来越多的电子设备。然而,这些设备通常具有不同的连接端口和协议,这可能会使它们之间的连接变得困难。这时候,使用USB转换就成为了一种非常方便和实用的解决方法。 无论是在家庭、办公室还…

网络编程day03(UDP中的connect函数、tftp)

今日任务&#xff1a;tftp的文件上传下载&#xff08;服务端已经准备好&#xff09; 服务端&#xff08;已上传&#xff09; 客户端&#xff1a; 代码&#xff1a; #include <stdio.h> #include <string.h> #include <stdlib.h> #include <sys/types.h…

vue实现进度条+背景定位

最近在做一个数字孪生项目&#xff0c;用于展示地铁车辆的进场动画及部件&#xff0c;使用的vueunity&#xff0c;但是 unity模型在加载完成之前会有个加载进度条&#xff0c;页面背景色是黑色&#xff0c;中间只有个一进度条框 可以看到很单调很丑&#xff0c;并且客户也不满…

Linux上的Pip和Python升级指南

在Linux系统上&#xff0c;保持Pip和Python版本的最新状态对于顺利进行Python开发至关重要。通过升级Pip和Python&#xff0c;你可以享受到最新的功能、修复的bug以及提升的开发效率。本文将为你提供在Linux上升级Pip和Python的详细指南&#xff0c;助你打造更强大的开发环境。…

✔ ★ 算法基础笔记(Acwing)(六)—— 贪心【java版本】

贪心 一、 区间问题1. 区间选点2. 最大不相交区间数量3. 区间分组(用 堆top 代表区间 头头)POJ3614Sunscreen(优先队列贪心) 4. 区间覆盖 二、哈夫曼树1. 合并果子 三、排序不等式1. 排队打水 四、绝对值不等式货仓选址 五、推公式耍杂技的牛 一、 区间问题 1. 区间选点 原题…

气传导和骨传导耳机哪个好?气传导耳机好用吗?气传导耳机推荐

​气传导和骨传导耳机都是不入耳设计&#xff0c;骨传导是通过振动颅骨传达声音信号 骨传导耳机是一种能够通过振动颅骨来传达声音信号的耳机&#xff0c;其原理是利用骨传导技术&#xff0c;将声音信号通过颅骨传达到内耳&#xff0c;从而实现听觉效果&#xff0c;不过长时间佩…

YashanDB向量化执行引擎如何给海量数据分析提速

作者介绍&#xff1a;李伟超&#xff0c;数据库系统架构师&#xff0c;YashanDB架设技术开发负责人&#xff0c;10年以上数据库内核技术开发经验。 *全文4510个字&#xff0c;阅读时长约11分钟。 背景 海量数据OLAP场景&#xff0c;通常具有数据规模大、查询复杂度高、处理速…

9月27日星期三今日早报简报微语报早读

9月27日&#xff0c;星期三&#xff0c;早报简报微语早读分享。 1、兰州&#xff1a;拟明年起奖励医保参保人连续缴费&#xff0c;提高其住院报销比例&#xff1b; 2、中国民办教育协会&#xff1a;10月15日起全面禁止校外培训系误读误解&#xff1b; 3、山西修订未成年人保…

外包干了3个月,技术退步明显。。。。。

先说一下自己的情况&#xff0c;大专生&#xff0c;17年通过校招进入广州某软件公司&#xff0c;干了接近4年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…

根据命令行参数动态导入模块或文件

需求 在命令行运行一个 python 文件&#xff0c;同时传入自定义参数&#xff1a; $ python main.py --nodeTable --actioncreate --data"{name: test2, is_sys_obj: False, encoding: UTF8,datconnlimit: -1, variables: []"希望 main.py 接收命令行参数&#xff0…

Flutter笔记:滚动之-无限滚动与动态加载的实现

Flutter笔记 无限滚动与动态加载的实现 作者&#xff1a;李俊才 &#xff08;jcLee95&#xff09;&#xff1a;https://blog.csdn.net/qq_28550263 邮箱 &#xff1a;291148484163.com 本文地址&#xff1a;https://blog.csdn.net/qq_28550263/article/details/133342307 目 录…

Goby 漏洞发布|泛微 E-office flow_xml.php 文件 SORT_ID 参数 SQL 注入漏洞

漏洞名称&#xff1a;泛微 E-office flow_xml.php 文件 SORT_ID 参数 SQL 注入漏洞 English Name&#xff1a; Weaver E-office flow_xml.php file SORT_ID parameter SQL injection vulnerability CVSS core:7.8 影响资产数&#xff1a; 21632 漏洞描述&#xff1a; 泛微…

前端知识总结

在前端开发中&#xff0c;y x是一种常见的自增运算符的使用方式。它表示将变量x的值自增1&#xff0c;并将自增后的值赋给变量y。 具体来说&#xff0c;x是一种后缀自增运算符&#xff0c;表示将变量x的值自增1。而y x则是将自增前的值赋给变量y。这意味着在执行y x之后&am…

linux使用操作[2]

文章目录 版权声明网络传输ping命令wget命令curl命令端口linux端口端口命令和工具 进程管理查看进程关闭进程 主机状态top命令内容详解磁盘信息监控 版权声明 本博客的内容基于我个人学习黑马程序员课程的学习笔记整理而成。我特此声明&#xff0c;所有版权属于黑马程序员或相…

设计模式-迭代器模式

介绍 顺序访问一个集合使用者无需知道集合的内部结构&#xff08;封装&#xff09; 示例 常用的jQuery演示 <p>jquery each</p> <p>jquery each</p> <p>jquery each</p><script> var arr [1,2,3] var nodeList document.getEl…