如何夯实数字经济时代的算力基石?

如今,快速发展的数字经济与数字产业正在成为经济增长的新动能。根据第三方研究报告:2021年中国数字经济规模已经达到45.5万亿元人民币,占中国国内生产总值的39.8%。而以人工智能、大数据、边缘计算、并行计算、元宇宙为代表的新兴信息技术,正在成为加速数字产业增长以及实体经济动力切换的推动力。这些新兴技术产业化落地的背后,都离不开算力的支撑。

a7712a8f7ad0c3ec59526b7da145b9ae.png

12月22日,戴尔科技集团、中国信通院和英伟达共同举办了“数字经济时代的算力基石”主题网络研讨会,多位AI、HPC领域技术专家共同探讨了数字时代的算力推进方式。

走进戴尔科技集团AI&HPC创新实验室

首先,来自戴尔科技集团数据中心业务部的企业技术架构师吴跃向大家介绍了戴尔科技集团AI&HPC创新实验室的情况。

c5b0f6b9c2c6feef3d03967d0d3c458f.png

戴尔科技集团数据中心业务部企业技术架构师 吴跃

戴尔科技集团AI&HPC创新实验室汇集了全球各地的AI&HPC领域技术精英,他们的工作聚焦于AI计算、并行计算的前沿技术研究、效能基准测试、戴尔科技就绪解决方案、技术白皮书,以及通过实验室的CPU&GPU计算资源,帮助用户针对自身的算法和应用软件进行个性化测试与优化。同时,AI&HPC创新实验室的专家团队也在与NVIDIA、Intel、AMD、Vmware、Ansys、Altair等全球战略合作伙伴进行深入的技术研究与解决方案合作,将最新的硬件和软件技术融入到戴尔科技AI与HPC解决方案中。

Ratter是戴尔AI&HPC创新实验室打造的GPU超算集群,目前已有超过300张NVIDIA高端GPU加速卡的计算集群规模。在2021年全球HPC Top500排名中,Ratter GPU集群位列第233位。戴尔很多AI以及使用GPU加速的HPC解决方案(如CAE、分子动力学、生命科学等)都是在Ratter集群上首先进行测试和优化的。

戴尔科技AI就绪解决方案是基于Dell基础设施产品与解决方案,与AI软件及应用特点相结合,为用户提供预验证、一体化的就绪解决方案。在该解决方案的基础上,通过戴尔科技中国AI战略合作伙伴生态,以及精选的AI软件平台与行业应用合作伙伴,戴尔科技集团可以为国内用户构建AI平台,以及制造、零售、教育等行业AI场景提供更全面、本土化的工程化落地方案。

190d4fc3d52ec72af4e87b93aba3f66e.png

在HPC领域,AI&HPC创新实验室持续跟进HPC在数值计算、网络通信、数据存储的最新技术,为用户提供HPC ready solution就绪的解决方案。在行业及技术应用方向上,Dell HPC团队重点关注制造业、生命科学、科学研究、人工智能与HPC的结合。同时,AI&HPC创新实验室还推出了面向EDA的Dell HPC就绪解决方案,面向数字设计与仿真验证的HPC就绪解决方案等。

吴跃表示,一直秉承着开放性理念的AI&HPC创新实验室还建立了Dell AI&HPC技术论坛、Dell HPC社区;戴尔科技会在其中分享最新研究成果、技术白皮书、解决方案以及技术博客,对这些内容感兴趣的朋友们都可以加入其中,下载资料,与大家进行技术沟通。

AI、HPC与元宇宙的算力基石

在圆桌论坛环节,在戴尔科技集团大中华区企业技术架构总监许良谋的主持下,中国信通院技术与标准研究所互联网中心副主任、算网融合产业及标准推进委员会秘书长穆琙博,戴尔科技集团中国研究院高级主管科学家李三平,以及英伟达解决方案架构师黄煜,围绕 “AI、HPC与元宇宙的算力基石”话题展开了分享和讨论。

71cf2a1667d3374e0712203a6849b4af.png

戴尔科技集团大中华区企业技术架构总监许良谋

信息技术应用普及加速算力升级

穆琙博指出,当前5G、云计算、大数据等新一代信息通信技术加速创新,行业应用场景日益丰富,海量数据与复杂应用处理需求进一步驱动算力规模不断扩大,加速了算力技术创新升级。从算力设备、算力园区到端到端的算力服务,算力已经成为数字经济时代新的生产力,对于推动科技进步、行业数字化升级,以及经济社会发展具有非常重要的作用。根据中国信通院发布的《中国算力发展指数白皮书》预测,在算力方面每投入1元,将带动3-4元的经济产出。

2f43816d72d90292f1c1c928c006ea8e.png

中国信通院技术与标准研究所互联网中心副主任

算网融合产业及标准推进委员会秘书长穆琙博

谈到AI时,李三平介绍,在世界杯比赛中使用的半自动化越位技术(SAOT),就是AI在体育行业中的典型应用。近几年戴尔科技集团也在与国家赛艇协会、皮划艇协会、国家队的人体运动表现和健康发展中心合作,把AI、大数据、边缘计算、流式数据处理技术应用在运动场景中。如在赛艇队的日常训练中,会用摄像头去捕捉运动员的姿态,在边缘端进行实时的数据分析,并应用AI、智能视频分析技术结合生物力学知识,对运动训练动作的力度、角度和稳定性偏差进行实时分析与评判,将分析结果实时反馈给教练员和运动员,从而起到辅助训练的作用。整个业务场景会对边缘端和数据中心端提出很多技术挑战,必然会用到AI、高性能计算的算力,也有使用到戴尔AI、边缘计算、流式数据计算、服务器、存储相关产品与解决方案。

18394c6698d3ab8f5b24118fd04e0e74.png

戴尔科技集团中国研究院高级主管科学家李三平

黄煜表示,除了体育行业,AI也正越来越多应用在零售行业中,如顾客可以通过AI进行人脸识别,以无接触式的支付方式购买商品;商家则可以通过店内摄像头产生的大量视频数据来分析商品摆放位置和人流动线情况,从而优化店内设置,进而提升销量。近年来热门的自动驾驶则是通过自带的摄像头或激光雷达等传感器来感知车辆外的世界,背后也有很多AI算法帮助车辆去判断路况,并做出相应的决策,也离不开边缘计算的算力。还有车路协同,把传感器、算力布置在路口或路况复杂的地方,可以为车辆提供场景补盲,让AI帮助优化交通效率,提升安全性。

e7432aa824697df4128139a0233b77b4.png

英伟达解决方案架构师黄煜

元宇宙也是近两年爆火的技术话题。李三平指出,实时的三维重建技术才能营造出元宇宙场景,戴尔中国研究院在这个领域也投入了大量的研发工作,因为在人体重建的过程中,无论是传统的图像渲染技术,还是神经渲染技术,都需要大量复杂的计算,需要AI、高性能计算的算力强有力的支撑。

AI GPU分布式训练有章可循

随着AI与HPC结合越来越紧密,AI大模型结构更加复杂,参数规模也更加庞大。所以很多AI大模型在训练中会用到AI集群式计算,目前主要实现方式是GPU分布式训练。

众所周知,当前AI领域的“网红”ChatGPT就是从AI大模型一步步发展而来的,从第一代参数量只有1亿,到第三代GPT-3参数量达到1750亿 ,再到现在的3.5代,其效果已经超出了所有人的想象。据第三方研究,在GPT-3训练过程中共使用了28.5万个CPU、1万个GPU的算力,训练费用高达1200万美元。

训练这样大型的模型,必须要大规模的AI计算集群进行集群化的分布式训练,才有可能在比较短的时间内实现训练模型的收敛。为了解决各个行业更加复杂的问题,以Transformer为代表的AI大规模预训练模型,已经成为AI领域的一个趋势。而这样的AI大模型的训练与推理部署,是无法通过单张GPU来计算的,因为单张GPU的显存空间与计算能力是有限的。因而,模型拆分、GPU分布式训练,是训练AI大模型必不可少的技术。

为了帮助国内用户实现AI分布式训练技术的工程化落地,戴尔科技集团今年在国内发布的《戴尔科技AI GPU分布式训练白皮书》, 将戴尔科技在构建AI GPU计算集群与分布式训练的优化经验分享给更多的国内用户。

而围绕着AI GPU分布式训练,黄煜分享了NVIDIA针对AI大模型计算,在计算、通信、存储的硬件优化;以及在训练框架层面,针对大模型拆分、通信优化、自动化微调、大模型推理部署上的软件优化。

软硬协同为应用提供算力基石

随着计算越来越走向并行化、网络化,越来越多的计算任务需要被拆分做并行计算,计算过程以及结果的同步需要通过网络来通信。

对此,穆琙博指出,深度融合计算与网络的算网融合是未来ICT技术发展的目标,计算网络化就是为实现这一目标而发展和演进的路径之一。其本质是从IT视角出发,将各类算力设备和多元算力中心,通过高速互联网打通,为行业用户提供一体化的算力服务平台。近期中国信通院正在依托中国算网融合产业及标准推进委员会(TC621),联合包括戴尔科技集团在内的19家合作伙伴,共同起草了计算网络化研究报告的编写工作。

计算网络化具有算力异构多元、网络广域互联、资源按需供给、一体化算力服务、应用规模部署五大特征。其典型应用实践有边缘计算、分布式云、高性能计算云、一体化智算等等。

其中边缘计算的发展已经获得全球各国的高度重视,我国也积极推动边缘计算在工业互联网等多个领域的发展。按照技术实现方式,边缘计算可分为运营商边缘、云边缘和行业边缘三类;同类型的边缘计算部署方式、应用场景均存在差异。为了应对边缘计算选型难的问题,中国信通院算网融合研究团队从边缘计算的基准能力入手,打造的“EC Ready”技术体系,推动计算方案和服务的基准能力标准化工作,开展行业第三方技术评测,推动边缘计算产业应用落地。

李三平则从实践角度分享了边缘计算的选型经验。李三平指出,在运动这个典型的边缘应用场景中,实时性是最大的需求和挑战,如果解决方案不能做到实时性,就不能快速反馈分析结果,也就不能及时有效的帮到运动员,所以是否存在延迟是戴尔在技术方案调试过程中关注的重点。戴尔依托自身性能强大的边缘服务器和数据中心端的GPU服务器,通过这些高算力平台的支撑,和国家队一起成功打磨出了边缘智能解决方案。而对于边缘端产生的视频数据,戴尔结合视频理解技术,在分析数据之前,就判断出视频画面是否需要存储,从而更快速的存储和分析有效数据。

当然,一个灵活好用的算力平台不能仅靠硬件,还需要好用的软件,软硬协同才能更好地为应用提供算力基石。据黄煜介绍,戴尔与NVIDIA为此合作推出了端到端的企业级AI平台解决方案NVAIE(NVIDIA AI Enterprise),NVAIE在由戴尔科技提供并通过NVIDIA官方认证的GPU基础设施硬件平台之上,可以在虚拟化和云原生平台上更快速地部署由NVIDIA提供的AI和数据分析软件套件包,进行资源调配,目前已经在国内很多行业中实现商用。

5dc115b711d45885a52f3c2324f3e204.png

黄煜表示,NVAIE的目标是利用NVIDIA积累的大量针对不同场景、不同行业的经验,提供一套软件来帮助各类企业满足其AI工作负载的需求。它能够帮助运行传统企业应用的IT人士,轻松、经济、高效地运行支持GPU加速的AI工作负载,同时使用原有的工具来管理大型数据中心或混合云等等,目前也有很多客户使用NVAIE来部署和扩展数据科学、对话式AI、计算机视觉等各种应用。

新技术、新方向,未来可期

在圆桌论坛的最后,各位嘉宾谈到了对边缘计算、AI、元宇宙技术的展望。

穆琙博表示,技术融合将成为边缘计算落地的主要助推器。基于此,中国信通院联合边缘计算产业各方共同提出了“边缘计算+”的概念,即要用各类技术通过边缘计算化,赋能产业数字化,实现网络化和智能化的升级。一体化、智能化将成为边缘计算+的重要研究方向,云原生将成为边缘计算+技术演进的加速器。

李三平表示,十年前我们很难预测到AI能够取得如此丰富多样的进展,如果未来我们能够模拟大脑的意识过程,给深度学习模型赋予自学习的能力,让它实现自我进化,那么机器学习模型就可能发展出自己的抽象能力,给机器智能找到一个可发展的新路径。

黄煜指出,现实世界中的东西都可以在元宇宙的虚拟空间中得到映射,甚至延伸。我们可以产生很多数字孪生类的应用,如在虚拟空间中训练自动驾驶算法,当达到一定的精度和可靠性之后再到车上去部署和验证,甚至进行整个城市级别的交通管理、动线优化。元宇宙会给我们提供非常大的想象空间,同时也会给我们的场景和应用带来更多的价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31859.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python自动下单:提高效率的必备利器

Python自动下单:提高效率的必备利器 随着电商市场的不断发展,越来越多的商家开始使用自动下单工具来提高生产力和效率。Python作为一种高级编程语言,具有功能强大,易于学习和使用的优点,其自动下单的能力也受到了广泛…

解决 openwrt/Lede pppoe拨号频繁掉线的问题

我自己的软路由是J1900刷的lede,近期电信pppoe拨号频繁掉线,排除了网线,更换了光猫,最终锁定软路由为的问题。目前才用了下面的方法,尝试解决该问题 转载自http://ninecmd.com/?p948 WRT1900AC路由器,自从宽带换到联…

tlwdr5660间歇性掉线_tplink路由器频繁掉线的原因及解决办法

tplink路由器频繁掉线是怎么回事?tplink是大家最常使用的路由器,很多朋友都会遇到路由器频繁掉线的情况,这真的很郁闷。那么,tplink路由器频繁掉线是什么原因导致的呢?主要有三大方面,下面小编就给大家介绍…

为什么win11连接wifi频繁掉线?

如果网络波动比较大的话,就会导致电脑使用过程中不顺畅,网页打开速度都会很缓慢。就有win11用户跟小编反映自己的电脑连接WiFi后总是掉线,非常烦人,这该怎么办?下面就来看看小编为大家整理的几个解决办法,希…

mac频繁掉线的解决方案汇总

mac频繁掉线的解决方案汇总 最近一个月我的mac回到家用的时候经常掉线,但是在公司一切正常,找了很多方法都没有解决到,最后在我实在受不了的情况下,终于解决了,以下将试过的方法都汇总一下,因为每台机的情况…

VM16-ubuntu16桥接网络频繁掉线

故障说明 旧电脑使用的vm15-ubuntu16,通过移植安装到新电脑,后又通过升级把虚拟机升级到vm16,更改网络连接的NAT模式到桥接模式,发现网络即使出现正常连接的图标和正确的IP地址但是还是会有频繁掉线的情况。 解决方案 1.依次打…

解决WiFi共享大师频繁掉线问题

查看当前网卡驱动是否支持承载网络 使用winr输入cmd打开命令行界面输入netsh wlan show drivers执行查看支持承载网络是否为是,如果为否,请执行下面的步骤将网卡驱动回滚 打开设备管理器,回滚网卡驱动 驱动程序->更新驱动程序->浏览我…

PC、手机老是掉线该如何排查?

连通性、ARP 欺骗、硬件、省电模式。 1、查看电脑的数据连通性 PING测网络运营商(114.114.114.114),看是否有延迟或者是丢包 ping 114.114.114.114 -t 2、ARP 欺骗 arp -a //通过询问当前协议数据,显示当前 ARP 项。如果指定…

微信机器人换了服务器掉线,故障2:微信频繁掉线

微信频繁掉线先排查问题 可能原因: 1.手机端微信不可以退出和切换其他微信,否则必掉线。(手机没网/关机等情况没事) 2. 在电脑上登陆了这个机器人微信, 一定会将机器人挤下线。 以上操作百分百会导致软件上微信掉线。切记,挂机时不…

案例23-服务出现频繁掉线情况

目录 一、背景介绍 二、分析原因 1.nacos中data文件的作用 2. data路径下protocol文件的作用 3.nacos ip混乱的问题 三、Naocs服务注册和发现 服务注册 服务发现 一、背景介绍 在springCloud项目中,通过使用nacos来对服务进行管理。但是其中一个服务总会出现…

chatgpt赋能python:Python断线重连完全指南:从原理到实现

Python断线重连完全指南:从原理到实现 介绍 Python作为一种高级编程语言,已经在各个领域中得到了广泛应用。在网络编程中,断线重连是一项非常重要的功能。本文将介绍Python中的断线重连的原理和实现,让读者可以轻松地了解和掌握…

大数据下的实时热点功能实现讨论(实时流的TopN)

我司内部有个基于jstorm的实时流编程框架,文档里有提到实时Topn,但是还没有实现。。。。这是一个挺常见挺重要的功能,但仔细想想实现起来确实有难度。实时流的TopN其实离大家很近,比如下图百度和微博的实时热搜榜,还有…

ChatGPT怎么用?自媒体要怎么利用gpt

ChatGPT怎么用?ChatGPT是一种基于人工智能的聊天机器人,它可以为新媒体作者提供各种有用的工具和资源,以帮助他们更好地创作内容。chatgpt要怎么用?以下是一些ChatGPT可以帮助新媒体作者创作的具体方法和示例。 1. 创意灵感 创意…

我的GPT-4 API 接入之旅

3月15日open-ai推出GPT-4 https://platform.openai.com/docs/models/gpt-4 chatgpt免费体验入口: http://chat.xutongbao.top 需要排队 28号加入等候队列 29号收到邀请 检查可用的model const { Configuration, OpenAIApi } require(openai)let listModels []…

ChatGPT + MindShow搞定PPT制作

一、获取PPT内容大概 1、进入chatgpt 官网:http://chat.openai.com,账号密码登录。 2、获取PPT内容 向他提问,提问格式如下,整理一份PPT大纲,主题是“如何使用热门AI工具”,回答内容采用Markdown的形式 二、…

[C++调试笔记]define.h

/* 取Ti2Te,入射杂质离子为C3,能量均一分布&#xff0c;由PIC计算得出 */ #include <math.h> /* 定义离子的结构 */ struct particle {double z;double vx;double vy;double vz;double ener; //单位eVdouble weig; };/* 定义一些常量 */ static const double …

TurtleBot3维护-1.openCR怎么更新/重刷固件

## TOCTurtleBot3维护-1.openCR怎么更新/重刷固件 机器人小车拆下机械臂 机械臂对我们的课题没有用处&#xff0c;又耗电又占地方&#xff0c;就想给它卸掉&#xff0c;但是发现卸掉以后小车不能移动了&#xff0c;蓝牙手柄也不能驱动了&#xff0c;小车也不能正常启动键盘控…

chatgpt赋能Python-python_bz2

Python BZ2&#xff1a;一种高效的数据压缩和解压工具 在计算机科学领域&#xff0c;数据压缩和解压常常是非常有用的工具。它们可以减少磁盘空间占用和网络传输时间。在Python中&#xff0c;有许多优秀的数据压缩/解压库&#xff0c;如gzip、zipfile等。但是&#xff0c;本文…

全网最详细中英文ChatGPT-GPT-4示例文档-从0到1快速入门自然语言智能转换SQL查询语句应用——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门自然语言智能转换SQL查询语句应用 Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人&#xff0c;它能够理解…

工业蒸汽量预测

关与作者更多博客请访问云里云外开源社区 工业蒸汽量预测 1 赛题理解 1.1 赛题背景 火力发电的基本原理是&#xff1a;燃料在燃烧时加热水生成蒸汽&#xff0c;蒸汽压力推动汽轮机旋转&#xff0c;然后汽轮机带动发电机旋转&#xff0c;产生电能。在这一系列的能量转化中&am…