DPU是什么?

问题描述:

DPU是什么?
在这里插入图片描述

解答:

DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件
定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等
基础设施层服务。2020年NVIDIA公司发布的DPU产品战略中将其定位为数据中
心继CPU和GPU之后的“第三颗主力芯片”,掀起了一波行业热潮。DPU的出
现是异构计算的一个阶段性标志。与GPU的发展类似,DPU是应用驱动的体系
结构设计的又一典型案例;但与GPU不同的是,DPU面向的应用更加底层。
DPU要解决的核心问题是基础设施的“降本增效”,即将“CPU处理效率低
下、GPU处理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低
整体系统的总体拥有成本(TCO)。DPU的出现也许是体系结构朝着专用化路
线发展的又一个里程碑。

DPU的作用

DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池
化等基础设施层服务,释放CPU的算力到上层应用。以网络协议处理为例,要
线速处理10G的网络需要的大约4个Xeon CPU的核,也就是说,单是做网络数据
包处理,就可以占去一个8核高端CPU一半的算力。如果考虑40G、100G的高速
网络, 性能的开销就更加难以承受了。A m a z o n 把这些开销都称之为
“Datacenter Tax”,即还未运行业务程序,先接入网络数据就要占去的计算资
源。AWS Nitro产品家族旨在将数据中心开销(为虚拟机提供远程资源,加密解
密,故障跟踪,安全策略等服务程序)全部从CPU卸载到Nitro加速卡上,将给
上层应用释放30%的原本用于支付“Tax” 的算力!

DPU的设计目标是提供高效的数据处理能力,以满足不同应用场景中对数据处理的需求。相比于传统的通用处理器(如CPU),DPU在数据处理方面通常具有更高的效率和性能。

简介

数据中心走向以数据为中心,CPU的性能已经远远落后于数据的增长速度,GPU加速计算成为了计算的主力,极大地提升了单处理器及单机的计算性能。
利用CPU来处理数据中心中的安全、通信、存储、虚拟化等基础架构操作的传统方式逐渐成为计算性能增长的瓶颈,计算和基础架构支撑功能对CPU的资源冲突愈加剧烈。
NVIDIA DPU的出现,将这些基础架构的操作由CPU卸载到了DPU上 ,实现了软件定义和硬件加速在安全、通信、存储和虚拟化等方面组合,将CPU的计算资源释放了出来,更好地支持应用的需求。

发展历史

源于传统的网卡设备,通过添加网络硬件卸载功能(如RDMA、安全卸载、存储卸载、OVS卸载等)走向了智能网卡,NVIDIA再通过和ARM CPU及PCIe交换机的整合实现了DPU的雏形,未来和GPU的进一步整合将实现完整的功能完善和强大的DPU。

核心结构

CPU + 智能网卡 + PCIe交换 + GPU(未来) + DOCA软件开发包

工作原理

软件定义和硬件加速是工作原理的综合。通过网卡的硬件卸载实现高性能的通信、安全、存储和虚拟化,通过CPU来处理管理和控制平面的操作,通过GPU实现DPU的自学习、推理及推荐,并增强DPU的计算性能。

性能优势

NVIDIA BlueField DPU [1]实现全线速的Data In-Line和Data At-Rest加解密功能,如150倍IPSec加解密性能提升; 在不消耗主机CPU的前提下大幅提升了存储的IOPS,比较主机CPU来操作大约30倍的性能提升;实现了RDMA操作的控制和数据平面卸载, 2.5倍的Overlay网络性能提升; 150倍的下一代有状态防火墙性能提升; 10倍的防恶意攻击性能提升等。

应用领域

包括安全加速、存储加速和软硬件分离、OVS卸载、计算加速、视频流业务加速、防火墙加速、防恶意攻击等。

应用场景一:网络功能卸载

网络功能卸载是伴随云计算网络而产生的,主要是对云计算主机上的虚拟
交换机的能力做硬件卸载,从而减少主机上消耗在网络上的CPU算力,提高可
售卖计算资源。

应用场景二:存储功能卸载

NVMe-oF硬件加速
NVMe over Fabric(又名NVMe-oF)是一个相对较新的协议规范,旨在使用
NVMe通过网络结构将主机连接到存储,支持对数据中心的计算和存储进行分
解。NVMe-oF协议定义了使用各种通用的传输协议来实现NVMe功能的方式。
在NVMe-oF诞生之前,数据存储协议可以分为三种:
(1)iSCSI:是一种基于IP的存储网络标准,在TCP/IP网络上通过发送
SCSI命令来访问块存储服务。
(2)光纤通道(Fibre Channel):是一种高速的数据传输协议,提供有序
无损的块数据传输。主要用于关键高可靠要求的业务上。

应用场景三:安全功能卸载

硬件信任根
硬件信任根在安全领域是其它安全功能的基础,主要表现如下方面:
(1)硬件信任根(Root-Of-Trust):硬件信任根提供更离散的密钥生成算
法,并且与主机操作系统相隔离,可以做到硬件防破解。硬件信任根实现私有
密钥存储,可以反克隆和签名。通过硬件信任根认证授权实现访问受控。
(2)加密解密(Encryption/Decryption):数据加密解密算法完全卸载到
硬件网卡,无需主机CPU资源,效率更高更可靠。可以实现通用加密算法和国
密算法等。
(3)密钥证书管理(KMS):密钥证书管理卸载到智能网卡,与主机系统
相隔离;支持多种密钥交换算法,如D-H密钥交换等。
(4)动态数据安全(Secure Data-in-Motion):利用硬件级加解密算法,对
传输通道上的数据做加解密处理,如IPSec和TLS等。硬件处理可以实现更高吞
吐量。
(5)静态数据安全(Secure Data-at-Rest):在存储服务中,永久存盘的数
据需要进行加密,防止被窃取,硬件级数据加解密在存储服务中可以提供更高
效的数据读取,并保证数据安全。
All Rights Reserved 55
DPU White Paper
(6)流日志和流分析(Flowlog):流分析和流日志监控,对数据中心流量
做精细监控,有效识别,可以及时识别DDoS攻击,并做出响应。

卸载到了DPU上,卸载到DPU上具体是什么意思?

卸载到DPU上意味着将特定的任务或操作转移给DPU来处理,而不是由CPU来执行。这可以提供一些优势,包括:

提高性能:DPU通常专门针对某些特定任务进行了优化,比如数据处理、网络处理、硬件加速等。相比于通用的CPU来说,DPU在这些特定任务上可能具有更高的效率和性能。降低CPU负载:将一些特定的任务从CPU卸载到DPU上,可以减轻CPU的工作负荷,使其能够更集中地处理其他任务。这有助于提高系统的整体性能和响应速度。节省能源:由于DPU通常比CPU更高效,卸载到DPU上的任务可以以更低的能耗完成。这可以帮助降低整体系统的能耗。

在NVIDIA的案例中,NVIDIA DPU(数据处理器)是专门设计用于数据中心和云计算环境的加速器,可以卸载和加速一些特定的数据处理任务,如网络加速、数据解码、转码等。通过将这些任务卸载到DPU上,可以提高整体系统的性能和效率。

总而言之,将任务卸载到DPU上意味着通过使用专门的处理器来执行特定的任务,以提高性能、降低负载和节省能源。

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/266034.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于x86架构的OpenHarmony应用生态挑战赛等你来战!

为了更快速推进OpenHarmony在PC领域的进一步落地,加快x86架构下基于OpenHarmony的应用生态的繁荣,为北向应用开发者提供一个更加便捷的开发环境,推动OpenHarmony北向应用开发者的增加,助力OpenHarmony在PC领域实现新的突破&#x…

buuctf_N1BOOK_粗心的小李

题目&#xff1a; 看完题目&#xff0c;git下载文件&#xff1f;然后将.git文件传到线上环境&#xff1f;&#xff08;which 会造成git泄露的安全威胁&#xff09;<这个背景抱歉我不太了解哈&#xff0c;可能后续有补充> 这里主要记录做法过程&#xff1a; 工具&#xf…

javaWeb个人学习02

会话技术 会话: 用户打开浏览器,访问web服务器的资源,会话建立,直到有一方断开连接,会话结束.在一次会话中包含多次请求和响应 会话跟踪: 一种维护浏览器状态的方法,服务器需要识别多次请求是否来自于同一个浏览器,以便在同一次会话的多次请求之间共享数据 会话跟踪方案: …

#stm学习总结 (二十八)硬件随机数实验

28.1 随机数发生器简介 STM32F407 自带了硬件随机数发生器&#xff08;RNG&#xff09;&#xff0c;RNG 处理器是一个以连续模拟噪声为基础的随机数发生器&#xff0c;在主机读数时提供一个 32 位的随机数。 28.1.1 RNG 框图 STM32F407 的随机数发生器&#xff08;RNG&#x…

React中使用useActive

1.引入 import { useActivate } from "react-activation";2.React Activation 在React中使用react-activation,其实就是类似于Vue中的keep-alive&#xff0c;实现数据的缓存&#xff1b; 源码&#xff1a; import { ReactNode, ReactNodeArray, Context, Component…

数据库的基本操作

数据库的基本操作 1创建数据库与查看数据库 创建数据库之前&#xff0c;先查看数据库&#xff1a; 然后使用命令行创建数据库&#xff1a; 再次查看数据库&#xff0c;发现多了一个数据库&#xff1a; 查看数据库基本信息&#xff1a; 2修改数据库 注意&#xff0c;修改…

Git自动忽略dll文件的问题

检查了半天发现是sourcetreee的全局忽略文件导致&#xff0c; 从里面删除dll即可。 我是干脆直接删了全局忽略&#xff0c;太恶心了&#xff0c;如下&#xff1a; #ignore thumbnails created by windows Thumbs.db #Ignore files build by Visual Studio *.exe .vsconfig .s…

使用全局事件总线实现任意组件间的通讯

本文以vue2中爷孙组件通讯为例&#xff0c;需求是点击孙组件的按钮&#xff0c;实现关闭爷组件的弹窗。 全局事件总线是通过Vue实例的事件系统来实现组件之间的通讯&#xff0c;可以方便地在任何组件中进行事件的触发和监听。 以下是使用全局事件总线实现爷孙组件通讯的步骤&a…

初阶数据结构:链表相关题目练习(补充)

目录 1. 单链表相关练习题1.1 移除链表元素1.2 反转链表1.3 链表的中间结点1.4 链表的倒数第k个结点1.5 合并两个有序链表1.6 链表分割1.7 链表的回文结构1.8 相交链表1.9 判断一个链表中是否有环1.10 寻找环状链表相遇点1.11 链表的深度拷贝 1. 单链表相关练习题 注&#xff1…

第一节:Sashulin Message Broker是什么?

一、Sashulin Message Broker简介 Sashulin Message Broker&#xff08;消息代理&#xff0c;简称SMB&#xff09;是一款可编程的消息流处理软件&#xff0c;它使应用程序、系统和服务能够相互通信并交换信息。通过消息传递和转换&#xff0c;实现不同平台和不同语言编写的服务…

登录页设计新选择:毛玻璃和新拟态风格,非2.5D和插画风

登录页给潜在用户传递了产品的品牌调性&#xff0c;是非常重要的一类页面&#xff0c;之前2.5D和插画风格的登录页流行一时&#xff0c;不过这阵风好像过去了&#xff0c;新的风格开始涌现了。 一、越来越流行的毛玻璃设计风格 毛玻璃风格是指将背景模糊处理&#xff0c;使得…

DOM 获取父子节点

DOM 是以树状结构排列的&#xff0c;所以父子关系是相对的&#xff0c;当li为我们的目标节点的时候&#xff0c;ul为其父节点&#xff0c;其他li为它的兄弟节点&#xff0c;li里面包含的标签为子节点&#xff0c;以此类推。 那我们如何找父节点&#xff1f; 元素.parentNode&am…

长江路一号桥的安全监测革新

位于无锡新区的长江路一号桥&#xff0c;自1997年落成以来&#xff0c;一直是多功能的市政要道。大桥北侧连接供气管道&#xff0c;右侧则是城市供水管道&#xff0c;而桥底则设有蓝藻环保监测点。这意味着一旦此桥出现问题&#xff0c;其影响远超交通堵塞的层面。近年来&#…

密码学及其应用(应用篇15)——0/1背包问题

1 问题背景 背包问题是一个经典的优化问题&#xff0c;在计算机科学和运筹学中有着广泛的应用。具体到你提到的这个问题&#xff0c;它是背包问题中的一个特例&#xff0c;通常被称为0/1背包问题。这里&#xff0c;我们有一系列的正整数 &#xff0c;以及一个正整数&#xff0c…

推荐一个 Obsidian 的 ChatGPT 插件

源码地址&#xff1a;https://github.com/nhaouari/obsidian-textgenerator-plugin Text Generator 是目前我使用过的最好的 Obsidian 中的 ChatGPT 功能插件。它旨在智能生成内容&#xff0c;以便轻松记笔记。它不仅可以在 Obsidian 中直接使用 ChatGPT&#xff0c;还提供了优…

《大模型时代-ChatGPT开启通用人工智能浪潮》精华摘抄

原书很长&#xff0c;有19.3w字&#xff0c;本文尝试浓缩一下其中的精华。 知识点 GPT相关 谷歌发布LaMDA、BERT和PaLM-E&#xff0c;PaLM 2 Facebook的母公司Meta推出LLaMA&#xff0c;并在博客上免费公开LLM&#xff1a;OPT-175B。 在GPT中&#xff0c;P代表经过预训练(…

Python入门到精通(九)——Python数据可视化

Python数据可视化 一、JSON数据格式 1、定义 2、python数据和JSON数据转换 二、pyecharts 三、折线图 四、地图 五、动态柱状图 一、JSON数据格式 1、定义 JSON是一种轻量级的数据交互格式。可以按照JSON指定的格式去组织和封装数据JSON本质上是一个带有特定格式的字符…

数仓项目6.0(二)数仓

中间的几步意义就在于&#xff0c;缓存中间处理数据样式&#xff0c;避免重复计算浪费算力 分层 ODS&#xff08;Operate Data Store&#xff09; Spark计算过程中&#xff0c;存在shuffle的操作&#xff0c;而shuffle会将计算过程一分为二&#xff0c;前一阶段不执行完&…

mongo之常用数据库操作

目录 一、准备环境 二、日常记录及执行示范 连接数据库查询版本查询表总数模糊查询(使用正则)查询文档中数据条数排序大于等于查询有哪些库时间查询不在条件内的查询复制数据更新字段名称删除数据库 四、高阶查询 五、备份迁移数据库 总结 一、准备环境 借鉴&#xff1a;…

【机器学习】特征选择之包裹式特征选择法

&#x1f388;个人主页&#xff1a;豌豆射手^ &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;机器学习 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共同学习、交流进…