FMS 2024:多家厂商CXL技术方案总览

CXL(Compute Express Link)联盟自成立以来一直是FMS闪存峰会的常客。在2022年的峰会上,CXL联盟宣布了CXL 3.0版本规范,随后在2023年的超级计算大会上推出了CXL 3.1版本。起初,CXL作为一种主机到设备的互联标准,逐渐吸收了其他竞争标准,如OpenCAPI和Gen-Z。通过在普遍存在的PCIe扩展总线上构建协议,CXL规范开始覆盖各种应用场景。

图片

CXL联盟成员包括AMD、Intel等业界巨头,以及大量初创公司,这些公司在设备端扮演着不同的角色。在2024年的峰会上,CXL技术在众多厂商的展位演示中占据了显著位置。

CXL专题扩展阅读:

  • 当CXL遇到NVMe,计算存储会发生什么?

  • CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案

  • CXL:拯救NVMe SSD缓存不足设计难题

  • 如何利用CXL技术突破内存墙?

  • CXL与PCIe世界的尽头|你相信光吗?

  • 下一代分层存储方案:CXL SSD

  • 是谁?阻止CXL在AI场景大展身手~

  • 浅析CXL P2P DMA加速数据传输的原理

  • NVMe over CXL技术如何加速Host与SSD数据传输?

随着服务器平台从DDR4向DDR5过渡,以及对大容量RAM需求的增加(但对内存带宽或延迟要求不高),CXL内存扩展模块成为首批广泛应用的CXL设备之一。过去几年中,三星和海力士等公司在这一领域推出了相关产品。

图片

1.SK海力士CXL内存模块与HMSDK

在2024 FMS上,SK海力士展示了其基于DDR5的CMM-DDR5 CXL内存模块,容量为128GB。该公司还详细介绍了与其配套的异构内存软件开发套件(HMSDK)——这是一组内核级和用户级的库和工具,旨在提高CXL内存的易用性。HMSDK通过考虑内存层次结构,并根据使用频率在服务器主内存(DRAM)和CXL设备之间重新定位数据,实现了这一点。

图片

CMM-DDR5 CXL内存模块采用了E3.S 2T接口形式,配备了PCIe 5.0 x8主机接口。内部内存基于1α技术的DRAM,并承诺在一个NUMA范围内,提供与DDR5相当的带宽和延迟。鉴于这些内存模块主要用于数据中心和企业环境,固件中包含了RAS(可靠性、可用性和可服务性)特性以及安全启动等功能。

SK海力士还展示了Niagara 2.0——一个基于FPGA的硬件解决方案,用于实现内存池化和共享,即连接多个CXL内存模块,使不同的主机(CPU和GPU)能够最优化地共享其容量。与之前的版本相比,最新的版本不仅支持容量共享,还支持数据共享。

2.Microchip与美光CZ120 CXL内存扩展模块

去年,美光基于Microchip SMC 2000系列CXL内存控制器推出了CZ120 CXL内存扩展模块。在2024年的峰会上,美光和Microchip共同展示了该模块在Granite Rapids服务器上的应用。

图片

SMC 2000控制器支持DRAM芯片故障处理,并提供了诊断和调试工具来分析故障模块。此外,该控制器支持ECC,这是SMC 2000系列企业级RAS功能集的一部分。其灵活性确保了基于SMC 2000的CXL内存模块可以与仅支持DDR5的主DRAM协同工作。

图片

3.Marvell Structera CXL产品线

在2024 FMS开始前几天,Marvell宣布了全新的CXL产品线——Structera。与专注于内存池化和扩展的其他CXL设备解决方案不同,Structera产品线还包括计算加速器部分,除了内存扩展控制器之外。所有这些组件均基于TSMC的5nm工艺制造。

图片

计算加速器部分——Structera A 2504(A代表Accelerator),是一款PCIe 5.0 x16 CXL 2.0设备,集成了16个运行在3.2GHz的Arm Neoverse V2(Demeter)核心。它支持四个DDR5-6400通道,每个通道最多支持两个DIMM,以及内联压缩和解压功能。集成高性能服务器级ARM CPU核心意味着CXL内存扩展部分不仅扩展了每核心的内存带宽,还增强了计算能力。

图片

像Deep-Learning Recommendation Models(DLRM)这样的应用可以从CXL设备的计算能力中获益。带宽扩展的同时还伴随着工作负载能耗的降低。这种方法也有助于服务器内部的整体热设计优化。

图片

Structera X 2404(X代表Expander)可作为PCIe 5.0(单x16或双x8)设备,支持四个DDR4-3200通道(每通道最多3个DIMM)。Structera X 2404同样具备内联(解)压缩、加密/解密以及硬件支持的安全启动等功能。与Structera X 2404的100W TDP相比,Marvell预计这部分功耗约为30W。该部件的主要目的是使超大规模数据中心能够回收DDR4 DIMM(每个扩展器最多6TB),同时增加服务器内存容量。

图片

Marvell还有一款Structera X 2504,支持四个DDR5-6400通道(每个通道两个DIMM,最多4TB每扩展器)。其他方面与DDR4回收部分相同。

Marvell强调了Structera产品线的一些独特之处——内联压缩优化了可用的DRAM容量,DDR4扩展器每个通道支持3个DIMM,从而最大化了每个扩展器的DRAM容量。5nm工艺降低了功耗,并且这些部件支持来自多个主机的访问。Arm Neoverse V2核心的集成似乎是CXL加速器的首次尝试,它使得计算任务成为可能,从而提升了系统的整体性能。尽管Marvell公布了Structera部件的规格,但样品至少还需要几个季度才能推出。

4.XConn与MemVerge CXL内存共享

XConn Technologies 和 MemVerge, Inc. 将在2024年的Future of Memory and Storage (FMS)大会上展示业界首个可扩展的CXL内存共享解决方案。该解决方案利用CXL技术来提高性能并降低AI应用程序和内存数据库的总体拥有成本(TCO)。通过结合MemVerge的智能分层软件与XConn的高性能CXL互联交换机,双方展示了CXL在加速高需求应用方面的有效性。

XConn的“Apollo”CXL 2.0交换机是业界首个支持CXL 2.0标准的交换机,同时也兼容Intel和AMD现有的CXL 1.1服务器处理器。Apollo CXL 2.0交换机专为加速AI计算系统的开发过程而设计,支持构建CXL内存池以打破传统的内存限制,并推动内存架构的革命。Apollo交换机支持PCIe 5.0标准,能够在单个设计中同时支持PCIe和CXL,提供高达2,048GB/s的总带宽和256条通道,为希望利用JBOG(一堆GPU)和JBOA(一堆加速器)配置的系统设计者提供了灵活性。

图片

MemVerge Memory Machine for CXL 是一个管理内存-存储层次结构的大内存平台,支持敏捷的服务器内存扩展和基于结构的内存。MemVerge软件通过允许应用程序共享内存,解锁了结构连接内存的性能潜力,从而加速了CXL技术的采用。

XConn Technologies和MemVerge的合作展示了CXL技术在AI和内存数据库领域的巨大潜力,通过实现可扩展的内存共享,该解决方案不仅提高了性能,还降低了总体拥有成本。XConn Apollo CXL 2.0交换机和MemVerge Memory Machine for CXL的结合为AI和高性能计算应用提供了强大的基础设施支持,有望推动下一代计算架构的发展。

5.MSI与MemVerge

MSI在FMS 2024展示了其基于CXL(Compute Express Link)技术的服务器平台。该平台采用了第四代AMD EPYC处理器,并在三星和MemVerge的展位上展出。该服务器旨在通过增加内存容量和带宽来提升内存数据库、EDA(电子设计自动化)和HPC(高性能计算)应用的性能。服务器采用了最新的AMD EPYC处理器,支持CXL 2.0内存扩展标准。MemVerge提供的软件可以智能地管理多层内存,优化AI和其他内存密集型工作负载的成本和性能。

图片

MSI的S2301 CXL内存扩展服务器结合了三星的256GB CXL2.0内存模块和MemVerge的Memory Machine X软件,通过智能管理内存层级来优化AI和其他内存密集型工作负载的成本和性能,根据带宽或延迟QoS策略自动将数据放置在合适的内存层级,以达到最优性能。

图片

6.Fadu

Fadu, Inc. 将在FMS 2024大会上推出针对AI数据中心优化的企业级SSD控制器和CXL(Compute Express Link)解决方案。Fadu将推出针对AI优化的下一代企业级SSD解决方案,并展示其在Gen5和Gen6控制器领域的领先地位。Fadu推广FDP (Flexible Data Placement)技术,这是一种针对下一代数据中心的标准讨论。Fadu还将推出一种新的系统,通过CXL开关优化GPU、HBM和SSD之间的连接,以增强性能。

7.Wolley

Wolley之前已在FMS 2023上展示了其PCI-SIG 5.0认证的CXL控制器IP核心。此后,该公司继续将其CXL技术扩展至数据中心之外的应用领域,例如AI PC和汽车。Wolley在FMS 2024上提供NVMe Over CXL和FleX解决方案的现场演示。NVMe Over CXL提供了一种高性能虚拟化架构,以满足AI对大量内存容量的需求。FleX技术则将CXL内存引入主板。

NVMe Over CXL: 虚拟化内存与存储的整合:Wolley开发了一种解决方案,利用CXL并在相同的PCIe物理接口上使用CXL.mem协议实现高效的内存访问,而CXL.io协议则支持所有NVMe的传统特性,无需重写应用程序。通过在同一设备上集成存储和内存,解决了资源分配中的竞争条件。

图片

8.Teledyne LeCroy与Cadence展示CXL 3.x技术

Teledyne LeCroy, Inc.与Cadence Design Systems, Inc.合作,在2024 FMS大会上展示了Compute Express Link (CXL) 3.x技术。这是两家公司第二次公开演示高速CXL 3.x技术。

Teledyne LeCroy的Summit M616是一款支持PCIe 6.0协议的分析仪/测试仪,它是Teledyne LeCroy一系列PCIe和CXL协议测试解决方案中的最新成员。Summit M616支持设计工程师创建、捕获、解码和分析CXL 3.x流量,帮助他们验证和确认最新的高速内存和加速器设备。

图片

Summit M616能够以高达64GT/s的速度运行,提供强大的CXL 3.x分析和测试能力。适用于CXL 3.x设备的设计验证、调试以及性能优化。作为一款协议分析仪/测试仪,Summit M616不仅能够分析CXL 3.x流量,还可以用于测试PCIe和NVMe协议,为工程师提供全面的支持。

图片

虽然,各个厂商都在CXL大力投入,但是CXL正处于缓慢增长阶段,短期内不太可能出现急剧增长。业内都在摸索中前进,保持技术观望。


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 存储正式迈入超大容量SSD时代!

  • FMS 2024: 带来哪些存储技术亮点?

  • IEEE报告解读:存储技术发展趋势分析

  • 什么?陶瓷也可以用来存储数据了?

  • 都说固态硬盘寿命短,那么谁把使用寿命用完了吗?

  • 内存原生CRAM技术将会颠覆计算存储的未来?

  • 浅析SSD性能与NAND速率的关联

  • MCR DIMM如何解决内存带宽瓶颈?

  • 浅析MPS对PCIe系统稳定性的影响

  • CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案

  • 万字长文|下一代系统内存数据加速接口SDXI解读

  • 数据中心:AI范式下的内存挑战与机遇

  • WDC西部数据闪存业务救赎之路,会成功吗?

  • 属于PCIe 7.0的那道光来了~

  • 深度剖析:AI存储架构的挑战与解决方案

  • CXL崛起:2024启航,2025年开启新时代

  • NVMe SSD:ZNS与FDP对决,你选谁?

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/405369.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在CUDA中优化矩阵转置

https://dmacssite.github.io/materials/MatrixTranspose.pdfhttps://dmacssite.github.io/materials/MatrixTranspose.pdf Chapter 1. Introduction 矩阵转置优化CUDA内存管理 本文档讨论了CUDA应用程序性能的各个方面,这些方面与有效使用GPU内存和应用于矩阵转…

C++ TinyWebServer项目总结(1. 配置安装)

语雀文档 项目记录会先更新在我的语雀文档 :Webserver 然后再同步发送到CSDN上,有些格式问题实在是懒得改了,可能会导致大家看的不舒服,建议有需要的大家可以看看我的原文。 安装环境 Ubuntu 20.04 mysql Ver 8.0.39-0ubuntu0…

Ajax-3

一.图片上传 1.获取图片文件对象 2.使用FormData携带图片文件 const fd new FormData() fd.append(参数名, 值) 3.提交表单数据到服务器,使用图片url网址 二.AJAX原理—XMLHttpRequest 定义:XMLHttpReques(XHR)对象用于与服务器…

SM2前后端加密和解密

一&#xff1a;前端vue 二&#xff1a;后端解密 三&#xff1a;后端详解 3.1maven文件 <dependency><groupId>org.bouncycastle</groupId><artifactId>bcprov-jdk15to18</artifactId><version>1.66</version> </dependency&g…

Linux命令学习 -- tar指令

功能&#xff1a;对文件和目录进行打包 格式&#xff1a;tar [参数] [压缩文件名] [要压缩的目录或者文件的名字]常用参数如下&#xff1a; -c &#xff1a;创建一个新的打包文件&#xff1b; -x :对打包文件进行解压缩&#xff1b; -z :gzip 格式进行压缩或者解压&#xff0c;…

Cookie Session Token

什么是会话技术&#xff1f; Cookie 以登录为例&#xff0c;用户在浏览器中将账号密码输入并勾选自动登录&#xff0c;浏览器发送请求&#xff0c;请求头中设置Cookie&#xff1a;userName:张三 ,password:1234aa &#xff0c;若登录成功&#xff0c;服务器将这个cookie保存…

重磅发布!天途多自由度无人机调试台

无人机调试、测试和试飞很容易受空域、场地、环境、失控炸机和操作失误等限制。天途TE55多自由度无人机整机调试台应运而生&#xff01; 突破空域限制 天途TE55多自由度无人机整机调试台&#xff0c;突破场地空域限制&#xff0c;不到0.7平米的空间&#xff0c;即可完成小型无人…

如何使用DataGear零编码快速制作MQTT物联网实时数据看板

DataGear是一个开源免费的数据可视化分析平台&#xff0c;企业版在开源版基础上开发&#xff0c;新增了诸多企业级特性&#xff0c;包括&#xff1a;MySQL及更多部署数据库支持、MQTT/WebSocket/Redis/MongoDB数据集、OAuth2.0/CAS/JWT/LDAP统一登录支持、前后端敏感信息加密传…

每天五分钟深度学习框架pytorch:神经网络工具箱nn的介绍

本文重点 我们前面一章学习了自动求导,这很有用,但是在实际使用中我们基本不会使用,因为这个技术过于底层,我们接下来将学习pytorch中的nn模块,它是构建于autograd之上的神经网络模块,也就是说我们使用pytorch封装好的神经网络层,它自动会具有求导的功能,也就是说这部…

高性能 Web 服务器:让网页瞬间绽放的魔法引擎(下)

目录 一.Nginx 反向代理功能 1.缓存功能 2.http 反向代理负载均衡 二.实现 Nginx 四层负载均衡 三.实现 FastCGI 1.为什么会有FastCGI&#xff1f; 2.什么是PHP-FPM&#xff1f; 3.FastCGI配置指令 4.Nginx与php-fpm在同一服务器 5.Nginx配置转发 6. php的动态扩展模…

探索全光网技术 | 全光网相关厂商的产品解决方案整理 (锐捷系列)

全光网产品解决方案整理-锐捷系列 目录 一、教学场景1、方案概述2、方案需求3、实践案例4、相关产品5、方案价值 二、办公场景1、方案概述2、方案需求3、实践案例4、相关产品5、方案价值 三、宿舍场景1、方案概述2、方案需求3、实践案例4、相关产品5、方案价值 注&#xff1a;本…

你的显卡能不能玩《黑神话:悟空》?

《黑神话&#xff1a;悟空》作为一款备受瞩目的国产单机大作&#xff0c;其对显卡和整体硬件配置的需求较高。根据官方公布的信息&#xff0c;游戏的推荐配置包括GeForce RTX 40系列GPU&#xff0c;以确保在2K或4K分辨率下能够享受到60FPS的全景光追游戏体验。特别是GeForce RT…

2024年新SCI顶刊算法信息获取优化算法IAO优化Transformer-GRU模型的多变量时间序列预测

matlab R2024a以上 一、数据集 ​ ​ 二、2024年新SCI顶刊算法信息获取优化算法IAO 本期介绍了一种名为信息获取优化算法Information acquisition optimizer&#xff0c;IAO的元启发式算法。该算法受人类信息获取行为的启发&#xff0c;由信息收集、信息过滤和评估以及信息分…

C#中客户端直接引用服务端Proto文件

gRPC 客户端是从 .proto 文件生成的具体客户端类型。 具体 gRPC 客户端具有转换为 .proto 文件中 gRPC 服务的方法。 下一步打开【服务引用】 控制面板 选择grpc选项&#xff0c;然后继续 到此配置完成&#xff0c;然后就和服务共用一份protocol文件

图像生成模型基础——Stable Diffusion模型介绍

随着人工智能技术的飞速发展&#xff0c;图像生成技术也取得了显著进步。扩散模型&#xff08;Stable Diffusion&#xff09;因其高效性和稳定性而得到广泛关注&#xff0c;目前的大多数生成模型都是以扩散模型为基础进行改进得到。首先简单介绍一下传统人工智能模型和生成模型…

request.getRequestURI()与request.getRequestURL()的区别

1.返回值的区别&#xff1a; request.getRequestURL() 返回值是一个StringBuffer类型 request.getRequestURI() 返回值是一个String类型 先看 request.getRequestURL() 返回的是一个具体的地址&#xff0c;访问网页的地址 而 request.getRequestURI() 返回的是一个映射地址&a…

VM Ubuntu22.04 ROS2 从头安装

目录 前言安装步骤1 设置编码2 添加ROS2软件源&#xff08;从哪去下载ros2相关软件&#xff09;报错解决方法 3 安装报错解决方法1解决方法2 报错 4 设置环境变量5 Ros2 测试Hello World 发送和监听小海龟键盘控制 成功 Hello World 发送和监听界面成功控制小海龟界面 前言 本…

【java】RuoYiBootstrap多模块版本-新写的接口,用接口工具访问,状态码302,访问不到。打的断点也进不去。其实是Shiro拦截器搞的鬼

【java】RuoYiBootstrap多模块版本-新写的接口&#xff0c;用接口工具访问&#xff0c;状态码302&#xff0c;访问不到。打的断点也进不去 你如果着急&#xff0c;可以直接看《ShiroConfig.java文件源码-过滤器配置-重点代码》 重点 状态码&#xff1a;302访问不到断点进不去 …

FileNotFoundException: XXX (系统找不到指定的文件。)

目录 问题描述 问题分析 问题总结 问题描述 idea引入文件&#xff0c;系统去读取&#xff0c;但是路径的问题报错系统找不到指定文件 String filePath "test.txt"; try {FileInputStream fileInputStream new FileInputStream(filePath); } catch (FileNotFou…

信息搜集--敏感文件Banner

免责声明:本文仅做分享参考... 目录 git安装: git目录结构: 敏感目录泄露 1-git泄露 (1)常规git泄露 scrabble工具 (2)git回滚 (3)git分支 GitHacker工具 (4)git泄露的其他利用 .git重定向问题 2-SVN泄露 dvcs-ripper工具 3-小结 dirsearch目录扫描工具 敏感备…