一、定义 cuda 缓存示意图gpu 架构示意图gpu 内存访问示意图 二、实现 cuda 缓存示意图 DRAM: 通常指的是GPU的显存,位于GPU芯片外部,通过某种接口(如PCIE)与GPU芯片相连。它是GPU访问的主要数据存储区域,用于存储大量的数据。 L1: 缓存位于GPU芯片内部,靠近计算核心。L1缓存通常直接集成在每个计算单元(如流多处理器SM)内部。 L2: 缓存位于GPU芯片内部,靠近计算核心。L2缓存则可能被多个计算单元共享。 速度: L1>L2>DRAM 容量: L1<<L2<DRAM gpu 架构示意图 gpu 内存访问示意图