【ARM Cache 系列文章 9 番外篇 -- ARMv9 系列 Core 介绍】

文章目录

    • ARMv9 系列Core
      • ARM Cortex-A510 介绍
      • ARM Cortex-A715
      • ARM Cortex-A720

ARMv9 系列Core

2021年5月Arm公布了其最新3款CPU和3款GPU核心设计,三款新CPU分别是旗舰核心Cortex-X2、高性能核心Cortex-A710、高能效核心Cortex-A510 CPU,三款新GPU核心则覆盖高中端和入门级。

这是继2021年3月推出重要的创新——全新64位指令集Armv9、2021年4月推出基于Armv9的首个产品——面向数据中心的Neoverse N2之后,Arm首次展示基于Armv9设计的一系列面向消费级移动设备市场的新核心,这些新设计不仅性能大幅提升,而且增加新的安全性和人工智能(AI)功能。

  • Cortex-X2,它是Arm Cortex-X定制项目的一部分,允许合作伙伴帮助为其特定用例设计专用核心。作 为Cortex-X1 的继任者,它也是Arm CPU产品线中强大的设计,可以用于笔记本电脑等大屏设备。Arm称,与Cortex-X1比,Cortex-X2的性能将提高16%,机器学习性能提升2倍;
  • Cortex-A710 “big” 核心 比 Cortex-A78 提高10%的性能、30%的能效、2倍的机器学习性能;
  • Cortex-A510 “LITTLE” 高能效核心 取代自2017年推出的Cortex-A55设计。与老款A55相比,其性能提升35%,能效提高20%,机器学习性能提升3倍。

高通骁龙888芯片,即采用 Arm Cortex-X1 和Cortex-A78的部分定制版本作为其四个“大”核心,并使用Cortex-A55设计作为其“LITTLE”核心。

X2、A510都将是纯64位,不再兼容32位,而A710会继续支持OL0 AArch32。其中,X2和A710的前端都改进了分支预测,精度更高,错误更少。

凭借 L3 缓存和丛簇设计 DSU-110 的特性,单一丛簇(cluster)最多可容纳8个X2 核心,并具有最大 16MB 的 L3快取能力。

ARM Cortex-A510 介绍

Cortex-A510是一个更大的微体系结构跳跃,因为它代表了Arm的 Cambridge CPU 设计团队的一项新的 CPU设计。A510 在改进 IPC的同时仍继续关注功率效率,并且也许最有趣的是,它保留了其有序的微体系结构特征。

A510则采用了一个混合核心微架构merged core microarchitecture)新设计,可将2个A510组合成一个群组,单一CPU可由多个群组构成,从而实现更加弹性化的结构设计。两个核心对它们共享L2缓存系统以及它们之间的FP / NEON / SVE pileline。
在这里插入图片描述

ARM 的 Merged-Core Microarchitecture 是 ARM 设计的新型微架构。这种微架构的主要特点是将多个物理核心合并为一个逻辑核心,以提高处理器的能效和性能。

在Merged-Core Microarchitecture中,每个物理核心都可以独立运行指令,但是所有的物理核心都共享同一个指令流。这样,当某个物理核心空闲时,它可以被用来执行其他核心的指令,从而提高整体的处理器性能。

ARM Cortex-A715

2022年8月 Arm又推出了他们的大核Cortex-A715(也称为 Makalu)。A715 支持与 ARMv9.0 ISA 大致相同的几项增强功能。更关键的是,A715的所有Exception Level都是仅支持AArch64(完全放弃了 32 位支持)。A715 的设计原则与之前的大核心相似:以更高的比率提高性能,而不是影响功率和面积。在这次迭代中,性能重点放在了整体改进上,而没有显着拓宽pipeline 或extending its depth。最后,Arm 工程师引入了受早期 Cortex-X 设计启发的有针对性的改进,例如分支预测器和预取增强功能。

A715 的另一项改进是引入了 3 阶段预测方案以实现快速周转。以前,Arm 具有快速的 L0 0 周期预测和较慢的 2 周期预测结构,而在 A715 中,Arm 将其分解为三个阶段,采用新的 1 周期周转中间结构,从而减少了获得预测的延迟。

随着更高容量的分支预测器产生更高的分支请求带宽,可能会遇到更多获取两个单独指令流的实例。为了适应这一点,A715 现在支持更高的指令高速缓存查找带宽,最高可达标签/周期的两倍。

ARM Cortex-A720

推荐阅读: Cortex-A720
在这里插入图片描述

推荐阅读
https://aijishu.com/a/1060000000365445

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/88510.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《面试1v1》ElasticSearch 集群索引分片

🍅 作者简介:王哥,CSDN2022博客总榜Top100🏆、博客专家💪 🍅 技术交流:定期更新Java硬核干货,不定期送书活动 🍅 王哥多年工作总结:Java学习路线总结&#xf…

【学会动态规划】买卖股票的最佳时机 IV(18)

目录 动态规划怎么学? 1. 题目解析 2. 算法原理 1. 状态表示 2. 状态转移方程 3. 初始化 4. 填表顺序 5. 返回值 3. 代码编写 写在最后: 动态规划怎么学? 学习一个算法没有捷径,更何况是学习动态规划, 跟我…

STM32F103C8T6开发笔记1:有线陀螺仪二自由度机械臂

经过之前几天的快速学习,今日尝试组装一款基于MPU6050陀螺仪控制的二自由度机械臂,本文对其使用器材以及基本原理进行介绍~ 组装效果图: 主要元器件如下: 器件个数15 KG以上 舵机3适合舵机的金属夹爪118650电池电源12V1云台支架2…

WebRTC音视频通话-实现GPUImage视频美颜滤镜效果iOS

WebRTC音视频通话-实现GPUImage视频美颜滤镜效果 在WebRTC音视频通话的GPUImage美颜效果图如下 可以看下 之前搭建ossrs服务,可以查看:https://blog.csdn.net/gloryFlow/article/details/132257196 之前实现iOS端调用ossrs音视频通话,可以查…

SCAU操作系统知识点之(一)计算机系统概述

缩写词: OS: Operating System 操作系统 PSW: Program Status Word 程序状态字 FCFS: First Come First Serve 先来先服务 PCB: Process Control Block 进程控制块 DMA: Direct Memory Access 直接存储器存取 MMU: Memory Management Unit 内存管理单元 SSTF: Short…

从零构建深度学习推理框架-6 构建计算图

PNNX PNNX项目 PyTorch Neural Network eXchange(PNNX)是PyTorch模型互操作性的开放标准。PNNX为PyTorch提供了一种开源的模型格式,它定义了与Pytorch相匹配的数据流图和运算图,我们的框架在PNNX之上封装了一层更加易用和简单的计…

本地跑Mapreduce程序的相关配置

本地跑MapReduce程序需要配置的代码 为了在本地运行MapReduce程序,需要加如下的东西 在项目中创建一个如图所示的包:org.apache.hadoop.io.nativeio,并在该包下面创建一个名为:NativeIO的类(注意:名字不能…

五、约束编程求解优化问题

文章目录 1、瑶草问题-离散优化问题2、重试优化3、分支限界法-改进重试优化法4、重启式搜索4.1 重启方针/策略4.2 自动化搜索策略 THE END 1、瑶草问题-离散优化问题 \qquad 要求在一个建木上构建一个完整的分枝树,每一个完整的分枝有100段,完整分枝上的…

uniapp 扩展组件 uni-forms 的表单验证之 validateFunction 只响应一次

uniapp 扩展组件 uni-forms 的表单验证之 validateFunction 只响应一次 问题代码官方说明参考资料 问题代码 直接从官方示例中复制过来改的。为了演示 <template><view><uni-forms ref"form" :modelValue"formData" :rules"rules&qu…

深度学习(36)—— 图神经网络GNN(1)

深度学习&#xff08;36&#xff09;—— 图神经网络GNN&#xff08;1&#xff09; 这个系列的所有代码我都会放在git上&#xff0c;欢迎造访 文章目录 深度学习&#xff08;36&#xff09;—— 图神经网络GNN&#xff08;1&#xff09;1. 基础知识2.使用场景3. 图卷积神经网…

UnityWebGL移动端兼容性说明

测试时间2023.8.10 官方文档说明 依据Unity官方最新版本文档&#xff08;2021.3LTS&#xff09;&#xff0c;关于WebGL的兼容性说明为"Unity WebGL不支持移动设备。它可能适用于高端设备&#xff0c;但当前的设备通常不够强大&#xff0c;并且没有足够的内存来支持Unity …

【c语言】字符函数与字符串函数(上)

大家好呀&#xff0c;今天给大家分享一下字符函数和字符串函数&#xff0c;说起字符函数和字符串函数大家会想到哪些呢&#xff1f;&#xff1f;我想到的只有求字符串长度的strlen,拷贝字符串的strcpy,字符串比较相同的strcmp,今天&#xff0c;我要分享给大家的是我们一些其他的…

SQL-每日一题【1517. 查找拥有有效邮箱的用户】

题目 表: Users 编写一个解决方案&#xff0c;以查找具有有效电子邮件的用户。 一个有效的电子邮件具有前缀名称和域&#xff0c;其中&#xff1a; 前缀 名称是一个字符串&#xff0c;可以包含字母&#xff08;大写或小写&#xff09;&#xff0c;数字&#xff0c;下划线 _ &…

详细讲解如何在github上编辑个人主页?

在 GitHub 上编辑个人主页可以让您展示您的项目、技能和个人信息&#xff0c;以及与其他开发者互动。以下是详细的步骤来在 GitHub 上编辑个人主页&#xff1a; 创建 GitHub 账户 如果您还没有 GitHub 账户&#xff0c;首先需要注册一个。 登录到 GitHub 使用您的用户名和密…

【TypeScript】进阶之路语法细节,类型和函数

进阶之路 类型别名(type)的使用接口(interface)的声明的使用二者区别&#xff1a; 联合类型和交叉类型联合类型交叉类型 类型断言获取DOM元素 非空类型断言字面量类型的使用类型缩小&#xff08;类型收窄&#xff09;TypeScript 函数类型函数类型表达式内部规则检测函数的调用签…

置信域策略优化Trust Region Policy Optimization (TRPO)

1. 置信域方法(Trust Region Methods) [1]将置信域方法用到强化学习中&#xff0c;并取到了非常好的结果. 1.1 优化问题 1.2 置信域 1.3 置信域方法的过程 References [1] Schulman J, Levine S, Abbeel P, et al. Trust region policy optimization[C]//International conf…

【K8S系列】深入解析k8s网络插件—Weave Net

序言 做一件事并不难&#xff0c;难的是在于坚持。坚持一下也不难&#xff0c;难的是坚持到底。 文章标记颜色说明&#xff1a; 黄色&#xff1a;重要标题红色&#xff1a;用来标记结论绿色&#xff1a;用来标记论点蓝色&#xff1a;用来标记论点 Kubernetes (k8s) 是一个容器编…

构建Docker容器监控系统(cadvisor+influxDB+grafana)

目录 一、部署 1、安装docker-cd 2、阿里云镜像加速 3、下载组件镜像 4、创建自定义网络 5、创建influxdb容器 6、创建Cadvisor 容器 7、创建granafa容器 一、部署 1、安装docker-cd [rootlocalhost ~]# iptables -F [rootlocalhost ~]# setenforce 0 setenforce: SELi…

BGP的工作过程及报文

IGP核心:路由的计算。OSPF,ISIS等 BGP核心:路由的传递,不产生路由,只是路由的搬运工,一般用于规模特别大的网络中,只要TCP可达就可以建立邻居。 大型企业分支间采用BGP进行路由传递,不同的分支属于不同的BGP的AS,它们通过BGP进行路由交互。企业与运营商之间可使用BGP进行…

解决nvm安装后,node生效但npm无效

问题描述 nvm安装后&#xff0c;node生效但npm无效 清除缓存 C:\Users\cc\AppData\Roaming cc是我的用户名改成你自己的就行删除 npm和npm-cache