基于算网大脑的探索和实践

2022年2月,国家正式发布消息,同意在内蒙古、贵州、甘肃、宁夏等地启动建设国家算力枢纽节点,标志着,”东数西算“工程已全面启动。 “东数西算”战略是一项长期的策略,并非是一时的热点,跟“南水北调”工程很类似,本质上都是为了解决国内资源不平均,算力供需不平衡的问题,同时促进国内数据中心高质量发展,并带动数字经济相关产业可持续性发展。

现状及场景需求

当前东部在市场、技术、人才等方面有更多优势,西部在资源、电力、自然条件等方面有更多优势,两者结合,能在一定程度上破解东部捉襟见肘的资源困境和成本压力。当然“东数西算”并不意味着所有数据都放到西部地区进行处理。毕竟受限网络长距离传输造成的时延以及相关配套设施等因素影响,西部数据中心并不能满足所有算力需求。“东数西算”一定是建立在满足业务的需求之上,再实现资源的最优配置,是实际业务需求来驱动的。尤其是对那些实时性要求较高的业务如工业互联网、金融证券、灾害预警、远程医疗、视频通话、人工智能推理等,就不太适合布局在西部。相反,对于后台数据加工清洗、离线数据分析、存储备份、视频渲染等对计算能力密集度要求高,但对网络实时性要求不高的业务则由西部数据中心来承接更为合适。

算力网络需求的落地面临着诸多挑战

挑战1 - 融合架构

在“东数西算”的整个布局中除了西部的数据中心建设外,必不可少的就是建设数据中心之间的高速网络通道,整合“网、云、数、智、边、端、链”多层次算力资源,构成融合架构,并充分利用融合架构的优势,扩展计算资源、存储资源、安全防护及各类丰富的应用等。
让用户请求按照距离就近、访问质量较优线路的数据中心接入,再通过数据中心之间的互联互通的线路通信和数据传输,逐步让算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“网络无所不达、算力无所不在、智能无所不及”的愿景。当然,算力网络还涉及多学科、多领域的融合,仅仅只是简单的叠加,那么融合深度、广度都是远远不够的。

挑战2 - 多层级协同

随着各层级、各场景的互联互通,则需要网随算动,无论是算网连接能力还是调度能力均需持续提升,通过实时感知、协同编排、算网一体的协同智能调度等能力实现网络服务和算力服务的同开、同停、同监控,并各取所需,按需分配,智能调配等动态适应并承载不同应用的能力,构建稳定可靠的算力互访平台,以有限资源换取无线空间,超越人工智能与大数据,实现最大价值。

挑战3 - 一体化服务

从推动信息基础设施布局角度看,全国一体化大数据中心与传统数据中心不同,是将数据中心、通信网、云计算、大数据、人工智能和安全融为一体,构建新型的体系。所以除了有硬件及网络的强大支撑外,提供更为便捷、易用的一体化服务也是很大挑战。

挑战4 - 可扩展及灵活性

算力成为整个数字信息社会发展的关键,超大的规模部署、大量且多样化的数据、海量的服务等,场景越来越复杂,但对灵活性要求却越来越高。性能和灵活性,鱼和熊掌,全部都要。因此对算力的能力也提出更高的要求:通过横向扩展来提升系统的服务能力,并且各种云服务的架构逐渐微服务化以及可扩展处理器的发布等用新技术赋能“东数西算”。

挑战5 - 安全

“东数西算”显然让数据实现东西部数据中心之间的迁移或传输,那跨越千山万水中间的安全问题也成为其挑战。在数据传输过程中是否有被窃取和篡改的风险、是否会遭受各种病毒入侵或攻击等导致数据损坏、业务中断等。因此需要对网端、云上、数据、应用的安全防护实现同步规划、同步建设、同步运营;以安全事件预警、分析研判和响应处置为核心,建设安全大脑以及运营中心,保障一体化大数据中心持续安全运营。除了安全,还有业务和数据的合规、审计等需求。

三大运营商、各专业领域厂商积极参与和推动算力网络整体演进与能力落地

基于上述几大挑战,各大运营商、云商、相关领域的厂商也积极地提出专业见解、解决方案或新技术创新等来应对挑战,积极投入到整个算力网络的研究当中,并在标准领域积极布局,推动国际、国内算力网络标准的形成。

  1. 中国电信认为,通过三个阶段将边缘计算、云计算等多级算力节点与网络完全融合,实现云网融合下的资源供给,为用户提供最优的服务以及运营保障,并逐步消除“计算”、“网络”、“存储”三大资源池之间的显著隔离,将基于云网资源的“云网统一服务”成为数字化平台的标准件。
  2. 中国联通基于云网融合1.0工作基础上,结合未来业务形态的变化,在云、网、芯3个层面持续推进研发,实现SDN和NFV的深度协同,服务算力网络时代各种新业态,迈向算网一体的云网融合2.0阶段。
  3. 中国移动计划把算力网络的发展分为三个阶段,即:起步阶段(泛在协同)、发展阶段(融合统一)和跨越阶段(一体内生)。早在2021年11月,在中国移动全球合作伙伴大会上,中国移动携手华为、中兴通讯、浪潮、飞腾、新华三、英特尔等合作伙伴,共同发布《中国移动算力网络白皮书》,提出了“算力网络”全新发展理念,并联合向业界提出算力网络发展倡议,掀起了算力网络发展新高潮。

结合三大运营商的演进思路来看,算力网络的实现即将算力融入网络,以网络作为桥梁,使得算力通过网络连接实现云-边-端的最优化协同与调度。业界普遍认为算力网络的能力落地主要包括:算网基础设施层、编排管理层、运营服务层。
在这里插入图片描述

(图一 *来自中国移动算力网络白皮书)

算网基础设施层:提供融合的算网底座,未来计算、存储遍布网络,需要以网络为根基,提供普遍服务,将网、云、数、智、安、边、端(ABCD-NETS)等深度融合、提供一体化服务的新型信息基础设施层。

运营服务层:承载泛在计算各类能力及应用,并将用户业务对融合型资源提出的需求如算力要求和网络SLA要求等,传递给编排管理层,实现算网产品的一体化服务供给,使客户享受便捷的一站式服务和智能无感的体验。

编排管理层:算网大脑,即算力网络的控制核心。算网大脑向下实现算网全领域资源拉通,向上实现算网融合类全业务支撑,融合人工智能、大数据技术,实现算网统一编排、调度、管理、运维,打造算力网络资源一体化设计、全局编排、灵活调度、高效优化的能力。未来,算网大脑还将融合意图引擎、数字孪生等技术,实现自学习、自进化,升级为真正智慧内生的超级算网大脑。

算网大脑:控制整个网络、云资源信息,编排整体算网调度的核心
在新华三认为,落地智能大脑的方案演进分为3个阶段:协同融合一体
1、 起步阶段,核心理念“协同”:云和网在资源形态、技术手段、承载方式等方面彼此相对独立,但可以通过两者在云网基础设施层的“对接”,统一资源视图,实现网随算动、协同编排、协同运营和一站式云网订购服务。
2、 发展阶段,核心理念“融合”:算与网逐步融合发展,但还是两个身体,负责管理编排的“大脑”融合统一,实现算网资源层面的统一管理、智能编排和融合服务。
3、 跨越阶段,核心理念“一体”:算网边界被彻底打破,形成算网一体化基础设施,为用户提供融合多技术要素的一体化服务。

除此之外,整体架构应统一技术路线、目标架构、标准体系;实现统一封装、灵活调用,为各行各业打造更便捷的决策工具,并开放、标准的编程模型和访问接口,满足多种外部对接,营造良好的生态环境。

当前新华三是以二阶段为主,并结合三阶段需求,构造新华三的算网大脑落地。

算网大脑作为算力网络的控制核心,在新华三的落地实践是AD-NET应用驱动网络解决方案。AD-NET凭借内生的6大关键能力:云智原生、复合孪生、意图驱动、全域融合、全栈透视和自主构建,在编排层构建起了统一编排、智慧内生的算网大脑。

  1. 云智原生的统一底盘提供算网融合的基础能力,打造敏捷灵活的算网编排底座;
  2. 复合孪生不仅能提供物理网络全生命周期的仿真验证、模拟推演,迭代优化,同时还能将仿真优化配置应用到实际网络网络中,进行网络的优化调配,提升了算网运行的可靠性;
  3. 意图驱动能力利用分析引擎和自动化引擎进行信息交互和闭环处理,基于意图自动翻译、策略构建和自动实施,智能高效实现算力资源整合和选择,持续交付服务意图的网络;
  4. 全域融合打通了不同领域的边界,为算力资源和网络资源的协同部署、编排、调度及可视、端到端的统一管理提供了基础;
  5. 全栈透视能力让我们能够实时感知网络和算力的状态、通过AI、大数据加持,能够做到算网自优化、自闭环,提供客户不间断业务;
  6. 自主构建为客户提供可定义可扩展的集成应用框架,包含可视化页面定制和可视化业务编排能力等,便于客户定制算网融合的服务需求,实现算网统一编排、部署和保障;

在整个算网系统中,AD-NET对接多云平台,收集算力和网络关键数据,形成算网地图。服务层提供协同编排的统一入口,给用户提交应用业务特征及应用所需的算力和网络要求,再由服务层调用AD-NET的标准接口,传递应用特征、算力和网络需求后,AD-NET基于当前算网地图,将算力、网络需求作为调度因子,未来还可结合成本、能耗、均衡性等调度因子,为应用快速计算并自动部署到最佳部署点,同时通过承载网的引流和调度技术,为应用及时部署端到端的最佳传输路径。与此同时,AD-NET也会对云、网资源及应用等多维度的实时监控并呈现,一旦资源紧张或者网络异常时,会及时产生告警,并且自动执行用户提前定义的应对策略,及时保障应用的服务质量。

对于阶段三,其核心需求和理念是“一体”:算网一体、智能算网、算力一体、运营一体。
 算网一体:算力和网络在协议层面一体化,通过更新路由协议,算力资源信息被写到路由信息中,网络设备在扩散路由的同时,分发、传播算力信息,实现转发即计算。
 智能算网:算网大脑引入更多的AI和大数据技术,实现智能感知、分析业务需求,提供安全、运维等多种智能服务,构建整个云网架构的智慧大脑;
算力一体:提供算力管理、算力计算、算力交易以及算力可视等能力,算力网络可像电力网络一样,吸纳全社会不同类型的算力资源,实现用户对算力资源的随取随用;
运营一体:提供云、算、网、数、智、链、安一体的融合运营平台,为客户提供最合适的一体化服务,并可以实时了 解服务提供进度,服务提供质量等各项内容;

在这里插入图片描述

图二 新华三提供全方位算力能力

结合阶段三的需求,新华三当前正以算网大脑为核心,通过试点、技术合作等多种模式,为运营商和政企客户提供泛在的算网一体化服务。包括算网一体化大屏、一体化监控、一体化拓扑、算网资源的统一分发、算网资源统一调度,并可以结合新华三的VDI云桌面等业务应用,进行更深层次的协调联动,从而也就保障了更为优质的业务使用体验。同时华三“融合”和“创新”上深度研究和耕耘:“融合”指的是算网智用一体化,从而让算力和智能实现无处不在,“创新”指的是算力度量、分级算网大脑架构、智能AI等技术创新,既适用于本地化区域中心控制运维,也支持“东数西算”的宏观调度。

结尾:

“东数西算”已逾周年,这一年来,数据中心项目加紧推进,算力产业底座持续夯实,算力资源架构日趋完善。新华三将持续关注、参与新技术、新标准的讨论与投入,和各行各业一起,探讨和实践算力产业高质量发展之路,真正赋能千行百业,为实现“东数西算”提升国家算力水平、促进绿色发展、扩大有效投资、推进区域协调发展的战略初心,贡献企业的社会责任。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/205106.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【古月居《ros入门21讲》学习笔记】08_发布者Publisher的编程实现

目录 说明: 1. 话题模型 图示 说明 2. 实现过程(C) 创建功能包 创建发布者代码(C) 配置发布者代码编译规则 编译并运行 编译 运行 3. 实现过程(Python) 创建发布者代码(…

【JavaEE初阶】 HTTP 请求 (Request)详解

文章目录 🍀序言🎄认识URL🚩URL 基本格式🚩query string🚩关于 URL encode 🌴认识 "方法" (method)🚩GET方法🚩POST 方法🚩 GET 和 POST 的区别 🎋…

云服务器-从零搭建前后端服务(自动化部署、数据库)

云服务器-从零搭建前后端服务(自动化部署、数据库) 免密登陆 第一步就是能免密快速登录到服务器 可以直接使用 FinalShell、MobaXterm 或 XShell 等进行连接 如下方法是直接用命令行操作 安装 Remote - SSH 插件,即可在 VSCode 中进行配置…

小辰的智慧树(差分+前缀和)

登录—专业IT笔试面试备考平台_牛客网 1.考虑总长度之和不能超过m,2考虑限制每棵树高度不能低于ci,如果用二分最短输能截到的高度,还要另外去判断,是否每棵树mid都能严格大于ci ,这样容易超时,换个角度&…

设计一个算法,将链表中所有结点的链接方向“原地”逆转,即要求仅利用原表的存储空间,换句话说,要求算法的空间复杂度为O(1)

设计一个算法,将链表中所有结点的链接方向“原地”逆转,即要求仅利用原表的存储空间,换句话说,要求算法的空间复杂度为O(1) 代码思路: 这里要求不用额外空间,那么就要考虑链表自身的…

西工大网络空间安全学院计算机系统基础实验一(45678)

接着来看第4个函数,int replaceByte(int x, int n, int c),看题目给出的例子,replaceByte(0x12345678,1,0xab) 0x1234ab78。我们可以多写几个例子,进而找出规律,比如: replaceByte(0x12345678,2,0xab) 0…

SASS的导入文件详细教程

文章目录 前言导入SASS文件使用SASS部分文件默认变量值嵌套导入原生的CSS导入后言 前言 hello world欢迎来到前端的新世界 😜当前文章系列专栏:Sass和Less 🐱‍👓博主在前端领域还有很多知识和技术需要掌握,正在不断努…

使用Terraform创建Docker镜像和容器

为了实现自动化操作,Terraform需要明确指定所使用的提供者。因此,在主要的main.tf文件中,需要提供提供者的名称、源和版本信息。对于Docker,可以在main.tf中使用以下代码块。 1 Terraform配置模块 使用块和资源创建Terraform脚本…

每日一题:LeetCode-202.面试题 08.06. 汉诺塔问题

每日一题系列(day 07) 前言: 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 &#x1f50e…

QT搭建的Ros/librviz的GUI软件

1.前言 开发初期学习了下面博主的文章,也报了他在古月局的课,相当于感谢吧。 ROS Qt5 librviz人机交互界面开发一(配置QT环境)-CSDN博客​​​​​​​r 软件前期也是参考他的开源项目 GitHub - chengyangkj/Ros_Qt5_Gui_App …

Java核心知识点整理大全22-笔记

目录 19.1.14. CAP 一致性(C): 可用性(A): 分区容忍性(P): 20. 一致性算法 20.1.1. Paxos Paxos 三种角色:Proposer,Acceptor,L…

【SpringBoot3+Vue3】五【完】【实战篇】-前端(配合后端)

目录 一、环境准备 1、创建Vue工程 2、安装依赖 2.1 安装项目所需要的vue依赖 2.2 安装element-plus依赖 2.2.1 安装 2.2.2 项目导入element-plus 2.3 安装axios依赖 2.4 安装sass依赖 3、目录调整 3.1 删除部分默认目录下文件 3.1.1 src/components下自动生成的…

GO 集成Prometheus

一、Prometheus介绍 Prometheus(普罗米修斯)是一套开源的监控&报警&时间序列数据库的组合,起始是由SoundCloud公司开发的。随着发展,越来越多公司和组织接受采用Prometheus,社会也十分活跃,他们便…

re:Invent 2023:PingCAP 荣获亚马逊云科技 2023 年度合作伙伴奖项

2023 年 11 月 27 日 – 12 月 1 日, 2023 亚马逊云科技 re:Invent 在拉斯维加斯举办,亚马逊云科技合作伙伴奖项在合作伙伴颁奖晚会上颁布, PingCAP 荣获亚马逊云科技大中华区 “2023 年度 ISV 合作伙伴” 和 “2023 年度亚马逊云科技 Market…

离散时间信号的分析(数字信号处理实验1-2)

前言:该系列实验均使用matlab完成,实验课程为《数字信号处理》 文章目录 一.题目二.实验目的三.实验仪器四.实验原理实验所用的matlab函数解析离散时间信号实验原理: 五.实验步骤六.实验代码及实验结果完整代码1.线性卷积代码2.循环卷积运算…

WordPress 外链跳转插件

WordPress 外链跳转插件是本站开发的一款WordPress插件,能对文中外链添加一层过滤,有效防止追踪,以及提醒用户。 类似于知乎、CSDN打开其他链接的提示。 后台可以设置白名单 学习资料源代码:百度网盘 密码:123

前端已死?看看我的秋招上岸历程

背景 求职方向:web前端 技术栈:vue2、springboot(学校开过课,简单的学习过) 实习经历:两段,但都是实训类的,说白了就是类似培训,每次面试官问起时我也会坦诚交代&…

蓝桥杯每日一题2023.11.28

题目描述 三羊献瑞 - 蓝桥云课 (lanqiao.cn) 题目分析 本题首先进行观察可以确定 1.“三”为 1 &#xff08;十进制数字要进位进一位&#xff09; 2.“祥”一定不为 0 &#xff08;有前导0就不能算为 4 位数&#xff09; 使用搜索时将其特判 #include<bits/stdc.h> …

SparkRDD及算子-python版

RDD相关知识 RDD介绍 RDD 是Spark的核心抽象&#xff0c;即 弹性分布式数据集&#xff08;residenta distributed dataset&#xff09;。代表一个不可变&#xff0c;可分区&#xff0c;里面元素可并行计算的集合。其具有数据流模型的特点&#xff1a;自动容错&#xff0c;位置…

蓝桥杯day02——移动机器人

1.题目 有一些机器人分布在一条无限长的数轴上&#xff0c;他们初始坐标用一个下标从 0 开始的整数数组 nums 表示。当你给机器人下达命令时&#xff0c;它们以每秒钟一单位的速度开始移动。 给你一个字符串 s &#xff0c;每个字符按顺序分别表示每个机器人移动的方向。L 表…