文章目录
- 华为文档获取方式
- 前言
- 云计算发展背景
- 国家政策、社会发展驱动数字经济开启新时代
- 深化数字化转型提升效率,国家数字主权云进入落地阶段
- 从Cloud-Based到Cloud-Native,两种模式长期并存
- 适合政企智能升级的云
- 华为云Stack,政企智能升级首选
- 华为云Stack系统整体架构
- 华为云Stack标准逻辑部署架构
- 华为云Stack 8.1.1云服务一览
- 华为云Stack,政企只能升级首选
- 坚实基座
- 基础设施全面云化
- 资源融合,灵活调配
- 多元算力,支撑政企客户自主创新
- 云内云外云间全互连网络
- 云网络运维 - CloudNetDebug
- 全地域全场景灾备
- 根据不同业务场景选择更加适合的上云容灾方案
- 云原生灾备,以应用为中心的同城容灾
- 租户级容灾演练平台
- 基于云原生安全能力,使能业务安全
- 从咨询到测评,一站式通过等保三级认证
- 商用密码应用安全性评估解决方案,高效过三级
- 数据安全解决方案
- 精细化管理
- ManageOne云管理平台功能架构
- 多云统一管理,打造客户视角一朵云
- 云联邦2.0智能升级,构建智能混合云
- 智能运维Operations Insight
- 自动化运维AutoOps
- 服务中心
- 智能数据、敏捷应用、卓越服务、缩略语整理
华为文档获取方式
-
登录华为官网
华为官网 -
然后点击:学习与技术支持-产品文档
-
以本文中的云计算为例,下拉,找到-企业数据中心-云计算
可以看到文档后面有锁,这种是需要华为客户才能看的。
-
我们这一共需要用到下面文档
-
还有个资料汇总也是找资料的一个重要地方
-
hcie的考试资料也可以直接下载【这个登录就能下载,没有权限限制】
前言
华为从2008年启动云计算研发布局,经过了十多年的发展,每个版本的迭代都紧跟技术的发展和时代要求,本章将结合最新历史背景介绍华为云Stack解决方案,为后续的进一步学习打下一定基础。
- 学完本课程后,您将能够:
- 了解传统IT和企业数字化转型的趋势
- 了解华为云Stack是什么
- 了解华为云Stack的架构
- 了解华为云Stack的高阶云服务
云计算发展背景
国家政策、社会发展驱动数字经济开启新时代
- 从宏观层面来看,数字经济开启了新时代。新基建、东数西算、数字主权、疫情新常态都引发了建设云平台,作为数字化底座的需求。例如数字霸权导致全球各国数字主权觉醒,国家数字主权云迅速兴起,各国陆续发布云战略。疫情期间,催生了在线教育风潮,而在线教育平台普遍都是基于云平台底座部署
- 数字霸权->数字主权:欧洲将在未来七年内提供76亿欧元强化数字主权; 2021年《中华人民共和国数据安全法》
- 西电东送->东数西算
- “双碳” 目标牵引数字经济绿色可持续发展
- 强化数据中心统筹布局与集约化建设,构建数字时代“经济新版图”
- 铁公机->新基建
- 云计算是”新技术基础设施” 的重要构成,数字经济重要底座
- 疫情新常态
- 疫情让政企进一步认识到数字化的重要性,并加快拥抱数字技术提升数字化韧性
深化数字化转型提升效率,国家数字主权云进入落地阶段
从行业变化来看,数字化转型是行业永恒不变的话题。 以通过拥抱新技术来提升企业活力和市场竞争力、支撑新业务发展是所有人的共识。银行业是相对IT技术能力较强的行业,先进银行客户进入Bank 4.0阶段,发展互联网金融业务、分布式改造从外围例如Web接入向核心系统延伸,未来会越来越多基于云原生技术来打造敏捷、创新的分布式新核心平台。油气行业通过引入大数据、AI等技术,提升勘探、开发效率。
从Cloud-Based到Cloud-Native,两种模式长期并存
适合政企智能升级的云
- 不同行业、不同阶段的需求不尽相同。那么政企迈向智能升级的新阶段,需要一朵什么样的云? 值得我们去深入思考:
- 初期,政企关注点主要在如何平滑上云,希望既享受云的便利,又不带来额外的负担。比如,云平台要能够匹配他们复杂的组织架构,长远看还要为包括关键业务在内的业务全面云化提供稳定可靠的保障;
- 其次,多样性数据时代已经来临,数据的价值需要更实时、更智能的手段进行挖掘,云平台是需要在这方面体现独特价值,驱动全流程的智能化变革;
- 第三,为了支撑业务快速创新和迭代,需要基于云原生实现应用的敏捷化,这个过程不能像互联网企业宣称的全盘推到重来,需要兼顾原有应用,渐进式创新;
最后,政企云平台从构思到落地的过程,通常比想象的复杂很多。如何更好地建云、上云和用云,政企希望有懂行的伙伴与专业的经验,以避免走弯路。
- 面对这些纷繁复杂的需求,总结起来需要一朵有技术、更懂政企的云,与用户一起深耕数字化转型。
华为云Stack,政企智能升级首选
华为云Stack 源于华为公有云的全栈服务能力,在统一API、统一体验和统一生态的基础上,通过本地部署满足用户的合规要求,目前我们已经提供业界最领先的12类80+云服务。华为云Stack从四个方向战略投入:打造坚实基座、推进数据智能、加速应用敏捷、提供卓越服务,并推出一系列产品和解决方案,使能政企从上云到云上创新。
华为云Stack系统整体架构
- 华为云Stack解决方案分为四个层次
- 基础设施层,适配多元的算力,支持X86、鲲鹏、飞腾、海光;支持GPU;支持分布式存储、集中式存储、交换机、负载均衡器、防火墙等;
- 第二层,资源池层,通过云平台系统软件实现硬件资源池的使能和操作,分别实现了IaaS的资源控制、容灾备份的资源控制、大数据、数仓的资源控制等;
- 第三层,是云服务层,构筑了云服务Service能力,实现云服务的使能和管控。
- 最上面一层是展现层(运营与运维),ManageOne面向租户和运营运维管理的入口。 提供云服务的运营集成能力,通过Console Home集成各云服务Console,为用户提供 统一的云服务使用界面入口。与此同时,提供云平台的系统级运维能力,实现对云服务端到 端的监控能力,包括云服务自身、租户资 源和云服务所依赖的基础设施(计算、存 储、网络)。收集并展示上述监控对象的 告警信息,同时基于这些监控和告警数据 提供报表、大屏以及高级运维数据分析能力。
华为云Stack标准逻辑部署架构
- 1 HCS Global与Region融合部署场景下,Global组件管理面与Region组件管理面部署在同一个OpenStack资源池内,并按不同的业务特性部署在不同的网络区域内。DMZ区部署LVS、Nginx等组件,External_OM区部署运营运维服务、高阶服务、基础服务、跨云管理服务,OM_Service区部署远程接入组件
- 2 计算-管理下沉区部署高阶服务管理面,计算-租户区部署计算AZ(KVM/BMS)
- 3 网络区部署网络节点与网元
- 4 存储区部署块存储和对象存储
华为云Stack 8.1.1云服务一览
华为云Stack,政企只能升级首选
坚实基座
基础设施全面云化
- HCS8.1.1解决方案增强了云底座的能力,围绕一云多芯组合算力,通过高适应性网络以及更高的安全保障,为客户提供最强的云基座基础服务能力,为客户IT基础设施全面云化和业务全量平滑入云提供强大的保证。
- 1、通过一云多芯的广泛异构设施接入能力,组合鲲鹏、X86、海光、飞腾多种CPU架构类型基础设施,并提供了灵活的混合部署管理能力,结合多种算力优势,提供KVM虚拟化、BMS等基础实例以及GPU、NPU等AI场景实例,覆盖范围更广,型号更全。
- 2、通过增强的高适应性网络接入能力,打通客户云内云外网络资源,帮助客户业务平滑上云。并进一步增强了网络设备的兼容性,支持第三方主流网络设备,如锐捷网络设备,提供客户更好的兼容性选择范围。3、在安全竞争力方面,HCS8.1.1全栈解决方案通过了国密三级标准,为用户提供安全可靠的全栈一站式入云解决方案,满足政企客户上云的合规,安全,可靠的要求。
资源融合,灵活调配
- HCS基础服务提供了完善的云化能力,对不同类型资源进行整合,利用灵活的资源调配能力,为用户提供完整的云基础设施解决方案。
- 1、基础设施云化是指,x86,鲲鹏,海光,飞腾不同CPU架构的服务器,OceanStor Pacific,华为SAN存储设备等存储设备,交换机等网络设备,并进一步扩大第三方设备的兼容性。作为物理资源池云化后,以虚拟化资源池,BMS资源池,GPU资源池,容器资源池,以及Hadoop资源池的形式,用户无需关心真实的物理硬件的类型和位置,只按需向资源池提出资源的诉求即可,并由资源池会全局考虑隔离性,安全性,并支持弹性伸缩和按需计量计价等能力。以IaaS,PaaS,DaaS服务化的方式提供给运营商,政府,金融,制造,医疗,媒咨,能源,交通等各行业客户来使用。
- 2、资源融合是指,服务化内部会把计算,网络,存储等各种资源,以虚机、容器、物理机,GPU加速、AI加速,高性能卸载转发、普通IO转发等形式提供给用户,用户无需关心资源的组合和发放过程。另外支持多云协同,支持全地域,全场景的灾备和备份,满足政企客户上云的合规,安全,可靠的要求。
- 3、灵活调配是指,在资源管理和分配的过程中是由HCS智能的按策略分配的,充分考虑资源的负载均衡和利用效率。
多元算力,支撑政企客户自主创新
截止目前华为云Stack云服务都已经完成了以国产化架构为核心的基础算力的适配,并已发布。同时和业界主流的操作系统、数据库、中间件都已经做了兼容性验证,如Centos、中标麒麟、深度、Ubuntu,Mysql、Postgresql、南大通用、达梦、东方通/金蝶等。同时基于操作系统提供丰富的编译器、工具链,编译器如Gcc、JDK,编程语言有C、C++、Java、Python、Ruby、Go等。向上联合政府、金融、公共安全、企业、运营商等行业的ISV进行行业应用适配,目前对接行业合作伙伴超过50家,形成行业联合解决方案超过60个。通过多核架构和更加广泛的国产化生态,并提高了上层应用的算力及网络处理能力,助力企业基础设施上云多元化选择和更高的企业自主适配创新能力
云内云外云间全互连网络
-
HCS云解决方案提供了丰富的网络服务化能力,支撑用户云内互通和云外互通的不同诉求。
-
云内租户业务互通方面,HCS提供了如下能力:
- 1、子网内互通(VPC):子网内默认二层互通,同时提供安全组能力,可以基于实例端口边界做安全访问控制。
- 2、同VPC内VM通过内网DNS互访(DNS):提供VPC内网DNS能力,VPC内应用可以基于域名互访,内网域名提供域名到IP的解析
- 3、同VPC子网间互通(VPC):同VPC内跨子网默认三层互通,同时提供网络ACL能力,基于基于子网边界做安全访问控制
- 4、多部门数据快速共享,跨VPC VM互通:如跨VPC有互访诉求,可以配置VPC Peering,按需配置路由实现跨VPC的子网间互通。
- 5、服务安全访问,跨VPC VM/容器/APIG等互通:如需集中部署服务开放给其它VPC访问。可以配置VPC Endpoint实现跨VPC的访问,无需配置路由,需要额外配置安全访问控制。
- 6、VPC内支持精细化路由能力,可把业务流量引流至特性云主机(如安全软件),实现云内流量调度能力,满足第三方安全模块引流安全诉求。
- 7、ELB服务支持跨云间的负载能力,并支持7层高级路由。
-
云外/云间租户业务互通方面,HCS提供了如下能力:
- 1、云内VM和Internet互通:如VPC内网需要和公网互通。可以配置EIP实现内外同时主动访问,可以配置SNAT实现内网主动访问外网,可以配置DNAT实现外网主动访问内网。
- 2、云内VM和专网/本地网络互通:如VPC内网需要和客户的本地网络互通。可以配置专线。
- 3、传统应用快速上云/互通,云内VM和第三方资源池二层互通:如客户本地网络内的应用需要迁移上云,且IP地址保持不变,可以配置二层桥接。
- 4、跨区域私网互通,支持跨Region网络互通,跨云VPC peering能力:如跨Region的VPC有互访诉求,可以配置云连接,按需配置路由实现跨Region VPC的子网间互通。
云网络运维 - CloudNetDebug
- 应用场景
- 解决客户局点云虚拟网络故障定界定位痛点,实现秒级故障定界定位
- 自动化收集网络故障状态、日志信息,精确辅助管理运维人员排障
- 新增关键技术
- 新增vpcep、natgw、elb拨测能力,快速定界流量中断点
- 新增vip流量抓包,支持EIP/VPC/DC/VPC-PEERING等网络流量类型运维场景
- 加固主动链路探测,新增elb主动链路,持续监测重要流量
- CloudNetDebug是面向运维人员的虚拟网络领域的网络诊断工具。通常数据中心网络出现异常时,运维人员需要手工登录各个节点,上传TCP DUMP的工具进行命令行抓包操作,抓包完成后需要下载抓包文件到本地进行排查。操作繁琐,耗时耗力,容易出错,当需要在业务流的多个点同时抓包时,需要同时操作多个命令行,需要一定的操作能力才能完成。CloudNetDebug集了拨测和抓包两个功能,用于处理数据中心内可能出现的各种网络问题,通过拨测工具可自动化检测业务网络是否出现断流,是否出现丢包,通过抓包功能可实现自动化抓包,支持基于业务流的多点协同抓包,支持灵活的单点虚拟机网卡抓包和主机网卡抓包。通过CloudNetDebug工具,可用于检测网络断流,丢包问题;当网络故障时,可用于定界虚拟网络和物理网络的故障边界,可自动化定界是哪个网元节点的问题;当无法确认是应用还是网络的问题时,可用于排除网络问题。
全地域全场景灾备
华为云Stack提供全地域、全场景的灾备服务,满足政企核心业务上云诉求。我们提供业界唯一支持全地域(本地/同城/异地/两地三中心)、全场景(数据/网络/应用)、租户自助的容灾解决方案。当业务部署在单一本地数据中心时,虚拟机、容器高可用、云硬盘高可用、云主机备份、卷备份等云服务会帮助客户保障数据的安全性和准确性,数据中心内故障时业务不中断。随着业务可靠性需求的增加,客户可按建设节奏逐步演进容灾方案,在同城建设双活数据中心,同时提供应用级与平台级业务连续性保障。华为云Stack支持数据库服务,中间件服务,虚拟机容器等核心组件的双活,做到实例级故障自动切换,单部件切换后网络IP和接入访问方式不变,业务生产完全无感知。RPO等于0,RTO分钟级,从容应对数据中心级灾难。当然,客户也可以选择基于云服务器的容灾能力,无需业务改造即可帮助客户轻松实现业务数据级容灾。极端场景下,企业可建设业务无改造的两地三中心容灾方案,通过CSHA、CSDR等服务,提供用户上云即容灾的能力。通过统一的容灾管理平台方舟,实现一键式容灾切换,降低运维复杂度。租户甚至可以定期执行容灾演练。当洪水、地震等极端灾害到来时,华为云Stack将从容应对,持续为客户提供服务。
根据不同业务场景选择更加适合的上云容灾方案
经过HCS在政企市场不断的实践中发现,用户对于容灾的诉求是不一样的。对于客户不同的业务诉求我们提供了两种不同技术堆栈的解决方案,对于业务连续性要求高的,可采用云原生双活解决方案,通过HCS平台本身提供的数据库、中间件、网络对接仲裁的高可用自动切换能力,可以为应用提供跨DC的双活能力。对于一些传统应用,业务连续性要求不高的,HCS提供业界独有的平台级容灾服务CSHA、CSDR,通过对虚拟机的数据保护能力,为用户提供无需业务改造的跨DC容灾能力,满足用户低成本的投入诉求。HCS提供的这两种方案能力是解耦的,可以在同一架构平台上同时提供两种方案能力,这样就为客户选择容灾方案上提供了更多的选择。
云原生灾备,以应用为中心的同城容灾
- 随着政企市场上云进度加快,各个行业的核心应用已经开始采用微服务架构开发。用户对于容灾的诉求更多的从基础架构层面上升到应用自身层面,HCS基于云原生时代的背景,推出了云原生的应用双活解决方案。
- 云原生双活方案主要在应用的接入层、应用层、中间件层、数据层分别提供了组件的跨DC高可用能力。
- 在接入层:支持网络出口故障自动切换,保持EIP不变;支持ELB跨数据中心高可用,可实现跨数据中心ECS负载均衡
- 在应用层:可以通过应用管理平台Service Stage对我们的应用进行生命周期管理,CCE和ECS实现了跨AZ的双活。
- 在中间件层:支持DCS/MQS集群跨AZ主备部署,单边故障无需修改配置,访问方式保持不变
- 在数据层:支持OBS和SFS跨AZ高可用。数据库跨AZ集群拉远部署,单边故障VIP不变。对于MRS和DWS也支持跨AZ容灾。
- 最后,通过我们的云管平台高可用架构,实现从业务到管理的端到端双活解决方案。
租户级容灾演练平台
在用户日常运维过程中,往往会做一些定期的容灾演练活动。方舟服务提供了一个租户级服务化的容灾管理平台,可以支撑租户自定义的容灾编排能力。租户可以依托界面化的方式,对应用容灾实例进行监控和任务管理。大大的减少了在容灾演练过程中的误操作,提升演练的效率和质量。
基于云原生安全能力,使能业务安全
从咨询到测评,一站式通过等保三级认证
- 华为云Stack提供完整的等级保护解决方案,通过”一个中心”+“三重防护”的安全服务和内置安全能力,满足等级保护要求,并按照套餐模式向客户提供一站式等级保护解决方案
- 1、等保整体解决方案设计原则为“一个中心+三重防护“,安全能力覆盖租户和平台;面向业务提供可满足等保认证的安全套餐;
- 2、平台安全能力由平台基础安全和平台安全服务注册,基础安全为内置能力,安全防护通过安全服务产品提供支持;
- 3、租户安全方案由服务内置安全和安全服务组成,租户自研应用需要基于安全服务的能力构建租户应用安全;
- 4、其中AntiDDos、态势感知、日志审计服务可同时支撑平台和租户,无需分别单独部署;
- 5、在通信网络安全中,通过网络分区隔离、虚拟网络平面隔离、管理墙、VPC、云防火墙、网络高可用等技术能力,满足等保安全通信网络要求;
- 6、在区域边界安全中,通过AntiDDos、IPS&AV、WAF、云防火墙等技术能力,满足安全区域边界中边界防护、访问控制、入侵检测、安全审计等技术要求;
- 7、在技术环境安全中,通过平台基础安全、平台安全防护、主机容器安全服务、网络隔离服务、数据加密服务、认证鉴权服务、应用防护服务,满足等保认证中身份鉴别、访问控制、入侵防护、数据保护等技术要求;
- 8、在安全管理中心中,通过日志审计、态势感知、数据安全管理、运维审计、密钥管理、漏洞扫描等,满足等保认证中系统管理、审计管理、安全管理、集中管理等技术要求;
商用密码应用安全性评估解决方案,高效过三级
- 2020年1月1日起施行《中华人民共和国密码法》, 相关标准包括GB/T 39786-2021《信息系统密码应用基本要求》、《信息系统密码测评要求》(简称“密评”)等相继发布实施。“密评”成为当前政务系统、关键基础设施等过等保2.0 三级以上测评的必要条件。因此为满足混合云的合规性, 华为严格基于《信息系统密码应用基本要求》对华为云平台进行整改,以在政务云、XC云等场景协助客户顺利通过“密评”。
- 具体方案层面,基于自研公共密码组件,集成满足二级密码模块要求的三方密码设备,对云服务、云管平台、远程运维等进程多方面改造,在云平台内落地商用SM密码,构建完善的密码防护体系,同步提升云平台自身内生安全防护,保障交付中国区重点行业客户的云平台安全、合规。云平台内主要改造点如下:
- 平台内存储的本地凭据、敏感数据存储加密;
- 服务接入、运维接入、VNC接入等外部链路传输安全加密,支持商密SM2双证书体系;
- 服务、云管、OS等登录口令加密保护;
- 镜像、日志等重要数据完整性保护;
- 服务、云管接入支持基于证书的身份鉴别,支持商密SM2双证书体系;
- 支持统一的密钥、证书管理;
- 同时,关键云服务ELB、KMS、DEW等支持商密能力,使能租户业务应用商密改造
数据安全解决方案
- 随着《数据安全法》《个人信息保护法》等法律法规的出台,数据安全已经涉及国家安全与公共利益。面向政企内部,可能存在商业间谍主动泄密的情况,也有无意的被动泄露如钓鱼邮件等;面对外部攻击,黑客可能采取拖库,洗库,撞库等方式盗取信息,发现响应难。针对数据安全,华为云Stack提供以数据为中心的安全解决方案。主要面向数据湖、存储池和数据库三大数据相关场景。
- 1.通过云安全服务和云原生安全特性保障数据安全,在数据发现与标记、主动安全防护、异常检测发现和响应恢复四个维度提供丰富能力,例如,数据存入OBS后,通过服务加密和秘钥管理,保证静态存储安全
-
- 大数据场景中,通过DSC和DGC的动态脱敏和静态脱敏,保证敏感隐私数据不泄露。
-
- 通过DSC和态势感知等能力,实现数据安全的可视化,可以直观展示比如多少个文档中有敏感数据,是否加密,是否泄漏,风险告警灯。出最终实现上云即安全,内部防泄漏,外部防窃取。
精细化管理
- ManageOne的定位是面向企业应用市场,为企业提供一站式IT服务管理平台,联合生态合作伙伴一起打造用户视角的一朵云,共同创造企业私有云和混合云市场新的商业及服务模式,使能企业IT更简单、更安全、更高效。
- ManageOne在连续5年的中国云管理市场软件排名中,均名列第一。
- ManageOne由3部分构成:
- 1、运营指挥中心(OCC):聚焦企业成本,效率,质量,风险需求,提供故障监控,事件管理,变更管理,值班管理,报表大屏,资源&云服务,容量等分析能力。
- 2、运维中心(SC):支撑运营管理员的管理操作,以及普通租户的资源的自助申请和管理,实现多个数据中心,多类型资源池,多类型云服务的集中运营管理。提高服务构建,组织管理,应用管理等能力。
- 3、运维中心(OC):支撑日常运维、系统变更、运营分析等运维业务场景,实现多个数据中心与混合云的集中运维管理。提高全栈监控,智能运维,运维自动化等能力
ManageOne引入生态合作伙伴,纳管Vmware,阿里,腾讯,浪潮ICOS等云系统,实现多云的统一管理
ManageOne云管理平台功能架构
- ManageOne作为华为云Stack的统一云管理平台,实现对不同地域云服务/资源池的统一管理和监控。
- ManageOne包括运营指挥中心OCC、运维中心OC、服务中心SC。
- 运营指挥中心OCC:运营指挥中心包括作战室,分析室,值班室,制作室等组件,提供故障监控,事件管理,变更管理,值班管理,报表大屏,资源&云服务,容量等分析能力。OCC聚焦企业成本,效率,质量,风险需求,构建开放的灵活开放的数字化运营平台,并匹配企业运营作战组织,提供专业的作战指挥室,从而提升运营效率和服务质量。
- 运维中心OC:云运维管理包含集中告警、统一监控、运维可视化、操作运维中心、日志中心等功能模块,支撑日常运维、系统变更、运营分析等运维业务场景,实现多个数据中心与混合云的集中运维管理。
- 服务中心SC:云服务中心包括服务目录管理,订单管理,用户/角色管理,配额管理,计量计价管理,流程审批等功能模块。支撑运营管理员的管理操作,以及普通租户的资源的自助申请和管理,实现多个数据中心,多类型资源池,多类型云服务的集中运营管理。
- ManageOne南向接入不同类型的资源池、云服务、设备管理系统,提供统一服务发放和服务保障功能;北向提供开放API,可以供第三方运营/运维/应用系统进行调用
多云统一管理,打造客户视角一朵云
- 多云统一管理,分两大类接入类型:
- 一朵云接入:即十统一接入,支持HCS、FusionCompute、Vmware、阿里(ISV提供接入插件,基线默认不提供)、腾讯(ISV提供接入插件,基线默认不提供);不在这个范围内的,可以由ISV通过十统一规范接入ManageOne;
- 云联邦接入:支持华为云、HCS、HCSO(华为边缘region、专属云场景),ManageOne以租户的身份,通过联邦认证,申请这些资源池的云服务资源,注意:
- 对接HCSO不支持统一配额、统一计量、统一服务流程、统一资源中心;
- HCSO部署到客户机房场景,ManageOne通过十统一的方式管理HCSO;
云联邦2.0智能升级,构建智能混合云
智能运维Operations Insight
- 1.由于云上的业务多为分布式部署、动态调整、网络边界不完全可见等因素,对业务系统的运维以及监控管理的支撑提出了更高要求。基于业务视角的监控模型和健康度/繁忙度评估算法,使用通用语言描述业务状态,IT部门监控业务和资源从此变得更简单
- 2.当业务系统出现问题时,花费时间最多的往往是多个部门之间确认到底是谁的问题。故障定界时间对业务的恢复时长有非常大的影响。基于即时的信息抓取和内置的CMDB,通过分层业务拓扑,各层资源对象的健康情况一览无余,IT部门在做故障定界时责任边界清晰可见,故障定界高速高效,有据可依。
- 3.当业务出现问题时,通过逐级下钻的分析方法,辅助运维人员进行定界定位,在一个页面中同步在多个时间轴内展示业务的虚拟化层、服务器层、网络层的健康、繁忙走势情况,以及针对各资源对象的性能下钻。通过这样的方法来辅助运维人员完成快速的问题定界。MTTR得到大幅缩短
-
- 基于XGBoost等异常检测算范,实现动态阈值告警,通过对历史数据的训练得到动态阈值基线,达到条件后触发告警。有效减少了配置工作量70%,提升告警精准度,降低误报率。智能运维分析提供的核心能力包括:
- 1、异常检测:采用分布异常检测算法GMM(高斯混合模型)进行异常检测,针对难预测无规律变化的指标采用”异常离群”点检测方法
- 2、指标预测:针对可预测且呈现强周期性规律变化的指标采用LSTM/XGBoost/EWMA等算法预测指标来拟合指标曲线
- 3、误差检测:针对拟合得到指标的预测误差采用boxplot方法来检测异常
自动化运维AutoOps
自动化平台AutoOps提供了运维脚本以及各类原子能力管理的框架,支持用户将日常运维经验自动化,利用我们内置的170+脚本和客户自己开发的脚本进行编排调度,帮助客户实现多云协同、资源发放、业务拨测、健康巡检、密码修改等各类日常操作。
服务中心
- 政企客户在使用传统云管时,往往还是采用资源申请、网络配置、软件安装的用云流程,并没有发挥出云的优势。
- ManageOne通过服务构建器,能够实现各类云资源、应用配置、业务软件和政企流程的二次封装,构建出符合特定政企场景的应用服务(例如数据库集群服务),进而形成政企客户自己的IT能力服务化生态。这样可以帮助IT部门变被动为主动,转变为企业IT服务供给中心。
- 服务构建器还支持跨云编排,可以把Web前缀部署在华为云资源池,数据库后端部署在本地资源池,充分利用本地的数据安全性和公有云海量资源的弹性。
智能数据、敏捷应用、卓越服务、缩略语整理
- 看下面这篇文章吧,没想到内容这么多,晕