赵哥,在上海一家基金公司做运维主管。
平时工作的首要任务,就是保障公司各项信息系统的安全运行。
万一系统运行中出现了一些重要问题,他还要负责进行调查、记录与汇报...
总之,责任很重,该说不说,搞不好就得“背锅”。
最近,赵哥接到上头领导下达的一项重要任务,为了系统突发事件时,能够快速、有效地响应和恢复系统的正常运行,需要赵哥组织公司各部门联动起来,开展应急管理,制定应急预案,并定期组织应急演练。
赵哥接到任务后,马不停蹄的开始行动起来,伴随着从0到1推进应急建设和管理工作的过程中,赵哥发现了诸多的难以横跨的难点...
- 各类系统应急预案较为分散,难以集中管理或标准化治理;
- 无法支持不同角色基于故障场景快速发起应急、演练;
- 应急预案无法支持“自动化“的原子策略进行编排、执行;
- 演练、应急资源集结、信息传递效率低下;
- 应急、演练流程不够通用、标准化、应急演练工作难以开展;
- 应急演练效果难以度量,缺乏相应数据作为参考。
此时此刻的赵哥,坐在电脑前,一个头几个大,满脸写着烦躁。
看到赵哥这个样子,我于心不忍,赶紧支招:哥,您别烦躁。并献上优维为赵哥量身定制的“锦囊妙计”。
这个“锦囊妙计”,叫做「优维新一代应急演练一体化管理解决方案」,即优维自主研发的IT系统应急、演练一体化管理平台。从企业业务管理视角出发,优维应急演练一体化管理平台构建了标准化、自动化、可度量,支持多角色协作的演练、应急、预案管理的能力,覆盖IT应急、演练、预案管理主流流程,提供一站式安全可控的应急演练服务。同时,业务、研发、运维等多部门、多角色能够协同参与IT应急管理,全面提升应急响应和处置能力,快速有效应对各类突发事件。
针对如基金交易等大规模多活中心及高复杂度业务调用下的场景特点和共性挑战,平台以“三中心一报表”为基础,全面覆盖了预案编排、演练实施、应急处置、多维评估等一站式全方位管理,提供预案中心、演练中心、应急中心、应急报表四大核心能力模块,实现更科学、更标准、更实用、更智能的应急管理,助力企业及时解决与善后系统中的突发事件,给整个系统的稳定、安全运行提供有力的保障。
那么它是如何帮助赵哥做好应急演练管理的呢?
提供四大能力!
预案中心
包含应急预案、预案策略、策略模板、全局历史、故障场景中心。
通过预案中心,可集中标准化管理企业各类系统的应急预案,支持应急预案的新增、编辑、删除和发起应急单。提供预案策略全生命周期管理,支持原子化自动化策略和手工策略的灵活定义,平台提供标准化各类预案策略模板,帮助用户快速完成标准预案编写工作。根据实际突发事件,梳理建立故障场景库,支持基于故障场景快速发起应急、演练。提供历史预案信息的查看功能。
应急中心
包含场景应急、系统应急、应急单。
在应急中心,支持用户根据场景和系统快速发起应急,当突发事件发生时,可快速根据故障选择合适的应急预案进行应急响应、处置和恢复。提供应急单全生命周期管理,支持应急单发起、应急审核、应急处置、处置结果上报、应急处置验收等全流程。
演练中心
包含演练计划、演练单。
着重解决针对于演练如何进行规范化、流程化、标准化的管理问题,从合规和规范流程的角度,对演练计划、演练单的全过程进行标准化、流程化的全生命周期管理。支持多角色进行协作,进行常态化演练和应急;支持演练计划新建、编辑、删除;支持演练单的发起、审核、开启演练、完成演练、验收等能力。
应急报表
包含预案执行次数、预案团队执行。
在预案、应急、演练结束后,平台支持从执行、覆盖度、数量等维度对预案、应急演练结果进行度量,提供丰富的报表和视图,进行可视化呈现。同时支持从MTTF、MTTD等维度评估演练、故障处置流程的效率,为后续流程及决策提供参考。
有了「优维新一代应急演练一体化管理解决方案」,系统应急演练管理更科学了,实际操作更标准了,运维工作变简单了,效率也更高了,处置系统突发事件也更游刃有余了。
只见赵哥用上之后,终于眉头舒展,露出了久违松弛的微笑...