站点可靠性工程 (SRE)

随着世界各地的组织努力开发安全、可靠、可扩展且可持续的 IT 基础架构,对高效基础架构监控和管理的需求日益增长,企业正在用不可扩展的遗留架构换取现代解决方案,在尖端技术的推动下,这些使基础设施管理过程更加顺畅和轻松,其中一项技术是站点可靠性工程 (SRE),它有助于扩展基础结构管理流程。

什么是 SRE

站点可靠性工程 (SRE) 是指使用软件工具自动执行 IT 基础架构任务(如系统管理和应用程序监控)的做法,组织使用 SRE 来确保其软件应用程序在开发团队频繁更新时保持可靠,SRE 特别提高了可扩展软件系统的可靠性,因为使用软件管理大型系统比手动管理数百台计算机更具可持续性。

SRE 专注于开发和管理可持续且可靠的网络,以提供无缝的最终用户体验,同时确保基础设施正常运行。

为什么站点可靠性工程很重要

站点可靠性描述了应用程序提供给最终用户后的稳定性和服务质量。如果未发现技术问题,软件维护有时会影响软件的可靠性。例如,当开发人员进行新的更改时,可能会无意中影响现有应用程序,并导致软件在某些使用案例中崩溃。

以下是站点可靠性工程 (SRE) 实践的一些好处:

  • 增强合作
  • 客户体验增强
  • 操作规划得到改进

增强合作

SRE 改善了开发和运营团队之间的协作。开发人员通常必须对应用程序进行快速更改,以发布新功能或修复关键错误。另一方面,运营团队必须确保服务无缝交付,因此,运营团队需要使用 SRE 实践来密切监控每一次更新,并及时响应因变更而出现的任何问题。

客户体验增强

组织使用 SRE 模型来确保软件错误不会影响客户体验。例如,软件团队使用 SRE 工具来实现软件开发生命周期自动化,这样可以减少错误,意味着团队可以将新功能开发优先于漏洞修复。

操作规划得到改进

SRE 团队接受软件失败的现实可能性。因此,团队需要计划适当的事故响应,以尽量减少停机时间对业务和最终用户的影响,其还可以更好地估计停机成本,并了解此类事故对业务运营的影响。

SRE 如何使基础架构受益

在快节奏的环境中,例如企业 IT 基础架构,可能会发生大量事件和事件,网络管理员只能做这么多来管理一切。随着越来越多的企业过渡到面向云的方法,甚至是云原生的方法,对 SRE 的需求迫在眉睫,通过实施 SRE 并自动执行与网络管理相关的单调任务,IT 管理员可以优化其基础架构以提高性能。

以下是在基础架构中采用 SRE 的一些主要好处:

  • 减少停机时间:在基础架构中实施 SRE 有助于最大程度地减少停机时间。SRE 的主要目标是自动执行基础设施管理中繁琐而困难的任务,通过使用集成的开发和 IT 运营方法,IT 管理员可以更好地协同工作,尽可能减少停机时间。
  • 增强的最终用户体验:采用 SRE 可帮助 IT 管理员增强其最终用户体验。任何新的问题修复或产品更新都可以使用 SRE 立即推出,而不是传统的开发和运营模型,后者可能需要一些时间才能实施。
  • 不易出现人为错误:企业数据中心中大约 70% 的网络中断是由人为错误引起的。通过在基础架构中采用 SRE,组织可以自动执行其繁琐的任务,从而减少手动干预并节省其他关键任务的时间。
  • 改进了缩放:基础设施上的负载通常是动态的,并受消费者需求的影响。这就需要高度敏捷、可靠且可以随时扩展的基础架构。在 SRE 的帮助下,组织可以轻松扩展其基础架构,因为过渡是以快节奏但以安全为导向的方式进行的。
  • 全面了解基础架构:SRE 开发背后的软件工程技术不仅可以帮助管理员监控基础架构的预定义指标,还可以帮助管理员观察网络,留意潜在问题,并找到问题的根本原因,这为组织提供了对其基础架构的更高可见性。
  • 优化业务运营成本:通过自动化所有单调的操作流程,SRE 可帮助组织降低间接成本。此外,SRE 还有助于基础架构保持符合服务级别协议 (SLA),从而进一步降低业务成本。

在这里插入图片描述

SRE 如何帮助组织遵守 SLA

SLA 是服务提供商必须满足的一组条件(通常是特定时间段内的服务质量),未能满足既定要求可能会导致处罚和负面品牌声誉,在尝试实现业务目标时,这可能被证明是一个主要障碍,通过将 SRE 部署到基础架构,管理员可以全面了解网络,跟踪关键指标,并确保基础架构符合 SLA。

以下是与 SLA 关联的一些关键指标:

  • 服务级别目标 (SLO):SLO 是服务提供商承诺根据 SLA 为其客户提供的服务质量。通过定义 SLO,服务提供商可以量化他们有义务提供的服务质量。这有助于他们决定是使基础结构更可靠并将更新保持在最低限度,还是通过部署频繁更新来保持与需求保持一致,从而拥有快节奏的基础结构。使用 SRE,组织可以根据其 SLA 中设置的 SLO 优化其基础结构。
  • 服务级别指标 (SLI):SLI 是基础架构的可用性指标。SLI 始终经过优化以满足合同规定的 SLO。如果 SLI 低于 SLO,则可能导致违反 SLA。通过部署 SRE,组织可以增强对其基础架构的控制,以帮助他们实现较长的正常运行时间,最终帮助 SLI 满足设定的 SLO。
  • 错误预算:错误预算是客户端在恢复服务之前可以忍受的最大停机时间。通过在 SLA 中指定服务质量,组织可以更好地评估其基础结构的未来目标。借助 SRE,组织可以充分了解其基础架构,设置适当的错误预算,并决定基础架构必须提供的可靠性量,同时将其扩展到最大以提高性能。

IT 基础架构监控工具

OpManager Plus是一个全面的IT运营管理工具包,可帮助管理员监控,观察和管理整个基础架构。使用此工具,管理员可以:

  • 有效监控基础架构:通过持续跟踪网络的指定指标来监控整个基础架构,从而确保正常运行时间。例如自适应阈值,预测性能趋势和预测报告。
  • 监控网络流量和带宽使用情况:提高对基础架构流量和带宽使用模式的可见性,并对其进行优化以获得更好的性能。使用网络预测和网络取证对基础设施管理采取积极主动的立场。
  • 获得端到端基础架构可见性:除了监控和管理您的基础架构外,还必须拥有深入的可见性,而不仅仅是设备。通过鸟瞰基础架构,提前防范恶意设备检测和 IP 冲突等麻烦,甚至要考虑电线、电缆和接口等微观元素。
  • 管理防火墙和 VPN 以保持安全合规性:通过获取有关基础架构潜在安全漏洞的全面报告,自动执行合规性审核并增强基础架构安全性,领先一步,防范基础架构的安全漏洞。
  • 管理基础架构中的配置更改:制定标准操作程序 (SOP),并安排自动设备配置备份。监控基础架构是否存在任何配置违规,并通过应用适当的反措施立即纠正它们,始终遵守行业标准和政府框架。
  • 监控和增强最终用户体验:全面了解业务关键型应用程序的性能和最终用户体验,识别并根除任何潜在的瓶颈,方便地过渡到更面向云的基础架构,以跟上竞争对手的步伐并实现业务目标,同时不影响所提供的最终用户体验的质量。

OpManager Plus是一个集成的网络性能管理解决方案,它免去了对多种监控工具的需求,为管理员提供整个网络的更高的可见性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/74555.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

测试|测试分类

测试|测试分类 文章目录 测试|测试分类1.按照测试对象分类(部分掌握)2.是否查看代码:黑盒、白盒灰盒测试3.按开发阶段分:单元、集成、系统及验收测试4.按实施组织分:α、β、第三方测试5.按是否运行代码:静…

【雕爷学编程】MicroPython动手做(25)——语音合成与语音识别

知识点:什么是掌控板? 掌控板是一块普及STEAM创客教育、人工智能教育、机器人编程教育的开源智能硬件。它集成ESP-32高性能双核芯片,支持WiFi和蓝牙双模通信,可作为物联网节点,实现物联网应用。同时掌控板上集成了OLED…

内网横向移动—NTLM-Relay重放Responder中继攻击LdapEws

内网横向移动—NTLM-Relay重放&Responder中继攻击&Ldap&Ews 1. 前置了解1.1. MSF与CS切换权限1.1.1. CS会话中切换权限1.1.1.1. 查看进程1.1.1.2. 权限权限 1.1.2. MSF会话中切换权限 2. NTLM中继攻击—Relay重放—SMB上线2.1. 案例测试2.1.1. 同账户密码测试2.1.2…

GC 深入(小白,对gc有一个进一步的了解)

垃圾回收器的搭配 一般固定 一般这年轻代垃圾回收器,老年代垃圾回收器,如上图搭配着使用 1.8呢默认就是最后边那哥俩 jvm调优 一个就是增加吞吐量 一个就是减少STW的时间。 三色标记算法(理解根可达算法) 并发的可达性分析 有…

k8s集群部署nacos,采用的是 emptyDir 临时目录挂载

官方参考地址:https://nacos.io/zh-cn/docs/use-nacos-with-kubernetes.html 说明: 1、官网采用的nfs持久化部署 我将nacos持久化改成 emptyDir 临时目录挂载,同时又能满足自行调节nacos集群实例数。 2. emptyDir 临时目录挂载的nacos.ya…

【前端知识】React 基础巩固(四十三)——Effect Hook

React 基础巩固(四十三)——Effect Hook 一、Effect Hook的基本使用 Effect Hook 用来完成一些类似class中生命周期的功能。 在使用类组件时,不管是渲染、网路请求还是操作DOM,其逻辑和代码是杂糅在一起的。例如我们希望把计数器结果显示在标签上&…

【计算机视觉|人脸建模】3D人脸重建基础知识(入门)

本系列博文为深度学习/计算机视觉论文笔记,转载请注明出处 一、三维重建基础 三维重建(3D Reconstruction)是指根据单视图或者多视图的图像重建三维信息的过程。 1. 常见三维重建技术 人工几何模型仪器采集基于图像的建模描述基于几何建模…

opencv37-形态学操作-开运算(先腐蚀后膨胀)cv2.morphologyEx()-参数 op 设置为“cv2.MORPH_OPEN”

腐蚀操作和膨胀操作是形态学运算的基础,将腐蚀和膨胀操作进行组合,就可以实现开运算、闭运算(关运算)、形态学梯度(MorphologicalGradient)运算、礼帽运算(顶帽运算)、黑帽运算、击中…

使用AIGC工具提升安全工作效率

新钛云服已累计为您分享760篇技术干货 在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于: 开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、…

杂谈项——关于我在bw上的见闻,以及个人对二次元游戏行业方面的前瞻

君兮_的个人主页 勤时当勉励 岁月不待人 C/C 游戏开发 Hello,米娜桑们,这里是君兮_,今天为大家带来一点不一样的,首先先光速叠一下甲: 在此说明博主并不是一个什么都知道的大佬,只是一个普通的老二次元以及期望以后能…

docker数据持久化

在Docker中若要想实现容器数据的持久化(所谓的数据持久化即数据不随着Container的结束而销毁),需要将数据从宿主机挂载到容器中。目前Docker提供了三种不同的方式将数据从宿主机挂载到容器中。 (1)Volumes:…

力扣 C++|一题多解之动态规划专题(1)

动态规划 Dynamic Programming 简写为 DP,是运筹学的一个分支,是求解决策过程最优化的过程。20世纪50年代初,美国数学家贝尔曼(R.Bellman)等人在研究多阶段决策过程的优化问题时,提出了著名的最优化原理&…

JavaScript原生将图片转成base64

1.写个html文件 <!-- 产品照片 --> <div class"mb-3"> <label for"cover" class"form-label">产品图片</label><inputtype"file"class"form-control"id"coverfile"/> </div>…

深度学习——LSTM解决分类问题

RNN基本介绍 概述 循环神经网络&#xff08;Recurrent Neural Network&#xff0c;RNN&#xff09;是一种深度学习模型&#xff0c;主要用于处理序列数据&#xff0c;如文本、语音、时间序列等具有时序关系的数据。 核心思想 RNN的关键思想是引入了循环结构&#xff0c;允许…

在线五子棋对战

目录 数据管理模块&#xff08;数据库设计&#xff09; 前端界面模块 业务处理模块 会话管理模块网络通信模块(session,cookie) 在线管理模块 房间管理模块 用户匹配模块 项目扩展 数据管理模块&#xff08;数据库设计&#xff09; 数据库中有可能存在很多张表&#xf…

Vue3文本省略(Ellipsis)

APIs 参数说明类型默认值必传maxWidth文本最大宽度number | string‘100%’falseline最大行数numberundefinedfalsetrigger展开的触发方式‘click’undefinedfalsetooltip是否启用文本提示框booleantruefalsetooltipMaxWidth提示框内容最大宽度&#xff0c;单位px&#xff0c;…

七大经典比较排序算法

1. 插入排序 (⭐️⭐️) &#x1f31f; 思想&#xff1a; 直接插入排序是一种简单的插入排序法&#xff0c;思想是是把待排序的数据按照下标从小到大&#xff0c;依次插入到一个已经排好的序列中&#xff0c;直至全部插入&#xff0c;得到一个新的有序序列。例如&#xff1a;…

计算机视觉与图形学-神经渲染专题-第一个基于NeRF的自动驾驶仿真平台

如今&#xff0c;自动驾驶汽车可以在普通情况下平稳行驶&#xff0c;人们普遍认识到&#xff0c;真实的传感器模拟将在通过模拟解决剩余的极端情况方面发挥关键作用。为此&#xff0c;我们提出了一种基于神经辐射场&#xff08;NeRF&#xff09;的自动驾驶模拟器。与现有作品相…

Python爬虫—破解JS加密的Cookie

前言 在进行网站数据爬取时&#xff0c;很多网站会使用JS加密来保护Cookie的安全性&#xff0c;而为了防止被网站反爬虫机制识别出来&#xff0c;我们通常需要使用代理IP来隐藏我们的真实IP地址。 本篇文章将介绍如何结合代理IP破解JS加密的Cookie&#xff0c;主要包括以下几个…