正常运行时间是衡量系统可靠性的指标,表示为机器工作和可用时间的百分比。当提到 IT 网络时,正常运行时间是衡量网络设备、网站和其他服务的可用性的指标。网络正常运行时间通常以百分位数来衡量,例如“五个 9”,这意味着系统在 99.999% 的时间内正常运行。网络正常运行时间监控的目标是实现 99.999% 的可用性,即每年的停机时间不到 5 分钟。停机时间是系统不运行的时间段,与正常运行时间相反。
什么是网络正常运行时间监控
跟踪服务器或任何网络组件对最终用户的可用性称为网络正常运行时间监控,监控网络正常运行时间可确保用户体验或业务运营不会中断,从而防止不可预见的网络停机或业务损失。
正常运行时间监视器使用 Internet 消息协议(ICMP)ping 和 Telent 定期向网络设备发送 ping,以检查设备是否已启动并运行。如果网络组件在两次尝试中未能响应,则将其归类为不可用设备。
如何计算设备的正常运行时间
让我们考虑一个监控一周的设备并计算其正常运行时间。
设备关闭的秒数:3600 秒
监控设备的秒数:6,04,800 秒
停机时间 = 设备关闭的秒数 / 设备监控的秒数= 3600/ 6,04,800 = 0.0059
停机时间 %= 0.59%
正常运行时间百分比 = 100 - 停机时间百分比 = 100-0.59 = 99.41 %
注意:“保持”、“维护”、“依赖不可用”、“关闭”、“未监控”计算为设备停机持续时间。
需要监控网络正常运行时间
网络正常运行时间监控工具可主动监控您的整个 IT 网络环境,以确保其可用且正常工作。将正常运行时间监控视为您值得信赖的 24/7 全天候在线安全卫士。当网络正常运行时间监视器发现网络设备或服务已关闭时,它会立即从单个仪表板通知您,以便您的网络管理员可以在问题变得过于严重之前解决根本问题。网络正常运行时间监控的目标是确保您的网络运营尽可能不中断。
术语“网络正常运行时间”和“停机时间”用于定义 IT 服务提供的成功级别。服务级别协议 (SLA) 通常包括正常运行时间和停机时间比率,这些比率显示服务预计保持运行的时间。IT 专业人员使用正常运行时间来指代连续的总操作时间。
网络正常运行时间监控如何工作
网络正常运行时间监控为您提供所需的可见性,让您在潜在问题面前领先一步,通过在易于阅读的界面中显示实时网络性能数据,网络正常运行时间监控软件可帮助您识别可能导致瓶颈的中断,能够实时检测威胁意味着您可以随时随地收到通知,并立即采取纠正或防御措施。您可以节省时间和金钱,并且不再需要物理系统管理员一直在场执行手动检查。网络正常运行时间监控工具:
- 跟踪网络设备的可用性(网络设备正常运行时间监控)和带宽使用情况,以检测任何潜在的瓶颈。
- 监控服务器的正常运行时间,包括 DNS 服务器、SQL Server、邮件服务器、FTP 服务器和虚拟服务器的正常运行时间。
- 监控您网站的可用性并检查是否有损坏的链接。
- 确定停机和网络性能问题的根本原因。
- SLA 报告:生成 SLA 报告以帮助您跟踪可用性和性能,以便您可以履行与客户的 SLA 承诺。
适用于网站、服务器和设备的网络正常运行时间监控工具
网络正常运行时间监控工具,有助于确保所有网络设备、服务和网站24/7连续启动和运行。OpManager的界面提供有关网络正常运行时间和各个服务的可用性的实时统计信息。仪表板使用绿色、黄色和红色指示器等视觉提示显示有关网络设备、服务和网站的状态和运行状况的报告,帮助您将关键指标归零。
可以监控网络正常运行时间的各个方面,包括:
- 设备正常运行时间监控
- 接口正常运行时间监控
- 服务正常运行时间监控
- Windows 服务正常运行时间监控
- 网站正常运行时间监控
- 过程正常运行时间监控
设备正常运行时间监控
持续监控整个网络的正常运行时间和网络可用性。OpManager 的网络正常运行时间监视器每两分钟向受监控设备发送一次ping。如果连续两次ping后没有响应,将认为设备不可用,可以根据业务需要分配 ping 的数量及其时间间隔。
使用ICMP Ping轮询设备的可用性,ping 是检测 IT 管理员设备可用性的有效工具。对于非 ICMP 环境,尤其是要监控边缘路由器或 DMZ 区域设备的正常运行时间,可以改用 Telnet。默认可用性轮询间隔为 5 分钟,您可以根据需要将其自定义为特定设备组或特定设备。
接口正常运行时间监控
网络正常运行时间监控工具提供基于SNMP的监控,以检查企业网络和IT基础架构中每个元素的接口正常运行时间和端口可用性。它提供正常运行时间报告,显示每日、每周、每月或自定义期间的接口可用性,以衡量您的网络级别可用性并确保满足您的 SLA。这些接口或端口状态通过单个设备状态、第 2 层网络图、业务视图或自定义设备组以及网络天气图在多个方面传播。
服务正常运行时间监控
服务器是任何 IT 基础架构的核心元素,至关重要的是,它们始终是可访问的,以确保内部流程的顺利运行和服务的可用性。服务器正常运行时间,即服务器可供用户使用的时间,是优化网络性能的最重要因素之一。
OpManager的服务器正常运行时间监控功能为您提供了有关被监控的传输控制协议(TCP)服务的可用性和响应时间的详细图表和报告。
Windows 服务正常运行时间监控
通过支持使用Windows Management Instrumentation(WMI)监控系统级服务(如Windows服务)来提供Windows网络正常运行时间监控。与系统级服务监控类似,您可以发现任何Windows服务并使用OpManager进行监控。
网站正常运行时间监控
OpManager 的网络正常运行时间监控器执行关键任务,每年365天全天候监控您的网站的可用性。它监视 HTTP/HTTPS URL、INTRANET 站点、Web 服务器场、具有登录名的 Web 应用程序、Windows NT LAN Manager (NTLM) 身份验证的网站等等。除了 URL 正常运行时间监控外,您还可以检查网站中的特定内容。网站可用性监控可确保网站不受黑客攻击。
过程正常运行时间监控
OpManager的进程正常运行时间监控使管理员能够远程监控和管理服务器上运行的进程,使用各种协议,如SNMP、WMI 和 CLI,来监控Windows、Linux、Solaris、UNIX、HP UX、IBM AIX、ESX和VMware服务器和虚拟机等上运行的进程。
OpManager 的实时正常运行时间监控器会定期扫描IT基础设施组件的运行状况和可用性,并帮助解决问题,以确保您的网络全天候正常运行。