作者:来自 Elastic Elastic Observability Team
监控和可观察性通常可以互换使用,但它们并不完全相同。 监控是可观察性的重要组成部分,但可观察性远远超出了传统监控实践的范围。
主要区别:监控从各个组件收集数据 —— 时间和内容; 可观察性提供了对分布式系统整体行为的洞察 —— 原因和方式。
云格局正在以惊人的速度从混合云计算架构发展到无服务器技术和分布式环境。 因此,虽然监控对于较小的环境仍然有效(本质上数据和应用程序蔓延较少),但使用云原生技术的较大组织需要发展到更复杂的工具。 这就是可观察性的用武之地。 (告别 FOMO,继续阅读事实。)
什么是监控?
监控是收集、摄取和分析应用程序、基础设施和/或云遥测数据以评估系统运行状况的过程。 监控依赖于指标,例如 CPU 或内存使用情况以及网络流量、日志和跟踪。 这些数据使 IT 团队能够实时跟踪其基础设施和应用程序的性能和可用性。 监控工具和平台可以提供仪表板和警报,并具有报告功能,以帮助 IT 团队监控组件、识别预测问题并解决给定环境中出现的问题。
然而,监控工具传统上是孤立的,因此并不总是适合现代云架构和更大的环境。
什么是可观察性?
可观测性是一组实践和工具,使 IT 用户能够通过其生成的遥测和操作数据获得整个环境的整体视图。 在分布式系统中,可观察性使团队能够关联数据(日志、指标、跟踪和分析)以提供统一的可见性。 反过来,企业可以获得可行的见解,以提高服务绩效和客户体验。 可观察性工具提供可定制的仪表板、自动化功能、分析和警报,帮助团队更快、更有效地执行根本原因分析。
换句话说,可观察性是一种不断发展的工具,用于提高现代 IT 运营及其管理的服务的性能和弹性。 毕竟,更好的弹性意味着更好的生产力 —— 投资回报率如何?
为了更好地理解现代可观测性及其价值,让我们看看它与监控的三大不同之处。
1. 洞察深度
检测异常和低效率是一回事,另一回事又是一回事。 是别人来理解他们的。
监控检测:监控依赖于预定义的指标和日志集来跟踪错误和使用模式 —— 已知的已知情况。 按照这种衡量标准,IT 团队只能发现他们已经预料到的问题。 简而言之,监控是一个必要的 IT 流程,使团队能够确保一切正常运行。 然而,尽管监控是不可或缺的检测工具,但它本身并不为检测到的异常提供上下文。
可观察性理解:可观察性通过收集不同的数据源、存储数据并将其统一以进行映射和分析来提供统一的可见性。 这种深入的关联功能使团队能够更好地了解其系统的整体情况。 他们可以查看并分析其系统行为、性能和交互。 改进的可见性和历史绩效数据还允许采用更具探索性的运营管理方法来发现未知的未知因素。 IT 团队获得的深度洞察力还使他们能够采取主动的方法来提高绩效。
2. 灵活性和适应性
云计算和无服务器、容器化应用程序意味着更高的开发灵活性。 因此,你的监控解决方案需要跟上。
监控可能是僵化的:因为监控依赖于 IT 团队确定的数据集,所以它无法 “看到” 尚未为其编程的内容。 换句话说,监控的范围是有限的:它跟踪已知问题,但无法单独满足通常依赖 Kubernetes 和微服务的动态云原生或混合环境的需求。
可观察性是灵活的:可观察性能够映射云环境、本地软件和第三方应用程序之间的交互,因此本质上具有适应性和灵活性。 这是专门为满足现代 IT 基础设施的需求而设计的实践。 通过自动化和 AIOps 功能,可观察性也可以随着生态系统的扩展而扩展,从而使团队能够更有效地扩展其基础设施。
3. 根本原因分析
无论采用什么工具和实践,技术生态系统中都会出现问题 —— 有些事情不会改变。 当它们出现时,IT 团队可以通过两种方式做出响应:
- 修补问题 —— 症状
- 深入挖掘解决问题 —— 问题
正确完成根本原因分析可确保更快的响应和恢复时间。
监控是被动的:监控警报配置为实时通知团队发生的异常和问题。 虽然监控告诉 IT 专家 “什么”,但它本身并不能解释 “为什么”。 事实上,在分布式架构中,跨数据流的可见性是一个常见的挑战。 孤立的监控工具具有局限性:工程师需要花费额外的资源来手动执行根本原因分析,同时采取反应性方法进行系统管理。 结果? 检测、响应和解决时间变慢,这可能意味着严重的中断。
可观察性是主动的:可观察性通过使用历史数据提供更丰富的上下文和内部系统操作的可见性,促进更深入的根本原因分析。 通过关联不同的数据源并跟踪系统中的请求或事件流,工程师可以全面了解其环境,从而更准确地查明问题的根本原因。 这种分析可以在中断期间或事后实时完成,以便主动了解问题所在。 最终,更好的根本原因分析能力意味着整体运营效率更高。
当今对现代可观测性的需求
从孤立的日志监控工具转向统一的数据平台和可观察性,是对你的组织以及作为企业开发人员、SRE 或 IT 运维专业人员的未来投资。从传统监控工具到现代可观察性的演变在当今云原生世界中是必需的。它为团队为未来的操作做好准备,增强了 AIOps 和 GAI。现代可观察性为组织铺平了一条增加效率、更具弹性的应用程序和业务的卓越客户体验之路。
了解有关现代可观测性的更多信息:
- 现代可观测性指南
- 利用可观察性构建更好的应用程序 playbook
本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。
原文:3 reasons why monitoring is different from observability | Elastic Blog