Observability:实现 OpenTelemetry 原生可观察性的商业价值

作者:来自 Elastic David Hope

利用开放标准和简化的数据收集转变组织的可观察性策略。

现代组织面临着前所未有的可观察性挑战。随着系统变得越来越复杂和分散,传统的监控方法难以跟上步伐。由于数据量每两年翻一番,系统跨越多个云和技术,组织需要一种新的方法来保持对其运营的可见性。挑战不仅在于收集更多数据,还在于使这些数据在整个组织中具有可操作性和价值。

工具孤岛和碎片化可观察性的成本

碎片化可观察性的隐性成本远远超出了工具许可证和基础设施费用。组织正在努力应对复杂的监控工具网络,每个工具都有自己的代理、仪表板和数据格式。这种碎片化造成了巨大的运营开销,团队花费宝贵的时间来维护和关联不同系统的数据,而不是推动创新。

考虑一下这个典型的企业场景:当事件发生时,团队必须浏览多种工具来拼凑发生的事情。一个团队在他们的应用程序性能监控 (application performance monitoring - APM) 工具中检查应用程序性能指标;另一个团队在另一个系统中检查基础设施指标;其他团队在另一个平台上挖掘日志。这种碎片化不仅会减慢事件响应速度,而且会使预防问题变得更加困难。

这对团队生产力的影响是巨大的。工程师通常需要在多个工具之间切换上下文来解决问题,从而延长解决问题的时间并增加运营成本。此外,缺乏标准化数据使得跨系统关联信息变得困难,从而产生盲点,可能导致服务中断和客户不满。

为什么 OpenTelemetry 和开放标准会改变一切

OpenTelemetry (OTel) 代表了组织处理可观察性方式的根本转变。作为继 Kubernetes 之后第二活跃的云原生计算基金会项目,OTel 正在打破长期困扰可观察性解决方案的供应商锁定障碍。通过提供标准化的方式来收集和传输遥测数据,OTel 使组织能够选择最适合其需求的工具,而不受专有格式的限制。

这种标准化充当了创新的催化剂。当团队不再需要担心底层的仪表机制时,他们可以专注于从数据中提取有意义的见解。社区驱动标准的力量确保 OTel 继续随着行业需求而发展,并得到 Elastic、Microsoft 和 Google 等主要贡献者的支持。

该项目的惊​​人增长说明了它自己的故事。凭借超过 9,160 名贡献者、55,640 多个代码提交和 1,100 多家贡献公司,OpenTelemetry 已成为可观察性仪表的事实标准。广泛的采用确保了长期可持续性和持续创新。

OpenTelemetry 带来的实际业务成果

采用 OpenTelemetry 的组织在其运营中看到了切实的好处。通过整合工具和简化维护可以降低成本,而标准化数据收集可以更快地解决问题并提高服务可靠性。当每个人都使用相同的可观察性语言时,团队可以更有效地协作,从而更快地交付功能并改善客户体验。

以下是实践中的情况。

财务影响

  • 通过整合监控解决方案降低工具成本
  • 通过标准化实践降低培训和入职成本
  • 通过更好的资源利用率(运行更少的代理)降低基础设施成本

运营效率

  • 平均解决时间 (MTTR) 减少 40%–60%
  • 简化部署和配置管理
  • 减少警报噪音和误报

创新加速

  • 通过内置可观察性加快功能部署
  • 改进实验能力
  • 通过全面的数据分析做出更好的决策

随着组织对其整个技术堆栈有了清晰的了解,资源分配变得更加高效。这种全面的视角可以实现更好的容量规划和更明智的投资决策,最终带来更好的业务成果。

OpenTelemetry 成功之路

成功采用 OpenTelemetry 始于专注的方法。从一个可以快速展示价值的试点项目开始,无论是检测关键服务还是解决特定的可观察性挑战。培养内部冠军也至关重要——确定了解标准化可观察性的技术和业务优势的团队成员。

采用过程中的关键里程碑

1. 评估阶段

  • 评估当前可观察性成本和痛点
  • 确定高价值的初始用例
  • 设定明确的成功指标

2. 试点实施

  • 为初始部署选择有界上下文
  • 实施基本检测
  • 测量和记录早期结果

3. 扩展阶段

  • 在团队之间扩展成功模式
  • 制定内部最佳实践
  • 构建自动化部署流程

4. 优化阶段

  • 微调数据收集和采样
  • 实施高级用例
  • 分享成功案例和经验教训

为你的可观察性策略做好未来准备

可观察性的未来正受到不断增加的系统复杂性和数据量的塑造。OpenTelemetry 等开放标准确保组织能够适应这些变化,而不会被锁定在特定的供应商解决方案中。Elastic 对 OpenTelemetry 生态系统的承诺 —— 体现在其作为前三大贡献者的地位和捐赠,包括 Elastic Common Schema 和 Universal Profiling —— 有助于确保组织拥有成功所需的工具。

OpenTelemetry 有能力解决的新兴趋势

  • 边缘计算和物联网可观察性要求
  • AI/机器学习 (ML) 系统监控需求
  • 跨云服务网格可观察性
  • 安全遥测集成

采取下一步行动

首先,通过考虑以下因素来评估你当前的可观察性实践在整个组织中的可访问性:

  • 有多少不同的团队需要了解你的遥测数据?
  • 对于尝试使用可观察性数据的团队来说,存在哪些专业知识障碍?
  • 你当前的数据收集管道有多统一?
  • 维护当前可观察性工具所需的总工作量是多少?

通过以下方式衡量你的进度

  • 提高团队间可观察性数据的可访问性
  • 减少维护多种收集机制所花费的时间
  • 改善不同类型遥测数据之间的相关性
  • 加快新团队加入可观察性实践
  • 降低遥测管道的复杂性

过渡到 OpenTelemetry 不仅是为了更好的工具,还在于让组织中的每个人都可以访问和使用可观察性。通过现在采用开放标准和简化的管道,你可以让你的团队专注于最重要的事情:构建和改进你的应用程序。立即开始你的旅程,加入不断壮大的组织社区,让可观察性为每个人服务。

准备好让可观察性更容易实现了吗?访问 elastic.co/observability 了解 Elastic 和 OpenTelemetry 如何简化你的可观察性实践。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

原文:OpenTelemetry: The key to modern enterprise observability | Elastic | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11274.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

deep generative model stanford lecture note2 --- autoregressive

1 Introduction 在note1 已经明确了生成模型,是通过概率分布来拟合数据,这个部分采用自回归的模型结构来拟合数据。主要任务包括:选择什么样的自回归模型结构和设计什么样的loss函数来让模型收敛。 自回归模型结构的理论基础还是贝叶斯概率结…

C++模板初了解

这节我们来学习一下C的一个便捷之处——模板 文章目录 一、泛型编程 泛型编程的基本思想 泛型编程的优点 泛型编程的应用 二、模板 函数模板 函数模板格式 函数模板的原理 函数模板的实例化 1.隐式实例化 2.显示实例化 函数模板的匹配原则 类模板 类模板的格式 类模板的实例化 …

PPT演示设置:插入音频同步切换播放时长计算

PPT中插入音频&同步切换&放时长计算 一、 插入音频及音频设置二、设置页面切换和音频同步三、播放时长计算 一、 插入音频及音频设置 1.插入音频:点击菜单栏插入-音频-选择PC上的音频(已存在的音频)或者录制音频(现场录制…

React

1. React 基础 1) 环境准备 创建项目 首先,通过 react 脚手架创建项目 npx create-react-app client --template typescriptclient 是项目名目前 react 版本是 18.x 运行项目 cd client npm start会自动打开浏览器,默认监听 3000 端口 修改端口 在…

[ESP32:Vscode+PlatformIO]新建工程 常用配置与设置

2025-1-29 一、新建工程 选择一个要创建工程文件夹的地方,在空白处鼠标右键选择通过Code打开 打开Vscode,点击platformIO图标,选择PIO Home下的open,最后点击new project 按照下图进行设置 第一个是工程文件夹的名称 第二个是…

3、从langchain到rag

文章目录 本文介绍向量和向量数据库向量向量数据库 索引开始动手实现rag加载文档数据并建立索引将向量存放到向量数据库中检索生成构成一条链 本文介绍 从本节开始,有了上一节的langchain基础学习,接下来使用langchain实现一个rag应用,并稍微…

【自然语言处理(NLP)】基于Transformer架构的预训练语言模型:BERT 训练之数据集处理、训练代码实现

文章目录 介绍BERT 训练之数据集处理BERT 原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽语言模型任务的数据从token中获取mlm数据将文本转换为预训练数据集创建Dataset加载WikiText-2数据集 BERT 训练代码实现导包加载数据构建…

41【文件名的编码规则】

我们在学习的过程中,写出数据或读取数据时需要考虑编码类型 火山采用:UTF-16 易语言采用:GBK php采用:UTF-8 那么我们写出的文件名应该是何种编码的?比如火山程序向本地写出一个“测试.txt”,理论上这个“测…

NLP深度学习 DAY4:Word2Vec详解:两种模式(CBOW与Skip-gram)

用稀疏向量表示文本,即所谓的词袋模型在 NLP 有着悠久的历史。正如上文中介绍的,早在 2001年就开始使用密集向量表示词或词嵌入。Mikolov等人在2013年提出的创新技术是通过去除隐藏层,逼近目标,进而使这些单词嵌入的训练更加高效。…

HarmonyOS简介:应用开发的机遇、挑战和趋势

问题 更多的智能设备并没有带来更好的全场景体验 连接步骤复杂数据难以互通生态无法共享能力难以协同 主要挑战 针对不同设备上的不同操作系统,重复开发,维护多套版本 多种语言栈,对人员技能要求高 多种开发框架,不同的编程…

Windows11 不依赖docker搭建 deepseek-R1 1.5B版本(附 Open WebUi搭建方式)

零、前言 过年这几天发现 DeepSeek 非常火,试用了一下发现确实不错。与豆包、kimi、perplexity 这些相比完全不是一个次元的存在,特别是用ta写文章的时候体验非常好。所以试着自己搭一个环境。 一、安装 Ollama和DeepSeek-R1 我的安装方式很简单&#xf…

解决whisper 本地运行时GPU 利用率不高的问题

我在windows 环境下本地运行whisper 模型,使用的是nivdia RTX4070 显卡,结果发现GPU 的利用率只有2% 。使用 import torch print(torch.cuda.is_available()) 返回TRUE。表示我的cuda 是可用的。 最后在github 的下列网页上找到了问题 极低的 GPU 利…

springCload快速入门

原作者:3. SpringCloud - 快速通关 前置知识: Java17及以上、MavenSpringBoot、SpringMVC、MyBatisLinux、Docker 1. 分布式基础 1.1. 微服务 微服务架构风格,就像是把一个单独的应用程序开发为一套小服务,每个小服务运行在自…

Gradle配置指南:深入解析settings.gradle.kts(Kotlin DSL版)

文章目录 Gradle配置指南:深入解析settings.gradle.kts(Kotlin DSL版)settings.gradle.kts 基础配置选项单项目配置多项目配置 高级配置选项插件管理(Plugin Management)基础配置模板案例:Android项目标准配…

C++ Primer 标准库类型string

欢迎阅读我的 【CPrimer】专栏 专栏简介:本专栏主要面向C初学者,解释C的一些基本概念和基础语言特性,涉及C标准库的用法,面向对象特性,泛型特性高级用法。通过使用标准库中定义的抽象设施,使你更加适应高级…

[EAI-028] Diffusion-VLA,能够进行多模态推理和机器人动作预测的VLA模型

Paper Card 论文标题:Diffusion-VLA: Scaling Robot Foundation Models via Unified Diffusion and Autoregression 论文作者:Junjie Wen, Minjie Zhu, Yichen Zhu, Zhibin Tang, Jinming Li, Zhongyi Zhou, Chengmeng Li, Xiaoyu Liu, Yaxin Peng, Chao…

使用MATLAB进行雷达数据采集可视化

本文使用轮趣科技N10雷达,需要源码可在后台私信或者资源自取 1. 项目概述 本项目旨在通过 MATLAB 读取 N10 激光雷达 的数据,并进行 实时 3D 点云可视化。数据通过 串口 传输,并经过解析后转换为 三维坐标点,最终使用 pcplayer 进…

UE求职Demo开发日志#19 给物品找图标,实现装备增加属性,背包栏UI显示装备

1 将用到的图标找好,放一起 DataTable里对应好图标 测试一下能正确获取: 2 装备增强属性思路 给FMyItemInfo添加一个枚举变量记录类型(物品,道具,装备,饰品,武器)--> 扩展DataT…

Docker 部署 Starrocks 教程

Docker 部署 Starrocks 教程 StarRocks 是一款高性能的分布式分析型数据库,主要用于 OLAP(在线分析处理)场景。它最初是由百度的开源团队开发的,旨在为大数据分析提供一个高效、低延迟的解决方案。StarRocks 支持实时数据分析&am…

(9) 上:学习与验证 linux 里的 epoll 对象里的 EPOLLIN、 EPOLLHUP 与 EPOLLRDHUP 的不同

(1)经过之前的学习。俺认为结论是这样的,因为三次握手到四次挥手,到 RST 报文,都是 tcp 连接上收到了报文,这都属于读事件。所以: EPOLLIN : 包含了读事件, FIN 报文的正常四次挥手、…