【Elasticsearch】实现分布式系统日志高效追踪

🧑 博主简介:CSDN博客专家历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c=1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编程高并发设计Springboot和微服务,熟悉LinuxESXI虚拟化以及云原生Docker和K8s,热衷于探索科技的边界,并将理论知识转化为实际应用。保持对新技术的好奇心,乐于分享所学,希望通过我的实践经历和见解,启发他人的创新思维。在这里,我希望能与志同道合的朋友交流探讨,共同进步,一起在技术的世界里不断学习成长。
技术合作请加本人wx(注明来自csdn):foreast_sea

在这里插入图片描述


在这里插入图片描述

【Elasticsearch】实现分布式系统日志高效追踪

一、引言

在当今的技术领域,大型分布式系统,尤其是微服务架构,已经成为构建复杂应用的主流方式。这些分布式系统由众多的微服务组成,它们相互协作以提供完整的业务功能。例如,在一个电商平台中,下单服务支付服务库存服务等多个微服务共同运作,才能完成一个订单从创建到完成支付的全过程。

然而,随着系统规模的扩大和微服务数量的增加,日志管理和问题排查变得极为复杂。当出现故障或性能问题时,开发人员往往需要在海量的日志信息中寻找线索,这些日志分散在不同的服务实例和服务器上,难以关联和整合。传统的日志分析方法在面对这种分布式环境时显得力不从心。

Elasticsearch 的出现为解决分布式系统日志追踪问题提供了强大的解决方案。它是一个分布式高可用可扩展的搜索引擎和数据分析引擎。通过合理地利用 Elasticsearch数据类型索引结构,我们能够有效地存储和检索分布式系统中的日志数据,进而实现跨服务的请求日志追踪,将分散的日志信息整合为完整的用户请求链路。这不仅有助于快速定位问题,还能为系统性能优化和业务流程分析提供有力支持。

在本文中,我们将深入探讨如何使用 Elasticsearch 来实现分布式系统日志追踪,详细介绍相关的技术细节和代码实现。

二、技术概述

(一)Elasticsearch 简介

Elasticsearch 是一个基于Lucene 库构建的开源搜索引擎。它具有分布式实时性高可用性等特点,能够快速地存储、搜索和分析大量的数据。在日志分析领域,Elasticsearch 可以高效地处理和索引日志数据,使得我们能够快速地查询和检索特定的日志信息。

(二)关键数据类型

  1. Keyword:用于精确匹配的字符串数据类型。在日志追踪中,例如服务名称、日志级别等字段可以使用 Keyword 类型,这样可以确保精确的查询和过滤。例如,当我们查询特定服务的日志时,使用 Keyword 类型的服务名称字段可以准确地定位到相关日志。
  2. Text:用于存储较长的文本数据,如日志消息内容。它会对文本进行分词处理,以便进行全文搜索。例如,当我们想要搜索日志消息中包含特定关键词的日志时,Text 类型的字段就可以发挥作用。
  3. Date:用于存储日期和时间信息。在日志数据中,日志的产生时间通常是一个重要的字段,使用 Date 类型可以方便地进行基于时间范围的查询,比如查询特定时间段内的日志。

(三)索引结构

我们可以设计一个专门用于存储日志数据的索引。索引的结构可以包含以下字段:

  • traceId:用于唯一标识一个用户请求链路的 ID。通过这个 ID,我们可以将不同服务中的相关日志关联起来。
  • serviceName:产生日志的服务名称,使用 Keyword 类型。
  • logLevel:日志的级别,如 INFO、WARN、ERROR 等,使用 Keyword 类型。
  • logMessage:日志的详细消息内容,使用 Text 类型。
  • timestamp:日志产生的时间,使用 Date 类型。

三、Maven 依赖

在使用 Elasticsearch 进行日志追踪的 Java 项目中,我们需要添加以下 Maven 依赖:

<dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId><version>7.17.0</version>
</dependency>
<dependency><groupId>org.elasticsearch</groupId><artifactId>elasticsearch</artifactId><version>7.17.0</version>
</dependency>

这些依赖将使我们能够在 Java 代码中方便地与 Elasticsearch 进行交互,使用其提供的高级客户端 API 来进行索引创建、数据插入、查询等操作。

四、案例实现步骤

(一)连接到 Elasticsearch

首先,我们需要创建一个连接到 Elasticsearch 的客户端。代码示例如下:

import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.client.RestClient;
import java.io.IOException;public class ElasticsearchClientUtil {private static final String HOST = "localhost"; // Elasticsearch 主机地址private static final int PORT = 9200; // Elasticsearch 端口public static RestHighLevelClient getClient() {RestClient.Builder builder = RestClient.builder(new HttpHost(HOST, PORT, "http"));return new RestHighLevelClient(builder);}public static void closeClient(RestHighLevelClient client) throws IOException {client.close();}
}

在上述代码中,我们定义了一个工具类 ElasticsearchClientUtil,其中 getClient 方法用于创建一个连接到本地 Elasticsearch 实例(地址为 localhost,端口为 9200)的 RestHighLevelClient 对象,closeClient 方法用于关闭客户端连接。

(二)创建索引

接下来,我们创建用于存储日志数据的索引。代码如下:

import org.elasticsearch.action.admin.indices.create.CreateIndexRequest;
import org.elasticsearch.action.admin.indices.create.CreateIndexResponse;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.common.settings.Settings;
import org.elasticsearch.common.xcontent.XContentType;
import java.io.IOException;public class LogIndexCreator {private static final String INDEX_NAME = "log_tracking_index";public static void createIndex(RestHighLevelClient client) throws IOException {// 创建索引请求CreateIndexRequest request = new CreateIndexRequest(INDEX_NAME);// 设置索引的设置request.settings(Settings.builder().put("index.number_of_shards", 3).put("index.number_of_replicas", 1));// 设置索引的映射(即字段类型等)String mapping = "{\n" +"  \"properties\": {\n" +"    \"traceId\": {\n" +"      \"type\": \"keyword\"\n" +"    },\n" +"    \"serviceName\": {\n" +"      \"type\": \"keyword\"\n" +"    },\n" +"    \"logLevel\": {\n" +"      \"type\": \"keyword\"\n" +"    },\n" +"    \"logMessage\": {\n" +"      \"type\": \"text\"\n" +"    },\n" +"    \"timestamp\": {\n" +"      \"type\": \"date\"\n" +"    }\n" +"  }\n" +"}";request.mapping(mapping, XContentType.JSON);// 执行创建索引操作CreateIndexResponse response = client.indices().create(request);if (response.isAcknowledged()) {System.out.println("索引创建成功");} else {System.out.println("索引创建失败");}}
}

在这段代码中,我们首先定义了索引名称 log_tracking_index,然后创建了 CreateIndexRequest 对象,设置了索引的分片数量和副本数量,并定义了索引的映射,即各个字段的类型。最后通过客户端执行创建索引操作,并根据响应判断索引是否创建成功。

(三)插入日志数据

假设我们有一个日志数据对象 LogMessage,包含 traceIdserviceNamelogLevellogMessagetimestamp 等属性。我们可以编写以下代码将日志数据插入到 Elasticsearch 索引中:

import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.client.RestHighLevelClient;
import java.io.IOException;
import java.util.Date;public class LogDataInserter {public static void insertLog(RestHighLevelClient client, LogMessage logMessage) throws IOException {// 创建索引请求IndexRequest request = new IndexRequest("log_tracking_index").id(logMessage.getTraceId()).source("traceId", logMessage.getTraceId(),"serviceName", logMessage.getServiceName(),"logLevel", logMessage.getLogLevel(),"logMessage", logMessage.getLogMessage(),"timestamp", new Date());// 执行插入操作IndexResponse response = client.index(request);if (response.getResult() == DocWriteResponse.Result.CREATED) {System.out.println("日志插入成功");} else {System.out.println("日志插入失败");}}
}

这里,我们创建了 IndexRequest 对象,指定了索引名称和文档 ID(这里使用 traceId 作为文档 ID,以确保同一请求链路的日志可以通过相同的 ID 进行关联),并设置了文档的源数据,即日志的各个字段值。然后通过客户端执行插入操作,并根据响应判断插入是否成功。

(四)查询日志数据

为了实现日志追踪,我们需要根据 traceId 或其他条件查询相关的日志数据。以下是一个根据 traceId 查询日志的示例代码:

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import java.io.IOException;public class LogDataSearcher {public static void searchLogsByTraceId(RestHighLevelClient client, String traceId) throws IOException {// 创建搜索请求SearchRequest request = new SearchRequest("log_tracking_index");// 创建搜索源构建器SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();// 设置查询条件,根据 traceId 进行精确匹配sourceBuilder.query(QueryBuilders.termQuery("traceId", traceId));request.source(sourceBuilder);// 执行搜索操作SearchResponse response = client.search(request);// 处理搜索结果for (SearchHit hit : response.getHits().getHits()) {System.out.println("traceId: " + hit.getSourceAsMap().get("traceId"));System.out.println("serviceName: " + hit.getSourceAsMap().get("serviceName"));System.out.println("logLevel: " + hit.getSourceAsMap().get("logLevel"));System.out.println("logMessage: " + hit.getSourceAsMap().get("logMessage"));System.out.println("timestamp: " + hit.getSourceAsMap().get("timestamp"));}}
}

在上述代码中,我们创建了 SearchRequest 对象,指定了要搜索的索引名称。然后使用 SearchSourceBuilder 构建查询条件,这里使用 termQuerytraceId 进行精确匹配。最后执行搜索操作,并遍历搜索结果,打印出每个匹配日志的相关信息。

五、单元测试

我们可以编写以下单元测试来验证上述代码的正确性:

import org.elasticsearch.client.RestHighLevelClient;
import org.junit.jupiter.api.AfterEach;
import org.junit.jupiter.api.BeforeEach;
import org.junit.jupiter.api.Test;import java.io.IOException;
import java.util.Date;import static org.junit.jupiter.api.Assertions.assertTrue;public class LogTrackingTest {private RestHighLevelClient client;@BeforeEachpublic void setUp() {client = ElasticsearchClientUtil.getClient();}@Testpublic void testLogTracking() throws IOException {// 创建索引LogIndexCreator.createIndex(client);// 插入日志数据LogMessage logMessage = new LogMessage("trace1", "order-service", "INFO", "订单创建成功", new Date());LogDataInserter.insertLog(client, logMessage);// 查询日志数据LogDataSearcher.searchLogsByTraceId(client, "trace1");// 这里可以根据实际情况添加更多的断言,例如验证查询结果的数量等assertTrue(true);}@AfterEachpublic void tearDown() throws IOException {ElasticsearchClientUtil.closeClient(client);}
}

在这个单元测试中,我们首先在 setUp 方法中获取 Elasticsearch 客户端连接。然后在 testLogTracking 方法中,依次进行索引创建、日志插入和日志查询操作。最后在 tearDown 方法中关闭客户端连接。这里我们简单地使用 assertTrue(true) 作为一个占位符,可以根据实际需求添加更详细的断言,比如验证查询到的日志数据是否与插入的数据一致,或者验证查询结果的数量是否符合预期等。

六、参考资料文献

  • Elasticsearch 官方文档https://www.elasticsearch.org/guide/index.html
  • Elasticsearch 实战》,作者:[美] 拉法尔·库奇Rafał Kuć)等,机械工业出版社。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/483984.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【0x3D】HCI_Remote_Host_Supported_Features_Notification事件详解

目录 一、事件概述 二、事件格式及参数说明 2.1. HCI_Remote_Host_Supported_Features_Notification事件格式 2.2. BD_ADDR 2.3. Remote_Host_Supported_Features 三、事件作用 3.1. 设备特性沟通与理解 3.2. 功能协商与性能优化 3.3. 设备管理与配置更新 四、应用场…

【C++】栈和队列的模拟实现(适配器模式)

不论是C语言还是C&#xff0c;我们都用其对应的传统写法对栈和队列进行了模拟实现&#xff0c;现在我们要用新的方法模拟实现栈和队列&#xff0c;这个新方法就是适配器模式。 C语言传统写法&#xff1a; C语言模拟实现栈 C传统写法&#xff1a;C模拟实现栈 1.容器适配器 …

【工具变量】上市公司企业所在地城市等级直辖市、副省级城市、省会城市 计划单列市(2005-2022年)

一、包含指标&#xff1a; 股票代码 股票代码 股票简称 年份 所属城市 直辖市&#xff1a;企业所在地是否属于直辖市。1是&#xff0c;0否。 副省级城市&#xff1a;企业所在地是否属于副省级城市。1是&#xff0c;0否。 省会城市&a…

【HarmonyOS】鸿蒙应用地理位置获取,地理名称获取

【HarmonyOS】鸿蒙应用地理位置获取&#xff0c;地理名称获取 一、前言 首先要理解地理专有名词&#xff0c;当我们从系统获取地理位置&#xff0c;一般会拿到地理坐标&#xff0c;是一串数字&#xff0c;并不是地理位置名称。例如 116.2305&#xff0c;33.568。 这些数字坐…

【优选算法篇】寻找隐藏的宝藏:用二分查找打开算法世界的大门(上篇)

文章目录 须知 &#x1f4ac; 欢迎讨论&#xff1a;如果你在学习过程中有任何问题或想法&#xff0c;欢迎在评论区留言&#xff0c;我们一起交流学习。你的支持是我继续创作的动力&#xff01; &#x1f44d; 点赞、收藏与分享&#xff1a;觉得这篇文章对你有帮助吗&#xff1…

【后端面试总结】golang channel深入理解

在Go语言中&#xff0c;Channel是一种用于在goroutine之间进行通信和同步的重要机制。它提供了一种安全、类型安全的方式来传递数据&#xff0c;使得并发编程变得更加直观和简单。本文将详细介绍Golang中Channel的基本概念、创建与关闭、发送与接收操作&#xff0c;以及相关的使…

centos 手动安装libcurl4-openssl-dev库

下载源代码 curl downloadshttps://curl.se/download/ 选择需要下载的版本&#xff0c;我下载的是8.11.0 解压 tar -zxvf curl-8.11.0 查看安装命令 查找INSTALL.md&#xff0c;一般在docs文件夹下 –prefix &#xff1a;指定安装路径&#xff08;默认安装在/usr/local&…

基于TensorFlow框架的线性回归实现

目录 ​编辑 线性回归简介 TensorFlow简介 线性回归模型的TensorFlow实现 1. 安装TensorFlow 2. 导入必要的库 3. 准备数据 4. 定义模型 5. 定义损失函数 6. 定义优化器 7. 训练模型 8. 评估模型 9. 模型参数的可视化 10. 模型预测的准确性评估 结论 在统计学和…

40分钟学 Go 语言高并发:服务性能调优实战

服务性能调优实战 一、性能优化实战概述 优化阶段主要内容关键指标重要程度瓶颈定位收集性能指标&#xff0c;确定瓶颈位置CPU、内存、延迟、吞吐量⭐⭐⭐⭐⭐代码优化优化算法、并发、内存使用代码执行时间、内存分配⭐⭐⭐⭐⭐系统调优调整系统参数、资源配置系统资源利用率…

云计算vsphere 服务器上添加主机配置

这里是esxi 主机 先把主机打开 然后 先开启dns 再开启 vcenter 把每台设备桌面再vmware workstation 上显示 同上也是一样 &#xff0c;因为在esxi 主机的界面可能有些东西不好操作 我们选择主机和集群 左边显示172.16.100.200

使用PaddlePaddle实现线性回归模型

目录 ​编辑 引言 PaddlePaddle简介 线性回归模型的构建 1. 准备数据 2. 定义模型 3. 准备数据加载器 4. 定义损失函数和优化器 5. 训练模型 6. 评估模型 7. 预测 结论 引言 线性回归是统计学和机器学习中一个经典的算法&#xff0c;用于预测一个因变量&#xff0…

将word里自带公式编辑器编辑的公式转换成用mathtype编辑的格式

文章目录 将word里自带公式编辑器编辑的公式转换成用mathtype编辑的格式MathType安装问题MathType30天试用延期MathPage.wll文件找不到问题 将word里自带公式编辑器编辑的公式转换成用mathtype编辑的格式 word自带公式编辑器编辑的公式格式&#xff1a; MathType编辑的格式&a…

一文说清:Git创建仓库的方法

0 引言 本文介绍如何创建一个 Git 本地仓库&#xff0c;以及与远程仓库的关联。 1 初始化仓库&#xff08;git init&#xff09; 1.1 概述 Git 使用 git init 命令来初始化一个 Git 仓库&#xff0c;Git 的很多命令都需要在 Git 的仓库中运行&#xff0c;所以 git init 是使…

【Linux系统编程】——理解冯诺依曼体系结构

文章目录 冯诺依曼体系结构硬件当代计算机是性价比的产物冯诺依曼的存储冯诺依曼的数据流动步骤冯诺依曼结构总结 冯诺依曼体系结构硬件 下面是整个冯诺依曼体系结构 冯诺依曼结构&#xff08;Von Neumann Architecture&#xff09;是现代计算机的基本结构之一&#xff0c;由数…

一、docker简介

一、docker简介 1.1 docker的前世今生 Docker是基于Go语言实现的开源容器项目&#xff0c;诞生于2013年年初&#xff0c;最初的发起者是dotCloud公司&#xff0c;Docker自开源后受到广泛的关注和讨论&#xff0c;目前已有多个相关项目&#xff08;包括Docker三剑客、Kubernet…

实验三:Mybatis-动态 SQL

目录&#xff1a; 一 、实验目的&#xff1a; 通过 mybatis 提供的各种标签方法实现动态拼接 sql 二 、预习要求&#xff1a; 预习 if、choose、 when、where 等标签的用法 三、实验内容&#xff1a; 根据性别和名字查询用户使用 if 标签改造 UserMapper.xml使用 where 标签进行…

解决Tomcat运行时错误:“Address localhost:1099 is already in use”

目录 背景: 过程&#xff1a; 报错的原因&#xff1a; 解决的方法&#xff1a; 总结&#xff1a; 直接结束Java.exe进程&#xff1a; 使用neststat -aon | findstr 1099 命令&#xff1a; 选择建议&#xff1a; 背景: 准备运行Tomcat服务器调试项目时&#xff0c;程序下…

剖析千益畅行,共享旅游-卡,合规运营与技术赋能双驱下的旅游新篇

在数字化浪潮席卷各行各业的当下&#xff0c;旅游产业与共享经济模式深度融合&#xff0c;催生出旅游卡这类新兴产品。然而&#xff0c;市场乱象丛生&#xff0c;诸多打着 “共享” 幌子的旅游卡弊病百出&#xff0c;让从业者与消费者都深陷困扰。今天&#xff0c;咱们聚焦技术…

三步入门Log4J 的使用

本篇基于Maven 的Project项目&#xff0c; 快速演示Log4j 的导入和演示。 第一步&#xff1a; 导入Log4j依赖 <dependency><groupId>org.apache.logging.log4j</groupId><artifactId>log4j-api</artifactId><version>2.24.2</version&…

node.js基础学习-express框架-静态资源中间件express.static(十一)

前言 在 Node.js 应用中&#xff0c;静态资源是指那些不需要服务器动态处理&#xff0c;直接发送给客户端的文件。常见的静态资源包括 HTML 文件、CSS 样式表、JavaScript 脚本、图片&#xff08;如 JPEG、PNG 等&#xff09;、字体文件和音频、视频文件等。这些文件在服务器端…