Elastic Agent 对 Kafka 的新输出:数据收集和流式传输的无限可能性

作者:来 Elastic Valerio Arvizzigno, Geetha Anne 及 Jeremy Hogan

介绍 Elastic Agent 的新功能:原生输出到 Kafka。借助这一最新功能,Elastic® 用户现在可以轻松地将数据路由到 Kafka 集群,从而实现数据流和处理中无与伦比的可扩展性和灵活性。在本文中,我们将深入探讨这种强大集成的优势和用例。

Elasticsearch 和 Kafka:更好的结合用例

在物联网 (IoT)、自动化工厂和汽车或制造业等行业复杂的 IT 架构不断发展的格局中,精确和实时数据至关重要。想象一下高科技汽车工厂的生产线,成千上万的传感器不断监测机器的性能,从机械臂的精确扭矩到关键发动机部件的温度。想想每天有多少分布式设备围绕着我们,需要远程管理、监控和保护,以确保最佳用户体验,同时为企业收集有价值的数据。在这种动态环境中,对高效数据采集、实时处理和强大的数据存储与分析的需求不仅仅是一种偏好,更是绝对必要。

正是在这里,凭借强大的数据流功能,Kafka 成为关键技术,将物联网和分布式系统世界与市场上领先的洞察引擎 Elasticsearch® 无缝连接,从而实现快速决策、预测性维护和增强的运营洞察。

在本文中,我们将探讨 Confluent Kafka 和 Elasticsearch 如何协同使用,通过新的 Elastic Agent 集成提供无与伦比的洞察、弹性和效率。

Elastic Agent 的 Kafka 输出解锁了新可能性

Kafka 通常是高效管理大规模数据场景的首选,许多 Elastic 用户已经在其环境中采用 Kafka,用于 Beats 和 Elasticsearch 集群之间的多种用例。长期以来,Beats 一直集成了原生的 Kafka 输出功能,许多客户对此非常满意。而如今,同样的功能也在 Elastic Agent中得以实现。Elastic Agent 是我们统一的解决方案,用于监控每个托管主机上的指标、收集日志并应对网络威胁。那么,这一 Elastic Agent 新功能为何如此重要?又有哪些理由让你今天就开始使用它?

Elastic Agent 比 Beats 有几个优势:

  1. 更易于部署和管理:Elastic Agent 是一个单一代理,可下载、配置和管理收集和解析数据所需的任何底层策略或组件。这样就无需部署多个 Beats 并为主机上运行的每个 Beat 管理单独的配置文件。
  2. 配置更简单:你无需为每个 Beat 定义和管理单独的配置文件,只需定义一个代理策略(agent policy)来指定要使用的集成设置,然后 Elastic Agent 会生成底层工具所需的配置。
  3. 集中管理:Elastic Agent 可以从 Kibana® 中名为 Fleet 的中心位置进行管理。在 Fleet 中,你可以查看正在运行的 Elastic Agent 的状态,更新代理策略并将其推送到你的主机,甚至触发二进制升级。不再需要 SSH 到你的主机或软件管理工具。
  4. 端点保护:Elastic Agent 使你能够保护你的端点免受安全威胁。这使客户能够使用他们正在收集的数据上的新安全用例来扩展他们的 Elastic 价值,而无需额外的工具或精力。

有了这些优势和功能,管理和保护你的分布式系统从未如此简单!要为 Fleet 管理的代理注册新的 Kafka 输出,你只需执行以下操作:

  • 在 Kibana UI 中打开 Fleet 的 “Settings” 选项卡。
  • 在 “Output” 部分,Add output
  • 为新输出命名并选择 Kafka 作为输出 Type
  • 填写你的场景所需的所有相关 Kafka 集群字段,例如 Kafka 代理的 hostnameauthentication 详细信息或 SSL 配置。
  • Save and apply settings

你将能够设置分区规则和要发送数据的主题,该主题/topic 是静态定义的。

Kafka 输出将在代理策略创建阶段可用,其中可以为集成和代理监控流设置它,并自动应用于你决定将它们附加到的代理。

你可以在我们的官方文档中探索所有详细信息和选项,也可以通过分步配置指南进行指导。

配置 Elastic Agent 到 Kafka 的新输出

借助此新发布的集成,现有使用 Beats 的 Kafka 用户将能够将其工作负载切换到 Elastic Agent,并从上述所有增强的可观察性和安全性场景中受益。此外,当前的 Elastic Agent 用户将不再有障碍来评估和采用 Kafka 作为其 Elastic 端到端数据流合作伙伴。

架构概述

在上面的整体架构图中,Elastic Agent、Confluent Kafka 和 Elastic Cloud 被显示为数据旅程的主要组件。

Elastic Agent 将通过其原生集成从大量主机和系统收集日志和指标,并与 Confluent Cloud 连接器一起处理来自多个数据源的事件和事务数据,从而产生无限的可能性,以在单一窗格中收集、整合和丰富你的企业数据。

然后,Kafka 将接收这些不同的数据流并对其进行处理并将其分发给相关消费者。对于需要强大转换的高级场景(例如,本机 IP 地理定位、从非结构化数据中获取结构化数据、PII 屏蔽),Logstash® 可以插入 Kafka 和 Elasticsearch 之间,这要归功于其专用的输入和输出插件。对于从 Kafka 到 Elasticsearch 的直接无缝流式传输,最好的选择是利用 Elasticsearch Sink Connector,只需通过 Confluent UI 单击几下即可进行配置。

一旦数据进入 Elastic,数据就会开始发光,借助 Elasticsearch 和 Kibana 的搜索、分析和可视化功能,展现其价值。我们将在以下部分中更详细地介绍这一点。

Confluent Kafka 对 Elastic 工作负载的好处

Confluent 的 Kafka 与 Elasticsearch 集成以处理 Elastic 工作负载时具有多种优势,尤其是在需要实时或近实时处理和分析大量数据的场景中。将 Ka​​fka 与 Elasticsearch 结合使用以处理 Elastic 工作负载的一些主要优势包括:

1. 完全托管服务

Confluent Cloud 是一种完全托管服务,这意味着 Confluent 负责底层基础设施,包括硬件配置、软件维护和集群扩展。这减轻了你团队的运营开销,让你可以专注于构建应用程序和处理数据。

2. 实时数据提取

Kafka 擅长实时收集和提取数据,是将数据流式传输到 Elasticsearch 的理想选择。Confluent 连接器旨在简化从 Kafka 到 Elasticsearch 和从 Elasticsearch 到 Kafka 的流式传输数据的过程,从而更轻松地为各种用例(包括日志和事件数据分析)构建实时数据管道。Confluent Elastic connectors 包括:

  • Confluent Elasticsearch Sink 连接器:此连接器用于将数据从 Kafka 主题发送到 Elasticsearch 进行索引和搜索。它允许你指定从哪些 Kafka 主题使用数据以及将数据写入哪些 Elasticsearch 索引。连接器支持多种数据格式,包括 JSON、Avro 等。
  • Confluent HTTP Sink 连接器:此连接器从 Kafka 主题使用记录并将其转换为字符串或 JSON,然后将其发送到配置的 API URL(在本例中为 Elastic API 端点)。这在需要完全可自定义的 API 调用的场景中非常有用。
  • Confluent Elasticsearch 源连接器:此连接器用于从 Elasticsearch 中提取数据并将其流式传输到 Kafka 主题。它允许你创建主题并将 Elasticsearch 索引映射到 Kafka 主题以进行数据同步。

3. 数据聚合和转换

Kafka 可以充当数据的缓冲区,允许你在将数据索引到 Elasticsearch 之前执行数据聚合和转换。Confluent 开发了 KSQL 和相关数据存储 (ksqlDB),它们是类似 SQL 的查询工具,用于将流数据直接处理到 Kafka 中。这简化了实时数据处理,使用户能够轻松创建应用程序,并为准备要在 Kibana 中搜索和可视化的数据提供帮助。

4. 可扩展性

Kafka 具有高度可扩展性,可以处理高数据吞吐量。它允许你水平和垂直扩展以适应不断增长的数据工作负载。这确保你的 Elastic 工作负载能够跟上不断增长的数据量和处理需求,而 Kafka 是其抵御意外峰值和摄入压力的盾牌。Confluent Cloud 允许你随着数据和工作负载需求的增长无缝扩展 Kafka 集群。你可以轻松调整集群大小、存储和吞吐量以适应数据量和处理需求的变化。

5. 数据源和消费者解耦

Kafka 充当数据源和 Elasticsearch 之间的中介。这种解耦允许你添加或删除数据生产者和消费者,而不会影响整个系统的稳定性。它还可以确保当 Elasticsearch 或连接网络发生故障时数据不会丢失。

6. 优化 Elasticsearch 索引

通过使用 Confluent 的 Kafka 作为中介,你可以优化 Elasticsearch 中的索引过程。数据可以在发送到 Elasticsearch 之前进行批处理和压缩,从而减少 Elasticsearch 集群上的负载。

7. 统一数据集成

Kafka 可以很好地与各种数据源和接收器集成。它可以从各种系统中提取数据,从而更容易将数据集中到 Elasticsearch 中进行全面分析。Elastic Agent 与 Kafka 集成相结合,为你提供了收集和移动数据的无限可能性。

8. 与 Logstash 合作

Kafka 插件允许 Logstash 使用来自 Apache Kafka 主题的数据作为输入,或将数据发送到 Kafka 主题作为输出。这些插件是更广泛的 Logstash 生态系统的一部分,被广泛用于在各种工作流程中将 Logstash 与 Kafka 集成。

  • Kafka 输入插件:Kafka 输入插件允许 Logstash 使用来自一个或多个 Kafka 主题的消息并在 Logstash 中处理它们。你可以配置 Kafka 输入插件以订阅特定主题、使用消息,然后应用各种 Logstash 过滤器来根据需要转换和丰富数据。
  • Kafka 输出插件:Kafka 输出插件允许 Logstash 将处理后的数据发送到 Kafka 主题。在 Logstash 中处理和丰富数据后,你可以使用此插件将数据发布到特定的 Kafka 主题,使其可供其他应用程序或系统的下游处理。

使用 Elastic Cloud 搜索洞察并检测异常

一旦数据进入 Elastic,就会产生无限可能来从中创造价值。例如,通过 Elasticsearch,预测分析的应用可实现预测性维护。通过利用传感器数据(包括气压、油压、温度、电压、速度、声音、频率以及颜色或照明变化等参数),Elasticsearch 有助于及早发现潜在的设备故障。这种实时数据分析与 Elasticsearch 强大的搜索和查询功能相结合,不仅可以作为预警系统,还可以为数据驱动的决策提供宝贵的洞察。最终结果是降低成本并制定更有效的维护策略,从而实现卓越运营。

此外,Elasticsearch 还使生产管理人员能够根据实时数据和自适应阈值制定个性化的维护计划,从而增强生产管理能力。这种动态方法取代了僵化的维护周期,在僵化的维护周期中,无论组件是否容易发生故障,都会进行更换。 Elasticsearch 的搜索和可视化功能(尤其是在利用 Kibana 功能时)提供了数据趋势和异常值的全面视图,从而有助于制定更有意义且更具成本效益的策略。同样的原则也适用于更高的抽象层,例如本地和云 IT 架构和应用程序,在这些架构和应用程序中,弹性和业务连续性是日益重要的主题,并且通常对制造流程至关重要。

尽管如此,实时分析来自大量传感器、设备和服务的数据并将其与历史事件进行比较的挑战对于人类操作员来说是一项艰巨的任务。这正是 Elasticsearch 的异常检测功能与其机器学习功能相结合发挥作用的地方。借助 Elastic,你可以有效地查明偏差或关联来自多个来源的数据以生成全面的健康评分。这种宝贵的功能使企业能够通过数据驱动的机制领先于潜在问题并主动响应。

除了增强预测性维护和质量控制外,Elasticsearch 在确保分布式架构和主机的安全性方面也发挥着至关重要的作用。 Elastic SIEM 和端点保护解决方案可全面监控、预防、检测和响应安全事件和威胁,确保业务连续性和合规性。

使用 Elasticsearch 和 Kafka,可以从制造厂或 IT 架构内的各种系统(从运行旧软件的传统系统到尖端技术)收集数据并将其转化为业务洞察,这是一个无缝流程。此外,在成本优化和工具整合的时代,没有比这更好的地方可以在单一管理平台中实现所有搜索、可观察性和安全性目标。

探索更多并试用!

了解 BMW 等客户如何利用 Elastic 构建弹性多渠道客户体验,并借助 Confluent Cloud 整合跨多个系统和应用程序的生产和销售数据流。

查看我们的 7 分钟教程或博客文章,详细了解如何通过 Elasticsearch Sink Connector 将 Confluent Cloud 与 Elastic 集成。 是否还想利用 Elastic 来监控 Kafka 集群本身? 通过这篇文章和我们的 Kafka 可观察性集成文档了解更多信息。

将数据从 Confluent Cloud 索引到 Elastic Cloud

亲自尝试一下! 开始使用和探索我们功能的最简单方法之一是使用你自己的免费 Elastic Cloud 试用版和 Confluent Cloud 试用环境,或者通过你最喜欢的云提供商的市场进行订阅。

原文:Elastic Agent’s new output to Kafka: Endless possibilities for data collection and streaming | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7974.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对神经网络基础的理解

目录 一、《python神经网络编程》 二、一些粗浅的认识 1) 神经网络也是一种拟合 2)神经网络不是真的大脑 3)网络构建需要反复迭代 三、数字图像识别的实现思路 1)建立一个神经网络类 2)权重更新的具体实现 3&am…

Java后端之AOP

AOP&#xff1a;面向切面编程&#xff0c;本质是面向特定方法编程 引入依赖&#xff1a; <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId></dependency>示例&#xff1a;记录…

【25考研】人大计算机考研复试该怎么准备?有哪些注意事项?

人大毕竟是老牌985&#xff0c;复试难度不会太低&#xff01;建议同学认真复习&#xff01;没有机试还是轻松一些的&#xff01; 一、复试内容 由公告可见&#xff0c;复试包含笔试及面试&#xff0c;没有机试&#xff01; 二、参考书目 官方无给出参考书目&#xff0c;可参照…

汽车OEMs一般出于什么目的来自定义Autosar CP一些内容

汽车OEMs在使用AUTOSAR CP(Classic Platform)协议时,可能会根据自身的特定需求对标准协议进行修改,形成自己的企业标准(企标)。这种修改通常是为了满足特定的硬件平台、功能需求、安全要求或优化性能。以下是一些常见的修改场景和例子: 1. 硬件平台适配 企业可能会根据…

基于语义-拓扑-度量表征引导的大语言模型推理的空中视觉语言导航

1. 摘要翻译及主要贡献点 摘要&#xff1a; 空中视觉语言导航&#xff08;VLN&#xff09;是一项新兴任务&#xff0c;它使无人机能够通过自然语言指令和视觉线索在户外环境中导航。由于户外空中场景中复杂的空间关系&#xff0c;这项任务仍然具有挑战性。本文提出了一种端到…

HTML-新浪新闻-实现标题-样式1

用css进行样式控制 css引入方式&#xff1a; --行内样式&#xff1a;写在标签的style属性中&#xff08;不推荐&#xff09; --内嵌样式&#xff1a;写在style标签中&#xff08;可以写在页面任何位置&#xff0c;但通常约定写在head标签中&#xff09; --外联样式&#xf…

LongLoRA:高效扩展大语言模型上下文长度的微调方法

论文地址&#xff1a;https://arxiv.org/abs/2309.12307 github地址&#xff1a;https://github.com/dvlab-research/LongLoRA 1. 背景与挑战 大语言模型&#xff08;LLMs&#xff09;通常在预定义的上下文长度下进行训练&#xff0c;例如 LLaMA 的 2048 个 token 和 Llama2 的…

.NET9增强OpenAPI规范,不再内置swagger

ASP.NETCore in .NET 9.0 OpenAPI官方文档ASP.NET Core API 应用中的 OpenAPI 支持概述 | Microsoft Learnhttps://learn.microsoft.com/zh-cn/aspnet/core/fundamentals/openapi/overview?viewaspnetcore-9.0https://learn.microsoft.com/zh-cn/aspnet/core/fundamentals/ope…

景联文科技加入AIIA联盟数据标注分委会

2025年1月16日&#xff0c;中国人工智能产业发展联盟&#xff08;简称AIIA&#xff09;数据委员会数据标注分委会&#xff08;以下简称“分委会”&#xff09;正式成立。景联文科技成为第一批AIIA联盟数据标注分委会委员单位。 数据标注分委会的成立旨在搭建数据标注领域产学研…

SQL Server 建立每日自动log备份的维护计划

SQLServer数据库可以使用维护计划完成数据库的自动备份&#xff0c;下面以在SQL Server 2012为例说明具体配置方法。 1.启动SQL Server Management Studio&#xff0c;在【对象资源管理器】窗格中选择数据库实例&#xff0c;然后依次选择【管理】→【维护计划】选项&#xff0…

Level DB --- TableBuilder

TableBuilder是Level DB里面重要的类和模块&#xff0c;它描述了数据如何序列化到文件中&#xff0c;以及数据里面的格式逻辑。它里面包含了之前介绍的多个模块和类。 data block、filter block和index block block格式&#xff0c;之前已经介绍过Level DB --- BlockBuilder-…

【esp32-uniapp小程序】uniapp小程序篇02——Hbuilder利用git连接远程仓库

一、安装git Git - Downloading Package 下载所需的安装包&#xff0c;点击安装&#xff0c;一路跟着安装指示就行。 二、安装ToriseGit Download – TortoiseGit – Windows Shell Interface to Git 语言包可下载可不下载&#xff0c;软件默认语言是英语。 如果下载了语言…

Java Web-Tomcat Servlet

Web服务器-Tomcat Web服务器简介 Web 服务器是一种软件程序&#xff0c;它主要用于在网络上接收和处理客户端&#xff08;如浏览器&#xff09;发送的 HTTP 请求&#xff0c;并返回相应的网页内容或数据。以下是关于 Web 服务器的详细介绍&#xff1a; 功能 接收请求&#…

MiniMax-01中Lightning Attention的由来(线性注意力进化史)

目录 引言原始注意力线性注意力因果模型存在的问题累加求和操作的限制Lightning AttentionLightning Attention-1Lightning Attention-2 备注 引言 MiniMax-01: Scaling Foundation Models with Lightning Attention表明自己是第一个将线性注意力应用到如此大规模的模型&#…

Linux 内核进程调度

一、进程的分类 在CPU的角度看进程行为的话&#xff0c;可以分为两类&#xff1a; CPU消耗型&#xff1a;此类进程就是一直占用CPU计算&#xff0c;CPU利用率很高。IO消耗型&#xff1a;此类进程会涉及到IO&#xff0c;需要和用户交互&#xff0c;比如键盘输入&#xff0c;占用…

BLE透传方案,IoT短距无线通信的“中坚力量”

在物联网&#xff08;IoT&#xff09;短距无线通信生态系统中&#xff0c;低功耗蓝牙&#xff08;BLE&#xff09;数据透传是一种无需任何网络或基础设施即可完成双向通信的技术。其主要通过简单操作串口的方式进行无线数据传输&#xff0c;最高能满足2Mbps的数据传输速率&…

Linux 入门 常用指令 详细版

欢迎来到指令小仓库&#xff01;&#xff01; 宝剑锋从磨砺出&#xff0c;梅花香自苦寒来 什么是指令&#xff1f; 指令和可执行程序都是可以被执行的-->指令就是可执行程序。 指令一定是在系统的每一个位置存在的。 1.ls指令 语法&#xff1a; ls [选项][目…

Node.js下载安装及环境配置

目录 一、下载 1. 查看电脑版本&#xff0c;下载对应的安装包 2. 下载路径下载 | Node.js 中文网 二、安装步骤 1. 双击安装包 2. 点击Next下一步 3. 选择安装路径 4. 这里我选择默认配置&#xff0c;继续Next下一步&#xff08;大家按需选择&#xff09; 5. 最后inst…

为什么在编程中cast有强制类型转换的意思?

C语言或C在编程时&#xff0c;常常遇到“XXX without a cast”的警告信息&#xff0c;意思是 XXX 没有进行显示的强制类似转换&#xff0c;那么cast为什么会有强制类型转换的意思呢&#xff1f; 从英语的本义来看&#xff0c;cast 有“塑造、铸造”的意思。引申到编程中&#…

Spring Boot(6)解决ruoyi框架连续快速发送post请求时,弹出“数据正在处理,请勿重复提交”提醒的问题

一、整个前言 在基于 Ruoyi 框架进行系统开发的过程中&#xff0c;我们常常会遇到各种有趣且具有挑战性的问题。今天&#xff0c;我们就来深入探讨一个在实际开发中较为常见的问题&#xff1a;当连续快速发送 Post 请求时&#xff0c;前端会弹出 “数据正在处理&#xff0c;请…