ES基础概念

ES基础概念

news/2024/12/28 22:06:24/文章来源:https://blog.csdn.net/LB_bei/article/details/139115089

本文不介绍如何使用ES（使用ES见：）

1.ES生态圈

ES：

Logstash：数据处理服务程序，解析转换加工数据；

Kibana：数据展示、集群管理，数据可视化、ES管理与监控、报表等；

Beats：轻量级数据采集工具，支持多个数据源采集，占用系统资源少；

ES-Hadoop：连接器，通过 ES-Hadoop，可以充分利用 Hadoop 的大数据处理能力和 Elasticsearch 的快速搜索与分析能力，构建强大的数据处理和分析平台；

其他非官方框架：Flink（开源的实时数据流处理框架）、nifi（数据集成工具）、GrafanaLabs（提供开源的监控、日志管理和数据可视化工具，帮助用户在分布式系统和云原生环境中实现更好的可观测性和性能管理）、presto。。。

2.ES的作用

全文搜索：全文索引，支持多种语言分词、中文、英文、数字、特殊符号，应用在企业知识库、电商商品搜索、垂直领域搜索引擎；
地图应用：地图位置应用搜索，集成 Geohash算法，支持大规模的地理位置搜索，结合自身的分布式特性，可以满足海量数据Geo检索；
向量检索：相似图片、类似语音、问答系统、推荐系统，内置支持Dense Vector数据类型，与多种向量计算产品集成，支持多种向量应用场景；
业务系统加速查询：替代关系型数据库，关系型数据库查询性能瓶，分库分表合并查询、海量数据查询、复杂条件组合查询；
大数据领域：强大的数据处理能力，提供Hadoop对外的数据查询服务；自有大数据处理能力、聚合、转换、上卷、大规模明细查询；
日志平台：统一日志平台，采集所有日志、系统日志、程序日志、业务日志，存储所有类型日志，查询所有日志，分析所有日志；
基础监控：指标采集、时序数据，采集基础指标、基于时序数据存储、性能超过时序数据库；
安全分析：网络安全分析预测，机器学习算法模型训练，分析预测潜在网络安全风险；

3.ES的核心概念

Cluster集群：Elasticsearch天然是分布式，由一个或者多个节点实例组成
Node节点：服务程序运行实例
Index索引：数据存储逻辑空间
Shard分片：数据存储实际逻辑空间，单分片就是完整索引数据
Replicate副本：分片数据备份复制，高可用高性能
Segment分段：分片数据实际存储空间
Docment文档：一条完整数据，等同Mysql一行数据
Term词项：单个字段数据拆分成多个独立的词

4.ES的核心算法

Inverted Index倒排索引：根据内容找到内容所在位置
Doc Value列式存储：Elasticsearch数据排序/聚合统计（导致修改数据性能差）
FST有限状态转换：Finite State Transducers 前缀/后缀（模糊匹配）
Skip List跳表：文档定位跳跃
BKD Tree多维空间树：简单数值、范围数据（解决倒排不好范围查询的问题）
RoaringBitmap压缩位图：原始数值压缩、查询结果合并
TF/IDF/BM25分值计算：文本搜索排序分值计算

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/331100.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

区块链钱包如果丢失了私钥或助记词，资产还能恢复吗？

区块链钱包如果丢失了私钥或助记词，资产还能恢复吗？

如果你丢失了区块链钱包的私钥或助记词（通常是用于恢复钱包的短语或种子），那么你的资产在大多数情况下是无法恢复的。私钥是访问和控制你在区块链上资产的唯一凭证，而助记词（如BIP39标准中的12、18、24个单词的短语&am…

阅读更多...

【数据分析面试】53.推送消息的分布情况（SQL）

【数据分析面试】53.推送消息的分布情况（SQL）

题目我们有两个表，一个是 notification_deliveries 表，另一个是包含 created 和购买 conversion dates 的 users 表。如果用户没有购买，那么 conversion_date 列为 NULL。编写一个查询，以获取用户转换前的推送通知总数的分布情…

阅读更多...

无人机监测系统：天空之眼，精准掌握地球脉动

无人机监测系统：天空之眼，精准掌握地球脉动

在当今信息化快速发展的时代，无人机技术以其独特的优势，正在成为资源调查、环境监测和规划支持的重要工具。无人机监测系统通过搭载多种传感器和设备，能够快速、高效地获取地表信息，为决策提供科学依据。项目背景随着全球环境…

阅读更多...

SpringMVC接收请求参数的方式：

SpringMVC接收请求参数的方式：

接收简单变量的请求参数直接使用简单变量作为形参进行接收（这里简单变量名称需要与接收的参数名称保持一致，否则需要加上RequestParam注解）： 细节： 1：SpringMVC会针对常见类型（八种基本类型及…

阅读更多...

二叉排序树的创建

二叉排序树的创建

二叉排序树就是节点经过排序构建起的二叉树，其有以下性质： 1. 若它的左子树不为空，则左子树上所有节点的值均小于它的根节点的值。 2. 若它的右子树不为空，则右子树上所有节点的值均大于它的根节点的值。 3. 它的左、右子树也分…

阅读更多...

python期末作业：批量爬取站长之家的网站排行榜数据并保存，数据分析可视化

python期末作业：批量爬取站长之家的网站排行榜数据并保存，数据分析可视化

爬虫作业，含python爬取数据和保存文件，数据分析使用pyecharts做数据可视化整体上分析网站的排名，直观看各个网站的热度。数据分析之后大致的效果：整个项目分为两个大的部分，第一部分就是抓取网站排名数据，然后保存为Excel、csv等格式，其次就是从文件中…

阅读更多...

下一代Docker会让部署更丝滑吗

下一代Docker会让部署更丝滑吗

下一代Docker会让部署更丝滑吗如何通俗易懂的理解DockerDocker有什么缺点Docker与AI结合，会让部署更加丝滑吗随着互联网技术的不断发展，单机系统已经无法满足日益正常的用户量以及正常处理用户请求，这个时候就需要进行多机部署，…

阅读更多...

设计新境界：大数据赋能UI的创新美学

设计新境界：大数据赋能UI的创新美学

设计新境界：大数据赋能UI的创新美学引言随着大数据技术的蓬勃发展，它已成为推动UI设计创新的重要力量。大数据不仅为界面设计提供了丰富的数据资源，还赋予了设计师以全新的视角和工具来探索美学的新境界。本文将探讨大数据如何赋能UI设计…

阅读更多...

使用Datav，echarts开发各种地图

使用Datav，echarts开发各种地图

一、功能描述在实际中，有时候需要针对不同的地图进行开发，而能在网上找到现成，与需要匹配度高的，几乎很难，而且找起对应的资源也相对麻烦。所以结合DataV提供的地图数据，就能开发出各种地图，然…

阅读更多...

英语学习笔记25——Mrs. Smith‘s kitchen

英语学习笔记25——Mrs. Smith‘s kitchen

Mrs. Smith’s kitchen 史密斯太太的厨房词汇 Vocabulary Mrs. 夫人【已婚】复习：Mr. 先生全名 / 姓　　　Mrs. 夫人全名 / 丈夫的姓　　　Miss 小姐（未婚） 全名 / 姓　　　Ms. 女士全名 / 姓查看婚姻状况，可以观察…

阅读更多...

神经网络的工程基础（零）——PyTorch基础

神经网络的工程基础（零）——PyTorch基础

相关说明这篇文章的大部分内容参考自我的新书《解构大语言模型：从线性回归到通用人工智能》，欢迎有兴趣的读者多多支持。本文涉及到的代码链接如下：regression2chatgpt/ch06_optimizer/gradient_descent.ipynb 本文将介绍PyTorch的基础。…

阅读更多...

速看！！！24上软考-信息系统项目管理师真题回忆，考点已更新

速看！！！24上软考-信息系统项目管理师真题回忆，考点已更新

整理了24上半年软考高级信息系统项目管理师的考试真题，软考一个批次一套题，现在都是机考，收集题目比较困难，希望能给个小小的赞支持一下。注意：当天考试的宝子们可以对答案预估分数！后面场次的宝子可以提…

阅读更多...

WordPress搭建流程

WordPress搭建流程

1. 简介 WordPress 是一个 PHP 编写的网站制作平台。WordPress 本身免费，并且拥有众多的主题可以使用，适合用于搭建个人博客、公司官网、独立站等。 2. 环境准备 2.1 WordPress 下载 WordPress 可以在 Worpress中文官网下载（如果后续要将后台调成中文的话，一定要从中文…

阅读更多...

idea中显示git的Local Changes

idea中显示git的Local Changes

1. 第一打开idea中的Settings文件 2. 找到Version Contro中的commint 3. 取消勾选应用即可 4. 本地提交就会显示出来

阅读更多...

堆和堆排序

堆和堆排序

目录 1.二叉树的顺序存储2.堆的性质3.堆的实现3.1 堆的插入（向上调整算法）3.2 堆向下调整算法3.3 堆的创建3.4 堆的删除3.5 全套代码 4.堆排序5.Top-K问题 1.二叉树的顺序存储顺序存储就是数组存储，一般使用数组只适合完全二叉树&#xff0…

阅读更多...

AI革命：生活无处不智能

AI革命：生活无处不智能

AI革命：生活无处不智能 😄生命不息，写作不止 🔥 继续踏上学习之路，学之分享笔记 👊 总有一天我也能像各位大佬一样 🏆 博客首页怒放吧德德 To记录领地 🌝分享学习心得&#xff0…

阅读更多...

回见，那果园

回见，那果园

记不得何时开始骑行，何时开始爬山，何时偶遇洛师傅，何时进了那半山腰的果园。似乎很远，又很近。昨天打电话给果园的师傅，本意问问杏是否熟了，周末骑行过去、进山聊天顺道吃个新鲜。洛师傅呵呵的笑…

阅读更多...

电脑版网易云音乐听歌识曲

电脑版网易云音乐听歌识曲

文章目录流程流程电脑网易云音乐的搜索框旁边就是听歌识曲功能

阅读更多...

NDIS小端口驱动开发(一)

NDIS小端口驱动开发(一)

在四种NDIS相关的驱动中，微型端口驱动(也经常翻译为为小端口驱动)位于驱动栈的底部，一般将它理解为NIC设备的驱动程序： 有几种类型的微型端口驱动程序类型： 无连接微型端口驱动程序用于控制无连接网络媒体 ，如以太网的…

阅读更多...

JMeter 常见易错问题

JMeter 常见易错问题

1、配置错误： 问题：线程组配置错误，例如设置了错误的线程数或循环次数。解决方法：检查线程组的配置。确保线程数（即并发用户数量）设置正确，以及循环次数符合预期。如果要模拟不同类型的用户行…

阅读更多...

最新文章

推荐文章