Elasticsearch是做什么的？

Elasticsearch是做什么的？

news/2024/11/24 0:16:40/文章来源:https://blog.csdn.net/weixin_53891720/article/details/142944491

初识elasticsearch

官方网站：Elasticsearch：官方分布式搜索和分析引擎 | Elastic

Elasticsearch是做什么的？

Elasticsearch 是一个分布式搜索和分析引擎，专门用于处理大规模数据的实时搜索、分析和存储。它基于 Apache Lucene 构建，能够快速、高效地执行全文搜索、结构化搜索以及数据分析任务。由于其强大的功能，Elasticsearch 常用于以下几种场景：

1. 全文搜索
Elasticsearch 提供快速、精确的全文搜索，支持复杂查询如模糊匹配、短语搜索、词条权重，广泛用于内容管理系统、电子商务、社交平台等。

2. 数据分析
通过聚合功能，Elasticsearch 可高效进行实时数据分析，支持多维聚合查询，适用于日志分析、业务数据分析等场景。

3. 日志与监控
结合 Elastic Stack（Logstash、Kibana），Elasticsearch 实现实时日志采集、分析和可视化，常用于系统监控、错误检测等。

4. 数据存储
作为分布式文档存储，Elasticsearch 可水平扩展，处理海量数据，保证高可用性和故障冗余。

5.地理位置查询
支持地理空间查询，适用于地图应用、物流、外卖等基于位置的服务场景。

核心特点

倒排索引：Elasticsearch 使用倒排索引来快速查找文档中包含特定词语的条目，特别适合全文搜索场景。

分布式架构：它天生支持水平扩展，允许在集群中分布和存储数据，保证性能和高可用性。

实时性：数据索引和搜索可以在毫秒级内完成，非常适合需要实时响应的数据查询场景。

RESTful API：通过简单的 RESTful API 进行操作，便于与其他系统集成。

典型应用场景

搜索引擎：用于内容搜索、产品搜索（如电商网站）、文档搜索等。
日志分析：通过 Elastic Stack（包括 Logstash 和 Kibana），构建日志管理和监控系统。
推荐系统：电商、流媒体、社交平台等使用 Elasticsearch 进行个性化推荐。
实时数据分析：企业实时分析海量数据，用于业务决策。

倒排索引是什么？和MySQL数据库有什么不同？

倒排索引（Inverted Index）是一种数据结构，广泛用于全文搜索引擎中。它的主要作用是将文档与其包含的单词进行关联，从而实现快速的文本检索。

基本原理：

文档与词汇表的映射：倒排索引将每个单词（或词项）映射到包含该单词的文档列表中。相比于传统的正排索引（即存储文档到词汇的映射），倒排索引更加高效。

结构：倒排索引通常包括两个主要部分：词汇表和文档列表。

假设有三个文档：

文档1：我爱编程

文档2：我爱学习

文档3：编程很有趣

构建倒排索引后的结构如下：

倒排索引与 MySQL 数据库的不同：

数据存储结构：
- 倒排索引：主要用于存储词项与文档之间的映射，更加适合文本搜索。
- MySQL：使用行或列存储数据，通常是基于表的关系型数据库。
查询性能：
- 倒排索引：在处理全文搜索时，可以快速查找包含特定词项的所有文档，支持复杂的查询。
- MySQL：虽然支持索引（如B树索引），但在处理复杂的文本搜索时性能不如倒排索引。
更新效率：
- 倒排索引：对于频繁更新的文档，重建索引的开销较大。
- MySQL：支持行级更新，但对于大量数据的复杂查询，性能可能下降。

倒排索引的搜索流程如下（以搜索"华为手机"为例），如图：

流程描述：

1.用户输入条件"华为手机"进行搜索。

2.对用户输入条件分词，得到词条：华为、手机。

3.拿着词条在倒排索引中查找（由于词条有索引，查询效率很高），即可得到包含词条的文档id：1、2、3。

4.拿着文档id到正向索引中查找具体文档即可（由于id也有索引，查询效率也很高）。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/451642.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

spring boot 3.3.4 网关(gateway) 集成knife4j 4.4.0

spring boot 3.3.4 网关(gateway) 集成knife4j 4.4.0

spring boot版本 3.3.4，jdk 22， springcloud 2023.0.3 官方参考链接 Spring Cloud Gateway网关聚合 | Knife4j (xiaominfo.com) springboot版本信息 <properties> <java.version>22</java.version> <spring-cloud.version>2023…

阅读更多...

软件企业选择第三方软件检测机构有哪些好处?

软件企业选择第三方软件检测机构有哪些好处?

在软件开发的当今时代，确保软件的质量和性能是每个企业面临的挑战，因此软件检测公正必不可少。随着市场的需求，越来越多企业会选择将该项工作交由第三方软件检测机构进行。第三方软件检测机构指独立于软件开发方和需求方的第三方机构&#xf…

阅读更多...

Java基于SSM微信小程序物流仓库管理系统设计与实现(源码+lw+数据库+讲解等)

Java基于SSM微信小程序物流仓库管理系统设计与实现(源码+lw+数据库+讲解等)

选题背景随着社会的发展，社会的方方面面都在利用信息化时代的优势。互联网的优势和普及使得各种系统的开发成为必需。本文以实际运用为开发背景，运用软件工程原理和开发方法，它主要是采用java语言技术和mysql数据库来完成对系统的设计。整个…

阅读更多...

EMCMO--多任务优化求解约束多目标问题

EMCMO--多任务优化求解约束多目标问题

EMCMO–多任务优化求解约束多目标问题 title： An Evolutionary Multitasking Optimization Framework for Constrained Multi-objective Optimization Problems author： Kangjia Qiao, Kunjie Yu, BoyangQu, Jing Liang, Hui Song, and Caitong Yue. …

阅读更多...

C++基础补充（03）C++20 的 std::format 函数

C++基础补充（03）C++20 的 std::format 函数

文章目录 1. 使用C20 std::format2. 基本用法3. 格式说明 1. 使用C20 std::format 需要将VisualStudio默认的标准修改为C20 菜单“项目”-“项目属性”，打开如下对话框代码中加入头文件 2. 基本用法通过占位符{}制定格式化的位置，后面传入变量 #…

阅读更多...

rk3588 opencv 的使用

rk3588 opencv 的使用

-------------------------------------------------------------------------------------------------------- 目前是 3588 上无法直接编译出 C程序。报错如下： -----------------------------------------------------------------------------------------…

阅读更多...

82.【C语言】数据结构之顺序表的初始化和销毁

82.【C语言】数据结构之顺序表的初始化和销毁

目录 1.线性表 2.分类 1.静态顺序表：使用定长数组存储元素代码示例(写入Seqlist.h中) 2.动态顺序表:使用与动态内存管理有关的函数代码示例(写入Seqlist.h中) 补:数据管理的四个需求:增改删查 3.操作顺序表 1.初始化顺序表 1.不开辟空间 2.开辟空间 1…

阅读更多...

无人机之三维航迹规划篇

无人机之三维航迹规划篇

一、基本原理飞行环境建模：在三维航迹规划中，首先需要对飞行环境进行建模。这包括对地形、障碍物、气象等因素进行准确的测量和分析，以获得可行的飞行路径。飞行任务需求分析：根据无人机的任务需求，确定航迹规划的…

阅读更多...

分布式篇（分布式事务）（持续更新迭代）

分布式篇（分布式事务）（持续更新迭代）

一、事务 1. 什么是事务 2. 事务目的 3. 事务的流程 4. 事务四大特性原子性（Atomicity） 一致性（Consistency） 持久性（Durability） 隔离性（Isolation） 5. MySQL VS Oracle …

阅读更多...

汇总10个AI免费一键生成PPT的网站

汇总10个AI免费一键生成PPT的网站

一、前言 PPT幻灯片是现代办公和学习中的重要组成部分。它在工作、研究或培训中扮演着重要角色，并能够让观众更好地理解信息。随着当今人工智能技术的快速发展，现在有很多免费的AI PPT生成器可供选择，帮助用户更加便捷地制作出高效且具有较强…

阅读更多...

基于SpringBoot+Vue+uniapp微信小程序的宿舍报修系统的详细设计和实现

基于SpringBoot+Vue+uniapp微信小程序的宿舍报修系统的详细设计和实现

项目运行截图技术框架后端采用SpringBoot框架 Spring Boot 是一个用于快速开发基于 Spring 框架的应用程序的开源框架。它采用约定大于配置的理念，提供了一套默认的配置，让开发者可以更专注于业务逻辑而不是配置文件。Spring Boot 通过自动化配置和约…

阅读更多...

Qt获取磁盘信息+表格显示

Qt获取磁盘信息+表格显示

效果展示主要代码获取磁盘相关数据获取磁盘数据 Qt 没有提供相关的接口，需要使用 Windows API。接口解释如下： BOOL GetDiskFreeSpaceExW([in, optional] LPCWSTR lpDirectoryName,[out, optional] PULARGE_INTEGER lpFreeBytesAvailable…

阅读更多...

GPIO口的学习

GPIO口的学习

推挽输出用它去控制一个mos管，当输出高电平时电流这样流出去，给外面的这颗mos管的栅极充电，所以这个过程称为推把电流推出去然后当IO口输出低电平时电流这样流进来,给外面的这颗mos管的栅极放电,那这就是挽，把电流挽回来,所以所…

阅读更多...

【汇编语言】寄存器（内存访问）（七）—— CPU提供的栈机制

【汇编语言】寄存器（内存访问）（七）—— CPU提供的栈机制

文章目录前言1. CPU提供的栈机制2. push指令3. 问题4. 问题的分析与解答5. pop指令结语前言 📌 汇编语言是很多相关课程（如数据结构、操作系统、微机原理）的重要基础。但仅仅从课程的角度出发就太片面了，其实学习汇编语言可以深…

阅读更多...

fmql之Linux Uart

fmql之Linux Uart

正点原子第48章。串口收发测试正点原子教程 RS232和RS485的串口收发测试是一样的。 // 设置串口波特率为115200 stty -F /dev/ttyPS1 ispeed 115200 ospeed 115200 cs8// 发送字符串 echo "www.openedv.com" >/dev/ttyPS1// 接收数据 cat /dev/ttyPS1 fmql测…

阅读更多...

强烈推荐Kafka动画入门概念的3个讲座

强烈推荐Kafka动画入门概念的3个讲座

强烈推荐Kafka动画入门概念的3个讲座，3个都是动画讲解，十分不错， 1、主题、偏移量和分区 ~ Kafka核心概念(Part1) 地址：主题、偏移量和分区 ~ Kafka核心概念(Part1)_哔哩哔哩_bilibili 2、偏移量提交、重平衡和消费者组 ~ Kafka核…

阅读更多...

C Primer Plus 第9章——第一篇

C Primer Plus 第9章——第一篇

你该逆袭了文章目录一、复习函数1、定义带形式参数的函数2、声明带形式参数函数的原型3、使用 return 从函数中返回值（1）、返回值不仅可以赋给变量，也可以被用作表达式的一部分。（2）、返回值不一定是变量的值&#x…

阅读更多...

【Linux】进程池

【Linux】进程池

目录进程池进程池的概念： 手搓进程池： 1、创建信道和子进程 2、通过channel控制子进程 3、回收管道和子进程进程池进程池的概念： 定义一个池子，在里面放上固定数量的进程，有需求来了，就拿一个池中…

阅读更多...

微信小程序考试系统(lw+演示+源码+运行）

微信小程序考试系统(lw+演示+源码+运行）

摘要随着信息技术在管理上越来越深入而广泛的应用，管理信息系统的实施在技术上已逐步成熟。本文介绍了微信小程序考试系统的开发全过程。通过分析微信小程序考试系统管理的不足，创建了一个计算机管理微信小程序考试系统的方案。文章介绍了微信小程序考…

阅读更多...

Leetcode 二叉搜索树的第 K 个元素

Leetcode 二叉搜索树的第 K 个元素

复习一下二叉搜索树二叉搜索树 (Binary Search Tree, 简称 BST) 是一种特殊的二叉树(可以为空)，其中每个节点都有一个值，并且满足以下特点： 定义： 左子树节点的值小于根节点的值：对于每个节点，左子树中所…

阅读更多...

最新文章

推荐文章