ES-模糊查询

模糊查询

1 wildcard

  • 准备数据
POST demolike/_bulk
{"index": {"_id": "1"}
}
{"text": "草莓熊是个大坏蛋"
}
{"index": {"_id": "2"}
}
{"text": "wolf 也是一个坏蛋"
}
{"index": {"_id": "3"}
}
{"text": "我们一起去看小姐姐"
}
{"index": {"_id": "4"}
}
{"text": "真相只有一个"
} 
  • 使用案例
GET demolike/_search  
{"query": {"wildcard": {"text.keyword": {"value": "*坏蛋*"}}}
}GET demolike/_search  
{"query": {"wildcard": {"text.keyword": {"value": "*个*"}}}
}

在这里插入图片描述
在这里插入图片描述

  • 正则
GET demolike/_search
{"query":{"regexp": {"text": "[\\s\\S]*是[\\s\\S]*"}}
}

在这里插入图片描述
-fuzzy(更适合用于生产环境)
拥有纠错的能力

POST demolikefu/_bulk
{"index":{"_id":"1"}}
{"text":"hello cat"}
{"index":{"_id":"2"}}
{"text":"hello fdsaf"}
{"index":{"_id":"3"}}
{"text":"hello cfasat"}
GET demolikefu/_search
{"query": {"fuzzy": {"text": {"value": "act", #fuzzy 会进行纠错"fuzziness": 1, #编辑距离 也就是可以进行多少次操作变成正确的字符 act -> cat c和a 交换就可已变成cat 编辑距离为1"transpositions": true #es 里面有两种算法 老算法:认为ac都移动了   新算法:交换只算移动了一次 false 是老算法 true是新算法}}}
}

在这里插入图片描述

  • 前缀搜索
GET demolikefu/_search
{"query":{"match_phrase_prefix": {"text": "zhangsan and l" #会搜索出 zhangsan and list}}
}
#这个也是分词的 会搜索分词后的
GET demolike/_search
{"query":{"prefix": {"text": {"value": "是" #如果要搜整个句子 用 text.keyword}}}
}
  • ngram
    性能会比 fuzzy 好,但是ngram会浪费空间,如果是要追求极致的性能一般使用ngram
PUT my_index
{"settings": {"analysis": {"filter": {"2_3_ngram": {"type": "ngram","min_gram": 2, #最小"max_gram": 3  #最大  比如she经过这个作用 sh he she 等}},"analyzer": {"my_ngram": {"type": "custom","filter": "2_3_ngram", #这个是在分词的基础上对每个单词进行分词"tokenizer": "standard" #这个是分词的 比如 hello world 分为 hello和world}}}},"mappings": { #建立索引的时候一般就默认 流量特别大的时候更合适用这个自定义的方式创建索引"properties": {"text": {"type": "text","analyzer": "my_ngram", #存储的时候怎么切分"search_analyzer": "standard" #查询语句怎么切分}}}
}
  • edge_ngram
put my_index
{"settings":{"analysis":{"filter":{"2_3_ngram":{"type":"ngram","min_gram":2,"max_gram":3}},"analyzer":{"my_ngram":{"type":"custom","filter":"2_3_ngram","tokenizer":"standard"}}}},"mappings":{"properties":{"text":{"type":"text","analyzer":"my_ngram","search_analyzer":"standard"}}}
}

从左向右切分,比ngram 切分的数量更少。

  • suggest
POST product_suggest/_bulk
{"index":{"_id" : 1}}
{"text":"你是一个小笨蛋"}
{"index":{"_id" : 2}}
{"text":"疯狂学习中"}
{"index":{"_id" : 3}}
{"text":"来呀摆烂躺平呀"}
{"index":{"_id" : 4}}
{"text":"我真的好想成为优秀的工程师"}PUT product_suggest{"mappings":{"properties":{"text":{"type":"text","analyzer":"ik_smart","fields":{"suggest":{"type":"completion", #补全"analyzer":"ik_smart"}}},"content":{"type":"text","analyzer":"ik_smart"}}}}#推荐补全
GET product_suggest/_search
{"suggest":{"my_suggest":{"prefix":"我", #suggest 中prefix是性能最好的"completion":{"field":"text.suggest"}} }
}

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/219069.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# WPF上位机开发(树形控件在地图软件中的应用)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 前面我们聊过图形软件的开发方法。实际上,对于绘制的图形,我们一般还会用树形控件管理一下。举个例子,一个地图…

云原生之深入解析使用Telepresence轻松在本地调试和开发Kubernetes应用程序

一、 准备 telepresence 下载:https://www.telepresence.io/docs/latest/install/kubectl 下载:https://kubernetes.io/docs/tasks/tools/ 二、版本检测 $telepresence version Client: v2.5.3 (api v3) Root Daemon: not running User Daemon: not r…

Wordle 游戏实现 - 使用 C++ Qt

标题:Wordle 游戏实现 - 使用 C Qt 摘要: Wordle 是一款文字猜词游戏,玩家需要根据给定的单词猜出正确的答案,并在限定的次数内完成。本文介绍了使用 C 和 Qt 框架实现 Wordle 游戏的基本思路和部分代码示例。 引言:…

前后端传参中遇见的问题

前后端传参经常容易出错,本文记录开发springBootMybatis-plusvuecli项目中出现的传参问题及解决办法 1.前后端没有跨域配置,报错 解决方法:后端进行跨域配置,拷贝CorsConfig类 package com.example.xxxx.config;import org.spr…

早上好,我的leetcode 【hash】(第二期)

写在前面:坚持才是最难的事情 C代码还是不方便写,改用python了,TAT 文章目录 1.两数之和49. 字母异位词分组128.最长连续序列 1.两数之和 你好,梦开始的地方~ https://leetcode.cn/problems/two-sum/description/?envTypestudy…

HiveSql语法优化三 :join优化

前面提到过:Hive拥有多种join算法,包括Common Join,Map Join,Bucket Map Join,Sort Merge Buckt Map Join等;每种join算法都有对应的优化方案。 Map Join 在优化阶段,如果能将Common Join优化为…

【docker 】基于Dockerfile创建镜像

Dockerfile文档 Dockerfile文档地址 Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。 DockerFile 可以说是一种可以被 Docker 程序解释的脚本,DockerFile 是由一条条的命令组成的,每条命令对应 …

RT-DETR优化:ASF-YOLO提取多尺度特征 | 2023年12月最新成果

🚀🚀🚀本文改进: ASF-YOLO一种新的特征融合网络架构,该网络由两个主要的组件网络组成,可以为小目标分割提供互补的信息:(1)SSFF模块,它结合了来自u;(2)TFE模块,它可以捕获小目标的局部精细细节等 🚀🚀🚀YOLOv8改进专栏:http://t.csdnimg.cn/hGhVK 学姐带你学…

AUTOSAR组织引入了Rust语言的原因是什么?有哪些好处?与C++相比它有什么优点?并推荐一些入门学习Rust语言链接等

AUTOSAR(汽车开放系统架构)是一个由汽车制造商、供应商和其他来自电子、半导体和软件行业的公司组成的全球发展伙伴关系,自2003年以来一直致力于为汽车行业开发和引入开放、标准化的软件平台。 AUTOSAR 最近宣布成立一个新的工作组,用于探索在汽车软件中使用 Rust 编程语言…

R语言|分面中嵌入趋势线

简介 关于分面的推文,小编根据实际科研需求,已经分享了很多技巧。例如: 分面中添加不同表格 分面中添加不同的直线 基于分面的面积图绘制 分面中的细节调整汇总 基于分面的折线图绘制 最近科研中又遇到了与分面相关的需求:…

Axure 9基本元件,表单及表格元件简介,表单案例

目录 一.基本元件 1.元件基本介绍 2.基本元件的使用 二.表单及表格元件 三.表单案例 四.简单简历绘制 一.基本元件 1.元件基本介绍 概述 - 在Axure RP中,元件是**构建原型图的基础模块**。 将元件从元件库里拖拽到画布中,即可添加元件到你的原型…

excel可视化看板【动态关联公司、部门、人员、及时间】

昨天网友花钱定制了一个可视化报表,花了一整天时间,做了这份酷炫的可视化报表,右边按钮控件可以动态关联可视化图表 做这种这重要是数据的统计,只要能统计到,剩下的只是如何展示,慢慢的调整,美…

一、微前端目标、前端架构的前生今世、微前端架构优势和劣势、软件设计原则与分层

1、目标 2、前端架构的前世今生 ① 初始:无架构,前端代码内嵌到后端应用中 ② 后端 MVC 架构:将视图层、数据层、控制层做分离 缺点:重度依赖开发环境,代码混淆严重(在调试时,需要启动后端所有…

加油站“变身”快充站,探讨充电新模式——安科瑞 顾烊宇

摘要:新能源汽车规模化发展的同时,充电不便利的痛点愈发明显。在未来的新能源汽车行业发展当中,充电的矛盾要远远大于造车的矛盾,解决好充电的问题成为电动汽车行业发展的一个突出问题。解决充电补能问题,重要的方式之…

【golang/g3n】3D游戏引擎G3N的windows安装与测试

目录 说在前面安装测试 说在前面 操作系统:win 11go version:go1.21.5 windows/amd64g3n版本:github.com/g3n/engine v0.2.0其他:找了下golang 3d相关的库,目前好像就这个比较活跃 安装 按照官方教程所说,…

linux空洞文件以及多线程写入

介绍空洞文件 Linux空洞文件(hole file)是一种特殊类型的文件,其大小可能超过实际存储的数据量。在空洞文件中,文件系统会为文件分配磁盘空间,但实际上只在文件中存储了部分数据,其余部分被称为"空洞…

Redis实现延迟队列

目录 一、什么是延时队列 二、延时队列的应用 三、举例说明 我的设计思想: 一、什么是延时队列 延时队列相比于普通队列最大的区别就体现在其延时的属性上,普通队列的元素是先进先出,按入队顺序进行处理,而延时队列中的元素在入队时会指定…

SQL、Jdbc、JdbcTemplate、Mybatics

数据库:查询(show、select)、创建(create)、使用(use)、删除(drop)数据库 表:创建(【字段】约束、数据类型)、查询、修改(alter *add)、删除 DML:增加(inse…

2024年网络安全比赛--系统渗透测试(超详细)

一、竞赛时间 180分钟 共计3小时 二、竞赛阶段 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 1.在渗透机中对服务器主机进行信息收集,将服务器开启的端口号作为 Flag 值提交; 2.在渗透机中对服务器主机进行渗透,在服务器主机中获取服务器主机名称&#xff…

【自动化测试】web3py 连接 goerli

web3py 连接 goerli 直接使用库里方法 if __name__ __main__:from web3.auto.infura.goerli import w3w3.eth.get_balance(get_address_by_private_key(os.getenv("AAA_KEY")))error info: websockets.exceptions.InvalidStatusCode: server rejected WebSocket …