大数据-173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

点一下关注吧!!!非常感谢!!持续更新!!!

目前已经更新到了:

  • Hadoop(已更完)
  • HDFS(已更完)
  • MapReduce(已更完)
  • Hive(已更完)
  • Flume(已更完)
  • Sqoop(已更完)
  • Zookeeper(已更完)
  • HBase(已更完)
  • Redis (已更完)
  • Kafka(已更完)
  • Spark(已更完)
  • Flink(已更完)
  • ClickHouse(已更完)
  • Kudu(已更完)
  • Druid(已更完)
  • Kylin(已更完)
  • Elasticsearch(正在更新…)

章节内容

上节我们完成了如下的内容:

  • Elasticsearch 索引操作
  • IK 分词器安装上使用
  • 自定义分词

在这里插入图片描述

映射操作

索引创建之后,等于有了关系型数据库中的Database,Elasticsearch7.x取消了索引type类型的设置,不允许指定类型,默认为_doc,但字段仍然是有的,我们需要设置字段的约束信息,叫做字段映射(mapping)
字段的约束包括但不限于:

  • 字段的数据类型
  • 是否要存储
  • 是否要索引
  • 分词器

创建映射字段

语法:

PUT /索引名/_mapping
{"properties": {"字段名": {"type": "数据类型","index": true,"store": false,"analyzer": "分词器"}}
}

上述内容解释如下:

  • type 类型,可以是 text、long、short、date等等
  • index 是否为索引 默认为true
  • store 是否存储 默认为false
  • analyzer 分词器

示例:

# 新建索引
PUT /wzkicu-index
# 映射关系
PUT /wzkicu-index/_mapping/
{"properties": {"name": {"type": "text","analyzer": "ik_max_word"},"job": {"type": "text","analyzer": "ik_max_word"},"logo": {"type": "keyword","index": "false"},"payment": {"type": "float"}}
}

运行结果如下图所示:
在这里插入图片描述
上图中,包含的字段如下所示,并且加了一些属性:

  • name 企业名称
  • job 需求岗位
  • logo logo图片地址
  • payment 薪资

映射属性详解

支持的类型非常的多,可以访问对应的文档进行查看:

https://www.elastic.co/guide/en/elasticsearch/reference/8.15/mapping-types.html

对应的页面如下图所示:
在这里插入图片描述
这里有几种:

  • String类型:text可分词,不可参与聚合。keyword不可分词,作为完整字段进行分配,可以参与聚合。
  • Numerical类型:数值类型、分两类,基本数据类型、浮点数的高精度类型
  • Date:日期类型,ES可以对日期格式化字符串存储,但是建议我们存储为毫秒值、存储为long、节省空间。
  • Array 数组类型,进行匹配时,任意一个元素满足,都认为满足。排序时,如果升序则用数组中最小值来排序,如果降序则用数组中的最大值来排序
  • Object对象,{ name: “jack”, age: 21, girl: {name: “Rose”, age: 21}},如果存储到索引库是对象类型,例如上面的girl,会把girl变成girl.name和girl.age
  • index,true字段会被索引,则可以用来进行搜索,默认值就是true。false字段不会被索引,不能用来搜索。比如LOGO的图片地址,这种不需要索引,就可以设置为False。
  • store,是否将数据进行独立存储,原始的文本存储在 _source里面,默认情况下其他提取出来的字段都不是独立存储的,是从_source里面提取出来的。当然你也可以独立的存储某个字段,只要设置store:true即可,获取独立存储的字段要比_source中解析快得多,但是也会占用更多的空间,所以要根据实际业务需要来设置,默认为false
  • analyzer:指定分词器 一般使用IK分词器 ik_max_word ik_smart

查看映射关系

单个映射关系
语法:

GET /索引名称/_mapping

示例:

GET /wzkicu-index/_mapping

执行的结果如下图所示:
在这里插入图片描述

所有映射关系

语法:

GET _mapping
GET _all/_mapping

执行结果如下图所示:
在这里插入图片描述

修改映射关系

PUT /索引库名/_mapping
{"properties": {"字段名": {"type": "类型","index": true,"store": true,"analyzer": "分词器"}}
}

主要注意的是:修改映射只能是增加字段的操作,其他的更改只能删除索引重新建立索引来实现。

一次性建立索引与映射

实际上创建索引和映射是可以放到一起来做的, 在创建索引的同时,直接指定映射。

PUT /索引库名称
{"settings":{"索引库属性名":"索引库属性值"},"mappings":{"properties":{"字段名":{"映射属性名":"映射属性值"}}}
}

案例:

PUT /wzk-index
{"settings": {},"mappings": {"properties": {"name": {"type": "text","analyzer": "ik_max_word"}}}
}

执行结果如下图所示:
在这里插入图片描述

文档增删改查与局部更新

文档,即索引库中的数据,会根据规则创建索引,将用来搜索,可以类比做数据库中的一行数据。

新增文档

新增文档时,涉及到的ID的创建方式,手动指定或者自动生成。

手动新增

POST /索引名称/_doc/{id}

示例:

POST /wzkicu-index/_doc/1
{"name" : "百度","job" : "小度用户运营经理","payment" : "30000","logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}POST /wzkicu-index/_doc/2
{"name" : "百度","job" : " 百度用户运营经理","payment" : "50000","logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

执行的结果如下图所示:
在这里插入图片描述

自动新增

语法:

POST /索引名称/_doc
{"field": "value"
}

示例:

POST /wzkicu-index/_doc
{"name" : "百度","job" : " 百度测试","payment" : "20000","logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

执行结果如下图所示:
在这里插入图片描述

查询文档

单个文档

语法:

GET /索引名称/_doc/{id}

示例:

GET /wzkicu-index/_doc/1

执行结果如下图所示:
在这里插入图片描述
对返回的结果的格式解释如下:
在这里插入图片描述

所有文档

语法:

 POST /索引名称/_search

示例:

POST /wzkicu-index/_search
{"query":{"match_all": {}}
}

测试运行的结果如下图所示:
在这里插入图片描述

定制返回字段

很多业务场景下,我们不需要返回这么多字段:
示例:

GET /wzkicu-index/_doc/1?_source=name,job

执行结果如下图所示,可以看到根据需要,只返回了 name 和 job:
在这里插入图片描述

更新文档

全部更新

新增方式相同,只不过新增是POST,而更新是PUT,而且修改必须指定ID才可以。

  • id对应的文档存在,则修改
  • id对应的文档不存在,则新增
PUT /wzkicu-index/_doc/5
{"name" : "百度","job" : " 百度测试","payment" : "20000","logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

第一次执行,可以看到右侧是:created:
在这里插入图片描述
再执行一次,可以看到右侧是:updated:
在这里插入图片描述

局部更新

ES可以使用PUT或者POST进行更新,如果指定ID存在,则执行更新操作。
注意:

  • ES执行更新操作的时候,ES是先将旧的标记为删除,再添加新的文档。
  • 旧的文档不会立即消失,但是你也无法访问,ES会在添加更多数据的时候,后台清理已经标记为删除的数据。
    全部更新是直接把之前的老数据,标记为删除状态,然后再添加一条更新的数据(PUT或者POST),局部更新,只是修改某个字段(POST)。
POST /索引名/_update/{id}
{"doc":{"field":"value"}
}

示例:

POST /wzkicu-index/_update/2
{"doc":{"name":"淘宝"}
}

执行的结果如下图所示:
在这里插入图片描述

删除文档

ID删除
语法:

DELETE /索引名/_doc/{id}

示例

DELETE /wzkicu-index/_doc/3

执行结果如下图所示:
在这里插入图片描述

条件删除

语法:

POST /索引名/_delete_by_query
{"query": {"match": {"字段名": "搜索关键字"}}
}

示例:

# 查询一下 包含百度关键字的
POST /wzkicu-index/_search
{"query":{"match":{"name":"百度"}}
}# 删除name字段为百度的doc
POST /wzkicu-index/_delete_by_query
{"query":{"match":{"name":"百度"}}
}

执行结果如下图所示:
在这里插入图片描述

删除所有

POST /索引名/_delete_by_query
{"query": {"match_all": {}}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/454735.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

后台管理员登录实现--系统篇

我的小系统后台原来就有一个上传图片的功能还夹带个删除图片的功能,还嵌到了一个菜单里面。之前效果如下 那么现在为了加大安全力度,想增加一个登录页面。通过登录再到这个页面。看着貌似很简单,但是听我细细说来,要新增些什么东西…

KMP 算法

目录 KMP 算法 算法思路 为什么不需要在主串中进行回退 计算 next 数组 代码实现 next 数组优化 查找所有起始位置 KMP 算法 KMP 算法是一种改进的字符串匹配算法,由 D.E.Knuth,J.H.Morris 和 V.R.Pratt 提出的,因此人们称它为 克努特…

(北京政务服务满意度公司)满意度调查助力服务质量提升

在当今社会,(政务服务满意度公司)政务窗口服务的质量直接关系到市民的日常生活和城市的健康发展。为了解市民对政务窗口服务的满意度,提升服务质量,某市委托民安智库专业市场调查公司开展了政务窗口服务满意度调查&…

【平方矩阵 + 蛇形矩阵】

矩阵找规律题 题目链接: 平方矩阵 I平方矩阵 II平方矩阵 III蛇形矩阵 平方矩阵 I 解法一:找坐标规律 while True:x int(input())if not x:breakfor i in range(x):for j in range(x):print(%d % min(i 1, j 1, x - i, x - j), end )print()prin…

【Hive】3-HiveSQL 数据定义语言(DDL)

HiveSQL 数据定义语言(DDL) SQL中DDL语法的作用 数据定义语言(Data Definition Language,DDL),是SQL语言集中对数据库内部的对象结构进行创建,删除,修改等的操作语言,这些数据库对象包括datab…

SpringBoot实现的汽车票在线预订系统

2相关技术 2.1 MySQL 数据库 MySQL 是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统,它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等,非…

5G NR GSCN计算SSB中心频率MATLAB实现

本期给大家带来5G NR中已知GSCN如何计算SSB的中心频率,用MATLAB实现,参考3GPP 38.104 下图是GSCN与SSB中心频率换算关系。 函数说明: 函数的入参是GSCN号 函数的输出是对应的SSB中心频率,单位MHZ function freqency nr_5g_gs…

汽配企业数字工厂管理系统实施规划方案

在当今快速发展的汽车工业中,汽配企业面临着日益激烈的市场竞争和不断变化的客户需求。为了提升生产效率、优化资源配置并增强市场竞争力,实施数字工厂管理系统已成为汽配企业转型升级的关键举措。本方案旨在提出一套全面、可行的数字工厂管理系统实施规…

U盘文件或目录损坏且无法读取:原因、恢复与预防全攻略

一、U盘文件或目录损坏现状概览 U盘,作为我们日常生活中不可或缺的数据存储设备,其便捷性和实用性广受好评。然而,在使用U盘的过程中,不少用户都曾遇到过一个棘手的问题——U盘文件或目录损坏且无法读取。这一故障不仅会导致数据…

大数据开发电脑千元配置清单

大数据开发电脑配置清单 电脑型号HUANANZHI 台式电脑操作系统Windows 11 专业版 64位(Version 23H2 / DirectX 12)处理器英特尔 Xeon(至强) E5-2673 v3 2.40GHz主板HUANANZHI X99-P4T(P55 芯片组)显卡NVIDIA GeForce GT 610 ( 2…

vscode设置特定扩展名文件的打开编码格式

用vscode 编辑c语言或者Verilog代码, 由于其它开发工具的文件编码格式无法修改,默认只能是gb2312, 与我们国内奉行的统一 utf8 不一致. 所以只能是更改特殊文件的打开方式. 配置方式如下. 关键配置如下: {"git.openRepositoryInParentFolders": "never",…

数据结构——广义表

介绍 注:广义表的元素既可以是一个元素(原子),也可以又是一个表(子表),()为原子是空元素,(())为子表是一个无元…

【计算机网络 - 基础问题】每日 3 题(五十二)

✍个人博客:https://blog.csdn.net/Newin2020?typeblog 📣专栏地址:http://t.csdnimg.cn/fYaBd 📚专栏简介:在这个专栏中,我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞…

打开游戏提示丢失(或找不到)XINPUT1_3.DLL的多种解决办法

xinput1_3.dll是一个动态链接库(DLL)文件,它在Windows操作系统中扮演着重要的角色。该文件作为系统库文件,通常存放于C:\Windows\System32目录下(对于32位系统)或C:\Windows\SysWOW64目录下(对于…

安装vue发生异常: idealTree:nodejs: sill idealTree buildDeps

一、异常 C:\>npm install vue -g npm ERR! code CERT_HAS_EXPIRED npm ERR! errno CERT_HAS_EXPIREDnpm ERR! request to https://registry.npm.taobao.org/vue failed, reason: certificate has expired 二、原因 请求 https://registry.npm.taobao.org 失败,证…

2024年10月22日练习

一.. 加一 - 力扣(LeetCode) 这题考虑的麻烦点就在于每位都进位,最后进位扩展一位,此时就要另开空间,用来进位。 其他的情况利用循环从后面往前面走,每一位都判断一下是否变成十,只要变成十&am…

VMamba:视觉SSM

论文标题:VMamba: Visual State Space Model 论文地址:https://arxiv.org/pdf/2401.10166 摘要 VMamba 是一个视觉骨干网络,基于状态空间模型(SSM),其复杂度是线性的。该架构的核心是视觉状态空间&#xff…

听泉鉴宝在三个月前已布局商标注册!

近日“听泉鉴宝”以幽默的风格和节目效果迅速涨粉至2500多万,连线出现“馆藏文物”和“盗墓现场”等内容,听泉鉴宝早在几个月前已布局商标注册。 据普推知产商标老杨在商标局网站检索发现,“听泉鉴宝”的主人丁某所持股的江苏灵匠申请了三十…

Java的买家秀探秘:API数据的优雅捕获

在编程世界的某个角落,Java特工正坐在他的高科技办公室里,沉浸在代码的海洋中。今天,他接到了一个有趣的任务:获取买家秀的API数据。这不仅是一次技术的挑战,更是一次深入了解买家心声的机会。Java特工,这位…

宇音天下最新力作 | VTX356语音识别合成芯片问世

北京宇音天下科技有限公司,依托在语音技术领域的丰富经验和技术积累,成功推出了一款具有里程碑意义的语音识别合成芯片——VTX356。这款芯片的问世,不仅彰显了公司在智能语音处理领域的专业实力,也预示着智能家居、车载电子、智能…