【Elasticsearch】开源搜索技术的演进与选择:Elasticsearch 与 OpenSearch

开源搜索技术的演进与选择:Elasticsearch 与 OpenSearch

  • 1.历史发展
  • 2.OpenSearch 与 Elasticsearch 相同点
  • 3.OpenSearch 与 Elasticsearch 不同点
    • 3.1 版本大不同
    • 3.2 许可证不同
    • 3.3 社区不同
    • 3.4 功能不同
    • 3.5 安全性不同
    • 3.6 性能不同
    • 3.7 价格不同
    • 3.8 两者可相互导入
  • 4.总结

1.历史发展

在 2010 年以 Apache 2.0 2.0 2.0 开源协议发布后,Elasticsearch 迅速成为全球最受欢迎的企业 搜索引擎

Elasticsearch 常与 LogstashKibana 一起部署,这一组合被称为 Elasitc Stack,用于启用日志分析用例,包括应用可观察性、安全日志分析和理解用户行为。

2015 年,亚马逊利用这一开源协议推出了 Amazon Elasticsearch ServiceAmazon ES),这是一个云托管服务,允许 AWS 客户启动可伸缩的 Elasticsearch 集群,连接数据源到集群端点,并在云中加载、处理、分析或可视化数据。

然而,Elastic 公司最终对亚马逊使用其产品和商标提出了反对,并在 2019 年因涉嫌商标侵权和虚假广告对这家科技巨头提起诉讼。

在这里插入图片描述

🚀《Elastic 与 Amazon 就商标侵权诉讼达成协议》

Elastic 和亚马逊在 2021 年解决了这一诉讼,带来了两个重要的发展:

  • 2021 年 1 月,Elastic 公司宣布,从 7.11 版本开始,Elasticsearch 将根据 Server Side Public LicenseSSPL)和 Elastic 许可证进行授权。这一变化阻止了亚马逊和其他公司在未与 Elastic 直接合作的情况下提供 Elasticsearch 服务。
  • 2021 年 4 月,亚马逊宣布,它将从 Elasticsearch 的最后一个开源版本(7.10.2)分支,推出一个新的开源搜索引擎项目。由于 Elasticsearch 名称不能再使用,新项目被命名为 OpenSearch。亚马逊还将 OpenSearch 作为云服务提供,名为 Amazon OpenSearch Service

🚀 OpenSearch 官网:https://opensearch.org/

这里提醒一句,阿里云早期的搜索引擎也叫 OpenSearch。巧合的是,阿里云开放搜索服务也叫 OpenSearch,其地址参见:https://developer.aliyun.com/article/67156。

阿里云 OpenSearch(开放搜索服务)是阿里云推出的一套自助式、可定制的云搜索服务,初衷是将阿里巴巴积累近 10 年的搜索引擎技术平台化、服务化,并开放给广大开发者,降低实现专业搜索产品的门槛,让开发者以较低的成本轻松拥有跟淘宝、天猫等应用的搜索工具类似的专业搜索产品。

本文介绍的是 Elasticserach 分支出来的 Opensearch,并非阿里云的 OpenSearch,特此说明。

在接下来的部分中,我们将更深入地探讨这两种搜索解决方案在过去近 3 年中如何发展分化,以及哪一个更适合你的 AWS 日志分析或企业搜索应用。

如下相同点和不同点主要来自:Elastic 官网、OpenSearch 官网及相关博客。

  • 🚀 https://www.elastic.co/cn/amazon-opensearch-service
  • 🚀 https://www.elastic.co/cn/elasticsearch/opensearch

2.OpenSearch 与 Elasticsearch 相同点

OpenSearch 是从 Elasticsearch 的一个相对高级的分支版本开发而来的,所以两个应用在搜索、分析和仪表盘的所有基本功能上都是相同的。

在这里插入图片描述
OpenSearch 和 Elasticsearch 都提供了 多租户架构全文搜索分布式搜索 能力的分析引擎。

因此,两者都可以用来满足 网站搜索企业搜索日志分析 的用例。

3.OpenSearch 与 Elasticsearch 不同点

在比较 OpenSearch 和 Elasticsearch 时,主要有以下几点不同:

  • 版本
  • 许可证
  • 社区
  • 功能
  • 安全性
  • 性能
  • 价格

3.1 版本大不同

下图显示了 Elasticsearch 和 OpenSearch 两个搜索引擎解决方案的独立发展路径和发布节奏。

在这里插入图片描述

  • Elasticsearch 经过 1.x2.x5.x6.x7.x8.x 版本更新,最终发展到预计在 2024 年发布的 9.x 版本。
  • OpenSearch 从 1.0 版本开始于 2021 年 7 月发布,然后逐步更新至 2.x 系列,其中 2.6 版本预计将是 2024 年的最后一个 2.x 系列版本,随后计划发布 3.x 系列。

3.2 许可证不同

在 2021 年之前,Elasticsearch 在 Apache 2.0 2.0 2.0 许可证下可供公众使用。这个许可证允许用户出于任何目的使用、分发或修改软件,以及分发修改后的 Elasticsearch 版本而无需支付任何版税。

在与亚马逊的争议之后,Elasticsearch 现在根据 SSPLElastic 许可证 进行授权。这一变化之后,Elasticsearch 不再被视为严格意义开源,因为许可证现在要求任何向第三方提供 Elasticsearch 功能的人必须发布整个源代码和所有第三方运行它所需的 API。

OpenSearch 目前根据 Apache 2.0 许可证 授权。

🚀 简述一下 SSPL 协议和常规开源的不同:SSPL 协议要求如果你提供基于此协议软件的服务,必须公开整个服务的源代码,而常规开源软件不需要。

这时候,大家可能在想,我们在使用 Elasticsearch,并没有公开源代码呀!

是这样的,国内能真正基于开源代码二次开发且商业化用途的代码,除了几个 BAT、字节等大厂外,屈指可数。

通俗说这是针对的类似亚马逊大厂商业化行为的协议!

使用 SSPL 协议的部分开源软件如下:

软件名称使用协议
时间
MongoDBSSPL2018 年 10 月启用 SSPL
GraylogSSPL2020 年 11 月宣布 4.0 及以后的版本将使用 SSPL
Elasticsearch & KibanaSSPL & Elastic 许可证2021 年 1 月 Elastic NV 宣布将来版本将使用 SSPL 和 Elastic 许可证双重授权

3.3 社区不同

OpenSearch 和 Elasticsearch 都拥有健康、活跃和忠诚的社区,因此两个搜索引擎都不太可能在功能供给上落后太远或很快不再受支持。

  • Elasticsearch 社区论文比较成熟,官方论坛地址:https://discuss.elastic.co/。

在这里插入图片描述

  • OpenSearch 官方论坛地址:https://forum.opensearch.org/。

在这里插入图片描述
我看了一下,OpenSearch 论坛问题数和回复数都还没有形成规模。

3.4 功能不同

亚马逊最初分支 Elasticsearch 7.10.2 创建 OpenSearch 时,首先必须删除所有不兼容 Apache 2.0 2.0 2.0 许可证的代码。

在这里插入图片描述

这包括禁用所有收费功能并删除整个 Elastic X-Pack 代码。

功能ElasticsearchOpenSearch
备注
许可证SSPL / Elastic LicenseApache License 2.0OpenSearch 保持了完全的开源许可
安全功能部分为付费功能大部分开源可用OpenSearch 倾向于开源其安全功能
警报和异常检测付费和开源版本开源可用OpenSearch 提供开源的警报和异常检测
SQL 支持OpenSearch 继承了 Open Distro 的 SQL 功能
机器学习支持付费功能开源插件形式提供OpenSearch 社区提供 ML 插件
客户端兼容性完全支持自家产品兼容 Elasticsearch 7.10OpenSearch 保持对旧 Elasticsearch 客户端的兼容
社区支持由 Elastic 公司主导社区驱动OpenSearch 鼓励社区贡献和反馈
插件生态较闭合的生态系统开放插件生态OpenSearch 促进插件的开源发展
跟踪分析付费功能开源可用OpenSearch 提供开源的跟踪分析功能
长期支持版本提供提供OpenSearch 承诺提供长期支持的版本

Elastic GitHub:https://github.com/elastic

在这里插入图片描述

OpenSearch GitHub:https://github.com/opensearch-project

在这里插入图片描述

3.5 安全性不同

Elasticsearch 和 OpenSearch 都配备了许多相同的安全功能。

但是,这些功能都包含在 OpenSearch 中,而某些功能在 Elasticsearch 中只对付费客户可用。

如 OpenSearch 官网介绍:其已缺省(系统默认)安全。

在这里插入图片描述

Elastic 付费功能清单列表:https://www.elastic.co/cn/pricing

在这里插入图片描述

3.6 性能不同

如果你正在进行大规模的搜索操作,你可能会对这两种搜索引擎中哪一个能提供更快查询感兴趣。

Elastic 最近发表了一篇博客,标题为 “Elasticsearch vs. OpenSearch:揭开性能差距”。

🚀 文章地址:https://www.elastic.co/cn/blog/elasticsearch-opensearch-performance-gap

Elastic 官网文档强调:自从 Elasticsearch 的一个早期版本问世以来,OpenSearch 就没有跟上创新的步伐。自 OpenSearch GA 以来,Elasticsearch 在功能创新方面已经超过了 4 4 4 倍。

Elastic 官方对比强调,如下图所示 —— Elasticsearch 在各个关键性能指标上的优势,并且更加节约存储资源。

在这里插入图片描述

  • 文本查询Text Querying):Elasticsearch 在文本查询性能上比 OpenSearch 快 76 % 76\% 76%
  • 排序Sorting):在排序操作中,Elasticsearch 比 OpenSearch 快 58 % 58\% 58%
  • 日期直方图Date Histogram):在进行日期直方图聚合时,Elasticsearch 显示出比 OpenSearch 快 81 % 81\% 81% 的性能。
  • 条款Terms):在处理条款查询时,Elasticsearch 的性能比 OpenSearch 快 61 % 61\% 61%
  • 范围Ranges):在范围查询方面,Elasticsearch 展现出比 OpenSearch 快 42 % 42\% 42% 的性能。
  • Elasticsearch 使用的 存储空间 比 OpenSearch 少 37 % 37\% 37%

这意味着 Elasticsearch 在处理同等任务时,不仅查询速度更快,而且在存储效率上也更优。

如下截图参见博客:https://www.elastic.co/cn/blog/migrating-1-billion-log-lines-opensearch-elasticsearch

在这里插入图片描述
左边是 Opensearch,右边是 Elasticsearch。明显对比可知:Elasticsearch 较 OpenSearch 节省了 23 % 23\% 23% 的存储空间。

3.7 价格不同

Elasticsearch 和 OpenSearch 的自我管理版本可以免费下载,但用户需要使用自己的硬件和计算资源来安装、管理和操作它们。

中小企业国内使用 Elasticsearch 居多,普通的免费基本功能基本够用。

而部分商业化银行等大型企业使用 Elasticsearch 商业化功能的也不在少数。

国内还有新特点就是云厂商和 Elastic 合作紧密,推出的 Elasticsearch 版本。比如:阿里云 Elasticsearch、腾讯云 Elasticsearch 用得也不少。
在这里插入图片描述

在这里插入图片描述

  • 🚀 Elasticsearch 下载地址:https://www.elastic.co/cn/downloads/elasticsearch
  • 🚀 OpenSearch 下载地址:https://opensearch.org/downloads.html
  • 🚀 阿里云 Elasticserach:https://www.aliyun.com/product/bigdata/elasticsearch
  • 🚀 腾讯云 Elasticsearch:https://cloud.tencent.com/product/es

3.8 两者可相互导入

OpenSearch 迁移到 Elasticsearch 参见:

  • 🚀 https://www.elastic.co/cn/blog/migrating-1-billion-log-lines-opensearch-elasticsearch

Elasticsearch 迁移到 OpenSearch 参见:

  • 🚀 https://opensearch.org/docs/latest/upgrade-to/upgrade-to/

4.总结

OpenSearch 已发布 3 年多,Elasticsearch 和 OpenSearch 已存在很多不同,但它们最终都源自同一个版本:Elasticsearch 7.10.2

我们不对 Elasticsearch 和 Amazon OpenSearch 之间的选型提供直接的推荐,因为最合适的选择将取决于项目或产品独特的需求和环境。但,文中数据相信会给你提供参考。

建议读者根据自己的具体情况和偏好做出决定,并考虑功能需求、成本效益、长期的技术支持或自身是否具备架构及性能调优等能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/372418.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

unity知识点 专项四 一文彻底说清楚(锚点(anchor)、中心点(pivot)、位置(position)之间的关系)

一 概述 想要使UI控件在屏幕中达到正确的显示效果,比如自适应屏幕尺寸、固定边距等等,首先要理清楚几个基本概念和设置:锚点(anchor)、中心点(pivot)、位置(position)、UI缩放模式、父物件的transform设置 二 Anchor、Pivot与Position 2…

Javascript常见数据结构和设计模式

在JavaScript中,常见的数据结构包括两大类:原始数据类型(Primitive Types)和对象类型(Object Types)。对象类型又可以进一步细分为多种内置对象、数组、函数等。下面是一些JavaScript中常见的数据结构&…

Vulnhub靶场DC-6练习

目录 0x00 准备0x01 主机信息收集0x02 站点信息收集1. wordpress扫描2. wordlists字典爆破 0x03 漏洞查找与利用1. 漏洞查找2. CVE-2018-15877漏洞利用3. 反弹shell5. nmap提权 0x04 总结 0x00 准备 下载链接:https://download.vulnhub.com/dc/DC-6.zip 介绍&#…

近红外光谱脑功能成像(fNIRS):2.实验设计、指标计算与多重比较

一、实验设计的策略与方法 近红外光谱成像(INIRS)作为一种非侵入性脑功能成像技术,为研究大脑活动提供了一种高效、生态效度高的方法。然而,为了充分利用INIRS技术并确保实验结果的准确性和可靠性,研究者必须精心设计实…

高阶面试-dubbo的学习

SPI机制 SPI,service provider interface,服务发现机制,其实就是把接口实现类的全限定名配置在文件里面,然后通过加载器ServiceLoader去读取配置加载实现类,比如说数据库驱动,我们把mysql的jar包放到项目的…

【库架一体立体库】与【传统立体库】对比

导语 大家好,我是社长,老K。专注分享智能制造和智能仓储物流等内容。 随着冷链物流行业的快速发展,对于冷藏设施的要求也在不断提高。库架一体式智能立体冷藏库以其高效、节能、智能化的特点,正逐渐成为行业发展的新趋势。 分享一…

UML中用例之间的可视化表示

用例除了与参与者有关联关系外,用例之间也存在着一定的关系,如泛化关系、包含关系、扩展关系等。 4.2.1 包含关系 包含关系指的是两个用例之间的关系,其中一个用例(称为基本用例,Base Use Case)的行为包…

el-tree 获取当前勾选节点的选中状态以及选中值对象 触发check-change多次事件问题原因

1.需求 现在需要一个树状结构的资产树 但是现在需求是 获取当前选中的值的状态是选中还是取消选中 然后再用当前选中 or 取消选中的值 进行 选中 or 取消选中的操作 一开始使用的是 check-change 方法 接收参数如图 但是我勾选父节点 或者 子节点后 他会打印一堆数据 是因…

理解JS与多线程

理解JS与多线程 什么是四核四线程? 一个CPU有几个核它就可以跑多少个线程,四核四线程就说明这个CPU同一时间最多能够运行四个线程,四核八线程是使用了超线程技术,使得单个核像有两个核一样,速度比四核四线程有多提升。…

Vivado FFT IP核使用

1. 今日摸鱼任务 学习Vivado FFT IP核的使用 Vivado_FFT IP核 使用详解_vivado fft ip核-CSDN博客 这篇写的很详细啦 简单做一点笔记进行记录 2. FFT IP核 xfft_0 ff (.aclk(aclk), // input wire aclk.aresetn(aresetn)…

C++编译链接原理

从底层剖析程序从编译到运行的整个过程 三个阶段 一、编译阶段二、链接阶段三、运行阶段 为了方便解释,给出两端示例代码,下面围绕代码进行实验: //sum.cpp int gdata 10; int sum(int a,int b) {return ab; }//main.cpp extern int gdata…

Java基础---复习01

main方法 一个程序有且只有一个main方法,main方法是java程序的唯一入口。 修饰符 修饰类修饰方法修饰域public都可以访问都可以访问private私有类只能本类只能本类protected子类可以继承、访问,同包下的类也可以访问子类可以继承、访问,同…

[AI 大模型] Google Gemini

文章目录 [AI 大模型] Gemini简介模型架构发展新技术和优势示例 [AI 大模型] Gemini 简介 Google Gemini 是 Google 最新推出的多模态 AI 大模型,旨在提升 AI 在各个领域的应用能力。Gemini 能够处理文本、图像、音频、视频和代码等多种数据类型,展现出…

暑期备考2024小学生古诗文大会:吃透真题和知识点(持续)

2024年上海市小学生古诗文大会的自由报名初赛将于10月19日(星期六)正式开始,还有3个多月的时间。 为帮助孩子们备考,我持续分享往年上海小学生古诗文大会真题,这些题目来自我去重、合并后的1700在线题库,每…

云计算渲染时代:选择Blender或KeyShot进行高效渲染

在云渲染技术日益成熟的背景下,挑选一款贴合项目需求的3D渲染软件显得尤为关键。当前,Blender与KeyShot作为业界领先的全能渲染解决方案,广受推崇。它们虽皆能创造出令人信服的逼真视觉效果,但在特色功能上各有所长。本篇文章旨在…

稀疏建模介绍,详解机器学习知识

目录 一、什么是机器学习?二、稀疏建模介绍三、Lasso回归简介四、Lasso超参数调整与模型选择 一、什么是机器学习? 机器学习是一种人工智能技术,它使计算机系统能够从数据中学习并做出预测或决策,而无需明确编程。它涉及到使用算…

华为HCIP Datacom H12-821 卷30

1.单选题 以下关于OSPF协议报文说法错误的是? A、OSPF报文采用UDP报文封装并且端口号是89 B、OSPF所有报文的头部格式相同 C、OSPF协议使用五种报文完成路由信息的传递 D、OSPF所有报文头部都携带了Router-ID字段 正确答案:A 解析: OSPF用IP报…

游戏AI的创造思路-技术基础-决策树(1)

决策树,是每个游戏人必须要掌握的游戏AI构建技术,难度小,速度快,结果直观,本篇将对决策树进行小小解读~~~~ 目录 1. 定义 2. 发展历史 3. 决策树的算法公式和函数 3.1. 信息增益(Information Gain&…

无线网卡怎么连接台式电脑?让上网更便捷!

随着无线网络的普及,越来越多的台式电脑用户希望通过无线网卡连接到互联网。无线网卡为台式电脑提供了无线连接的便利性,避免了有线网络的束缚。本文将详细介绍无线网卡怎么连接台式电脑的四种方法,包括使用USB无线网卡、内置无线网卡以及使用…

终于搞定了通过两路蓝牙接收数据

一直想做无线传感器,通过蓝牙来接收数据,无奈因为arduino接收串口数据的一些问题,一直搁到现在。因为学校里给学生开了选修课,所以手边有一些nano和mega可以使用,所以就做了用两个nano加上两个蓝牙模块来发射数据&…