作者:来自 Elastic Shay Banon 及 Philipp Krenn
Elasticsearch 刚刚 15 岁了!回顾过去 15 年的索引和搜索,并展望未来 15 年的相关内容。
Elasticsearch 刚刚成立 15 周年。一切始于 2010 年 2 月的一篇公告博客文章(带有标志性的 “You Know, for Search - 你知道,用于搜索” 标语)、第一次公开提交和第一个版本,当时的版本号是 0.4.0。
让我们回顾一下过去 15 年的索引和搜索,并展望未来 15 年的发展。
更多阅读,请参阅:
-
Elasticsearch 简介
-
Elasticsearch 的前世今生
GET _cat/stats
自推出以来,Elasticsearch 平均每秒被下载 3 次,累计下载量超过 14.5 亿次。
GitHub 统计数据同样令人印象深刻:来自 2,400 名独特作者的超过 83,000 次提交、38,000 个问题、25,000 个分支和 71,500 个星标。并且没有放缓的迹象。
所有这些都是建立在无数 Apache Lucene 贡献之上的。今年是 Lucene 诞生 25 周年,我们也将深入讨论这些问题。与此同时,你可以查看 20 周年纪念页面,庆祝 Apache 的顶级项目之一。
Search 故事
亮点太多,无法全部列出,但以下是过去 15 年中推出的 15 个版本和功能,这些版本和功能使 Elasticsearch 达到了今天的水平:
- Elasticsearch 公司(2012 年):该开源项目正式成为一家开源公司,为其成长奠定了基础。
- ELK Stack(2013 年):Elasticsearch 与 Logstash 和 Kibana 联手形成了 ELK Stack,现在它已成为日志记录和分析的代名词。
- 版本 1(2014):第一个稳定版本引入了快照/恢复、聚合、断路器和 _cat API 等主要功能。
- Shield 和 Found(2015):Shield 以(付费)插件的形式为 Elasticsearch 集群带来了安全性。而对 found.no 的收购则将 Elasticsearch 带入了云端,发展成为现在的 Elastic Cloud。有趣的是,没有人能找到 “Found”—— SEO对于某些关键词来说可能很难。
- 版本 2(2015):引入了 pipelined 聚合、使用 Java 安全管理器增强安全性以及提高性能和弹性。
- 版本 5 和 Elastic Stack(2016):跳过两个主要版本,统一 ELK Stack 的版本号,并在添加 Beats 后将其转变为 Elastic Stack。此版本还引入了摄取节点和painless 脚本语言。
- 版本 6(2017):带来零停机升级、索引排序和类型删除以简化数据建模。
- 版本 7(2019):将集群协调更改为更具可扩展性和弹性的 Zen2、单分片默认设置、内置 JDK 和自适应副本选择。
- 免费安全(2019):随着 6.8 和 7.1 版本的发布,核心安全变得免费,以帮助每个人保护他们的集群。
- ILM、数据层和可搜索快照(2020):通过索引生命周期管理 (ILM)、分层存储和可搜索快照使时间序列数据更易于管理且更具成本效益。
- 版本 8(2022):引入了使用 HNSW 的原生密集想量搜索,并默认启用安全性。
- ELSER(2023):推出了 Elastic Learned Sparse EncoderR 模型,带来稀疏向量搜索以实现更好的语义相关性。
- 再次开源(2024):添加 AGPL 作为许可选项以恢复开源 Elasticsearch。
- Start Local(2024):运行 Elasticsearch 和 Kibana 变得比以往更容易:curl -fsSL https://elastic.co/start-local sh
- LogsDB(2024):一种新的专门索引模式,可将日志存储减少高达 65%。
搜索的未来一片光明
由于人工智能能力的崛起,搜索比以往更加相关且有趣。那么 Elasticsearch 的下一步是什么?由于内容太多,无法一一列举,因此我们将重点讨论三个领域及其所要解决的挑战。
Serverless
没有分片、节点或版本。 Elasticsearch Serverless(在 AWS 上已正式发布,在 Azure 上刚刚进入技术预览版)可以解决你过去可能遇到的运营问题:
- 15 年过去了,仍然有人无缘无故地将 number_of_shards 设置为 100。
- 15 年了,我们仍在争论 refresh_interval:1 秒还是 30 秒,就像这是一个生死攸关的决定一样。
- 15 年的大版本迭代、一次次的惊心动魄,以及升级到最新版本的刺激体验。
你今天就可以试用 Elasticsearch Serverless。
ES|QL
“为 Elasticsearch 15 周年干杯 — — Query DSL 仍然是你日常生活中最复杂的部分。” 但事实并非如此。新的 Elasticsearch 管道查询语言 (ES|QL) 带来了更简单的语法,并对性能有更高要求的新计算引擎进行了重大投资。虽然我们正在构建更多功能,但你今天就可以使用 ES|QL。不用担心; 查询 DSL 将会理解。
人工智能无处不在
- 经过 15 年的查询调整,我们仍然只是使用 boost: 10 来解决问题。
- 15 年来,我们一直致力于让你的日志可搜索,但你仍然不知道生产过程中发生的情况。
- 仍然最擅长找到那一条日志行...如果你还记得如何对其进行索引的话。
人工智能正在重新定义一切皆有可能 —— 从利用人工智能助手将原始日志转化为可操作的见解以实现可观察性和安全性,到利用语义理解和智能重新排名进行更相关的搜索。
这仅仅是一个开始。更多人工智能功能即将问世 —— 带来更智能的搜索、增强的可观察性和更强的安全性。 Elasticsearch 的未来不仅仅是查找数据;而是要理解它。敬请关注——最好的尚未到来。
感谢大家
感谢过去 15 年来的所有贡献者、用户和客户,是他们让 Elasticsearch 有了今天的地位。如果没有你,我们就无法做到这一点,我们非常感谢你向 Elasticsearch 发送的每一个查询。
展望未来 15 年。尽情享受吧!
Elasticsearch 包含许多新功能,可帮助你为你的用例构建最佳的搜索解决方案。深入了解我们的示例笔记本以了解更多信息,开始免费云试用,或立即在本地机器上试用 Elastic。
更多阅读:与我们一起庆祝 Elasticsearch 15 周年
原文:Elasticsearch: 15 years of indexing it all, finding what matters - Elasticsearch Labs