Elasticsearch：15 年来致力于索引一切，找到重要内容

作者：来自 Elastic Shay Banon 及 Philipp Krenn

Elasticsearch 刚刚 15 岁了！回顾过去 15 年的索引和搜索，并展望未来 15 年的相关内容。

Elasticsearch 刚刚成立 15 周年。一切始于 2010 年 2 月的一篇公告博客文章（带有标志性的 “You Know, for Search - 你知道，用于搜索” 标语）、第一次公开提交和第一个版本，当时的版本号是 0.4.0。

让我们回顾一下过去 15 年的索引和搜索，并展望未来 15 年的发展。

更多阅读，请参阅：

Elasticsearch 简介
Elasticsearch 的前世今生

GET _cat/stats

自推出以来，Elasticsearch 平均每秒被下载 3 次，累计下载量超过 14.5 亿次。

GitHub 统计数据同样令人印象深刻：来自 2,400 名独特作者的超过 83,000 次提交、38,000 个问题、25,000 个分支和 71,500 个星标。并且没有放缓的迹象。

所有这些都是建立在无数 Apache Lucene 贡献之上的。今年是 Lucene 诞生 25 周年，我们也将深入讨论这些问题。与此同时，你可以查看 20 周年纪念页面，庆祝 Apache 的顶级项目之一。

Search 故事

亮点太多，无法全部列出，但以下是过去 15 年中推出的 15 个版本和功能，这些版本和功能使 Elasticsearch 达到了今天的水平：

Elasticsearch 公司（2012 年）：该开源项目正式成为一家开源公司，为其成长奠定了基础。
ELK Stack（2013 年）：Elasticsearch 与 Logstash 和 Kibana 联手形成了 ELK Stack，现在它已成为日志记录和分析的代名词。
版本 1（2014）：第一个稳定版本引入了快照/恢复、聚合、断路器和 _cat API 等主要功能。
Shield 和 Found（2015）：Shield 以（付费）插件的形式为 Elasticsearch 集群带来了安全性。而对 found.no 的收购则将 Elasticsearch 带入了云端，发展成为现在的 Elastic Cloud。有趣的是，没有人能找到 “Found”—— SEO对于某些关键词来说可能很难。
版本 2（2015）：引入了 pipelined 聚合、使用 Java 安全管理器增强安全性以及提高性能和弹性。
版本 5 和 Elastic Stack（2016）：跳过两个主要版本，统一 ELK Stack 的版本号，并在添加 Beats 后将其转变为 Elastic Stack。此版本还引入了摄取节点和painless 脚本语言。
版本 6（2017）：带来零停机升级、索引排序和类型删除以简化数据建模。
版本 7（2019）：将集群协调更改为更具可扩展性和弹性的 Zen2、单分片默认设置、内置 JDK 和自适应副本选择。
免费安全（2019）：随着 6.8 和 7.1 版本的发布，核心安全变得免费，以帮助每个人保护他们的集群。
ILM、数据层和可搜索快照（2020）：通过索引生命周期管理 (ILM)、分层存储和可搜索快照使时间序列数据更易于管理且更具成本效益。
版本 8（2022）：引入了使用 HNSW 的原生密集想量搜索，并默认启用安全性。
ELSER（2023）：推出了 Elastic Learned Sparse EncoderR 模型，带来稀疏向量搜索以实现更好的语义相关性。
再次开源（2024）：添加 AGPL 作为许可选项以恢复开源 Elasticsearch。
Start Local（2024）：运行 Elasticsearch 和 Kibana 变得比以往更容易：curl -fsSL https://elastic.co/start-local sh
LogsDB（2024）：一种新的专门索引模式，可将日志存储减少高达 65%。

搜索的未来一片光明

由于人工智能能力的崛起，搜索比以往更加相关且有趣。那么 Elasticsearch 的下一步是什么？由于内容太多，无法一一列举，因此我们将重点讨论三个领域及其所要解决的挑战。

Serverless

没有分片、节点或版本。 Elasticsearch Serverless（在 AWS 上已正式发布，在 Azure 上刚刚进入技术预览版）可以解决你过去可能遇到的运营问题：

15 年过去了，仍然有人无缘无故地将 number_of_shards 设置为 100。
15 年了，我们仍在争论 refresh_interval：1 秒还是 30 秒，就像这是一个生死攸关的决定一样。
15 年的大版本迭代、一次次的惊心动魄，以及升级到最新版本的刺激体验。

你今天就可以试用 Elasticsearch Serverless。

ES|QL

“为 Elasticsearch 15 周年干杯 — — Query DSL 仍然是你日常生活中最复杂的部分。” 但事实并非如此。新的 Elasticsearch 管道查询语言 (ES|QL) 带来了更简单的语法，并对性能有更高要求的新计算引擎进行了重大投资。虽然我们正在构建更多功能，但你今天就可以使用 ES|QL。不用担心; 查询 DSL 将会理解。