Elastic 发布 Elasticsearch Relevance Engine™ — 为 AI 革命提供高级搜索能力

作者:Matt Riley

今天我们将向大家介绍 Elasticsearch Relevance Engine™(ESRE™),这是一种创建高度相关的 AI 搜索应用程序的新功能。ESRE 建立在 Elastic 在搜索领域的领导地位以及超过两年的机器学习研究和开发基础之上。Elasticsearch Relevance Engine 结合了 AI 的最佳实践和 Elastic 的文本搜索。ESRE 为开发人员提供了一整套将复杂的检索算法和与大型语言模型(LLM)集成的能力。不仅如此,ESRE 使用 Elastic 的简单、统一 API,开发人员可以立即开始以提高搜索相关性,因为这些 API 已经得到 Elastic 社区的信任和广泛应用。

Elasticsearch Relevance Engine launch

Elasticsearch Relevance Engine 的可配置功能可通过以下方式提高相关性:

  • 应用高级相关性排名功能,包括 BM25f,这是混合搜索的关键组成部分
  • 使用 Elastic 的向量数据库创建、存储和搜索密集向量
  • 使用各种自然语言处理(NLP)任务和模型处理文本
  • 让开发人员在 Elastic 中管理和使用自己的 transformer 模型,以适应业务特定的上下文
  • 通过 API 与第三方转换器模型集成(如 OpenAI 的 GPT-3 和 4),从 Elasticsearch 集群中汇总的客户数据存储的检索内容中提取直观摘要
  • 使用 Elastic 的开箱即用的 Learned Sparse Encoder 模型实现基于 ML 的搜索,无需训练或维护模型,可在各种领域提供高度相关、语义化的搜索
  • 与第三方工具集成,例如 LangChain,以帮助构建复杂的数据管道和生成式 AI 应用程序

 

搜索的发展始终受到提高相关性和不断改进搜索应用程序交互方式的需求的推动。高度相关的搜索结果可以导致搜索应用程序上的用户参与度增加,对收入和生产力产生重大的影响。在新的 LLM 和生成式 AI 世界中,搜索可以走得更远,理解用户意图,提供前所未有的响应特定性。

值得注意的是,每一次搜索进步都提供了更好的相关性,同时解决了新兴技术和不断变化的用户行为所带来的新挑战。无论是扩展关键字搜索以提供语义搜索,还是为视频和图像启用新的搜索模式,新技术都需要独特的工具来为搜索用户提供更好的体验。同样,当今人工智能世界需要一个新的、高度可扩展的开发人员工具包,该工具包应建立在被广泛印证、被客户测试过的技术堆栈上。

随着生成式 AI 的发展势头和 ChatGPT 等技术的日益普及,以及对大型语言模型能力的日益增强的认识,开发人员渴望尝试使用技术来改进他们的应用程序。Elasticsearch Relevance Engine 为生成式 AI 世界带来了新的能力,并以强大的工具迎接当今时代,任何开发团队都可以立即使用。

Elasticsearch Relevance Engine 现在可以在 Elastic Cloud 上使用,这是唯一一个包含此最新版本中所有新功能的托管 Elasticsearch 服务。您还可以下载 Elastic Stack 和我们的云编排产品 Elastic Cloud Enterprise 和 Elastic Cloud for Kubernetes,以在自建集群上获得体验。

想了解更多关于 Elasticsearch Relevance Engine™ 的信息?请查看这些技术博客:

  • ChatGPT and Elasticsearch
  • Elastic Learned Sparse Encoder blog
  • Accessing machine learning models in Elastic
  • Privacy-first AI search using LangChain and Elasticsearch

克服生成式 AI 模型的局限性

Elasticsearch Relevance Engine™ 可以很好地帮助开发人员快速发展并应对自然语言搜索的这些挑战,包括生成 AI。

1)企业数据/上下文感知: 模型可能没有足够的与特定领域相关的内部知识。这源于训练模型的数据集。为了定制 LLM 生成的数据和内容,企业需要一种方法来为模型提供专有数据,以便他们能够学习提供更多相关的、特定于业务的信息。

2)卓越的相关性: Elasticsearch 相关性引擎让来自私有数据源的数据集成起来变得简单,只需生成和存储 embeddings,就可以使用语义搜索检索上下文。embeddings 是对单词、短语或文档的数值表示,可以帮助 LLM 理解单词的含义和关系。这些 embeddings 可以提高转换器模型的输出速度和规模。ESRE 还允许开发者将自己的转换器模型引入 Elastic 或与第三方模型集成。

我们还意识到,后期交互模型的出现使我们能够提供开箱即用的功能——无需对第三方数据集进行大量培训或微调。由于并非每个开发团队都有资源或专业知识来训练和维护机器学习模型,也不了解规模、性能和速度之间的权衡,因此 Elasticsearch Relevance Engine 还提供了 Elastic Learned Sparse Encoder,一个为跨领域语义搜索而构建的检索模型。该模型将稀疏向量与基于关键字的传统 BM25 搜索配对,为混合搜索提供了一个易于使用的 Reciprocal Rank Fusion (RRF)评分器。ESRE 在第一天就为开发人员提供了机器学习驱动的相关性和混合搜索技术。

3)隐私和安全:数据隐私是企业使用和安全地在网络和组件之间传递专有数据的核心,即使是在构建创新的搜索体验时也是如此。

Elastic 提供基于角色和基于属性的访问控制的原生支持,以确保只有那些有权访问数据的角色才能看到它,即使对于聊天和问答应用程序也是如此。Elasticsearch 可以支持您的组织保持某些文档可供特权个人访问的需求,从而帮助您的组织维护所有搜索应用程序的通用隐私和访问控制。

当隐私是最重要的关注点时,将所有数据保留在您组织的网络内不仅是至关重要的,而且是必须的。从允许您的组织实现在隔离环境中部署应用程序,到支持访问安全网络,ESRE 提供了您需要的工具来帮助您的组织保护您的数据安全。

4)规模和成本: 由于数据量和所需的计算能力和内存,使用大型语言模型对于许多企业来说可能是不切实际的。然而,想要构建自己的生成式 AI 应用程序(如聊天机器人)的企业需要将 LLM 与他们的私有数据结合起来。

Elasticsearch Relevance Engine 为企业提供了一种高效地提供相关性的引擎,它使用精确的上下文窗口来帮助减少数据占用空间,而不会带来麻烦和费用。

5)过时: 模型在收集训练数据时,被冻结在过去的某时间点上。因此,生成式 AI 模型创建的内容和数据只有在它们被训练时才是最新的。将企业数据集成起来是使 LLM 能够提供及时结果的内在需求。


6)幻觉:在回答问题或交互式对话时,LLM 可能会编造一些听起来可信且令人信服的事实,但实际上是不不符合事实的预测。这也是为什么需要将 LLM 与具有上下文、定制化知识相结合,以使模型在商业环境中可用的另一个至关重要的原因。

Elasticsearch Relevance Engine 让开发者可以通过生成式AI模型中的一个上下文窗口,连接到他们自己的数据存储。添加的搜索结果可以提供来自私有源或专业领域的最新信息,因此在被提示时可以返回更多的事实信息,而不是仅仅依赖于模型所谓的 “参数化” 知识。


借助向量数据库的强大功能

Elasticsearch Relevance Engine 包含了一个经过设计的弹性、生产级的向量数据库。它为开发者提供了一个构建丰富的语义搜索应用程序的基础。使用 Elastic 的平台,开发团队可以使用密集向量检索来创建更直观的问答,不受关键字或同义词的限制。他们可以使用图像等非结构化数据来构建多模态搜索,甚至可以对用户画像进行建模来获取个性化的搜索结果,以用于产品和发现、求职或配对应用程序。这些NLP转换器模型还可以实现情感分析、命名实体识别和文本分类等机器学习任务。Elastic的向量数据库让开发者可以创建、存储和查询向量,这些向量具有高度的可扩展性和性能,适用于真正的生产应用程序。

Elasticsearch 擅长高相关性的搜索检索。有了 ESRE,Elasticsearch 为生成式 AI 提供了与企业专有数据相连接的上下文窗口,让开发者可以构建更吸引人、更准确的搜索体验。搜索结果根据用户的原始查询返回,开发者可以将数据传递给他们选择的语言模型,以提供带有额外上下文的答案。Elastic 利用来自您企业存储的相关上下文数据内容,为问答和个性化功能提供加速,这些数据是私有的,也是针对您业务定制的。


为所有开发人员提供开箱即用的卓越相关性

随着 Elasticsearch Relevance Engine 的发布,我们正在使 Elastic 的专有检索模型随时可用。该模型易于下载,并且可以与我们所有的摄取机制(如 Elastic 网络爬虫、连接器或 API)一起使用。开发者可以将其与他们可搜索的语料库一起开箱即用,而且它足够小,可以适应笔记本电脑的内存。Elastic Learned Sparse Encoder 为诸如知识库、学术期刊、法律发现和专利数据库等搜索用例提供了跨领域的语义搜索,无需调整或训练就能提供高度相关的搜索结果。

大多数真实世界的测试显示,混合排名技术正在产生最相关的搜索结果集。直到现在,我们一直缺少一个关键组件 —— RRF。我们现在为您的应用程序搜索需求提供 RRF,这样您就可以将向量和文本搜索能力结合起来。

机器学习在增强搜索结果与语义上下文的相关性方面处于领先地位,但是往往由于成本、复杂性和资源需求而使得开发者难以有效地实施它。开发者通常需要专业机器学习或数据科学团队的支持来构建高度相关的 AI 驱动的搜索。这些团队花费大量时间选择合适的模型,在特定领域的数据集上进行训练,并随着数据及其关系变化而维护模型。


了解 Go1 如何使用 Elastic 的矢量数据库进行可扩展的语义搜索。

没有专业团队支持的开发者也可以实施语义搜索,并从一开始就受益于 AI 驱动的搜索相关性,而无需其他替代方案所需的努力和专业知识。从今天开始,所有客户都拥有构建块来帮助实现更好的相关性和更现代、更智能的搜索。


试试看

了解这些功能以及查看更多信息。

现有的 Elastic Cloud 客户可以直接从 Elastic Cloud 控制台访问其中的许多功能。没有利用 Elastic on Cloud?了解如何将 Elasticsearch 与 LLM 和生成式 AI 结合使用。

本博文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。任何目前还没有的功能或特性,可能会延期或者根本不会出现。
Elastic、Elasticsearch、Elasticsearch Relevance Engine、ESRE、Elastic Learned Sparse Encoder 和相关标记是 Elasticsearch NV 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18766.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能轨道交通行业周刊-第45期(2023.5.15-5.21)

本期关键词:动车洗澡、热备列车、火车司机室、无缝线路、图像分割、自动标注 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交通RailMetro轨道…

利用ChatGPT完成深度学习分类任务

利用ChatGPT完成深度学习分类任务 一、任务背景 ​ 关于早期诊断NEC(坏死性小肠结肠炎(Necrotizing enterocolitis,NEC))和及时干预一直是临床关注的重点和难点问题。现在手上有相关的临床数据集,我们想要…

chatgpt赋能python:如何使用Python绕过反爬虫机制提高SEO排名

如何使用Python绕过反爬虫机制提高SEO排名 在现代互联网时代,网站把自己的内容都用高墙围了起来,就是防止别人复制内容或者爬虫程序对网站造成损害。但是, SEO优化却需要搜索引擎对网站爬取,并且通过搜索引擎渠道引入流量&#x…

识别「ChatGPT造假」,效果超越OpenAI,AI生成检测器来了!

Datawhale干货 AI生成检测器,编辑:机器之心 AI 造假的成功率很高,前几天「10 分钟骗 430万」还上了热搜。在最热门的大语言模型上,研究人员最近探索了一种识别方法。 随着生成式大模型的不断进步,它们生成的语料正逐步…

chatgpt赋能python:Python如何绕过检测封号的技巧

Python如何绕过检测封号的技巧 Python作为目前最受欢迎的编程语言之一,广泛应用于各种领域。在SEO领域中,Python也发挥着重要的作用,但是在不当的使用下,可能会被搜索引擎检测到并封号。在本文中,我们将介绍几种Pytho…

无际Ai官网ChatGPT4和3.5的真实功能测评

生活是我们每个人都必须面对的现实。它涵盖了各种方面,包括我们的工作、家庭、朋友和爱好等等。在这个充满挑战和机遇的世界中,我们必须学会如何平衡自己的需求和责任,并适应不断变化的环境。无论你处于生命的哪个阶段,生活都是一…

2022机器学习阶段性复盘

2022机器学习阶段性复盘 文章目录 2022机器学习阶段性复盘一、业务洞察1.1 业务调研1.2 采样策略 一、特征工程1.1 特征筛选之iv_psi1.2 特征筛选之启发式搜索1.3 时间特征的曲率变换1.4 多重共线性特征的剔除1.5 什么样的特征适合树模型或LR模型1.5 什么样的特征是稳定可泛化特…

音乐推荐算法+ChatGPT歌词创作

不知道有没有小伙伴喜欢这个项目,今天刚完成,哈哈哈。 体验地:http://make.forwardforever.top:614 账号:root 密码:123 账号:root2 密码:456 主页: 曲库: 评论功能: …

使用LSTM预测股价,特征:19个指标5天历史数据

LSTM介绍 LSTM是具有时间特性的神经网络,我们利用LSTM预测时间序列——股价。 从文本到股价,LSTM的输入特征和网络结构都有哪些变化呢? 我们先看一个简单的RNN结构。与普通的全连接层神经网络的权重更新沿着一层层隐藏层网络不同&#xff0c…

北大朱松纯教授:做智能时代的先知、先觉、先行者

本文转发自北京大学智能学院,文章根据朱松纯教授2023年7月1日在北京大学智能学院2023年毕业典礼上的即兴讲话整理而成。 做智能时代的 先知、先觉、先行者 ——在智能学院2023届毕业典礼上的讲话 朱松纯 2023年7月1日 尊敬的各位来宾、各位老师,毕业班同…

谷歌周彦祺:LLM浪潮中的女性科学家多面手丨智源大会嘉宾风采

导读 大模型研发竞赛如火如荼,谷歌紧随OpenAI其后推出PalM2、Gemini等系列模型。Scaling Law是否仍然适用于当下的大模型发展?科技巨头与初创企业在竞争中各有哪些优势和劣势?模型研究者应秉持哪些社会责任? 2023智源大会「基础模…

AI巨头争相推出,企业对话场景应用量暴增1000%,究竟发生了什么?

采访嘉宾 | 中关村科金AI 平台能力中心 作者 | 刘燕 大模型构建人机协同的新型生产关系 对话式 AI 产品拥抱大模型 一个大胆的决定 自 2014 年成立以来,中关村科金就选择专注于企业服务赛道提供对话场景服务,聚焦生成式 AI 技术,包括领域大…

深聊丨“紫东太初”大模型背后有哪些值得细读的论文(一)

原创:谭婧 没有人想等待,没有人想落伍。 新鲜论文时兴火热,成为大模型发展迅猛的标志之一,人们用“刷论文”这个游荡意味的动词替代另一个颇为严肃的动作,“读论文”。 论文被当作“教材”和“新知识”,在a…

紫东太初:造一个国产大模型,需用多少篇高质量论文?

原创:谭婧 “视觉自监督算法这轮,你是不是没跟上?” 我面前这位年薪近七十万,互联网大厂AI算法工程师的好友, 他用一个反问句回答了我的关心: “自监督这个玩意咋跟上?” 他抬了抬头&#xff0c…

一场九年前的“出发”:奠基多模态,逐鹿大模型

原创:谭婧 全球AI大模型的技术路线,没有多少秘密,就那几条路线,一只手都数得过来。 而举世闻名的GPT-4浑身上下都是秘密。 这两件事并不矛盾。为什么呢? 这就好比,回答“如何制造一台光刻机?”。…

独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将...

文丨谭婧 以ChatGPT为代表的AI大模型是2023年的科技C位。 2023年3月27日,ChatGPT引发的“抓马连续剧”,又有新剧更新。 前情提要: 前美团联合创始人、高级副总裁王慧文发文宣布进入AI领域,称将打造中国的OpenAI。 新闻标题一&…

对话AI顶尖大牛周明老师:大模型的机遇和挑战?

Datawhale学习 分享人:周明老师,Datawhale 特邀嘉宾 这次 Datawhale开源学习 特别邀请了周明老师分享: 周明,澜舟科技创始人兼CEO,中国计算机学会 CCF 副理事长、NLP和大模型领域的顶尖大牛。 1991年就从NLP重镇哈工大…

对话李彦宏:AI 大模型时代,应用开发机会比移动互联网大十倍

AI 2.0 时代,ChatGPT 的出现,让大模型引发的诸神之战正式打响。百度作为中国首个推出真实应战“武器”的公司,其基于千亿量级数据炼就而成的“文心一言”背后,蕴藏哪些鲜为人知的故事?这种打破人类对过往 NLP 之智能对…

从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进...

图文原创:亲爱的数据 “Were building something big ... stay tuned. Talk to me if you want to work on scalable foundation models.” “我们正在建造一个大项目……请继续关注。如果你想在可扩展基础模型上工作,请告诉我。” “参数服务器之父” A…

单元测试编写最佳实践(ChatGPT+Mockito+JUnit)

背景 基于 springboot 微服务架构给单元测试带来的问题: springboot 单元测试启动家长过程非常缓慢,后期服务启动达到分钟级,非常影响效率服务之间相互依赖非常严重,单元测试的运行非常依赖其它服务稳定性第三方服务和中间件&am…