从企业级 RAG 到 AI Assistant,阿里云 Elasticsearch AI 搜索技术实践

在过去一年中,基座大模型技术的快速迭代推动了 AI 搜索的演进,主要体现在以下几个方面:

1.搜索技术链路重构

基于大模型的全面重构正在重塑 AI 搜索的技术链路。从数据采集、文档解析、向量检索到查询分析、意图识别、排序模型和知识图谱等各个环节,都在经历深刻变革。新的交互方式如对话式搜索、答案总结、智能客服、企业数字员工和虚拟人逐渐成为主流,不仅提升了用户体验,也为更多应用场景提供了可能。

2.AI 搜索作为基础设施

AI 搜索已成为各类 AI 应用的基础技术之一。作为热门的 AI 原生应用,它不仅驱动了知识类 AI 应用的发展,还逐步成为各大基础模型的内置能力。例如,向量检索、检索增强生成(RAG)和语义搜索等技术已在多个领域广泛应用。这种集成化趋势增强了 AI 搜索在不同场景下的适应性和灵活性。

3.效果提升面临的瓶颈

尽管 AI 搜索在效果上取得了显著进步,但幻觉问题仍是制约其广泛应用的主要因素,尤其在对知识准确性要求极高的业务场景中更为突出。此外,高成本和隐私安全可控性低也是实施过程中面临的重要挑战。

这是为何,阿里云 Elasticsearch 推出了 AI 搜索方案,使用 RAG 技术对检索增强生成的各个环节进行能力增强,并深度融合了企业版 AI Assistant,将 RAG 技术应用于 AIOps 领域。

Elasticsearch 向量性能5倍提升

Elasticsearch 向量引擎持续优化,特别是针对性能与成本的改进尤为突出。初期,由于普遍存在的认知偏差——认为 ES 向量引擎虽功能强大但在性能上可能存在短板,尤其是对于 Java 生态系统中的应用——这一观点正逐渐被其技术演进所颠覆。自8.0初始版本至已经迈入8.15版本的历程中,Elasticsearch 不断迭代,特别是在性能优化方面取得了显著进展,其中包括但不限于对硬件加速技术的有效整合。

Elasticsearch 版本迭代路线

Elasticsearch 利用硬件加速技术在向量检索领域,尤其是处理复杂相似度计算任务时,实现了显著的性能飞跃。这种技术创新不仅限于理论层面,实践证明,通过硬件加速器的深度融合,部分计算密集型操作的效率提升了数倍乃至更多。例如,从2022年9月至今的基准测试数据可直观看出,查询响应时间从最初100ms大幅缩减至现在20ms左右,彰显了 Elasticsearch 向量检索迭代升级带来的巨大性能提升。

此外,Elasticsearch 在内存优化上同样值得关注,通过向量量化技术,所需内存仅为原先需求的四分之一,极大提升了资源利用率。同时,针对高并发查询场景进行的优化,确保了在处理大规模客户信息查询等任务时,系统的稳定性和响应速度得以保持,进一步验证了ES在向量处理应用中的高性能。

Elasticsearch 企业版 AI 能力解读

1.语义扩展与稀疏向量表示:

Elasticsearch 利用诸如稀疏编码技术,不仅能够基于原始词汇建立索引,还能有效扩展至与其相关的概念或词汇,每项扩展均附有模型计算出的权重,增强了语义理解的深度和广度。这得益于稀疏向量技术,它以较低内存占用高效存储信息,对比稠密向量需全内存索引,显著提升了资源效率。

2.查询效率与资源优化:

查询过程受益于倒排索引结构,避免了向量相似度匹配的开销,加速了检索速度。此外,Elasticsearch 的稀疏向量减少了内存需求,进一步优化了资源利用。

3.混合搜索策略:

现代搜索需求促使 Elasticsearch 支持多模态查询,结合文本、向量检索以及rrf混合排序方法,以增强结果的相关性和覆盖范围。这种混合搜索策略能够召回更多样化的数据,提升用户体验。

4.排名与相关性调整:

为了从召回的大量数据中精确选出最相关的结果,ES 采用如BM25等排序机制,考虑文档频率和位置等因素初步确定权重。随后,通过集成学习或更精细的模型(如Rerank阶段)对初步筛选出的文档进行二次排序,确保顶部结果高度相关。

5.模型集成与原生支持:

Elasticsearch 展现了强大的模型集成能力,允许用户直接将自定义模型加载至集群中运行,实现从输入到输出(如词嵌入生成)的端到端处理,无需外部预处理步骤。这不仅简化了工作流程,还促进了机器学习模型与搜索引擎的无缝融合,强化了系统的智能化水平和适应性。

阿里云 Elasticsearch 将准确率提升至95%

阿里云 Elasticsearch AI 搜索产品的基础是 Elasticsearch 和阿里云 AI 搜索开放平台,整合多样化模型与混合检索技术,实现了从传统搜索到 AI 语义搜索的跨越。该方案通过精细的数据预处理、智能向量化、多维度检索召回、以及大模型辅助生成,形成了一个完整且高效的 RAG 场景应用框架。

  • 文档解析与切分:利用自研模型识别非结构化数据,提取关键信息,保证内容的完整性和语义连贯性。

  • 高效向量化:采用参数量优化的向量模型,在保证效果的同时降低成本,实现向量化过程的高效执行。

  • RRF混合检索策略:结合文本、稀疏及稠密向量索引,实现多路召回,大幅提升检索精度与效率。

  • 意图理解与重排优化:通过查询分析模型理解用户意图,配合重排模型对结果进行精排序,确保内容的相关性。

  • 综合测评与灵活配置:AI搜索开放平台提供一站式服务,包含多款模型组件,兼容开源生态,助力企业快速搭建定制化搜索系统。

通过阿里云 Elasticsearch AI 搜索的全面应用,客户在知识库问答场景中见证了显著成效,准确率从最初的48%提升至最终超过95%。此外,三路混合检索与重排模型的结合,进一步提升了检索的精确度,保障了搜索体验的卓越性。

AI Assistant 集成通义千问大模型实现 AI Ops

Elasticsearch 企业版的 AI Assistant 融合了 RAG 技术和阿里云大模型服务,为企业提供了 AI Ops 助手。这一创新工具在通用搜索、可观测性分析及安全保障等多个领域展现出了卓越的应用潜力,不仅能够助力开发者在异常监控、警报处理、问题识别与诊断、数据分析建模以及查询性能优化等方面取得显著进展,还通过更加直观易用的交互界面极大提升了工作效率。

特别是在可观测性方面,AI Assistant 借助于自动化的函数调用机制,该助手能够高效地请求、分析并可视化您的数据,将其转化为具有实际操作价值的信息。此外,基于 Elastic Learned Sparse EncodeR (ELSER) 支持的知识库进一步丰富了来自私有数据集中的上下文信息和建议;而 RAG 技术与通义大模型相结合,则确保了更精准的数据理解和表达能力。

通过阿里云 AI 搜索开放平台上集成通义千问大模型后,Elasticsearch 的 AI Assistant 特别注重激活函数模拟调用,以保证不同系统间的无缝兼容。这使得用户可以根据具体需求灵活切换多种连接器,从而实现高效的信息检索与处理流程。尤其在微服务运维场景下,AI Assistant 发挥着至关重要的作用——它不仅能实时监测异常状况与潜在故障点,还能对详细的错误日志进行深入剖析,并结合现有运维手册快速定位问题根源。与此同时,AI Assistant 还能有效整合各类告警信息,对安全攻击链条进行全面分析,进而提出切实可行的防御策略,显著提高了问题解决的速度与质量。

通过调用 API 接口并自动生成 ESQL 查询语句,AI Assistant 能够执行复杂的数据分析任务并生成直观易懂的统计图表,即使是对 Elasticsearch 查询语法不甚了解的用户也能轻松上手。无论是探究字段间的关系,还是解读数据趋势等数据洞察,AI Assistant 都能以极高的效率和便捷的操作方式满足用户的多样化需求。

  • 免费试用:Elasticsearch_全托管云搜索_兼容开源ELK_智能化运维_AI搜索_大数据-阿里云

  • 更多咨询:精准分析检索, 打造商品推荐体验-阿里云技术解决方案

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/500887.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

BootstrapTable处理表格

需求背景 历史项目使用 BootstrapTable 作为前端组件 应客户需要调整&#xff1a; 冻结前四列对于大文本文字显示部分内容&#xff0c;鼠标悬浮显示完整内容 冻结列 1、引入相关CSS,JS CSS <link rel"stylesheet" href"/css/bootstrap.min.css"> …

《Vue3实战教程》35:Vue3测试

如果您有疑问&#xff0c;请观看视频教程《Vue3实战教程》 测试​ 为什么需要测试​ 自动化测试能够预防无意引入的 bug&#xff0c;并鼓励开发者将应用分解为可测试、可维护的函数、模块、类和组件。这能够帮助你和你的团队更快速、自信地构建复杂的 Vue 应用。与任何应用一…

【算法】模拟退火算法学习记录

写这篇博客的原因是博主本人在看某篇文章的时候&#xff0c;发现自己只是知道SGD这个东西&#xff0c;但是到底是个啥不清楚&#xff0c;所以百度了一下&#xff0c;然后在通过博客学习的时候看到了退火两个字&#xff0c;想到了本科做数模比赛的时候涉猎过&#xff0c;就上bil…

【MATLAB第111期】基于MATLAB的sobol全局敏感性分析方法二阶指数计算

【MATLAB第111期】基于MATLAB的sobol全局敏感性分析方法二阶指数计算 一、简介 在MATLAB中计算Sobol二阶效应指数通常涉及到全局敏感性分析&#xff08;Global Sensitivity Analysis, GSA&#xff09;&#xff0c;其中Sobol方法是一种流行的技术&#xff0c;用于评估模型输入…

android studio android sdk下载地址

android studio安装后&#xff0c;因为公司网络原因&#xff0c;一直无法安装android sdk 后经过手机网络&#xff0c;安装android sdk成功如下&#xff0c;也可以手动下载后指定android sdk本地目录 https://dl.google.com/android/repository/source-35_r01.zip https://dl…

“AI人工智能软件开发公司:创新技术,引领未来

大家好&#xff01;今天我们来聊聊一个充满未来感的话题——AI人工智能软件开发公司。这个公司&#xff0c;用大白话说&#xff0c;就是专门研究和开发人工智能软件的地方&#xff0c;它们用最新的技术帮我们解决问题&#xff0c;让生活和工作变得更智能、更便捷。听起来是不是…

ACL的注意事项

ACL只对数据进行抓取和匹配&#xff0c;ACl本身不对数据做拒绝和允许的操作&#xff0c;只有在接口方向上应用后才对数据进行拒绝或允许的操作。 ACl只在packetfilter包过滤时默认动作是允许&#xff0c;这个时候至少需要有一条deny规则&#xff0c;否则全都是允许的规则&…

gitlab 还原合并请求

事情是这样的&#xff1a; 菜鸡从 test 分支切了个名为 pref-art 的分支出来&#xff0c;发布后一机灵&#xff0c;发现错了&#xff0c;于是在本地用 git branch -d pref-art 将该分支删掉了。之后切到了 prod 分支&#xff0c;再切出了一个相同名称的 pref-art 分支出来&…

webserver的http实现

1、用了状态机&#xff0c;为什么要用状态机&#xff1f; 在逻辑处理模块中&#xff0c;响应的http请求采用主从状态机完成&#xff0c; 传统的控制流程都是按照顺序执行的&#xff0c;状态机能够处理任意顺序的事件&#xff0c;并能提供有意义的响应--即使这些事件发生的顺序和…

C语言面的向对象编程(OOP)

如果使用过C、C#、Java语言&#xff0c;一定知道面向对象编程&#xff0c;这些语言对面向对象编程的支持是语言级别的。C语言在语言级别不支持面向对象&#xff0c;那可以实现面向对象吗&#xff1f;其实面向对象是一种思想&#xff0c;而不是一种语言&#xff0c;很多初学者很…

Qt监控系统放大招/历经十几年迭代完善/多屏幕辅屏预览/多层级设备树/网络登录和回放

一、前言说明 近期对视频监控系统做了比较大的更新升级&#xff0c;主要就是三点&#xff0c;第一点就是增加了辅屏预览&#xff0c;这个也是好多个客户需要的功能&#xff0c;海康的iVMS-4200客户端就有这个功能&#xff0c;方便在多个屏幕打开不同的视频进行查看&#xff0c…

基于feapder爬虫与flask前后端框架的天气数据可视化大屏

# 最近又到期末了&#xff0c;有需要的同学可以借鉴。 一、feapder爬虫 feapder是国产开发的新型爬虫框架&#xff0c;具有轻量且数据库操作方便、异常提醒等优秀特性。本次设计看来利用feapder进行爬虫操作&#xff0c;可以加快爬虫的速率&#xff0c;并且简化数据入库等操作…

数据挖掘——模型的评价

数据挖掘——模型的评价 模型的评价混淆矩阵ROC曲线如何构建ROC曲线 模型过分拟合和拟合不足减少泛化误差 模型的评价 混淆矩阵 准确率 a d a b c d \frac{ad}{abcd} abcdad​ T P T N T P T N F P F N \frac{TPTN}{TPTNFPFN} TPTNFPFNTPTN​ 其他度量&#xff1a; …

庐山派K230学习日记1 从点灯到吃灰

1 简介​ 庐山派以K230为主控芯片&#xff0c;支持三路摄像头同时输入&#xff0c;典型网络下的推理能力可达K210的13.7倍&#xff08;算力约为6TOPS&#xff09;。支持CanMV&#xff0c;可作为AI与边缘计算平台 K230简介 K230芯片集成了两颗RISC-V处理器核心&#xff0c;双核…

活动预告 |【Part2】Microsoft 安全在线技术公开课:安全性、合规性和身份基础知识

课程介绍 通过参加“Microsoft 安全在线技术公开课&#xff1a;安全性、合规性和身份基础知识”活动提升你的技能。在本次免费的介绍性活动中&#xff0c;你将获得所需的安全技能和培训&#xff0c;以创造影响力并利用机会推动职业发展。你将了解安全性、合规性和身份的基础知…

【PCIe 总线及设备入门学习专栏 4.5 -- PCIe Message and PCIe MSI】

文章目录 PCIe Message 与 MSIPCIe Message 和 MSI 的作用与关系MSI 的配置与寄存器MSI 和 ARM GIC 的关系示例&#xff1a;MSI 在 ARM GIC 的实际应用总结 PCIe Message 与 MSI 本文将介绍 PCIe message 的作用以及message 与 MSI 的关系&#xff0c;再介绍 MSI 如何配置以及…

C++11右值与列表初始化

1.列表初始化 C98传统的{} C98中一般数组和结构体可以用{}进行初始化。 struct Point {int _x;int _y; }; int main() {int array1[] { 1, 2, 3, 4, 5 };int array2[5] { 0 };Point p { 1, 2 };return 0; } C11中的{} C11以后统一初始化方式&#xff0c;想要实现一切对…

设计模式 创建型 建造者模式(Builder Pattern)与 常见技术框架应用 解析

单例模式&#xff08;Singleton Pattern&#xff09;&#xff0c;又称生成器模式&#xff0c;是一种对象构建模式。它主要用于构建复杂对象&#xff0c;通过将复杂对象的构建过程与其表示分离&#xff0c;使得同样的构建过程可以创建出具有不同表示的对象。该模式的核心思想是将…

什么是Redis哨兵机制?

大家好&#xff0c;我是锋哥。今天分享关于【什么是Redis哨兵机制&#xff1f;】面试题。希望对大家有帮助&#xff1b; 什么是Redis哨兵机制&#xff1f; 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 Redis 哨兵&#xff08;Sentinel&#xff09;机制是 Redis 提…

全国计算机设计大赛大数据主题赛(和鲸赛道)经验分享

全国计算机设计大赛大数据主题赛&#xff08;和鲸赛道&#xff09;经验分享 这是“和鲸杯”辽宁省普通高等学校本科大学生计算机设计竞赛启动会汇报—大数据主题赛的文档总结。想要参加2025年此比赛的可以借鉴。 一、关于我 人工智能专业 计赛相关奖项&#xff1a; 2022年计…