通过MongoDB Atlas 实现语义搜索与 RAG——迈向AI的搜索机制

目录

通过MongoDB Atlas 实现语义搜索与 RAG——迈向AI的搜索机制

一、引言

二、语义搜索与 MongoDB Atlas 的背景

三、MongoDB Atlas 的向量搜索功能

1. 向量搜索的实现方式

2. 典型操作示例

四、RAG 在 MongoDB Atlas 的应用

1、RAG是什么

2、RAG 的实现过程

3、RAG 的实际应用场景

4、实现 RAG 的示例流程

五、语义搜索与传统搜索方式的对比

六、总结


作者:watermelo37

涉及领域:Vue、SpingBoot、Docker、LLM、python等

---------------------------------------------------------------------

温柔地对待温柔的人,包容的三观就是最大的温柔。

---------------------------------------------------------------------

通过MongoDB Atlas 实现语义搜索与 RAG——迈向AI的搜索机制

一、引言

        随着大模型和语义搜索的迅速发展,如何高效管理和检索大规模非结构化数据成为现代应用的重要课题。MongoDB Atlas 近年来推出了面向语义搜索的向量存储和检索功能,使开发者能够在 Atlas 中轻松构建语义搜索和 RAG(Retrieval-Augmented Generation)应用。本文将深入探讨 MongoDB Atlas 的语义搜索功能、其向量检索的实现原理,并结合 RAG 框架介绍其在实际场景中的应用潜力。

二、语义搜索与 MongoDB Atlas 的背景

        语义搜索是基于内容意义而非简单关键词匹配的搜索方式,在信息检索领域具有广泛应用。然而,传统数据库中的全文检索无法实现语义级的理解和匹配。而 MongoDB Atlas 新推出的向量搜索功能,通过引入向量化语义数据存储和检索,使语义搜索和 RAG 在文档数据库中成为可能。

为什么需要语义搜索?

  • 提高信息匹配精度:语义搜索基于内容的相似性,可跨越词汇的表面差异。
  • 支持自然语言处理:与大语言模型(如 GPT)集成,使得数据库能够直接支持生成式 AI 和问答系统等高级应用。
  • RAG 模式的基础:向量搜索为 RAG 提供了高效的检索方式,以强化生成式模型的知识深度。

三、MongoDB Atlas 的向量搜索功能

        MongoDB Atlas 的向量搜索通过将文本、图像等内容向量化并存储在数据库中,实现基于向量相似度的检索。这种方式允许用户在存储文档的同时存储对应的向量表示,从而支持语义搜索。

1. 向量搜索的实现方式

        在 MongoDB Atlas 中,向量搜索的核心是将内容向量化并存储到文档的字段中,并通过余弦相似度或欧氏距离计算相似性。以下是其主要流程:

  • 向量化数据:通常借助大模型(如 BERT、GPT)将文本或图像转换为高维向量。
  • 索引管理:Atlas 提供对向量字段的索引,使得高维度数据的检索效率显著提升。
  • 相似性计算:支持基于距离度量的相似性查询,从而实现语义搜索。

        Atlas 的向量搜索适合以下几类应用:

  • 文本语义搜索:从大量文本中查找语义相似的内容。
  • 多模态检索:在图像或文本等不同数据类型上实现跨模态的检索。
  • 个性化推荐:基于用户行为向量化,为其推荐相似内容。

2. 典型操作示例

        在 MongoDB Atlas 中进行向量搜索,通常需要先向量化数据,然后在 MongoDB 中执行语义查询。以下是一个简单的示例:

// 设定文档格式,包含文本内容和对应的向量
db.collection.insertOne({content: "This is a sample document.",embedding: [0.23, 0.45, 0.78, ...]  // 向量化后的表示
});// 执行基于向量相似度的查询
db.collection.aggregate([{$search: {"index": "default","knnBeta": {"vector": [0.21, 0.47, 0.80, ...],"path": "embedding","k": 5  // 返回与查询向量最相似的5条记录}}}
]);

四、RAG 在 MongoDB Atlas 的应用

1、RAG是什么

        RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索技术与语言生成模型的人工智能技术。它通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。

        RAG 是近年来一种将生成式 AI 和检索技术结合的框架,主要应用于知识问答、文档总结等任务。RAG 模型通过检索相关的背景信息作为生成模型的输入,显著提高了生成结果的准确性和可靠性。

        MongoDB Atlas 的向量搜索功能使 RAG 应用能够直接在数据库内实现数据检索,为生成式模型提供上下文。

2、RAG 的实现过程

在 RAG 框架中,通常有以下关键步骤:

  1. 内容向量化:利用向量化模型(如 BERT 或 Sentence Transformers)将文档存储为向量。
  2. 语义检索:使用 MongoDB Atlas 的向量检索功能查找与输入查询相似的内容。
  3. 生成结果:将检索到的内容传递给生成模型(如 GPT)进行答案生成或内容总结。

3、RAG 的实际应用场景

        MongoDB Atlas 结合 RAG 可以支持多种实际应用,如下所示:

  • 智能客服:将客户常见问题和答案向量化存储在 MongoDB Atlas 中,当客户提出问题时,RAG 模型可以先检索相关答案,然后由生成式模型生成个性化回应。
  • 企业知识管理:公司内部知识库往往包含大量复杂文档。通过 RAG,可以实现对知识库的语义化检索,提供更智能的知识问答。
  • 内容生成和推荐:在电商和媒体行业,可以根据用户兴趣向量推荐相关产品或文章,提供个性化内容。

4、实现 RAG 的简要流程

        下面是一个简单的 RAG 框架实现流程:

        假设我们有一个文档数据库,其中每个文档都经过向量化处理,并且我们使用 MongoDB Atlas 的向量搜索来进行相似文档检索。然后将检索到的结果作为上下文传递给生成式 AI 模型以生成答案。

        我们将详细分解以下几步:

  1. 将用户查询向量化。
  2. 在 MongoDB Atlas 中根据向量搜索匹配最相似的文档。
  3. 将这些相似文档合并成上下文。
  4. 传递上下文和用户查询给生成式模型生成答案。
  5. 返回答案。

        由于涉及到文本向量化的相关知识和与大模型交互的知识,这里不多赘述。假设已经有一个函数 vectorize(query) 将文本向量化,并且有一个函数 generate_answer_with_ai_model(query, context) 使用生成式模型生成答案。

// 引入 MongoDB Atlas 连接库
const { MongoClient } = require("mongodb");// 假设 MongoDB Atlas 的连接信息
const uri = "YOUR_MONGODB_ATLAS_CONNECTION_STRING";
const client = new MongoClient(uri);// 假设数据库和集合的名称
const dbName = "knowledgeBase";
const collectionName = "documents";// 1. 定义向量化和生成模型函数(假设已经定义好或导入)
async function vectorize(query) {// 调用向量化模型 API,例如 Hugging Face 模型或自定义 BERT 模型// 返回查询的向量表示
}async function generate_answer_with_ai_model(query, context) {// 调用生成式 AI 模型(例如 OpenAI 的 GPT 模型或自建模型)// 使用 query 和 context 生成最终答案
}// 2. 主 RAG 实现函数
async function retrieve_and_generate_answer(userQuery) {try {// 连接 MongoDB Atlasawait client.connect();const db = client.db(dbName);const collection = db.collection(collectionName);// 1. 将用户查询向量化const queryVector = await vectorize(userQuery);// 2. 在 MongoDB Atlas 中进行向量相似度搜索const k = 5;  // 设置希望检索的相似文档数量const results = await collection.aggregate([{$search: {"index": "default","knnBeta": {"vector": queryVector,"path": "embedding","k": k  // 返回最相似的 k 个文档}}},{$project: {content: 1,_id: 0,  // 仅保留内容字段score: { $meta: "searchScore" }  // 选择性:记录相似度得分}}]).toArray();// 3. 整理上下文,将相似文档内容合并为完整上下文let context = results.map(doc => doc.content).join(" ");console.log("检索到的上下文内容: ", context);// 4. 传递上下文和用户查询给生成式 AI 模型生成答案const answer = await generate_answer_with_ai_model(userQuery, context);// 5. 返回生成的答案return answer;} finally {// 关闭 MongoDB Atlas 连接await client.close();}
}// 示例:用户输入的问题
const userQuery = "What are the best practices for managing microservices?";// 调用 RAG 实现函数
retrieve_and_generate_answer(userQuery).then(answer => console.log("生成的答案: ", answer)).catch(err => console.error("出现错误: ", err));

五、语义搜索与传统搜索方式的对比

        语义搜索和传统关键词搜索在实现原理和应用效果上有显著区别:

特点传统关键词搜索语义搜索
匹配方式基于字符串或关键词匹配基于语义相似性
搜索结果精确匹配,常出现遗漏或误报相似内容匹配,结果更具相关性
处理数据类型结构化文本非结构化数据(如图像、文本等)
计算需求计算成本低高维向量计算,资源需求较高
应用场景基本信息检索智能客服、推荐系统、知识问答等

        语义搜索可以更好地理解用户的意图,尤其适用于开放性查询和需要语义理解的场景。而传统搜索依赖于精确的关键词匹配,对自然语言理解有限。

六、总结

        MongoDB Atlas 的向量搜索功能为语义搜索和 RAG 提供了一个高效的数据库管理平台。在这个全新的应用场景下,Atlas 的向量检索能力支持开发者实现高效的知识检索和增强型生成应用,使其在智能客服、知识问答、个性化推荐等场景中大放异彩。结合生成式模型的 RAG 应用,MongoDB Atlas 提供了从数据存储到智能生成的完整解决方案,展现出其在现代应用中的巨大潜力。希望本文能够帮助大家更好地理解 MongoDB Atlas 的语义搜索功能和 RAG 的实际应用。

         只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~

        MongoDB Atlas官网:MongoDB:开发者数据平台 | MongoDB

        MongoDB Atlas Vector Search:MongoDB Atlas Vector Search | MongoDB

        其他热门文章,请关注:

        你真的会使用Vue3的onMounted钩子函数吗?Vue3中onMounted的用法详解

        通过array.filter()实现数组的数据筛选、数据清洗和链式调用

        极致的灵活度满足工程美学:用Vue Flow绘制一个完美流程图

        el-table实现动态数据的实时排序,一篇文章讲清楚elementui的表格排序功能

        TreeSize:免费的磁盘清理与管理神器,解决C盘爆满的燃眉之急

        在线编程实现!如何在Java后端通过DockerClient操作Docker生成python环境

        Dockerfile全面指南:从基础到进阶,掌握容器化构建的核心工具

        MutationObserver详解+案例——深入理解 JavaScript 中的 MutationObserver

        JavaScript中闭包详解+举例,闭包的各种实践场景:高级技巧与实用指南

        干货含源码!如何用Java后端操作Docker(命令行篇)

        Idea启动SpringBoot程序报错:Port 8082 was already in use;端口冲突的原理与解决方案

        PDF预览:利用vue3-pdf-app实现前端PDF在线展示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/471538.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring——事务

事务 JdbcTemplate 简介 Spring框架对JDBC进行封装&#xff0c;使用JdbcTemplate方便实现对数据库操作 准备工作 ①搭建子模块 搭建子模块&#xff1a;spring-jdbc-tx ②加入依赖 <dependencies><!--spring jdbc Spring 持久化层支持jar包--><dependenc…

C++ —— 哈希详解 - 开散列与闭散列

目录 1. 哈希的概念 1.1 直接定址法 1.2 哈希冲突 1.3 负载因子 1.4 哈希函数 1.4.1 除法散列法/除留余数法 1.4.2 乘法散列法 1.4.3 全域散列法 1.5 处理哈希冲突 1.5.1 开放定址法&#xff08;闭散列&#xff09; 1. 线性探测&#xff08;挨着查找&#xff09; 2.…

苦等三年!金克斯大人回来了!

2021年《英雄联盟&#xff1a;双城之战》第一季上线&#xff0c;该动画连续三周在全球 52 个国家和地区占据榜单前十&#xff0c;并在第49届安妮奖中斩获最佳电视 / 流媒体类动画、最佳艺术指导、最佳角色动画等9项大奖。 苦等三年&#xff01;&#xff01;&#xff01; 《双城…

NVR录像机汇聚管理EasyNVR多品牌NVR管理工具/设备:大华IPC摄像头局域网访问异常解决办法

在当今社会&#xff0c;安全监控已成为各类场所不可或缺的一部分。无论是家庭、学校、商业场所还是公共场所&#xff0c;安全监控设备都扮演着至关重要的角色。在众多监控品牌中&#xff0c;大华IPC摄像头凭借其高清画质、强大功能和卓越稳定性&#xff0c;赢得了市场的广泛认可…

随机数

目录 一、传统方式&#xff1a;std::rand 和 std::srand 使用方法&#xff1a; 优缺点&#xff1a; 二、现代方式&#xff1a; 库&#xff08;推荐&#xff09; 1. 随机整数 2. 随机浮点数 3. 布尔值 4. 字符 5. 正态分布&#xff08;高斯分布&#xff09; 6. 离散分…

Python Plotly 库使用教程

Python Plotly 库使用教程 引言 数据可视化是数据分析中至关重要的一部分&#xff0c;它能够帮助我们更直观地理解数据、发现潜在的模式和趋势。Python 提供了多种数据可视化库&#xff0c;其中 Plotly 是一个功能强大且灵活的库&#xff0c;支持交互式图表的创建。与静态图表…

LeetCode题解:5.最长回文子串【Python题解超详细,中心拓展、动态规划、暴力解法】

题目描述 给你一个字符串 s&#xff0c;找到 s 中最长的回文子串。 解答 class Solution(object):def longestPalindrome(self, s):""":type s: str:rtype: str"""# 思路一&#xff1a;中心拓展def extend_from_center(left,right):# 从中心向…

企业一站式管理系统odoo的研究——PLM插件的搭建

大纲 1. 环境准备1.1 安装操作系统1.2 更新操作系统1.3 配置用户组和用户1.3.1 创建用户组 odoo1.3.2. 创建用户 odoo1.3.3. 设置用户 odoo 的密码1.3.4. 验证用户和组1.3.5. 将用户 odoo 添加到添加sudo组&#xff1a;1.3.6. 切到odoo用户 2. 安装 Odoo1. 安装依赖项目2.2. 安…

Keil基于ARM Compiler 5的工程迁移为ARM Compiler 6的工程

环境&#xff1a; keil版本为5.38&#xff0c;版本务必高于5.30 STM32F4的pack包版本要高于2.9 软件包下载地址&#xff1a;https://zhuanlan.zhihu.com/p/262507061 一、更改Keil中编译器 更改后编译&#xff0c;会报很多错&#xff0c;先不管。 二、更改头文件依赖 观察…

ABAP开发学习——ST05 ABAP SQL跟踪工具

操作步骤 第一步使用ST05之前&#xff0c;将要查的程序停留想要看的操作的前一步&#xff0c;这里想看到取数操作&#xff0c;所以停留在选择界面 第二步进入ST05 选择SQL Trace 然后激活 第三步去执行程序 第四步ST05取消激活 第五步查看操作 选完时间直接执行

C/C++语言基础--C++模板与元编程系列六,C++元编程相关库的讲解与使用

本专栏目的 更新C/C的基础语法&#xff0c;包括C的一些新特性 前言 模板与元编程是C的重要特点&#xff0c;也是难点&#xff0c;本人预计将会更新10期左右进行讲解&#xff0c;这是第六期&#xff0c;讲解元编程相关库等&#xff0c;本人感觉这一部分内容还是比较复杂的&am…

uni-app之数据驱动的picker选择器( uni-data-picker)之可以选择到任意级别

背景说明 uni-app 官方的插件市场有数据驱动选择器&#xff0c;可以用作多级分类的场景。本人引入插件后&#xff0c;发现&#xff0c;在h5和微信小程序都只能选择到叶子级。而在给出的官方组件示例中确并非如此。 以选择年级&#xff0c;而不选择班级。然后&#xff0c;想试试…

探索 HTML 和 CSS 实现的蜡烛火焰

效果演示 这段代码是一个模拟蜡烛火焰的HTML和CSS代码。它创建了一个具有动态效果的蜡烛火焰动画&#xff0c;包括火焰的摆动、伸缩和光晕的闪烁。 HTML <div class"holder"><div class"candle"><div class"blinking-glow"&g…

react + ts定义接口类型写法

接口&#xff08;未进行ts定义&#xff09; export async function UserList(params: {// keyword?: string;current?: number;pageSize?: number;},// options?: { [key: string]: any }, ) {return request<API1.UserList>(http://geek.itheima.net/v1_0/mp/artic…

【教程】Ubuntu设置alacritty为默认终端

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 目录 背景介绍 设置教程 注意事项 背景介绍 alacritty是一个开源的终端&#xff0c;比默认的xterm更好看&#xff0c;甚至编辑文本时候还会代码高亮…

使用Element UI实现前端分页,及el-table表格跨页选择数据,切换分页保留分页数据,限制多选数量

文章目录 一、前端分页1、模板部分 (\<template>)2、数据部分 (data)3、计算属性 (computed)4、方法 (methods) 二、跨页选择1、模板部分 (\<template>)2、数据部分 (data)3、方法 (methods) 三、限制数量1、模板部分 (\<template>)2、数据部分 (data)3、方法…

写给初学者的React Native 全栈开发实战班

React Native 全栈开发实战班 亲爱的同学们&#xff1a; 很高兴在这里与大家相聚&#xff01;我是你们的讲师&#xff0c;将带领大家一起踏上 React Native 移动开发的学习之旅。 为什么选择 React Native&#xff1f; 在这个移动互联网时代&#xff0c;App 开发工程师已经…

StarRocks Summit Asia 2024 全部议程公布!

随着企业数字化转型深入&#xff0c;云原生架构正成为湖仓部署的新标准。弹性扩展、资源隔离、成本优化&#xff0c;帮助企业在云上获得了更高的灵活性和效率。与此同时&#xff0c;云原生架构也为湖仓与 AI 的深度融合奠定了基础。 在过去一年&#xff0c;湖仓技术与 AI 的结…

[CKS] K8S Dockerfile和yaml文件安全检测

最近准备花一周的时间准备CKS考试&#xff0c;在准备考试中发现有一个题目关于Dockerfile和yaml文件安全检测的题目。 ​ 专栏其他文章: [CKS] Create/Read/Mount a Secret in K8S-CSDN博客[CKS] Audit Log Policy-CSDN博客 -[CKS] 利用falco进行容器日志捕捉和安全监控-CSDN博…

鸿蒙之多选框(Checkbox)

前言&#xff1a; 控制单个或者多个选项的选中状态&#xff0c;就可以使用 多选框组件 Checkbox:多选框组件CheckboxGroup:多选框组&#xff0c;控制多个多选框 Checkbox: 参数CheckboxOptions说明 名称 类型 必填 描述 name string 否 用于指定多选框名称。一般结合Ch…