rag实际工程中好用的技巧

rag fusion

这是一个论文来着我记得。而且在langchain官方教学里也有。思路是一个query生成多个同样语义但是表述不同的query,然后分别进去rag,得到多个回答,最后把多个回答fusion,即总结。

这个法子能很好滴增加正确文档的召回率。

稀疏向量、稠密向量、关键词一起用

稀疏向量是指维度极大的query embedding,这种向量做完对齐基本上是维度冗余的,但是在query极度像训练数据里的query时,就很容易匹配到正确的chunk。
稠密向量,就是bge那些。
关键词,可以是bm25,也可以是你用小模型抽出来的关键词,再按metadata搜索。

这三种各自有各自的优势,所以一起用吧,废文档靠后面相关性检查模块就好啦。

信息追问

这个机制是在llm参数量足够大,能力够强,然后能识别出给的context不足以回答问题的时候,引导llm生成三个追问问题的机制。完成这个机制只需要prompt就行,但是能极大提高用户体验。例如kimi也每次都会在答案后面给你生成一些追问问题,以前的ai医疗问答也会这么干,不如说追问是基操。

embedding微调的小技巧

有些bad case出现,是因为用户在query提了一个很稀有但是与他的询问没多大关系的词,这个稀有词极大地影响了embedding,导致召回失败。
首先,你得分从语义层面分割句子,让不相关的两句话拆开,尽量剔除无关句子。然后分割完你也不知道前面是问题还是后面是问题,所以都得拿去召回,并且还得分别获得信息,最后再fusion所有信息。
训练的时候,训练的query语义分割了,我们会认为一个query分割成几段,都是要得到同样的chunk,所以都要与chunk对齐。

作为一个产品,用户用你的东西检索,但是你后面有好多个数据库,全量检索的话,这rag基本等于废了。所以如何引导用户选择他感兴趣的库?而不是直接开问?

注册的时候就就得给用户几个引导性提问,就跟短视频平台一进去让你选的那些似的。
如果用户想切换了,其实完全可以让用户给出一些描述,他想问哪类问题,你先根据库的特征匹配一些,如果用户反复修改描述,就等于是你没找对,总之这个过程是收集正负例的过程。数据多了,就能做描述和数据库的匹配了,或者是query-db对齐,或者是query-query的对齐。没有现成的好办法。

多轮对话里,有时候用不到知识库,只是闲聊天。有时候召回得太杂,有些文档纯纯没用,还是塞进来了,llm很可能把没用的信息也融进输出。

对于区分闲聊天和检索,可以用意图识别or训练llm自动识别是否检索。前者好说,一个轻量级模型能做到。后者,你得走self-rag的路子(我看kimi就是用的self-rag)。
用selfrag架构要比意图识别好,把所有事都在一次生成里干完,是最快的。

还是召回无关文档的问题

假设你向量模型调得挺好,我可以说相关和无关的向量分数会有明显的分布差距。你找个阈值,一般设两段,一硬一软,例如0 8和0.6,低于0.6的直接扔,不到0.8的rerank往后排,过了的排前面。
还有,你知识库生成的时候先来生成一些QA对,直接query-Q匹配,然后拿召回的几个Q对应A来生成针对query的回答,注意此时的A就全是llm生成的了。

用户想查数据库,本质是个统计问题,例如想查xx年的总支出

这种问题就只能意图识别 or tools引导到对应的专门处理text2sql的llm了,注意这里面重写query使其规范是一个很重要的事,最好还让用户确认一下,否则用户写的乱七八糟也不好直接生成sql。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/386319.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第一个设计模式——单例模式

目录 一、特点: 二、实现单例模式步骤 三、饿汉式 四、懒汉式 五、双重检查锁 六、静态内部类 七、枚举 八、可能被反序列化和反射破坏什么意思? 九、如何解决呢? 一、特点: 唯一性,单例模式确保程序中只有一…

Qt自定义带前后缀图标的PushButton

写在前面 Qt提供QPushButton不满足带前后缀图标的需求,因此考虑自定义实现带前后缀图标的PushButton,方便后续快速使用。 效果如下: 同时可设置前后缀图标和文本之间间隙: 代码实现 通过前文介绍的Qt样式表底层实现 可以得…

HiveSQL中last_value和first_value函数的应用

概述 今天做一个数据分析,其中有一列数据有些有数据有些没数据,因此我们需要把每数据的进行补充进来因此我们需要使用last_value 函数和over 结合使用,但是遇到一个比较奇葩的问题不能按照预期进行处理。 新说原因: 由于我们要处…

vue3-环境变量-JavaScript-axio-基础使用-lzstring-字符串压缩-python

文章目录 1.Vue3环境变量1.1.简介1.2.全局变量的引用1.3.package.json文件 2.axio2.1.promise2.2.安装2.3.配置2.3.1.全局 axios 默认值2.3.2.响应信息格式 2.4.Axios的拦截器2.4.1.请求拦截器2.4.2.响应拦截器2.4.3.移除拦截器2.4.4.自定义实例添加拦截器 3.lz-string3.1.java…

java项目数据库 mysql 迁移到 达梦

目录 一、下载安装达梦数据库 1、下载 2、解压 3、安装 二、迁移 三、更改SpringBoot 的 yml文件 1、达梦创建用户 2、修改yml 一、下载安装达梦数据库 1、下载 下载地址 https://eco.dameng.com/download/ 点击下载 开发版 (X86平台) , 然后选择操作系统并点击立…

“科技创新‘圳’在变革”2025深圳电子展

电子产业作为现代社会的核心驱动力之一,正以前所未有的速度发展。在这样的背景下,深圳作为中国的经济特区和创新高地,又一次迎来了备受瞩目的盛会——2025深圳电子展览会。本次展览会定于2025年4月9日至11日,在深圳会展中心&#…

剪画小程序:手机提取人声和伴奏

在音乐的海洋中,我们常常渴望更纯粹地感受歌手的嗓音魅力。 如今,有了 剪画,人声分离不再是难题! 想象一下,当您沉浸在一首动人的歌曲中,却希望更清晰地捕捉到歌手声音中的每一个微妙情感。 无论是经典老…

算能端侧 AI 盒子 Stable Diffusion 一秒一张图:AirBox BM1684X

本篇文章聊聊基于 端侧 AI 计算设备,20~30 瓦功耗运行大模型的算能 AirBox。 写在前面 去年的双十二的时候,在群里看到了一张照片,“手掌大小的 NUC”,但是能够跑大模型。 这个草就种下了。 今年 7 月初的时候,在上…

学习008-02-04-09 Assign a Standard Image(分配标准图像)

Assign a Standard Image(分配标准图像) This lesson explains how to associate an entity class with a standard image from the DevExpress.Images assembly. This image illustrates the entity class in the following sections of the UI: 本课介…

C# 知识点总结

入门 C#程序在.NET上运行,.NET framework包含两个部分: ①:.NET framework类库 ②:公共语言运行库CLR(.NET虚拟机) CLS(公共语言规范) CTS(通用类型系统) .N…

ubuntu20.04安装nginx,mysql8,php7.4详细教程,包成功

目录 1.更新索引 2.安装 Nginx 1.安装 Nginx: 2.启动 Nginx 服务并设置为开机自启: 3.开放防火墙的 80 端口: 4.检查 Nginx 是否正常运行: 3.安装 MySQL 8.0 1.首先,安装 MySQL 的仓库: 安装过程中你会看…

RewardBench:Evaluating Reward Models for Language Modeling

Leaderboard: https://hf.co/spaces/allenai/reward-bench Code: https://github.com/allenai/reward-bench Dataset: https://hf.co/datasets/allenai/reward-bench 在人类偏好的强化学习(RLHF)过程中,奖励…

【Vulnhub系列】Vulnhub_Seattle_003靶场渗透(原创)

【Vulnhub系列靶场】Vulnhub_Seattle_003靶场渗透 原文转载已经过授权 原文链接:Lusen的小窝 - 学无止尽,不进则退 (lusensec.github.io) 一、环境准备 1、从百度网盘下载对应靶机的.ova镜像 2、在VM中选择【打开】该.ova 3、选择存储路径&#xff0…

【AI大模型】-- 应用部署

一、GPU价格参考 有些在京东就能买到:https://item.jd.com/10065826100148.html美国商务部限制 GPU 对华出口的算力不超过 4800 TOPS 和带宽不超过 600 GB/s,导致最强的 H100 和 A100 禁售。英伟达随后推出针对中国市场的 A800 和 H800。 H100 与 A100&…

CATIA V5R21安装包下载及图文安装教程

大家好,今天给大家分享下catia安装教程 注意安装前请退出杀毒软件,防止误报影响安装进程 下载链接:百度网盘 请输入提取码 提取码:ypc6 01 在电脑D盘新建文件夹命名为CATIA,将下载的软件压缩包放置在该文件夹。 鼠标右击【C…

淘宝测试环境治理实践

去年之前,阿里巴巴的淘天集团测试环境是以领域方式运作:不局限测试环境治理本身,从测试模式方法论及用好测试环境思路引领集团测试环境治理。领域运作最难的是“统一思想”。业务进一步细分调整后,测试环境治理策略理应由业务方自…

【MetaGPT系列】【MetaGPT完全实践宝典——多智能体实践】

目录 前言一、智能体1-1、Agent概述1-2、Agent与ChatGPT的区别 二、多智能体框架MetaGPT2-1、安装&配置2-2、使用已有的Agent(ProductManager)2-3、多智能体系统介绍2-4、多智能体案例分析2-4-1、构建智能体团队2-4-2、动作/行为 定义2-4-3、角色/智…

若能重回白宫,特朗普称将把比特币列为美国战略储备资产!

KlipC报道:当地时间7月29日,美国前总统特朗普参加比特币2024大会,并在会上宣布称,如果重返白宫,他将把比特币列为美国战略储备资产。讲话期间,比特币价格一度上涨到6.9万美元大关。 特朗普表示&#xff1a…

Photos框架 - 自定义媒体选择器(UI预览)

引言 在前面的博客中我们已经介绍了使用媒体资源数据的获取,以及自定义的媒体资源选择列表页。在一个功能完整的媒体选择器中,预览自然是必不可少的,本篇博客我们就来实现一个资源的预览功能,并且实现列表和预览的数据联动效果。…

前端基于 axios 实现批量任务调度管理器 demo

一、背景介绍 这是一个基于 axios 实现的批量任务调度管理器的 demo。它使用了axios、promise 等多种技术和原理来实现批量处理多个异步请求,并确保所有请求都能正确处理并报告其状态。 假设有一个场景:有一个任务列表,有单个任务的处理功能…