检索式知识库问答相关研究调研

基于信息检索的知识库问答存在以下问题

在这里插入图片描述

一、问题解析阶段

复杂问题解析

1.问题中包括多个实体:(i)使用卷积操作捕获每个词的上下文特征;(ii)使用大语言模型对问题进行凝练,保留关键信息;(iii)采用思维链的方式对问题进行分解,通过子问题的答案来组织原始问题的答案。
2.问题中存在歧义实体:(i)使用知识库中歧义实体的相关信息来实现消歧;(ii)使用大语言模型对问题进行扩展,生成歧义实体更多的信息,最后对问题进行重写。
3.问题中包含噪音:(i)将问题解析和模型推理融合在一起,将损失直接反馈到问题解析模块。
4.问题中词语省略:(i)从汉字级、词级、短语级进行多粒度分词。

时序问题解析

(i)将问题拆解为非时态子句和时态约束;(ii)结合知识库将更多的时间信息融入问题,来解决问题中时间信息不明确。

二、信息检索阶段

检索方式及优化

1.主题实体的N跳邻居检索:根据问题对子图的不相关部分进行裁剪,利用问题相关性、候选实体一致性、子图中的连通性。
2.问题相关性检索:使用广度优先搜索算法对子图进行剪枝。
3.大模型检索:(i)判断模型是否能够回答当前问题,若可以则不需要检索信息。(ii)使用大语言模型生成问题的相关信息,提高检索的准确率。

知识库缺失

1.知识库结合文本语料:将额外的文本语料与知识库的实体相关联,使用补充知识库的知识。
2.补充知识库:(i)学习两个实体之间的关系,用以补充缺失的关系;(ii)对于重要性的实体在N跳邻居内寻找相关度更高的实体,建立它们之间的关系。

三、模型推理阶段

静态推理

1.动态的删除关系
2.动态的删除节点
3.动态的增强关系

虚假路径

1.建模路径与问题之间的关系:通过路径语义信息过滤掉虚假路径。
2.使用思维链技术

四、答案生成阶段

1.答案数目不确定:将具有相同关系的节点聚合成超子图节点。

展望

问句解析阶段中融入大语言模型有助于加深对问句的深层次语义理解.当前有 2 类问句回答准确率相对较低,分别为复杂问句和时序问句.现有方法大都集中在基于知识库相关信息或者结合问句上下文进行细粒度建模提升复杂问句的理解能力上.随着大语言模型的快速发展,其表现出语言解析的优异性能.未来可以尝试把知识库和大语言模型结合实现复杂问句分析.大语言模型可以加深对问句的深层次语义理解,可以判断出问句中不同成分,更准确率识别问句中的主题实体和关键特征,为生成准确的回答奠定基础.此外,时序问句的解析和回答同样是问答领域的 1 大难题,因为模型需要复杂的时间推理才能得到正确答案.鉴于目前大部分知识库都不包含时序关系,现阶段研究大都集中在如何对时序问题进行解析方面.将大语言模型融入现有知识库以增强知识库时序性特征,并在此基础上设计相应的时序推理模型,包括对时间线的建模、时间间隔的计算、事件顺序的推断等,有助于提高时序问句回答的准确率.
信息检索阶段融入多模态和大语言模型生成的文本数据有助于提供更全面知识信息.受知识库存储容量的限制,知识库中有时可能不包含问答问句的必要信息.目前针对知识库不完整主要有 3 种解决方法:基于大量文本语料库结合知识库进行回答;通过模型学习方式补充知识库;使用大语言模型生成相关信息来进行补充.但是,第 1 种方法经过文本补充之后得到的知识库仍然可能是缺失的;第 2种方法则可能面临着知识库补充的准确性和可解释性无法考量问题;第 3 种方法对于大语言模型生成的文本相关性无法进行有效验证.类似于使用知识库结合图像信息进行回答,未来可以从多模态角度出发,融合知识库、文本语料、图像、视频及语音等多模态数据对异构知识库统一整合和嵌入,以及融入大语言模型根据问句生成的相关文本信息;并在此基础上进行跨模态推理和学习,以发现模态之间的关联和潜在的知识.通过不同模态数据的融合和联合推理学习,弥补知识库缺失,提供更准确全面知识,以提高问答准确性.
模型推理阶段将强化学习和多任务学习融入大语言模型提升推理泛化能力.多跳推理一直以来是模型推理过程中面临的挑战之一,需要在知识库推理过程的每一跳中找到适当的节点和路径.现阶段研究大都集中在如何提高模型对问句的理解和知识库的推理方面,并没有对于每一跳推理准确性和合理性进行深入研究,未来可以从以下 2 个方面继续研究:一方面采取强化学习思路,将强化学习的思想引入大语言模型中(类 ChatGPT 模型),使得模型能够在不断交互中,根据每一跳获得的奖励值来学习如何进行多跳推理,以获取更高的问答准确率;另一方面可以采取多任务学习方法,让模型能够正确回答问句的同时,将每一跳视为 1 个独立的任务,以学习到每一跳应该采取的路径,提高模型泛化能力和效果.
答案生成阶段引入思维链技术和用户反馈机制有助于提高模型回答的完整性和准确性.目前针对部分问句答案可能存在多个情况的解决方法较少.针对该问题,一方面可以参考多链推理思想,提示大语言模型通过不同思维链沿不同路径进行推理,根据各个路径上的推理结果对最终答案进行整合.另一方面可以增加用户反馈机制,鼓励用户对答案结果进行反馈,让模型根据用户反馈信息不断学习和改进,以提高回答的全面性和准确性.
总之,目前随着大语言模型技术发展,检索知识库相关信息增强大语言模型在知识库问答领域取得了不错效果,其具有推理能力强、通用性强等优势,但是生成式模型存在的幻觉问题会造成答案不准确甚至会出现严重偏差,因此,对于精确化程度要求较高领域如医疗、金融等仍然需要提升.未来可以从检索方法和策略出发,在模型推理前检索出更相关准确信息来增强大语言模型的推理能力,缓解生成式模型的幻觉问题.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14063.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python基于Django的课堂投票系统的设计与实现【附源码】

博主介绍:✌Java老徐、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&…

C++ Primer 数组

欢迎阅读我的 【CPrimer】专栏 专栏简介:本专栏主要面向C初学者,解释C的一些基本概念和基础语言特性,涉及C标准库的用法,面向对象特性,泛型特性高级用法。通过使用标准库中定义的抽象设施,使你更加适应高级…

CPU的基本结构

基本结构 控制器(Control Unit):负责控制,如指令计数器,指令跳转。 算术逻辑控制器(Arithmetic/Logic Unit):负责计算,如算术运算加减,逻辑比较大小等。 南北…

git SourceTree 使用

Source Tree 使用原理 文件的状态 创建仓库和提交 验证 再克隆的时候发发现一个问题,就是有一个 这个验证,起始很简单 就是 gitee 的账号和密码,但是要搞清楚的是账号不是名称,我之前一直再使用名称登录老是出问题 这个很简单的…

BFS算法篇——广度优先搜索,探索未知的旅程(上)

文章目录 前言一、BFS的思路二、BFS的C语言实现1. 图的表示2. BFS的实现 三、代码解析四、输出结果五、总结 前言 广度优先搜索(BFS)是一种广泛应用于图论中的算法,常用于寻找最短路径、图的遍历等问题。与深度优先搜索(DFS&…

hot100(9)

81.104. 二叉树的最大深度 - 力扣(LeetCode) 后序遍历,从下往上,需要用到下面返回的结果。 public int maxDepth(TreeNode root) {if(root null){return 0;}int left maxDepth(root.left);int right maxDepth(root.right);re…

Elasticsearch:向量搜索的快速介绍

作者:来自 Elastic Valentin Crettaz 本文是三篇系列文章中的第一篇,将深入探讨向量搜索(也称为语义搜索)的复杂性,以及它在 Elasticsearch 中的实现方式。 本文是三篇系列文章中的第一篇,将深入探讨向量搜…

U9成品入库单有提示 组织+单号已经存在

2025年首个问题出来了!也是U9上线以来首次碰到的问题。看到这样的提示,头皮发麻了。深感不妙。看过all.log之后,果然是重复行的问题! 怎么会有重复行的错误发生呢?百思不得其解。 无奈之下,只能将单据类型…

为什么要设计DTO类/什么时候设置DTO类?

为什么设计DTO类? 例如:根据新增员工接口设计对应的DTO 前端传递参数列表: 思考:是否可以使用对应的实体类来接收呢? 注意:前端提交的数据和实体类中对应的属性差别比较大,所以自定义DTO类。 …

【C++篇】C++11新特性总结1

目录 1,C11的发展历史 2,列表初始化 2.1C98传统的{} 2.2,C11中的{} 2.3,C11中的std::initializer_list 3,右值引用和移动语义 3.1,左值和右值 3.2,左值引用和右值引用 3.3,…

大语言模型遇上自动驾驶:AsyncDriver如何巧妙解决推理瓶颈?

导读 这篇论文提出了AsyncDriver框架,致力于解决大语言模型在自动驾驶领域应用中的关键挑战。论文的主要创新点在于提出了大语言模型和实时规划器的异步推理机制,实现了在保持性能的同时显著降低计算开销。通过设计场景关联指令特征提取模块和自适应注入…

【iOS自动化】Xcode配置WebDriverAgent

WebDriverAgent 是 iOS 端自动化测试的工具,这里记录下 MacOS 环境 Xcode 如何配置 WebDriverAgent。 【重要】环境准备 ‼️ 注意:Xcode 版本需要支持对应的 iOS 版本,而 Xcode 版本又依赖 MacOS 版本;在开始部署前&#xff0c…

洛谷题目: P8774 [蓝桥杯 2022 省 A] 爬树的甲壳虫 题解 (本题较简)

题目传送门: P8774 [蓝桥杯 2022 省 A] 爬树的甲壳虫 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 前言: 这是一道关于概率和期望的动态规划问题,解题的核心思路是通过建立状态转移方程来计算甲壳虫从树根爬到树顶所需时间的期望值。题…

力扣题库第495题目解析

文章目录 1.题目再现2.思路分析&&示例说明2.1第一个示例2.2第二个示例 3.代码解释 1.题目再现 这个题目的名字叫做提莫攻击,如果是玩游戏的小伙伴对于这个场景就很熟悉了; 这个实际上是说:已知的条件会给我们一个数组,在…

leetcode刷题日记 1

https://leetcode.cn/problems/decode-ways/description/ 题目分析 分析了一下题目,我的第一想法:和之前的上楼梯问题很像 为什么这么说呢,感觉他们的值和他们之前元素都有千丝万缕的联系 就像上楼梯问题 就是我们的dp问题 怎么解释呢&a…

matlab simulink 汽车四分之一模型轮胎带阻尼

1、内容简介 略 matlab simulink121-汽车四分之一模型轮胎带阻尼 可以交流、咨询、答疑 2、内容说明 略 3、仿真分析 略 4、参考论文 略

广度优先搜索(BFS)算法详解——以走迷宫问题为例

引言:当算法遇见迷宫 想象你置身于一个复杂的迷宫,如何在最短时间内找到出口?这个问题不仅存在于童话故事中,更是计算机科学中经典的路径搜索问题。本文将带你通过走迷宫问题,深入理解广度优先搜索(BFS&am…

网工_以太网MAC层

2025.02.05:网工老姜学习笔记 第12节 以太网MAC层 2.1 MAC层的硬件地址2.2 MAC地址特殊位含义2.3 终端适配器(网卡)具有过滤功能2.4 MAC帧的格式2.4.1 DIX Ethernet V2标准(先私有,后开放,用得比较多&#…

解锁高效 Web 开发新姿势:Open WebUI 安装指南

在 Web 开发的浩瀚宇宙里,找到一款强大又好用的框架,就如同拥有了超级外挂,能让开发效率直线飙升。 今天要给大家介绍的 Open WebUI,便是这样一款神器,它作为开源框架,助力开发者轻松搭建现代感十足、交互性…

485网关数据收发测试

目录 1.UDP SERVER数据收发测试 使用产品: || ZQWL-GW1600NM 产品||【智嵌物联】智能网关型串口服务器 1.UDP SERVER数据收发测试 A(TX)连接RX B(RX)连接TX 打开1个网络调试助手,模拟用户的UDP客户端设…