CRE-LLM:告别复杂特征工程,直接关系抽取

CRE-LLM:告别复杂特征工程,直接关系抽取

    • 提出背景
    • CRE-LLM 宏观分析
    • CRE-LLM 微观分析
      • 1. 构建指令集(Instruction Design)
      • 2. 高效微调大型语言模型(Efficient Fine-Tuning on LLMs)
      • 3. 方法讨论(Discussion of Methods)
      • 应用场景:糖尿病治疗反应关系抽取
    • 区别对比
      • 1. 生成式方法与分类方法的区别
      • 2. 指令监督的创新
      • 3. 参数效率微调(PEFT)
      • 4. 适应领域特定任务的灵活性
      • 5. 直接关系提取

 


提出背景

论文:https://arxiv.org/pdf/2404.18085

代码:https://github.com/SkyuForever/CRE-LLM

 

在糖尿病领域,基于PLMs的关系抽取方法通常会使用预训练模型(如BERT和T5)来识别文本中的实体和关系。

例如,对于句子“糖尿病患者需要定期检查血糖”,一个基于PLMs的模型可能会识别出“糖尿病患者”作为实体,并提取出与“糖尿病患者”相关的关系,比如“需要定期检查”等。

而CRE-LLM框架则提供了一种新颖的方法来处理这种领域特定的关系抽取任务。

它不再依赖于传统的分类方法,而是利用微调的开源LLMs(如Llama2-7B、ChatGLM2-6B和Baichuan2-7B)通过生成过程直接识别给定实体之间的关系。

在糖尿病领域中,CRE-LLM可以根据给定的文本,例如“糖尿病患者需要定期检查血糖”,直接提取出与“糖尿病患者”相关的关系,而无需先进行实体识别。

这种方法可能会更高效,并且能够更好地适应特定领域的语言特点和语境。

 

给定一个句子:“该患者被诊断患有2型糖尿病。”

在这个句子中,我们可以识别出实体:患者(entity)、2型糖尿病(entity)。

然后,我们可以使用CRE-LLM框架来识别实体之间的关系。

在这种情况下,可能的关系可以是:

  • 患者(entity)- 患有(relation)- 2型糖尿病(entity)

通过这种方式,我们可以利用CRE-LLM框架从给定的句子中提取出实体之间的关系,以帮助理解糖尿病领域的文本信息。

CRE-LLM :这种方法假设模型已经针对糖尿病领域得到了专门的训练和优化。

因此,当输入“糖尿病患者因胰岛素不足而经常感到疲劳”这句话时,模型不仅识别出实体和关系,还能直接输出具体的关系:“糖尿病患者”因“胰岛素不足”而“感到疲劳”,显示出胰岛素不足导致了疲劳。

 

CRE-LLM 宏观分析

在这里插入图片描述

CRE-LLM的总览图

  • 展示了CRE-LLM框架如何利用参数高效微调技术(例如LoRA)对领域特定的中文关系抽取进行操作。
  • 输入嵌入后,通过LoRA模块和自注意力机制处理,最后输出结构,从而抽取关系。
  • “Instructions”和“Input”是用于LLM的提示,指导模型关注任务的关键信息,最终“Output”输出指定实体间的关系。

 

CRE-LLM 微观分析

CRE-LLM是一个针对领域特定关系抽取(Domain-Specific Chinese Relation Extraction, DSCRE)的框架,它使用基于生成式问答的方法,并结合了指令监督下的大型语言模型(LLMs)微调技术。

CRE-LLM利用微调过的大型语言模型,通过自然语言的指令来引导模型提取和理解特定领域内实体之间的关系。

1. 构建指令集(Instruction Design)

  • 子解法1:自然语言指令设计

    • 特征:需要明确地指导模型理解和执行特定的任务,例如提取实体之间的关系。
    • 原因:通过构建有效的自然语言指令,可以更直观地指引模型聚焦于关键信息,如实体和它们之间的关系。这样做增强了模型对任务的理解,提高了执行任务的准确性。
    • 例子:在处理糖尿病相关的医疗记录时,指令可能是“识别文本中糖尿病患者的主要症状和导致这些症状的原因。”
  • 子解法2:输入输出格式配置

    • 特征:需要结构化的方式来定义模型如何接收输入并生成输出。
    • 原因:合理的输入输出配置确保了数据在模型中的正确处理,使得输出的数据结构能够直接用于下一步的处理或分析。
    • 例子:设定输入为“糖尿病患者报告说他们经常感到疲劳”,输出为“([糖尿病患者], 经常感到疲劳, 疲劳原因是[高血糖])”。

2. 高效微调大型语言模型(Efficient Fine-Tuning on LLMs)

  • 子解法1:参数高效微调(PEFT)技术应用
    • 特征:大型语言模型通常参数庞大,直接微调成本高。
    • 原因:通过PEFT技术,如LoRA,可以仅对模型的部分关键参数进行调整,这样不仅降低了计算和存储的需求,还保持了模型的学习能力。
    • 例子:在糖尿病病例分析中,使用PEFT技术微调模型处理“哪些药物对治疗疲劳有效?”的问题,只调整与药物和症状关系识别相关的模型部分。

3. 方法讨论(Discussion of Methods)

  • 子解法1:生成式问答模式应用
    • 特征:生成式问答能直接从文本生成答案,适用于复杂关系的提取。
    • 原因:此方法能动态地根据问题的上下文生成关系答案,不受固定模式的限制,更适合处理多变和非结构化的医疗数据。
    • 例子:在询问“糖尿病患者使用什么药物后疲劳减轻?”时,生成式问答模式能够直接提供药物名称和关联的效果描述。

这种方法通过将复杂的任务细分为特定的子任务来增强模型的针对性和效率,使其能够在特定领域,如糖尿病医疗数据中,进行更为精确的信息抽取和分析。

 
考虑使用CRE-LLM框架来处理糖尿病相关的医学文本。

在这个例子中,假设我们有一个包含丰富信息的医学数据库,其中包括糖尿病患者的详细病历和治疗记录。

我们的目标是从这些文本中提取出有关糖尿病患者的特定治疗反应和并发症的关系。

应用场景:糖尿病治疗反应关系抽取

  1. 输入数据:假设我们有以下句子作为输入数据:“张三因为糖尿病并发了视网膜病变,正在接受激光治疗。”

  2. 指令设计:为了引导模型正确抽取信息,我们设计一条指令:“请根据下面的描述提取糖尿病患者的并发症及其治疗方式。”这条指令被用来让模型聚焦于‘并发症’和‘治疗方式’这两个实体及其之间的关系。

  3. 模型运作:CRE-LLM通过这个指令开始分析文本,首先识别出“糖尿病”作为疾病实体,"视网膜病变"作为并发症实体,和"激光治疗"作为治疗方式实体。

  4. 关系提取:然后,模型使用其微调后的生成式能力,生成一个关系描述,这可能是:“糖尿病导致视网膜病变"和"视网膜病变正在接受激光治疗”。这些关系直接反映了疾病、并发症和治疗之间的逻辑联系。

  5. 输出结果:最终输出的三元组可能是 [(“糖尿病”, “导致”, “视网膜病变”), (“视网膜病变”, “治疗方式”, “激光治疗”)]。这些输出有助于医疗专业人员快速理解患者的病情和治疗方案。

通过这样的应用,CRE-LLM不仅提高了从医学文本中自动提取关键信息的效率,而且通过精确的关系抽取,支持了更深入的医学研究和更有针对性的治疗决策。

这种技术特别适用于处理复杂的医疗情况,其中需要理解多个实体之间的多层次关系。

 

区别对比

解决CRE任务的四种不同范式

  • 这张图说明了四种解决CRE任务的方法:
    • (a) 基于分类的PLMs: 使用预训练语言模型(PLM),通过关系集合输出概率最高的关系。
    • (b) 基于提示的LLMs: 利用RE数据集和关系集合构建提示,然后输入到大型语言模型(LLM)中提取关系。
    • © 基于检索的LLMs: 使用RE数据集构建提示,通过检索机制在LLM中提取关系。
    • (d) CRE-LLM(本文的方法): 直接利用RE数据集构建的微调数据集来微调LLM,并生成准确的关系抽取结果。

 
CRE-LLM的主要作用是提取三元组(即实体-关系-实体的结构),但它在方法和应用方面具有几个独特的特点,尤其是在处理领域特定的文本数据时。

这种方法利用大型语言模型(LLMs)的强大能力,通过指令监督和微调,以生成式的方式提取和理解文本中的复杂关系。

以下是CRE-LLM与其他常见关系抽取方法相比的主要区别:

1. 生成式方法与分类方法的区别

  • 分类方法(如传统的PLMs方法)通常基于固定的类别进行关系判定,需要大量的标注数据来训练模型识别预定义的关系类型。
  • 生成式方法(如CRE-LLM采用的方法)则更灵活,它不依赖于事先定义的关系类型,而是可以生成关系的描述,允许模型探索文本中未预先标记的关系类型。

2. 指令监督的创新

  • 其他方法往往重点关注模型的算法优化和数据的质量。
  • CRE-LLM通过指令监督引导模型的关注点,使其能够更准确地聚焦于任务的关键部分。这种方式提供了一种直观的模型交互手段,能够有效地通过自然语言指令提高模型对复杂任务的理解。

3. 参数效率微调(PEFT)

  • 许多现有的关系抽取方法依赖于对整个模型的重训练或广泛的微调。
  • CRE-LLM采用的PEFT技术允许在保持模型底层复杂性的同时,仅微调模型的一小部分参数,这样做显著减少了计算资源的消耗,加快了模型调整的速度。

4. 适应领域特定任务的灵活性

  • 许多关系抽取工具通用性较强,但可能在特定领域(如医疗、法律或金融)的适应性不足。
  • CRE-LLM特别设计用于适应领域特定的数据和需求,通过针对特定领域的指令和微调策略,增强了模型在特定领域内的表现和准确性。

5. 直接关系提取

  • 传统方法可能需要多步骤处理,如先分类后提取,或生成后检索。
  • CRE-LLM通过生成直接的关系描述,简化了处理流程,提高了效率和准确性。

总的来说,CRE-LLM通过结合最新的大型语言模型技术、创新的指令监督方法和参数高效的微调策略,为领域特定的关系抽取任务提供了一个高效、灵活且资源节约的解决方案。

这使得它在处理需要深度理解和高精度的复杂文本数据时,特别是在有限的监督下,表现出其他方法难以匹敌的优势。

CRE-LLM通过直接生成三元组的方式简化了传统关系抽取流程中的多个步骤,减少了对复杂特征工程的依赖,并提高了处理速度和灵活性。

这种方法特别适合于处理大规模和复杂的文本数据,尤其是在需要快速有效地从大量文本中抽取精确关系时。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/319966.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode—706. 设计哈希映射【简单】(constexpr)

2024每日刷题(127) Leetcode—706. 设计哈希映射 数组实现代码 class MyHashMap { public:MyHashMap() {memset(arr, -1, sizeof(arr));}void put(int key, int value) {arr[key] value;}int get(int key) {if(arr[key] -1) {return -1;} return arr…

【在线OJ】Vue在线OJ项目

一、主页 二、题库 三、在线编译器 四、比赛 五、搜索 六、个人主页

保研面试408复习 2——操作系统、计网

文章目录 1、操作系统一、进程、线程的概念以及区别?二、进程间的通信方式? 2、计算机网络一、香农准则二、协议的三要素1. 语法2. 语义3. 时序 标记文字记忆,加粗文字注意,普通文字理解。 1、操作系统 一、进程、线程的概念以及…

VMware worksation 17 简易安装Centos8.2、Redhat8.2、Ubuntu16.04

系列文章目录 文章目录 系列文章目录前言一、VMware worksation 17 安装二、安装Centos8.2三、安装RHEL8.2四、安装Ubuntu16.04总结 前言 傻瓜式按照Linux系统,如果觉得简单,可以自定义设置,特别是配置一下磁盘空间大小,对以后排…

深入解析:匹配网络(Matching Networks)的原理和应用

匹配网络(Matching Networks) 深入解析:匹配网络(Matching Networks)的原理和应用匹配网络的核心原理工作原理算法流程 匹配网络的实现应用示例结论 深入解析:匹配网络(Matching Networks&#…

使用docker-compose编排Lnmp(dockerfile) 完成Wordpress

目录 一、 Docker-Compose 1.1Docker-Compose介绍 1.2环境准备 1.2.1准备容器目录及相关文件 1.2.2关闭防火墙关闭防护 1.2.3下载centos:7镜像 1.3Docker-Compose 编排nginx 1.3.1切换工作目录 1.3.2编写 Dockerfile 文件 1.3.3修改nginx.conf配置文件 1.4Docker-Co…

leetCode74. 搜索二维矩阵

leetCode74. 搜索二维矩阵 二分法模板&#xff1a;见到背过就行 // 区间[L,R]被划分为[L,mid]和[mid 1, R]时使用这个模板 int bsearch_1(int l, int r){while(l < r){int mid l r >> 1;if(check(mid)) r mid; //check()判断mid是否满足性质else l mid 1;}retu…

Istio 流量管理(请求路由、流量转移、请求重试、流量镜像、故障注入、熔断等)介绍及使用

一、Istio 流量管理 Istio是一个开源的服务网格&#xff0c;它为分布式微服务架构提供了网络层的抽象。它使得服务之间的通信变得更为可靠、安全&#xff0c;并且提供了细粒度的流量管理、监控和策略实施功能。Istio通过在服务之间插入一个透明的代理&#xff08;Envoy&#x…

正则表达式_字符匹配/可选字符集

正则表达式&#xff08;Regular Expression&#xff09;也叫匹配模式(Pattern)&#xff0c;用来检验字符串是否满足特 定规则&#xff0c;或从字符串中捕获满足特定规则的子串。 字符匹配 最简单的正则表达式由“普通字符”和“通配符”组成。比如“Room\d\d\d”就这样 的正则…

有这样的黑色产业链你遇到了吗?

今天上午来到公司发现公司的数据库被黑了。还留下了勒索的信息&#xff0c;下面给大家粘贴上。现在这样的产业是不是很多。你怎么看 把公司的数据库全删除了。然后自己新建了一个数据库&#xff0c;又建立了一个表。里面写的内容如下。 omg! 肯定是扫描出来的。这个库对外暴…

ChatGPT Web Midjourney一键集成最新版

准备工具 服务器一台 推荐使用浪浪云服务器 稳定 安全 有保障 chatgpt api 推荐好用白嫖的api 项目演示 项目部署 浏览器访问casaos 添加软件原添加 https://gitee.com/langlangy_1/CasaOS-AppStore-LangLangy/raw/master/chatmjd.zip 安装此软件 等待安装 安装后再桌面设置…

【Python深度学习(第二版)(4)】神经网络的基本数据结构-张量概念、阶数、使用NumPy操作张量、张量种类、样本轴等概念

文章目录 一. 张量概念二. 张量的阶数1. 标量&#xff08;0阶张量&#xff09;2. 向量&#xff08;1阶张量&#xff09;2. 矩阵&#xff08;2阶张量&#xff09;3. 3阶张量与更高阶的张量 三. 张量属性及操作张量1. 张量的关键属性2. 在NumPy中操作张量2.1. 选择某个图片数据2.…

常用语音识别开源四大工具:Kaldi,PaddleSpeech,WeNet,EspNet

无论是基于成本效益还是社区支持&#xff0c;我都坚决认为开源才是推动一切应用的动力源泉。下面推荐语音识别开源工具&#xff1a;Kaldi&#xff0c;Paddle&#xff0c;WeNet&#xff0c;EspNet。 1、最成熟的Kaldi 一个广受欢迎的开源语音识别工具&#xff0c;由Daniel Pove…

上位机图像处理和嵌入式模块部署(树莓派4b使用lua)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 lua是一个脚本语言&#xff0c;比c语言开发容易&#xff0c;也没有python那么重&#xff0c;整体使用还是非常方便的。一般当成胶水语言进行开发&a…

对于子数组问题的动态规划

前言 先讲讲我对于这个问题的理解吧 当谈到解决子数组问题时&#xff0c;动态规划(DP)是一个强大的工具&#xff0c;它在处理各种算法挑战时发挥着重要作用。动态规划是一种思想&#xff0c;它通过将问题分解成更小的子问题并以一种递归的方式解决它们&#xff0c;然后利用这些…

【redis】Redis数据类型(三)List类型

目录 List类型介绍特点 List数据结构附&#xff1a;3.2以前的版本(介绍一下压缩列表和双向链表)压缩列表ZipList双向链表LinkedList 常用命令lpush示例 lpushx示例 rpush示例 rpushx示例 LPOP示例 RPOP示例 BLPOP非阻塞行为阻塞行为相同的 key 被多个客户端同时阻塞在 MULTI/EX…

爬虫学习:基本网络请求库的使用

目录 一、urllib网络库 1.urlopen()方法 2.request方法 二、requests网络请求库 1.主要方法 2.requests.get()和requests.post() 一、urllib网络库 1.urlopen()方法 语法格式&#xff1a; urlopen(url,data,timeout,cafile,capath,context) # url:地址 # data:要提交的数据…

nacos(docker部署)+springboot集成

文章目录 说明零nacos容器部署初始化配置高级配置部分访问权限控制命名空间设置新建配置文件 springboot配置nacos添加依赖编写测试controller 说明 nacos容器部署采用1Panel运维面板&#xff0c;进行部署操作&#xff0c;简化操作注意提前安装好1Panel和配置完成docker镜像加…

避雷!7.7分,新增1区TOP被标记On Hold,5本已被踢除!

本周投稿推荐 SSCI • 2/4区经管类&#xff0c;2.5-3.0&#xff08;录用率99%&#xff09; SCIE&#xff08;CCF推荐&#xff09; • 计算机类&#xff0c;2.0-3.0&#xff08;最快18天录用&#xff09; SCIE&#xff08;CCF-C类&#xff09; • IEEE旗下&#xff0c;1/2…