【NLP文章阅读】Zero-Shot Information Extraction via Chatting with ChatGPT

【NLP文章阅读】Zero-Shot Information Extraction via Chatting with ChatGPT

  • 1 模型创新
  • 2 前期调研
    • 2.1 难以解决的问题
  • 3 Method
    • 3.1 方法
    • 3.2 数据集
      • 3.2.1 RE
      • 3.2.2 NER
      • 3.2.3 EE
    • 3.3 评价指标
      • 3.3.1 RE
      • 3.3.2 NER
      • 3.3.3 EE
  • 4 效果

转载和使用规则:更多论文解读请关注: NLP_paper,如需转载文章需要为我的github项目star,并声明文章来源

1 模型创新

零样本信息提取(Information Extraction)旨在从未注释的文本中构建IE系统。由于很少涉及人类干预,这是一项具有挑战性的工作。零样本IE具有挑战性但值得一提,它减少了数据标记所需的时间和数据标注的麻烦

我们使用两阶段框架(ChatIE)将零样本IE任务转换为多轮问题解答问题。在三个IE任务上对我们的框架进行了广泛的评估:

  • 实体关系三重提取(entity–relation triple extract,RE)
  • 命名实体识别(name entity-relation,NER)
  • 事件提取(event extraction,EE)

在两种语言的六个数据集上的经验结果表明,ChatIE取得了令人印象深刻的性能。

2 前期调研

2.1 难以解决的问题

包含多个相关元素的结构化数据很难通过一次性预测来提取,尤其是对于RE等一些复杂任务。以前的工作将这些复杂任务分解为不同的部分,并训练几个模块来解决每个部分。

  • 例如,在RE任务中,pipline方法PURE首先识别两个实体,然后预测它们之间的关系。然而,在该模型中,需要通过标记数据进行监督。此外,Li等人将RE视为一个问答过程,首先提取主题,然后根据关系模板提取对象

3 Method

3.1 方法

Zero-shoot任务转换为具有两阶段框架的多回合问答问题。

  • 第一阶段,我们的目标是找出句子中可能存在的相应元素类型。
  • 第二阶段,我们对阶段I中的每个元素类型执行链式信息提取。每个阶段都通过多回合QA过程实现。
    在这里插入图片描述

3.2 数据集

3.2.1 RE

NYT11-HRL:包含12种预定义的关系类型。

DuIE2.0:业界最大的基于模式的中文RE数据集,包含48种预定义的关系类型

3.2.2 NER

conll2003:包含4种实体类型

MSRA:是一个以中文命名的新闻领域实体识别数据集,包含3种实体类型

3.2.3 EE

DuEE1.0:百度发布的一个中文事件提取数据集,包含65种事件类型。

ACE053语料库提供了来自新闻专线和在线论坛等多个领域的文档和句子级别的事件注释。

3.3 评价指标

3.3.1 RE

我们报告了标准的微观F1测量,并采用了两个评估指标:

1)边界值(BE):如果主体和对象以及关系的整个实体跨度都是正确的,则提取的关系三元组(主体、关系、对象)被认为是正确的。

2) 严格评估(SE):除了订单评估中需要的内容外,主体和客体的类型也必须正确。我们在NYT11-HRL上使用be,因为没有实体类型的注释,而在DuIE2.0上使用SE

3.3.2 NER

只考虑完全匹配,并使用微观F1来评估NER任务。只有当预测实体和真实实体的边界和类型相同时,我们才会将其视为正确的预测

3.3.3 EE

我们在DuEE1.0数据集和ACE05数据集上采用了不同的评估指标。对于DuEE1.0数据集,根据单词水平匹配对F-measure( F 1 4 F1^4 F14)进行评分。对于ACE05数据集,预测的自变量结果与实体级别的手动标记自变量结果相匹配,并由micro F1进行评估

TP: Ture Positive 把正的判断为正的数目。
FN: False Negative 把正的错判为负的数目。
FP: False Positive 把负的错判为正的数目。
TN: True Negative 把负的判为负的数目。

P(Precision)查准率,精确率:精确率就是算正样本中有多少是正确的。(简单来说是你预测为正的样本中有多少是正确的) 公式:P=TP/(TP+FP)

R(Recall)查全率,召回率:召回率是所有的正样本中有多少被预测正确了公式:R=TP/(TP+FN)

P , R是一对矛盾的度量,一般一个的值高了,另一个的值就会降低,

F1就是综合P,R公式:F1=2PR/(R+P)

4 效果

  • 在六个广泛使用的IE数据集上,ChatIE通常平均提高18.98%的性能。值得注意的是,与少镜头方法相比,这种提高变得更加显著。
  • 监督学习模型计算密集,需要高质量的标记数据。此外,对于每项任务,都会从头开始训练一个单独的模型。相比之下,ChatIE在没有任何微调和训练来更新参数的情况下工作。它大大减少了计算和时间投入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15034.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OSI模型七层

【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书,通俗易懂,风趣幽默,无广告,忍不住分享一下给大家。(点击查看学习资料) OSI将计算机网络体系结构(architecture)划分为以下七层&#xff…

【时间之外】系统管人,能行?(冷眼旁观连载之三)

这次是这个系列的第三篇。最近一直在搞chatGPT的应用,在写代码这方面,GPT真的很牛,几乎没有它不会的问题,简直比雇了一个高级程序员还好,而且是724小时,永不休息! 回到主题,下面继续…

在群晖中部署VoceChat

一、简介 VoceChat 是一款支持独立部署的个人云社交媒体聊天服务。15MB 的大小可部署在任何的服务器上,部署简单,很少需要维护。前端可以内嵌到自己的网站下,数据完全由用户自己掌握,传输过程加密。VoceChat 从 Slack, Discord, …

Midjourney AI绘画中文教程详解(完整版)模型、命令、参数与各种高级用法

我有一种预感,您一下子看不完这篇内容,您得【收藏】一下,以便下次接着看~~ Midjourney AI绘画中文教程,Midjourney是一款2022年3月面世的AI绘画工具,创始人是David Holz。 只要输入想到的文字,就能通过人…

Midjourney Discord的使用手册

探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南2.Prompts-提示指令3.Explore Prompting-提示指令的探索4.Blend-叠加5.Midjourney Discord的使用手册6.Versions-版本…

ChatGLM-6B 部署与 P-Tuning 微调实战

自从 ChatGPT 爆火以来,树先生一直琢磨想打造一个垂直领域的 LLM 专属模型,但学习文本大模型的技术原理,从头打造一个 LLM 模型难度极大,所以这事儿就一直搁置了。 但最近一个月,开源文本大模型如雨后春笋般接踵而至&…

chatgpt赋能python:Python如何打开Word文档?

Python 如何打开 Word 文档? Python 是一种强大的编程语言,可以帮助我们完成各种重复性工作,其中包括自动化文件的处理。在这篇文章中,我们将学习如何使用 Python 打开 Word 文档。本文将介绍三种不同的方式:使用 Pyt…

chatgpt赋能python:Python创建Word文档指南

Python创建Word文档指南 在今天的数字时代,Word文档仍然是最常见和使用的文档类型之一。Python是一个强大的编程语言,可以用于自动化创建各种类型的文档,包括Word文档。在本篇文章中,我们将介绍如何使用Python创建Word文档&#…

奇舞周刊第486期:ChatGPT 的狂飙之路

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ ChatGPT 的狂飙之路 最近随着 ChatGPT 爆火出圈,网络上各种关于 ChatGPT 的争论声也不断;有些人把它当成一个更高级的聊天机器人,有人兴奋地看到…

ChatGPT 如何应用于决策?Rationale 带你狂飙!

ChatGPT 回答多领域问题的能力之强悍,引发了全球关注。许多人将 ChatGPT 视为对话式 AI 或生成式 AI 发展史上的一个重要里程碑。从 ChatGPT 本身的生产力来看,它可以帮助人们完成很多事,比如写项目申报书、写股票查询代码,甚至写…

Nature | 奇病毒(Mirusviruses)将疱疹病毒与巨型病毒联系起来

奇病毒(Mirusviruses)将疱疹病毒与巨型病毒联系起来 Mirusviruses link herpesviruses to giant viruses 翻译:周之超UW-Madison Article,2023-4-19,Nature,[IF 69.504] DOI:10.1038/s41586-023…

HOG特征

01 什么是HOG特征 1.1 HOG特征简介 我们先来从字面入手分析一下HOG特征的名字。 HOG特征是图像的一种特征,图像的特征其实就是图像中某个区域的像素点在经过某种四则运算后所得到的结果。 它可以是一个具体的数值,可以是一个向量,可以是…

chatgpt赋能Python-python_span_抓取

介绍 随着互联网的不断发展,SEO(搜索引擎优化)已成为所有网站主人必须面对的问题。在SEO中,抓取是一个非常重要的环节,也是一个关键性的步骤,它直接影响到网站的排名。 在Python编程中,有很多…

chatgpt赋能python:Python获取微信群内聊天信息

Python获取微信群内聊天信息 微信是目前国内最受欢迎的即时通讯软件之一,它拥有着亿万用户。而微信群作为微信的一个重要功能,也是吸引了大量用户加入到其中的一个社交方式。但是,随着微信用户数量的增多,大量的聊天信息也会产生…

最容易被ChatGPT抢饭碗的科学家,竟然真的是数学家???

可用于 ChatGPT 的 11 个插件。图片来源:OpenAI 撰文 杜若云 编辑 吴兰、魏潇 北京时间 3 月 23 日,OpenAI 发布了第一批可接入 ChatGPT 的插件。这些插件由 11 个第三方提供,同时 OpenAI 官方也提供了两个官方插件 Browsing 和 Code Interpr…

80%白领危了!OpenAI发布GPT时代就业秘笈:34大铁饭碗保命

【导读】GPT-4发布没几天,OpenAI直接告诉所有人,GPTs是通用技术,80%的美国人的工作受到影响。想要保命,且看这34大「铁饭碗」。 前脚刚推出GPT-4,OpenAI后脚就发布了35页论文官宣: 80%的美国人&#xff0c…

字节正在内部测试对话类 AI 项目;Deepmind 推出新系统革新排序算法;ChatGPT iOS 应用更新|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

自学了Python半年后,发现,这3本书能让你少走一半弯路!

Time will tell. 我是在疫情期间去开始接触Python的,唯一的一点代码基础就是在校时学的那一点皮毛。但在我这半年多的自学时间里,我发现它越来越有意思,Python是非常友好并且易于学习的! 它几乎可以做任何事,从简单的脚本创建、web 、到数据可视化以及 AI 人工智能,越来…

2022,AIGC元年?

文|世昕 编|石灿 2022年12月16日,Science杂志发布了2022年度科学十大突破,韦伯望远镜当选为年度最大科学突破,可谓实至名归。而在其他入选的科学突破中,AIGC也赫然在列。 这或许是当下最炙手可热的概念了。…

专业、简单、稳定,融云重新定义互联网通信云服务

艾瑞咨询《2023 年全球互联网通信云行业研究报告》(下简称《报告》)显示,79.1% 的开发者计划或已经出海,其中已将应用推到海外的开发者占比 43%。关注【融云全球互联网通信云】了解更多 后台回复【报告】获取完整版 消费群体成长…