brat事件标注平台使用教程

事件图谱首先涉及到的是事件标注,我采用的是brat事件标注平台,该平台使用的是Linux系统,因为我的电脑是windows系统, 将brat安装在了linux虚拟机(Ubuntu)上。

一.下载与安装

1.下载brat
进入brat官网brat rapid annotation tool下载安装包,点击download的按钮即可。因为我当时是在windows上下载的,所以又下载了FileZilla将压缩包从Windows上传到虚拟机中。(注意:brat一切操作都是在Linux系统上的。)

2:更新apt

sudo apt upgrade
sudo apt update

3:安装git

sudo apt install git

4.安装apache2

sudo apt install apache2

5.在主目录下新建一个datalabeling的文件夹,将压缩包安装到这里,在终端解压缩。

tar xzf brat-1.3p1_.tar.gz

进入brat-1.3p1文件夹,输入命令进行安装

./install.sh

接下来需要输入登录名,密码,邮箱。登录名和密码是之后登录brat所需要的

如果之前虚拟机上有安装python2的话可以直接输入以下命令

python2 standalone.py

如果没有安装python2的话,需要安装一下,再输入上面的命令

之后就可以运行啦,显示Serving brat at http://127.0.0.1:8001

右键点击上链接,选择打开链接,就可以开始标注了(Ubuntu默认的浏览器是火狐浏览器,但是官方推荐Google chrome,所以最好还是先下载一个Google chrome)

6.因为brat默认不支持中文标注,因此需手动修改brat主目录**/server/src路径下的projectconfig.py**文件的第162行代码

sudo vim /var/www/html/brat/server/src/projectconfig.py

(可能会报错,可以把上面命令的vim改成vi)
将其改为:

# n  = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

二、标注

先登录用户名和密码,也即之前在终端安装时设置的用户名和密码。

1.根据标注需求,按照句子/段落/篇章整理成文件,每个文件为一个样本,所有样本整合到一个文件夹下,再将该文件夹置于 Brat 安装路径下的 data 目录下。

注意:文本编码格式为utf-8,文件名称为xxx.txt,其中xxx只能为数字或英文

添加标注文本,在brat-v1.3p1/data文件夹下添加标注的文本,然后在brat-v1.3p1目录下执行以下命令就会生成和标注文本文件名相同文件后缀为.ann的文件,这个文件保存了标注结果。每个样本文件必须有一个与之对应的空的ann文件,主要用于存放标注后自动生成的标注结果。若没有ann文件,那么当你在页面点击相应文件时是无法打开的。

brat-v1.3p1目录下执行命令

find data -name '*.txt' | sed -e 's|\.txt|.ann|g' | xargs touch

2、配置实体、事件、关系

首先,我们需要明确:

  • 所要标注的事件有哪些,即明确事件类型;

  • 每个事件的结构如何,即明确每个事件类型下的事件元素/论元(角色);

  • 每个事件元素可以属于哪些实体类型;

  • 每个事件元素是必须有,还是可以有可以无,或者有几个。

在以上内容明确以后,再进行配置文件的配置。

这里需要解释一点,就是按照标准事件抽取任务定义来说,事件的元素都是实体,所以我们必须明确每个事件类型下的每一个元素可以属于哪些实体类型。

annotation.conf 配置文件放于相应数据文件夹下。

如何配置具体内容可参考https://blog.csdn.net/fengdu78/article/details/126552709

3、brat支持标注实体、关系、事件、属性,把brat-v1.3p1目录下annotation.conf中对应的地方改成你要标注的即可,如果想要在标注页面显示成中文,则需要修改相同目录下的visual.conf。

注:visual.conf和annotation.conf是对应的,annotation.conf中所涉及到的实体、事件、论元角色,都需要在visual.conf中配置中文名称,否则标注时出现的还是英文名称。

4、打开我们想要标注的文件,光标选择某个实体,会弹出一个选择框,选择之前设置好的实体类型即可。光标选择某个触发词,会弹出一个选择框,选择之前设置好的事件类型即可。双击这个实体或触发词可删除或移动。

长按某个触发词会出现一个箭头,可指向某个实体。(这一步在annotation.conf中的事件配置部分设置,配置好这个事件中需要的实体,从这个事件触发词出来的箭头才能指向这个实体。)

如果在标注过程中,annotation.conf文件有修改(记得修改完保存),点击页面上方的刷新,标注界面即可实时更新。

参考:
1、(16条消息) 【NLP】NLP标注工具Brat的简单使用_风度78的博客-CSDN博客

2、(16条消息) 保姆级brat标注工具部署_dl_None的博客-CSDN博客_brat部署

3、(16条消息) 文本标注工具之BRAT_brat标注_发呆的比目鱼的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65122.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 成近期顶流团队?如何使用 OpenAI 和 Node.js 构建 AI 图像生成器?

摘要: 12月7号&#xff0c;知名人工智能研究机构 Open AI 在Youtub上发布视频介绍使用OpenAI 和 DALL-E 模型创建一个网络应用程序&#xff0c;该应用程序将根据输入的文本从头开始生成图像。https://www.youtube.com/watch?vfU4o_BKaUZE 前言&#x1f496; 大家好&#xff0…

AI 自动写代码插件 Copilot(副驾驶员)

AI 自动写代码插件 Copilot 提示&#xff1a;Copilot单词直译过来就是副驾驶员的意思。 介绍&#xff1a;本质上就是基于GitHub开源的亿级别的代码&#xff0c;训练AI模型&#xff0c;自动生成代码。 就是数据量(GitHub的数据量就很大&#xff01;)能够决定你AI模型精度的上…

软件测试中的AI——运用AI编写测试用例

文章目录 一、现状二、测试技术可结合AI的几个方向三、尝试使用AI编写测试用例&#xff08;实验过程&#xff09;1、AI联系上下文的能力弱2、回答的内容类似于能在网上搜索到的内容3、需要有一个明确的指令4、输出内容有限5、无法想象到需求描述之外的内容 四、总结&#xff1a…

AI热度降温?揭秘加德纳技术成熟度曲线与AI发展阶段

一文解决你所有对 AI 的焦虑 近期&#xff0c;我们发现ChatGPT的热度似乎不如前几个月。许多人尝试了这个技术&#xff0c;觉得它非常强大&#xff0c;但似乎与自己的日常生活和工作关系不大&#xff0c;因此逐渐失去了兴趣。 然而&#xff0c;这实际上是技术发展的正常周期&…

王炸赚钱组合!!ChatGPT + AI大模型

“ 你近期有体验过哪些大模型产品呢&#xff1f; 你有使用大模型API做过一些实际开发吗&#xff1f; 在你日常开发中&#xff0c;可以与大模型相关应用结合来完成工作吗&#xff1f; ” 从去年底开始&#xff0c;大模型的发展趋势就非常迅猛&#xff0c;这也代表着人工智能进入…

ChatGPT + AI大模型 = 王炸!!!

“ 你近期有体验过哪些大模型产品呢&#xff1f; 你有使用大模型API做过一些实际开发吗&#xff1f; 在你日常开发中&#xff0c;可以与大模型相关应用结合来完成工作吗&#xff1f; ” 从去年底开始&#xff0c;大模型的发展趋势就非常迅猛&#xff0c;这也代表着人工智能进入…

ChatGPT+低代码,好用到飞起?

ChatGPT 凭借短短 2 个月&#xff0c;月活用户突破 1 亿&#xff0c;成为史上用户增长速度最快的消费级应用程序。ChatGPT 的爆火&#xff0c;在全球范围内掀起了一场关于 AI 技术革命的狂潮&#xff0c;AIGC 也迅速成为科技圈最火赛道。 更有国际咨询机构预测&#xff0c;203…

信用卡兴趣人群洞察报告.pdf

男性用户对信用卡的关注度显著高于女性 信用卡兴趣人群年龄集中在24-40岁,与主流消费人群相吻合。41岁以上人群信用卡关注度明显滑落 深广信用卡关注度最高,占据前四名知州、西安等中西部城市占据前十名中半数名额 信用卡兴趣人群高度集中于iPhone手机,其次分别为三星、魅族…

关于程序员的调查报告

最近Stack Overflow发布一份开发者调查报告&#xff0c;内容涵盖了开发人员最喜欢的技术到工作偏好等等各种问题。下面小编就带大家一起来看一看。 NO.1 最常用的的编程语言&#xff1a; 我们发现Python的使用度今年超过了Java&#xff0c;Python的势头有点猛啊&#xff01;&am…

c语言进行数据统计分析的研究报告,统计分析报告范文

统计分析报告范文 大家都知道&#xff0c;统计分析的写作是为了制作统计分析文章。在统计部门&#xff0c;统计分析文章则称为统计分析报告。下面是一篇统计分析报告范文&#xff0c;欢迎阅读! 统计分析报告范文 【目录】 一.引言 二.研究目的 三.数据分析 I.对能源生产及构成的…

论文阅读报告

0 2022/6/23-2022/6/25 1. FLAME: Taming Backdoors in Federated Learning 1.1 本文的贡献 我们提出了FLAME&#xff0c;这是一种针对FL中后门攻击的防御框架&#xff0c;能够消除后门而不影响聚合模型的良性性能。与早期的后门防御相反&#xff0c;FLAME适用于一般对手模型…

「市场调研」简说

1. 外部因素评价矩阵EFE EFE矩阵可以帮助战略制定者归纳和评价经济、社会、文化、人口、环境、政治、政府、法律、技术以及竞争等方面的信息。 建立EFE矩阵的五个步骤如下&#xff1a;  1&#xff09; 列出在外部分析过程中所确认的外部因素&#xff0c;包括影响企业和其所…

《用图表说话》读后感

《用图表说话&#xff1a;麦肯锡商务沟通完全工具箱&#xff08;珍藏版&#xff09;》在我的必读清单里&#xff0c;推荐过很多次&#xff0c;也是之前送书活动中的书目&#xff0c;今天就来总结一下这本书到底讲了个啥。&#xff08;知识图谱在文末&#xff0c;想要高清图片可…

微信读书产品调研报告

在信息爆炸时代,还是有一些人通过阅读书籍的方式静下心思考,静心提升自己的。而电子阅读产品也是互联网时代下的特色与产物,在竞争激励的电子阅读产品市场中,微信读书也正凭借着高质量的产品设计赢取用户的称赞与信赖。 微信读书产品调研报告 产品名称:微信读书 产品版…

哪里下载全部股票历史数据?下载全部股票历史数据怎么下?

4000只个股所有股票的历史数据&#xff0c;500个指数的全部历史数据&#xff0c;已经打包好了&#xff0c;而且可以随时下载最近一个交易日的全部股票历史数据&#xff0c;一个在线下载的工具 只要两步就能下载&#xff1a; 填股市代码、邮箱5分钟后收到股市历史数据Excel 放…

如何下载股票历史数据?

如何下载股票历史数据?发现一个可以在线批量下载股票历史数据的的工具&#xff0c;相比那些套路收费的&#xff0c;起码批量在线下载历史数据的Excel是真的&#xff0c;免费很关键… 只要两步就能下载&#xff1a; 填股市代码、邮箱5分钟后收到股市历史数据Excel 放在公主号…

股票历史走势的比较及显示

本文总结一下以前参加的一个股票分析软件的子项目&#xff08;仅放了部分代码&#xff09;&#xff0c;项目用QT实现的&#xff0c;股票历史数据存储在excel文件中。 子项目的目标是根据提供的股票历史数据查找与近期股票数据相似的时间段&#xff0c;并根据历史数据对走势进行…

股票数据下载-如何下载股票历史行情数据?

股票数据是研究和分析行情的基础&#xff0c;不管是量化分析还是数据对比&#xff0c;股票数据都是最基础的部分。之前各个炒股软件基本都有下载股票数据的功能&#xff0c;但是后来就取消或者加了限制了。 只要两步就能下载&#xff1a; 填股票代码、邮箱收到股票历史数据…

股票历史数据-股票历史数据下载

股票历史数据-股票历史数据下载 共享一个股票历史数据下载系统工具&#xff0c;可以在线下载股票历史数据&#xff0c;下载股票历史数据是&#xff1a;A股所有股票从成立到最近一天的所有股票历史数据&#xff0c;亲测手机在线就能下载a股股票历史数据 亲测获取步骤&#xf…

A股全市场股票历史行情低频日频EOD数据

A股市场全部历史日频数据每日盘后更新 数据源 本文中的日频数据源来自恒生&#xff0c;包括前后复权和无复权行情&#xff0c;数据分股票代码压缩&#xff0c;每日盘后更新上传网盘 共享网盘链接与详情 全A股票前复权历史行情数据&#xff1a; 链接&#xff1a;https://pa…