大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
本文主要介绍了使用ltp进行三元组提取的实战代码,希望对学习三元组提取的同学们有所帮助。需要说明的是,ltp进行三元组提取不需要数据标注,效果并非特别好,可作为baseline进行使用。
文章目录
- 1. 前言
- 2. 安装方法
- 3. 实战代码
- 3.1 提取三元组
- 3.2 根据三元组重构文本
1. 前言
由于近期要开启一个新课题,课题中的子任务之一为三元组抽取。为了更好的与后续算法进行比较,所以需要先构建三元组提取的baseline代码。根据调研和实践比较,最终采用了哈工大的ltp进行三元组抽取,抽取实例如下所示:
2. 安装方法
安装方法比较简单,可使用pip命令进行安装,安装命令和截图如