揭秘 “移动云杯”高校赛道——法律科技创新子赛道

【赛道介绍】

法律科技创新大赛以人工智能、大数据等技术为基础，拓展政法工作现代化中的创新应用，加强科学的方法论和先进的技术手段与传统政法业务的融合，搭建法律科技领域思想、技术、应用的交流实践平台，助推法律科技产业人才培养，推动构建智慧司法能力，助力数字法治建设发展。

大赛始终坚持并且鼓励将科技创新与法律服务深度融合，鼓励原始创新，充分体现人工智能和大数据技术在法律行业中的实际应用。大赛突破关键技术，以公开裁判文书为基础数据，为参赛者提供云算力平台进行实际模型运算，促进实战应用。

【报名要求】

1、报名方式使用移动云账号登录大赛官网，点击大赛页面上方“我要参赛”按钮进行报名，提交作品时需完成实名认证（点击”右上角-账号中心-实名认证），每人仅可报名一个赛道。（如有疑问请查看：资料下载 - 移动云杯大赛报名流程手册）

2、参赛对象：高校在校学生，包括本科、研究生等。

1）参赛团队可由1-5人组成

2）每位选手只能参加1支队伍

3）每个团队可有1位指导老师（指导老师不计入团队人数）

3、参赛形式

1）参赛团队必须完全基于大赛提供的数据完成竞赛作品。

2）参赛作品应为未经发表的原创作品，具有一定的创新性和独特性。

3）获取排名的团队，需参加现场或线上路演答辩。

4）所有参赛相关的提交材料均不予退还。主办方有权将参赛作品及相关信息用于制作纸质、音频、视频等形式的宣传品和出版物（传播途径包括互联网），以及举办展览展示活动（展览展示途径包括互联网）等。

4、资源获取方式：

使用移动云互联网账户通过互联网免费试用政策获取资源。

【赛程安排】

说明：比赛赛程安排若调整，将通过大赛官网、交流群、邮件等途径通知。

【奖项设置】

1、赛道奖项设置如下

一等奖：1支队伍

二等奖：2支队伍

三等奖：3支队伍

注：获奖团队成员可推荐至华宇、中国移动云能力中心等校园招聘/实习生招聘绿色通道

2、赛道前三名团队入围全国总决赛；其中高校赛道的法律科技创新子赛道（3支）、”软件杯“直推子赛道（3支）、算网调度应用子赛道（3支）、九天应用子赛道（3支）等四个子赛道12支队伍进行全国总决赛。

全国总决赛奖项设置如下：

一等奖：1支队伍

二等奖：3支队伍

三等奖：8支队伍

【赛题介绍】

比赛题目：法律文书中的敏感关系识别

题目背景：

信息抽取是自然语言处理的基础任务之一，信息抽取可以辅助司法办案人员高效阅卷、快速厘清案件信息，同时也可以为知识图谱构建、相似案例推荐、自动量刑建议等法律智能技术提供研究基础。

比赛任务：

本次任务聚焦法律文本中的敏感人物关系抽取，其中实体类型为涉案人物，参赛队伍需要识别出文本中的实体关系三元组，并按照规定格式返回结果。例如文本“5、证人王某乙（王某甲之子）证言”，参赛队伍需要利用模型和算法，对输入文本进行分析，识别其中包含的实体(“王某乙”和“王某甲”)，同时判断人名实体之间的关系类别：亲子女。

赛题说明：

为降低比赛难度，比赛任务中人名识别功能参赛选手可调用移动九天的命名实体识别或使用开源实现；关系识别功能需自己实现。参赛选手提交的模型应包含所有功能模块，不允许通过网络调用其他外部服务，否则视为违规并取消比赛成绩。

数据说明：

本任务所使用的数据集来自于裁判文书网公开的裁判文书。

`label.txt`为标签文件，每行是一个关系类别

`train.txt`为训练集，包含若干条数据，每条数据的字段信息如下:

`ID`: 代表该条数据的ID
`sentence`: 裁判文书中的句子内容
`relation`: 本条数据中实体对之间的关系
`head`: 句子中的第一个实体
`name`: 实体内容
`pos`：列表，实体在句子中的索引
`tail`: 句子中的第二个实体
`name`: 实体内容
`pos`：列表，实体在句子中的索引

最终测试集中不包含 `relation`,`head`,`tail`字段，选手根据 `sentence`预测实体对和实体对应的关系字段。

数据样例：

{"sentence": "同事周某和蒋宗志将伍刚鼎重新控制后，才将其带离现场","head": {"name": "周某", "pos": [2, 4]},"tail": {"name": "蒋宗志", "pos": [5, 8]},"relation": "同事", "id": "9957b9fc-2481-4df4-ac47-0588eb6ddec5"
}

Baseline说明：

我们提供了基于text-cnn的baseline模型，代码及使用方式在baseline文件夹。

【作品提交】

你需要将所有的代码压缩为一个 `zip`文件进行提交，该 `zip`文件内部形式可以参看 `main.zip`。该 `zip`文件内部顶层必须包含 `main.py`，为运行的入口程序，我们会在该目录下使用 `python3 main.py`来运行你的程序。

在代码中需要实现以下内容：

① 读取测试集数据`../judge/input/test_null.json`。该数据的格式与下发的训练数据格式完全一致。

② 将测试集预测结果输出到`../judge/output/result.json`中，与训练集数据格式保持一致，需要包含句子id，原始sentence字段，对应的实体以及关系类别。如果两个实体之间无关系，则不需要输出包含无关系的整行数据；如果一个句子存在多组关系，则输出多行数据（格式详见 `baseline/output/result_sample.json`）。以上为代码中你需要实现的内容，你可以利用 `main `下的文件进行进一步参考。请注意，在加载模型的时候请尽量使用相对路径。

【评审维度】

赛道最终得分排名由初赛、决赛两轮成绩组成，总分 = 初赛开放测试得分* 0.3 + 初赛封闭测试得分 * 0.5 + 决赛路演得分 * 0.2

1、初赛评分办法

初赛分为开放测试和封闭测试两部分，选手线上提交程序或模型，运行完毕后评测系统自动计算结果。

1）开放测试：选手上传模型，平台自动调用模型对测试集1进行预测并打分，选手可以实时看到评测得分，开放测试得分以关闭上传通道前最后一次上传模型的评分为准；

2）封闭测试：开放测试结束后进入封闭测试阶段，平台自动调用选手最后一次提交的模型对测试集2进行预测并打分，公布初赛阶段测试排行榜得分。

2、初赛评分标准

本任务以提取出的实体关系三元组为单位，采用微平均F1值（Micro-F1-measure）作为评价指标。

3、决赛答辩评审

参加决赛的团队将进行路演答辩，决赛评价标准主要包括成果的创新性、算法模型的效果、数据的利用程度、现场表现等维度。最终成绩将结合初赛成绩及决赛答辩成绩进行综合排名。如不能参加答辩，则视为放弃比赛，决赛资格将按照复赛排名顺延。

4、总决赛答辩评审维度

1）创新价值