【赛道介绍】
法律科技创新大赛以人工智能、大数据等技术为基础,拓展政法工作现代化中的创新应用,加强科学的方法论和先进的技术手段与传统政法业务的融合,搭建法律科技领域思想、技术、应用的交流实践平台,助推法律科技产业人才培养,推动构建智慧司法能力,助力数字法治建设发展。
大赛始终坚持并且鼓励将科技创新与法律服务深度融合,鼓励原始创新,充分体现人工智能和大数据技术在法律行业中的实际应用。大赛突破关键技术,以公开裁判文书为基础数据,为参赛者提供云算力平台进行实际模型运算,促进实战应用。
【报名要求】
1、报名方式 使用移动云账号登录大赛官网,点击大赛页面上方“我要参赛”按钮进行报名,提交作品时需完成实名认证(点击”右上角-账号中心-实名认证),每人仅可报名一个赛道。(如有疑问请查看:资料下载 - 移动云杯大赛报名流程手册)
2、参赛对象:高校在校学生,包括本科、研究生等。
1)参赛团队可由1-5人组成
2)每位选手只能参加1支队伍
3)每个团队可有1位指导老师(指导老师不计入团队人数)
3、参赛形式
1)参赛团队必须完全基于大赛提供的数据完成竞赛作品。
2)参赛作品应为未经发表的原创作品,具有一定的创新性和独特性。
3)获取排名的团队,需参加现场或线上路演答辩。
4)所有参赛相关的提交材料均不予退还。主办方有权将参赛作品及相关信息用于制作纸质、音频、视频等形式的宣传品和出版物(传播途径包括互联网),以及举办展览展示活动(展览展示途径包括互联网)等。
4、资源获取方式:
使用移动云互联网账户通过互联网免费试用政策获取资源。
【赛程安排】
说明:比赛赛程安排若调整,将通过大赛官网、交流群、邮件等途径通知。
【奖项设置】
1、赛道奖项设置如下
一等奖:1支队伍
二等奖:2支队伍
三等奖:3支队伍
注:获奖团队成员可推荐至华宇、中国移动云能力中心等校园招聘/实习生招聘绿色通道
2、赛道前三名团队入围全国总决赛;其中高校赛道的法律科技创新子赛道(3支)、”软件杯“直推子赛道(3支)、算网调度应用子赛道(3支)、九天应用子赛道(3支)等四个子赛道12支队伍进行全国总决赛。
全国总决赛奖项设置如下:
一等奖:1支队伍
二等奖:3支队伍
三等奖:8支队伍
【赛题介绍】
比赛题目:法律文书中的敏感关系识别
题目背景:
信息抽取是自然语言处理的基础任务之一,信息抽取可以辅助司法办案人员高效阅卷、快速厘清案件信息,同时也可以为知识图谱构建、相似案例推荐、自动量刑建议等法律智能技术提供研究基础。
比赛任务:
本次任务聚焦法律文本中的敏感人物关系抽取,其中实体类型为涉案人物,参赛队伍需要识别出文本中的实体关系三元组,并按照规定格式返回结果。例如文本“5、证人王某乙(王某甲之子)证言”,参赛队伍需要利用模型和算法,对输入文本进行分析,识别其中包含的实体(“王某乙”和“王某甲”),同时判断人名实体之间的关系类别:亲子女。
赛题说明:
为降低比赛难度,比赛任务中人名识别功能参赛选手可调用移动九天的命名实体识别或使用开源实现;关系识别功能需自己实现。参赛选手提交的模型应包含所有功能模块,不允许通过网络调用其他外部服务,否则视为违规并取消比赛成绩。
数据说明:
本任务所使用的数据集来自于裁判文书网公开的裁判文书。
`label.txt`为标签文件,每行是一个关系类别
`train.txt`为训练集,包含若干条数据,每条数据的字段信息如下:
`ID`: 代表该条数据的ID
`sentence`: 裁判文书中的句子内容
`relation`: 本条数据中实体对之间的关系
`head`: 句子中的第一个实体
`name`: 实体内容
`pos`:列表,实体在句子中的索引
`tail`: 句子中的第二个实体
`name`: 实体内容
`pos`:列表,实体在句子中的索引
最终测试集中不包含 `relation`,`head`,`tail`字段,选手根据 `sentence`预测实体对和实体对应的关系字段。
数据样例:
{"sentence": "同事周某和蒋宗志将伍刚鼎重新控制后,才将其带离现场","head": {"name": "周某", "pos": [2, 4]},"tail": {"name": "蒋宗志", "pos": [5, 8]},"relation": "同事", "id": "9957b9fc-2481-4df4-ac47-0588eb6ddec5"
}
Baseline说明:
我们提供了基于text-cnn的baseline模型,代码及使用方式在baseline文件夹。
【作品提交】
你需要将所有的代码压缩为一个 `zip`文件进行提交,该 `zip`文件内部形式可以参看 `main.zip`。该 `zip`文件内部顶层必须包含 `main.py`,为运行的入口程序,我们会在该目录下使用 `python3 main.py`来运行你的程序。
在代码中需要实现以下内容:
① 读取测试集数据`../judge/input/test_null.json`。该数据的格式与下发的训练数据格式完全一致。
② 将测试集预测结果输出到`../judge/output/result.json`中,与训练集数据格式保持一致,需要包含句子id,原始sentence字段,对应的实体以及关系类别。如果两个实体之间无关系,则不需要输出包含无关系的整行数据;如果一个句子存在多组关系,则输出多行数据(格式详见 `baseline/output/result_sample.json`)。以上为代码中你需要实现的内容,你可以利用 `main `下的文件进行进一步参考。请注意,在加载模型的时候请尽量使用相对路径。
【评审维度】
赛道最终得分排名由初赛、决赛两轮成绩组成,总分 = 初赛开放测试得分* 0.3 + 初赛封闭测试得分 * 0.5 + 决赛路演得分 * 0.2
1、初赛评分办法
初赛分为开放测试和封闭测试两部分,选手线上提交程序或模型,运行完毕后评测系统自动计算结果。
1)开放测试:选手上传模型,平台自动调用模型对测试集1进行预测并打分,选手可以实时看到评测得分,开放测试得分以关闭上传通道前最后一次上传模型的评分为准;
2)封闭测试:开放测试结束后进入封闭测试阶段,平台自动调用选手最后一次提交的模型对测试集2进行预测并打分,公布初赛阶段测试排行榜得分。
2、初赛评分标准
本任务以提取出的实体关系三元组为单位,采用微平均F1值(Micro-F1-measure)作为评价指标。
3、决赛答辩评审
参加决赛的团队将进行路演答辩,决赛评价标准主要包括成果的创新性、算法模型的效果、数据的利用程度、现场表现等维度。最终成绩将结合初赛成绩及决赛答辩成绩进行综合排名。如不能参加答辩,则视为放弃比赛,决赛资格将按照复赛排名顺延。
4、总决赛答辩评审维度
1)创新价值
解决问题的思路和方法是否有创新点。
2)商业价值
能够创造市场效益,具备广阔市场前景。
3)行业前景
是否符合行业现状,解决行业需求和痛点。
4)功能完整性
核心功能可用,具备客观可行性。
5)产品交互性
逻辑流程顺畅,用户体验佳。
6)移动云产品能力试用情况
移动云产品能力运用的合理性,以及紧密度。
7)附加分
A作品跟赛题关联性大,从“算力网络”、“东数西算”大方向出发,并有较好的立意。
B具有“算网络调度策略”、“流量引流策略”、“算力资源同步策略”、“网络资源同步策略”等算网基本策略的设计或实现构思,具有“算网大脑”统一编排和调度的设计或实现构思。
【赛事交流】
1、大赛过程中如有任何疑问,可通过大赛官方交流群咨询。群里会不定时公布赛事重要通知、获奖名单、培训信息等内容。请务必添加。( QQ群:1135854564)
2、大赛过程中如有其它问题,请联系邮箱:marketing@thunisoft.com。
【组织单位】
主办单位:北京华宇软件股份有限公司、清华大学互联网司法研究院、中国移动通信集团有限公司
承办单位:北京华宇信息技术有限公司、北京华宇元典信息服务有限公司、中国移动云能力中心、中国移动通信集团江苏有限公司
【违规处理】
参赛项目必须真实、健康、合法,如发现以下违规情况,大赛组委会有权取消参赛者或参赛队伍的参赛资格:
1、参赛报名信息作弊或造假;
2、涉嫌抄袭或侵犯他人知识产权的行为,直接套用开源代码等行为;
3、在参赛过程中出现违反相关法律、法规、政策规定以及移动云官网相关规则的行为;
4、提交的作品涉及不健康或毁谤第三方的内容;
5、使用第三方AI软件(如ChatGPT等);
6、在比赛过程中发现或者被举报认定存在的其他违规行为。
【申诉与仲裁】
1、 参赛队伍或选手对不符合大赛规定的设备、工具和软件,有失公正的评判和奖励以及工作人员的违规行为等,均可向大赛组委会提出申诉。大赛组委会负责受理比赛中提出的申诉并进行调解仲裁,以保证大赛的顺利进行和大赛结果的公平公正。大赛组委会作出的仲裁结果为终局决定。
2、申诉报告应明确申诉内容并提供相关证据,要求必须实名申诉,否则申诉将不予以受理。
3、大赛组委会将在收到申诉报告之日起5个工作日内予以受理,并认真审核和处理。
【其他】
1、在大赛举办过程中,竞赛规程可能会有少量的变更和调整,所有内容均以大赛官网为准。
2、赛事全程将会摄影录像;参赛作品将用于移动云开发者社区官网展示及宣传使用。
3、本竞赛规程的最终解释权归“法律科技创新大赛”组织委员会所有。
赛事详情咨询: