揭秘 “移动云杯”高校赛道——法律科技创新子赛道

916582bc1398952ce1cddce5e31af117.gif

【赛道介绍】

法律科技创新大赛以人工智能、大数据等技术为基础,拓展政法工作现代化中的创新应用,加强科学的方法论和先进的技术手段与传统政法业务的融合,搭建法律科技领域思想、技术、应用的交流实践平台,助推法律科技产业人才培养,推动构建智慧司法能力,助力数字法治建设发展。

大赛始终坚持并且鼓励将科技创新与法律服务深度融合,鼓励原始创新,充分体现人工智能和大数据技术在法律行业中的实际应用。大赛突破关键技术,以公开裁判文书为基础数据,为参赛者提供云算力平台进行实际模型运算,促进实战应用。

【报名要求】

1、报名方式 使用移动云账号登录大赛官网,点击大赛页面上方“我要参赛”按钮进行报名,提交作品时需完成实名认证(点击”右上角-账号中心-实名认证),每人仅可报名一个赛道。(如有疑问请查看:资料下载 - 移动云杯大赛报名流程手册)

2、参赛对象:高校在校学生,包括本科、研究生等。

1)参赛团队可由1-5人组成

2)每位选手只能参加1支队伍

3)每个团队可有1位指导老师(指导老师不计入团队人数)

3、参赛形式

1)参赛团队必须完全基于大赛提供的数据完成竞赛作品。

2)参赛作品应为未经发表的原创作品,具有一定的创新性和独特性。

3)获取排名的团队,需参加现场或线上路演答辩。

4)所有参赛相关的提交材料均不予退还。主办方有权将参赛作品及相关信息用于制作纸质、音频、视频等形式的宣传品和出版物(传播途径包括互联网),以及举办展览展示活动(展览展示途径包括互联网)等。

4、资源获取方式:

使用移动云互联网账户通过互联网免费试用政策获取资源。

【赛程安排】

f117f1ca246f05305189bdc47c1ede83.png

说明:比赛赛程安排若调整,将通过大赛官网、交流群、邮件等途径通知。

【奖项设置】

1、赛道奖项设置如下

一等奖:1支队伍

二等奖:2支队伍

三等奖:3支队伍

注:获奖团队成员可推荐至华宇、中国移动云能力中心等校园招聘/实习生招聘绿色通道

2、赛道前三名团队入围全国总决赛;其中高校赛道的法律科技创新子赛道(3支)、”软件杯“直推子赛道(3支)、算网调度应用子赛道(3支)、九天应用子赛道(3支)等四个子赛道12支队伍进行全国总决赛。

全国总决赛奖项设置如下:

一等奖:1支队伍

二等奖:3支队伍

三等奖:8支队伍

【赛题介绍】

比赛题目:法律文书中的敏感关系识别

题目背景:

信息抽取是自然语言处理的基础任务之一,信息抽取可以辅助司法办案人员高效阅卷、快速厘清案件信息,同时也可以为知识图谱构建、相似案例推荐、自动量刑建议等法律智能技术提供研究基础。

比赛任务:

本次任务聚焦法律文本中的敏感人物关系抽取,其中实体类型为涉案人物,参赛队伍需要识别出文本中的实体关系三元组,并按照规定格式返回结果。例如文本“5、证人王某乙(王某甲之子)证言”,参赛队伍需要利用模型和算法,对输入文本进行分析,识别其中包含的实体(“王某乙”和“王某甲”),同时判断人名实体之间的关系类别:亲子女。

赛题说明:

为降低比赛难度,比赛任务中人名识别功能参赛选手可调用移动九天的命名实体识别或使用开源实现;关系识别功能需自己实现。参赛选手提交的模型应包含所有功能模块,不允许通过网络调用其他外部服务,否则视为违规并取消比赛成绩。

数据说明:

本任务所使用的数据集来自于裁判文书网公开的裁判文书。

`label.txt`为标签文件,每行是一个关系类别

`train.txt`为训练集,包含若干条数据,每条数据的字段信息如下:

  •  `ID`: 代表该条数据的ID

  •  `sentence`: 裁判文书中的句子内容

  •  `relation`: 本条数据中实体对之间的关系

  •  `head`: 句子中的第一个实体

  •  `name`: 实体内容

  •  `pos`:列表,实体在句子中的索引

  •  `tail`: 句子中的第二个实体

  •  `name`: 实体内容

  •  `pos`:列表,实体在句子中的索引

最终测试集中不包含 `relation`,`head`,`tail`字段,选手根据 `sentence`预测实体对和实体对应的关系字段。

数据样例:

{"sentence": "同事周某和蒋宗志将伍刚鼎重新控制后,才将其带离现场","head": {"name": "周某", "pos": [2, 4]},"tail": {"name": "蒋宗志", "pos": [5, 8]},"relation": "同事", "id": "9957b9fc-2481-4df4-ac47-0588eb6ddec5"
}

Baseline说明:

我们提供了基于text-cnn的baseline模型,代码及使用方式在baseline文件夹。

【作品提交】

你需要将所有的代码压缩为一个 `zip`文件进行提交,该 `zip`文件内部形式可以参看 `main.zip`。该 `zip`文件内部顶层必须包含 `main.py`,为运行的入口程序,我们会在该目录下使用 `python3 main.py`来运行你的程序。

在代码中需要实现以下内容:

① 读取测试集数据`../judge/input/test_null.json`。该数据的格式与下发的训练数据格式完全一致。

② 将测试集预测结果输出到`../judge/output/result.json`中,与训练集数据格式保持一致,需要包含句子id,原始sentence字段,对应的实体以及关系类别。如果两个实体之间无关系,则不需要输出包含无关系的整行数据;如果一个句子存在多组关系,则输出多行数据(格式详见 `baseline/output/result_sample.json`)。以上为代码中你需要实现的内容,你可以利用 `main `下的文件进行进一步参考。请注意,在加载模型的时候请尽量使用相对路径。

【评审维度】

赛道最终得分排名由初赛、决赛两轮成绩组成,总分 = 初赛开放测试得分* 0.3 + 初赛封闭测试得分 * 0.5 + 决赛路演得分 * 0.2

1、初赛评分办法

初赛分为开放测试和封闭测试两部分,选手线上提交程序或模型,运行完毕后评测系统自动计算结果。

1)开放测试:选手上传模型,平台自动调用模型对测试集1进行预测并打分,选手可以实时看到评测得分,开放测试得分以关闭上传通道前最后一次上传模型的评分为准;

2)封闭测试:开放测试结束后进入封闭测试阶段,平台自动调用选手最后一次提交的模型对测试集2进行预测并打分,公布初赛阶段测试排行榜得分。

2、初赛评分标准

本任务以提取出的实体关系三元组为单位,采用微平均F1值(Micro-F1-measure)作为评价指标。

3、决赛答辩评审

参加决赛的团队将进行路演答辩,决赛评价标准主要包括成果的创新性、算法模型的效果、数据的利用程度、现场表现等维度。最终成绩将结合初赛成绩及决赛答辩成绩进行综合排名。如不能参加答辩,则视为放弃比赛,决赛资格将按照复赛排名顺延。

4、总决赛答辩评审维度

1)创新价值

解决问题的思路和方法是否有创新点。

2)商业价值

能够创造市场效益,具备广阔市场前景。

3)行业前景

是否符合行业现状,解决行业需求和痛点。

4)功能完整性

核心功能可用,具备客观可行性。

5)产品交互性

逻辑流程顺畅,用户体验佳。

6)移动云产品能力试用情况

移动云产品能力运用的合理性,以及紧密度。

7)附加分

A作品跟赛题关联性大,从“算力网络”、“东数西算”大方向出发,并有较好的立意。

B具有“算网络调度策略”、“流量引流策略”、“算力资源同步策略”、“网络资源同步策略”等算网基本策略的设计或实现构思,具有“算网大脑”统一编排和调度的设计或实现构思。

【赛事交流】

1、大赛过程中如有任何疑问,可通过大赛官方交流群咨询。群里会不定时公布赛事重要通知、获奖名单、培训信息等内容。请务必添加。( QQ群:1135854564)

2、大赛过程中如有其它问题,请联系邮箱:marketing@thunisoft.com。

【组织单位】

主办单位:北京华宇软件股份有限公司、清华大学互联网司法研究院、中国移动通信集团有限公司

承办单位:北京华宇信息技术有限公司、北京华宇元典信息服务有限公司、中国移动云能力中心、中国移动通信集团江苏有限公司

【违规处理】

参赛项目必须真实、健康、合法,如发现以下违规情况,大赛组委会有权取消参赛者或参赛队伍的参赛资格:

1、参赛报名信息作弊或造假;

2、涉嫌抄袭或侵犯他人知识产权的行为,直接套用开源代码等行为;

3、在参赛过程中出现违反相关法律、法规、政策规定以及移动云官网相关规则的行为;

4、提交的作品涉及不健康或毁谤第三方的内容;

5、使用第三方AI软件(如ChatGPT等);

6、在比赛过程中发现或者被举报认定存在的其他违规行为。

【申诉与仲裁】

1、 参赛队伍或选手对不符合大赛规定的设备、工具和软件,有失公正的评判和奖励以及工作人员的违规行为等,均可向大赛组委会提出申诉。大赛组委会负责受理比赛中提出的申诉并进行调解仲裁,以保证大赛的顺利进行和大赛结果的公平公正。大赛组委会作出的仲裁结果为终局决定。

2、申诉报告应明确申诉内容并提供相关证据,要求必须实名申诉,否则申诉将不予以受理。

3、大赛组委会将在收到申诉报告之日起5个工作日内予以受理,并认真审核和处理。

【其他】

1、在大赛举办过程中,竞赛规程可能会有少量的变更和调整,所有内容均以大赛官网为准。

2、赛事全程将会摄影录像;参赛作品将用于移动云开发者社区官网展示及宣传使用。

3、本竞赛规程的最终解释权归“法律科技创新大赛”组织委员会所有。

赛事详情咨询:

896eba854d07e24f0e1c456c351ae463.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20690.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

资源分享(nlp、kaggle、pytorch、datawhale)

文章目录 一、.机器学习、深度学习库、优秀课程1.1 资源库1.2 优秀课程1.3 优秀作者、公众号 二、NLP相关2.1 NLP相关2.2 transformer资源2.3 Hugging Face:2.4 其它文章 三、CV相关四、数据挖掘4.1 pandas、sns工具类 五、kaggle赛事5.1 NLP赛事 六、 其它赛事&…

chatgpt赋能python:自动填表程序:让烦人的表格填写工作自动化

自动填表程序:让烦人的表格填写工作自动化 随着互联网的发展,填写表格已经成为我们日常生活和工作中不可避免的一部分。不管是在线申请、调查问卷还是财务报表,表格的填写让人感到烦恼而且耗费时间。为了解决填表的烦恼,python的…

chatgpt赋能python:Python如何自动发邮件

Python 如何自动发邮件 Python 是世界上最受欢迎的编程语言之一,Python 可以实现各种各样的功能,自动化发邮件也是其中之一。本文将介绍 Python 的邮件发送库和如何自动发送邮件,希望能为读者提供帮助。 为什么要自动发邮件? 自…

Python某地区二手房房价数据分析

房价数据分析 数据简单清洗 data.csv 数据显示 # 导入模块 import pandas as pd # 导入数据统计模块 import matplotlib # 导入图表模块 import matplotlib.pyplot as plt # 导入绘图模块# 避免中文乱码 matplotlib.rcParams[font.sans-serif] [SimHei] # 设置字体为…

house_price(房价预测)

最近在阅读一些AI项目,写入markdown,持续更新,算是之后也能回想起做法 项目 https://github.com/calssion/Fun_AI Kaggle--House Prices: Advanced Regression Techniques Kaggle address(网址):https://www.kaggle.com/c/house…

kaggle房价预测

通过前面的学习,实战一个房价预测项目,kaggle房价预测,该数据集涵盖了2006-2010年期间亚利桑那州埃姆斯市的房价,包含了很多特征。 导入所需的包 %matplotlib inline import pandas as pd import torch import numpy as np from…

Pandas与ChatGPT的超强结合,爆赞!

来自公众号:数据STUDIO Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。 在人工智能领域,Pandas经常用于机器学习和深…

一个浏览器插件畅享Chat GPT,还有更多实用小组件、高清壁纸

即使chatGPT已经火爆了一段时间了,但它仍然是目前备受关注的话题。而在国内使用需要一定的成本,许多人甚至根本找不到注册的办法,因此也衍生了不少代注册服务。但其实国内也有不少可以体验和chatGPT几乎同样服务的办法,这篇文章就…

docker一键部署网址导航+博客+管理系统(强势开源)

花森门户 码云仓库地址:https://gitee.com/HuaSenJioJio/huasenjio-compose Github仓库地址:https://github.com/huasenjio/huasenjio-compose 📌 关于 花森系列网站增添新作品,(huasenjio-compose)官方仓…

【LLMs】关于LLMs的语义搜索

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

AI_Papers:第一期

2023.02.06—2023.02.12 文摘词云 Top Papers Subjects: cs.CL 1.Multimodal Chain-of-Thought Reasoning in Language Models 标题:语言模型中的多模式思维链推理 作者:Zhuosheng Zhang, Aston Zhang, Mu Li, Hai Zhao, George Karypis, Alex Sm…

基于ChatGPT用AI实现自然对话

1.概述 ChatGPT是当前自然语言处理领域的重要进展之一,通过预训练和微调的方式,ChatGPT可以生成高质量的文本,可应用于多种场景,如智能客服、聊天机器人、语音助手等。本文将详细介绍ChatGPT的原理、实战演练和流程图&#xff0c…

怎样用一周时间研究 ChatGPT

我是怎样用一周时间研究 ChatGPT 的? 上周大概开了 20 多个会,其中有一些是见了觉得今年可能会比较活跃出手的机构,其余见的绝大多数是和 ChatGPT 相关。 我后面就以 ChatGPT 为例,讲下我是如何快速一周 cover 一个赛道的&#x…

走进机器学习

作者简介:本人是一名大二学生,就读于人工智能专业,学习过c,c,java,python,Mysql等编程知识,现在致力于学习人工智能方面的知识,感谢CSDN让我们相遇,我也会致力…

Spring 20年:缔造Java领域神话,近90% Java程序员形影不离

题图 | Image by Freepik 摘要:在编程世界,代码耦合性高、复杂性大的问题一直折磨着所有开发人员。为了解决这个问题,程序员前仆后继开发出了各种框架。但是没有一个特别能打、且让大部分程序员拍手称快的框架诞生。直到有一位年轻但经验丰富…

程序员的三大优点:懒惰、急躁和傲慢

1987 年的今天,Perl 1.0 发布。 今天是 Perl 语言诞生 35 周年。 忽略一下这张图的时间 Perl 语言发明人 Larry Wall 是一位传奇的黑客、一个风趣幽默的人。他的传世名言—— 程序员的三大优点是:懒惰、急躁和傲慢。 在编程圈子的普及程度大概仅次于——…

Qt6教程之三(19) Git版本管理工具

一 Git简介 Git的由来 是一个开源的分布式版本控制系统 ,用于有效、高速的处理从很小到非常大的项目版本管理。 Git 最初是由Linus Torvalds设计开发的,用于管理Linux内核开发。 GitHub是一个基于Git的远程文件托管平台(同GitCafe、BitBucket和GitLab等…

Android中如何使用GPS

Android中如何使用GPS获取位置信息?一个小Demo如下 GPS简介 Gobal Positioning System,全球定位系统,是美国在20世纪70年代研制的一种以人造地球卫星为基础的高精度无线电导航的定位系统,它在全球任何地方以及近地空间都能够提供…

【万字长文】深度解析 Transformer 和注意力机制(含完整代码实现)

深度解析 Transformer 和注意力机制 在《图解NLP模型发展:从RNN到Transformer》一文中,我介绍了 NLP 模型的发展演化历程,并用直观图解的方式为大家展现了各技术的架构和不足。有读者反馈图解方式虽然直观,但深度不足。考虑到 Tra…

全球首位 AI 律师出庭,花 100 万美元找“传话筒”!网友:头脑正常的人谁会同意?...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在 ChatGPT 的热潮下,近来在国内外科技网站上,各类 AI 话题几乎成为了“热搜常驻户”,其中不乏一些看起来极具噱头的新闻: 本周,AI 公司 Do…