CCL2023-Eval | 汉语高考机器阅读理解对抗鲁棒评测正式开启,诚邀您积极参与

8eeb5a1339eb64da757ad6f026afccdc.gif

905e7c08ee1476be35f6f9edaf2de5ae.png

简介

机器阅读理解领域近年来取得了显著的发展成果,然而,在面向开放、动态、真实环境下的推理与决策时,模型鲁棒性仍有待提高。为此,山西大学自然语言处理团队基于“CCL2022-高考语文阅读理解可解释评测”数据集 GCRC 构建了对抗鲁棒子集 GCRC_advRobust,包含了近 600 个选择题及 2500 个选项,并设计了四种对抗攻击策略,旨在着力增强模型的鲁棒性,提升其在实际应用中的稳定性和可靠性。

任务介绍

汉语高考阅读理解对抗鲁棒是基于通过对抗攻击提高模型鲁棒性的机器阅读理解评测任务,本次评测设计了以下四种对抗攻击策略:

  • 关键词扰动:对影响选项语义的关键词进行替换或重新表述。

  • 时空属性扰动:改变选项中时间或空间属性。

  • 因果关系扰动:更改或去除选项中的因果关系。

  • 推理逻辑扰动:通过改写前提或结论,改变选项的逻辑推理过程。

根据 GCRC 数据集中原始题目的四个选项所涉及到的推理能力,设计相应的对抗攻击策略,为每个选项构建了一个正对抗选项和一个负对抗选项,并使用这些对抗选项分别构建正负对抗题目。评测要求参赛者输出原始题目及对抗题目的答案。

赛道和赛程

赛道

1

开放赛道:

参赛队伍可以使用 ChatGPT、文心一言等大模型。

2

封闭赛道:

参赛的模型参数量最多不超过 1.5 倍 Bert-large(510M)。

赛程

1

报名时间:

2023年4月10日-5月20日

2

训练、验证、测试数据发布:

2023年4月10日

3

最终测试结果提交:

2023年5月25日-6月1日

4

公布测试结果:

2023年6月10日

5

中英文技术报告提交:

2023年6月20日

6

中英文技术报告反馈:

2023年6月28日

7

中英文评测论文提交:

2023年7月3日

8

公布获奖名单:

2023年7月7日

9

评测论文录用通知:

2023年7月10日

10

论文Camera Ready提交:

2023年7月15日

11

评测研讨会及颁奖:

2023年8月3-5日

报名方式

本次评测采用电子邮件进行报名,邮件标题为:“CCL2023-汉语高考阅读理解对抗鲁棒评测-参赛单位”,例如:“CCL2023-汉语高考阅读理解对抗鲁棒评测-山西大学”。请参加评测的队伍发送邮件至202112407002@email.sxu.edu.cn,并同时在智源指数平台(http://cuge.baai.ac.cn/#/ccl/2023/gcrc)上完成报名,报名完成后可在该平台上获取评测数据,并加入评测交流QQ群:755173513,或扫描下方二维码:

b02a7e08590baf45ec0776f88e61efec.jpeg

Github链接:

https://github.com/SXU-YaxinGuo/GCRC_advRobust

智源指数平台:

http://cuge.baai.ac.cn/#/ccl/2023/gcrc

评测单位

单位:

山西大学

合肥工业大学

f8ab0937b2898abcedbfec757ce6bc5d.png

cb24554e8248b176f827339af4549275.png

组织者:

谭红叶(山西大学)

李   茹(山西大学)

张   虎(山西大学)

俞   奎(合肥工业大学)

比赛奖励

本次评测开放赛道和封闭赛道都将评选出如下奖项,并由中国中文信息学会计算语言学专委会(CIPS-CL)为获奖队伍提供荣誉证书。

奖项

一等奖

二等奖

三等奖

数量

1名

2名

3名

奖励

荣誉证书

荣誉证书

荣誉证书

诚邀学术界、工业界的研究者与开发者积极参与和支持评测!

913667bbe7c0e0c68779e6d2a78c64a8.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

00eb0bf24d6452a043a1e9a2383b4dc0.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

dfe76f706e667e716721af40d8cc0f7a.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/48258.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java对接钉钉机器人推送消息

自定义钉钉机器人推送使用 钉钉官方文档 使用场景 可用于替换短信发送节约成本,也可以将报警等消息推送到指定的钉钉群中 调用频率限制 由于消息发送太频繁会严重影响群成员的使用体验,因此钉钉开放平台对自定义机器人发送消息的频率作出以下限制&…

DingTalk「开发者说」 钉钉连接平台:打通企业数据孤岛的开发实践

钉钉连接平台简介 钉钉连接平台是什么? 简单来说,钉钉连接平台是打破企业系统数据孤岛的开发平台。钉钉连接平台通过统一的标准协议,接入各类应用和系统,并提供强安全、高可用、轻量化的连接能力,同时输出覆盖各类业…

JAVA对接钉钉

正文 公司要求对接钉钉,之前没对接过,相当于从0开始,记录一下对接的过程 1、访问钉钉官网 申请成为开发者 因为公司没对接过,所以我自己注册了一个公司(公司名随便填,其他的按要求填就好) …

java对接钉钉 发送/更新 互动卡片消息

java对接钉钉 发送/更新 互动卡片消息 一、准备工作二、发送互动卡片消息三、更新互动消息卡片 先看下效果图 点击相应的积分按钮,就会给对应的申请人发送对应的积分(对接到我们自己的系统发送),审核完之后,按钮变成已…

PHP-钉钉扫码登录对接第三方网站

这个小功能对于企业内部的一些自用后台网站还是很常用的,对接也相对简单,记录下对接流程。 开发文档:扫码登录第三方网站 - 钉钉开放平台 1.先登录钉钉开发者后台,创建扫码登录应用授权 开发者后台统一登录 - 钉钉统一身份认证 …

TED1984-2019全部中英对照演讲稿集 学习英文演讲写作的好帮手

TED1984-2019全部中英对照演讲稿集 学习英文演讲写作的好帮手 一、TED简介: TED(指Technology, Entertainment, Design在英语中的缩写,即技术、娱乐、设计)是美国的一家私有非营利机构,该机构以它组织的TED大会著称&…

那些会讲ppt的技术人有多爽?演讲的6个步骤

一场好的技术分享,可以用“有趣有料”四个字来形容,那么如何才能做到有趣又有料呢?结合我的经历,做了一些总结。 2015年,我出版《技术管理之巅》以后,先后收到QCon、CSDN、IT168等业界知名技术大会的邀请担…

关于计算机的英语演讲ppt模板,英语演讲ppt模板

目录 一、英语演讲ppt素材 ①.要简单点的 内容不限 但最好是寓言或者能给人点启示的东西 有意思就行 背景。 ②.要简单点的 内容不限 但最好是寓言或者能给人点启示的东西 有意思就行 背景。 ③.时间3-5分钟,主题无所谓,liuxiaoxuan89tom.com ④.Mans li…

自定义Msgbox密码登录

背景:虽然Excel是自带密码功能的,但是设置了密码以后,打开excel,是看不到excel的内容的。 如果想让使用者打开excel,能大概看到excel的内容 ,但是会有弹窗,导致没法选择和更改数据,就…

Linux 系统密码策略设置

目录 Linux主要密码安全需求 1. 禁止使用旧密码 2.设置密码最短长度 3.设置密码复杂度 4.设置密码过期期限 Linux密码策略理论知识: 1、使用配置文件/etc/pam.conf 2、使用配置目录/etc/pam.d/ 讲怎么使用,后面有理论教程,先知其然再…

远程计算机guest密码更改了,怎么给guest设置密码

我们一般是在控制面板 - 用户帐户下启用来宾帐户,但我们可以在guest(供来宾访问计算机或访问域的内置帐户)下新建用户名和设置密码,方法简单,操作容易。下面是学习啦小编给大家整理的一些有关给guest设置密码的方法,希望对大家有帮…

计算机知识科普讲解大赛,谁是科普达人?2020年成都市科普讲解大赛拉开帷幕...

生活中无处不在的电磁波是怎样产生的呢? 被称为“汉代计算机”的一钩多综式提花织机与成都有什么关系? …… 近日,成都博物馆,40余家单位的70余名选手,通过4分钟参赛视频,亮相2020年成都市科普讲解大赛预赛…

chatgpt赋能python:Python预测分析:什么是预测分析?

Python预测分析:什么是预测分析? 随着数字化时代的到来,数据越来越多,数据分析的需求也随之增加。预测分析就是一种基于数据分析的技术,可以通过数据分析并应用统计模型,来预测未来发生的事件或趋势&#…

度盘搜失效?这款网盘搜索神器万万别错过!

奶糖猫来啦!资源搜索一直以来都是需求非常大的一方面,总会有伙伴问我有没有这方面比较好用的软件。 之前很火的度盘搜失效了,后面也出现了一系列的资源搜索工具,但总存在一个致命的问题,资源普遍太老了,不能…

好用的网盘搜索引擎

最近,我们见到了许多安利网盘搜索引擎的推文,安利了很多网址和论坛。但经过答主亲测,许多被提到的网站,不是打不开链接,就是进去发现是广告,早已经被封停了,所以我们亲自测试了一些这方面的内容…

百度云盘搜索助手 V1.2(可查询提取码,带5个搜索引擎)

介绍: 云盘搜索助手功能强大,操作简单,使用后可以帮助用户更轻松快捷的搜索云盘资源。软件内置5个搜索引擎供您查资源,另外内置查询提取码功能。 网盘下载地址: http://www.bytepan.com/bNjeq9AKuVC 图片&#xff1a…

百度网盘_SEARCH

需求分析 我有一些资源网站,但是每次我需要资源的时候需要打开他们的网页,搜索再筛选我需要的网盘资源,这样的操作非常麻烦使用python模拟这些搜索操作,然后爬取我需要的百度网盘信息用python的Gui编程开发一个简单的界面 实现 …

使用ChatGPT进行个性化学习

推荐:将 NSDT场景编辑器 加入你的3D工具链 3D工具集: NSDT简石数字孪生 在这篇文章中,您将发现 ChatGPT 作为机器学习和数据科学爱好者的个人导师的好处。特别是,您将学习 如何让ChatGPT引导你学习抽象代数如何让 ChatGPT 帮助您…

【对话ChatGPT】如何使用ChatGpt来学习和提问?

ChatGPT的不断发展和进步,我们需要工作中很多时候会用到ChatGPT,那么如何使用ChatGPT来解决我们工作中的问题呢? Q1 如何向ChatGPT提问,从而更快解决我们的问题? ChatGPT:以下是向ChatGPT提问的一些提示&am…

chatgpt赋能python:Python收费介绍

Python收费介绍 什么是Python? Python是一种高级的、解释性、面向对象、纯粹的动态语言,多用于快速应用程序开发、脚本编写、系统管理任务等。它有一个简单直观优美的语法,非常容易学习。 Python的收费形式 Python语言本身是免费的,任何…