B题——大规模创新类竞赛评审方案研究
思路:采用数据分析等手段改进评分算法性能
完成情况(1-2问已经完成)
- 代码下载
问题一
在每个评审阶段,作品通常都是随机分发的,每份作品需要多位评委独立评审。为了增加不同评审专家所给成绩之间的可比性,不同专家评审的作品集合之间应有一些交集。但有的交集大了,则必然有交集小了,则可比性变弱。请针对3000支参赛队和125位评审专家,每份作品由5位专家评审的情况,建立数学模型确定最优的“交叉分发”方案,并讨论该方案的有关指标(自己定义)和实施细节。
第一题只是分配而已,没啥太多好讨论的,但是更多的交集会更有利于分析。
问题二
在评审中采用标准分(附件1)为基础的排序方法,其假设是不同评审专家评审的作品集合的学术水平分布相同。但在大规模创新类竞赛评审中,通常任意两位专家评审的作品只有小部分是共同的,绝大多数作品是不同的(见问题一),而且每位专家只看到作品集合的很小部分,因此标准分评审方案的假设可能不成立,需要探索新的评审方案。请选择两种或两种以上现有或自己设计的评审方案和题目附件数据,分析每位专家、每份作品原始成绩、调整之后(如取标准分)成绩的分布特点,按不同方案进行排序,并设法比较这些方案的优劣。进而针对大规模创新类竞赛的评审,设计新的标准分(公式)计算模型。另外,一般认为经多位专家协商一致的获奖论文具有最大的可信度,附件2提供的数据1,其第二评审阶段评选出的一等奖作品排序是经专家协商取得一致的,请利用这批数据,改进你们的标准分计算模型。
针对数据集不完整情况下的分布参数估计做出了一些改进
问题三
“创新类”大赛的特点是“创新性”,即没有标准答案。由于这类竞赛的问题难度较大,一般需要通过创新才能在竞赛期间部分解决。而作品的创新到了什么程度,后续研究的前景如何,很难有一致看法,即使专家面对面的交流,都可能由于各持己见而无法统一。加上研究生的论文表达不到位,评审专家的视角不同,同一份作品的几位专家给出的成绩会有较大的差异(极差)。极差大是大规模创新类竞赛的特点,极差比较大的作品一般处于高分段或低分段。低分段属于淘汰范围,低分段极差大的原因是有专家对违规作品或有重大失误的作品给了很低的分数,或评审专家都认同该作品质量不高,只是其中某位(些)专家更不认同该作品。故这里极差虽大,但属于不获奖范畴,一般不需要调整极差。而高分段作品还要参加权威性较高的第二阶段评审(附件数据表格同一行代表同一个作品在两个阶段的成绩,没有第二阶段评审成绩的作品只参加了第一阶段的评审)。第二阶段评审仍然存在部分极差大的作品,因为是终审,误差可能影响获奖等级,因此对部分极差大的作品,需要复议调整极差(附件的数据中有记录,复议分就是该专家最后给的标准分,用来替换原来的标准分)。第二阶段(注意两个阶段每份作品评审专家人数不同)专家调整“大极差”的规律可以作为建立极差模型的借鉴。
请根据题目所给的模拟数据2.1和2.2,讨论两阶段的成绩整体的变化和两阶段极差整体的变化,分析两阶段评审方案相比不分阶段评审方案的优劣。注意到极差大和创新性强两大特点之间会有一定的关系,为了发掘创新论文,请建立“极差”模型(含分析、分类、调整等),并针对所给数据,尝试给出第一评审阶段程序化(不需要人工干预)处理非高且非低分段作品的 “大极差”的办法。
问题四
对“创新类”竞赛,给出一个完整的评审模型(提示:例如优化模型),并针对所给的数据研究如何求解?也可对现行的评审方案给出改进的具体建议(包括未来还要收集哪些数据)。