显著性测试(Friedman test, Post-hoc Nimenyi test以及可视化)

目标:

1 了解Friedman test的基本原理以及使用实践;
2 了解Post-hoc Nimenyi test 的基本原理以及使用实践,包括结果的可视化。

Friedman test

作用: 简单来说, Friedman test就是一种基于排序的统计方法用来比较多个方法/模型在多份数据集/实验中的平均性能是否存在显著差异。

Null H0 hypothesis: 用于比较的多个方法性能相当;

假设现在有N粉数据集,K个模型, 这K个模型在N的数据集上的测试结果组成结果矩阵,尺寸: [N, K]。

Step 1: 计算序值矩阵以及每个模型对应的Rank值。
对于每份数据集, 将K个模型按照其性能升序进行排序后的索引值作为对应模型在该数据集上的序值。

例如,K=4个模型在第一份数据集上的Accuracy分别为0.6, 0.5, 0.9, 0.2, 则对应的序值向量为3,2,4,1。

注, 当有不止一个模型在同一个数据集上的Accuracy相同时,去平均即可,但要保证序值总和不变。 如,Accuracy分别为0.6, 0.5, 0.5, 0.2,则对应的序值向量为4,2.5, 2.5,1。

得到序值矩阵后就可以计算每个模型的Rank值了。
记第i个模型在第j个数据集上的序值为 r a n k i , j rank_{i,j} ranki,j, 则第i个模型的Rank为:
r i = 1 N ∑ j = 1 N r a n k i , j r_{i}=\frac{1}{N}\sum_{j=1}^{N}rank_{i,j} ri=N1j=1Nranki,j

Step 2: 计算相应的统计量
假设每个模型的Rank服从正态分布,则对应的卡方统计量为,
τ X 2 = k − 1 k ∑ i = 1 k ( r i − k + 1 2 ) 2 / 12 N k 2 − 1 = 12 N k ( k + 1 ) { ∑ i = 1 k r i 2 − k ( k + 1 ) 2 4 } \tau_{X^{2}}=\frac{k-1}{k}\sum_{i=1}^{k}(r_{i} - \frac{k+1}{2})^{2}/{\frac{12N}{k^{2} - 1}}=\frac{12N}{k(k+1)}\{\sum_{i=1}^{k} r_{i}^{2} - \frac{k(k+1)^{2}}{4}\} τX2=kk1i=1k(ri2k+1)2/k2112N=k(k+1)12N{i=1kri24k(k+1)2}

另外还有其改进统计量
τ F = ( N − 1 ) τ X 2 N ( k − 1 ) − τ X 2 \tau_{F}=\frac{(N-1)\tau_{X^{2}}}{N(k-1) - \tau_{X^{2}}} τF=N(k1)τX2(N1)τX2

将算出来的统计量与临界检验值表进行比对,

实践

Python包Scipy的stats模块提供了Friedman test的API, 可直接调用。

Demo:
如下, data即为上面所说的NxK矩阵,
注意:friedmanchisquare的输入中,每个参数表示每个模型的多次(N=4)测量值
在这里插入图片描述最终输出结果:
在这里插入图片描述p_value < α = 0.05 \alpha=0.05 α=0.05, 故拒绝H0假设, 换句话说,多个模型的测量结果之间有显著差异。

Post-hoc Nimenyi test

Friedman test只能用来确定多个模型的测量结果之间是否存在显著差异,却并不能知道任意两个模型之间是否存在差异,这正是Post-hoc Nimenyi test所要解决的。

Step 1, 首先计算所谓的临界值Critical Difference (CD)。
计算公式如下:
C D = q α k ( k + 1 ) 6 N CD=q_{\alpha} \sqrt{\frac{k(k+1)}{6N}} CD=qα6Nk(k+1)
其中 α \alpha α

CD的计算可直接调用

Orange.evaluation.compute_CD(avranks, num_exp, alpha=str(alpha))

Step 2,将两个算法的平均序值的差 (Average Rank Difference, ARD) 和 CD 进行比较,如果 ARD > CD,则两个算法的性能有明显差异

实践

Python包scikit_posthocs提供了用于Post-hoc Nimenyi test的API,可直接调用。

Demo:
在这里插入图片描述
最终输出结果:
在这里插入图片描述可以看到输出为一个对称矩阵,表示不同模型的两两比较结果,

Post-hoc Nimenyi test结果可视化

这方面可供参考的资料非常少,刚开始好不容易找到一个, 结果发现虽然可以运行,但是图明显有错误。

最后发现Python包Orange3有Post-hoc Nimenyi test的可视化API。

Demo:
数据如下
在这里插入图片描述

names = list(methods_with_score.keys())
avranks = list(methods_with_score.values())‘’‘ cmpt Critical Difference (CD)’‘’
cd = Orange.evaluation.compute_CD(avranks, num_exp, alpha=str(alpha))
print('Critical difference (CD): {}'.format(cd))graph_ranks(avranks, names, cd=cd, width=6, textspace=1.5, filename=filename)

最终效果图如下,
可以看到: 从统计意义上讲模型3,4,5的结果是Comparable, 同时模型4,5,1的结果又是Comparable, 而模型1,3的结果差异非常显著。
在这里插入图片描述

References

1.Statistical comparisons of classifiers over multiple data sets
2. Distribution-free multiple comparisons
3. Python包orange3 API的官网介绍
4. https://blog.csdn.net/qq_38225713/article/details/103890338?utm_term=hoc%20post&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-0-103890338&spm=3001.4430

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72402.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

显著性检测的四种经典方法

最近闲来蛋痛&#xff0c;看了一些显著性检测的文章&#xff0c;只是简单的看看&#xff0c;并没有深入的研究&#xff0c;以下将研究的一些收获和经验共享。 先从最简单的最容易实现的算法说起吧&#xff1a; 1、 LC算法 参考论文&#xff1a;Visual Attention Detection in…

Stata实证:一键显著代码免费教程

目录 一、写在前面 二、使用Python生成可变变量组合 三、Stata代码 四、更进一步-寻找中介效应的控制变量 一、写在前面 &#xff01;&#xff01;&#xff01;&#xff01;&#xff01;…

显著性分析

选择图 为什么要分Non-parametric & parametric 方法 为了找到更符合数据的分析方法。每个方法有自己的假设&#xff0c;如果违背了结果会不精准。 Sign Test 是一个可以用于任何数据分布情况的pairwise 方法。 检查normality: Sample 数量 < 50,适用 Shapiro-Wilk&am…

显著性检测综述(完整整理)

转载请附链接&#xff0c;注明出处。 显著性对象检测综述 参考&#xff1a;http://mmcheng.net/zh/paperreading/ 一、 程明明等人的论文&#xff1a;Salient Object Detection: A Surve&#xff08;简单归纳了文章中的我认为比较重要的部分&#xff09; 该论文旨在全面…

显著性检测数据集—学习笔记

文章目录 DUT-OMRONDUTSHKU-ISECSSD/CSSDSODPASCAL-S参考资料 DUT-OMRON 数据集包含5168张图像&#xff0c;最大边长为400像素&#xff0c;数据集中具有一个或多个显著对象和相对复杂的背景&#xff0c;具有眼睛固定、边界框和像素方面的大规模真实标注的数据集。 论文: C. Ya…

【计算机网络】计算机网络基础知识总结(秋招篇)

文章目录 前言计算机网络笔记TCP和UDP分别是什么 有什么区别基于TCP UDP这两个协议的上层协议有哪些&#xff1f;TCP和UDP分别在哪些领域被用的多&#xff1f;TCP实现可靠性传输用了哪些技术&#xff1f;&#xff08;TCP如何实现可靠性传输&#xff09;讲一下超时重传和超时定时…

汤家凤高等数学基础手写笔记-导数与微分

越来越发现&#xff0c;下层基础决定上层建筑。除了考试&#xff0c;在研究中&#xff0c;我们能够用到的就是理论体系的知识&#xff0c;而不是会做题目的多少。做题目的目的在于加深对基础理论的理解。 本系列笔记汇总之处&#xff1a;汤家凤高等数学基础课2020年基础笔记概…

请教高数题

这里这么多学霸&#xff0c;教我一道不定积分的计算&#xff0c;应该不难吧

【高数】高数竞赛必背重点(随时更)

高数竞赛必背重点&#xff08;随时更&#xff09; 博主高数相关文章链接 左边为必背知识点&#xff0c;右边为备注栏 博主高数相关文章链接 高数第一章节——极限&无穷&连续与间断 高数第二章节——导数&求导法则&高阶导数&微分 高数第三章节——微分中值…

高数做题小技巧:分布积分的计算法—表格法

考研数学3分钟秒杀分布积分的计算法—表格法的拓展理解---bilibili

高等数学辅导讲义_历年真题,复习讲义的经验分享(数二127分)

纯属个人经验 之前的回答里面提到了我使用的教材 2021 考研数学该怎么复习?​www.zhihu.com 其实我刚开始备考的时候,也跟很多人一样,盲目的买了很多教材,又买了很多练习册,刚开始备考的时候看着一大摞书,心里就开始飘了,想着做完这些拿高分还不是轻轻松松 然而现实很残…

高数————思维导图(上岸必备)(积分部分)

高数————思维导图&#xff08;上岸必备&#xff09;(极限与连续). 高数————思维导图&#xff08;上岸必备&#xff09;(微分部分). 高数————思维导图&#xff08;上岸必备&#xff09;(积分部分). 高数————思维导图&#xff08;上岸必备&#xff09;(级数部…

2022张宇考研基础30讲 第八讲 一元函数积分学的概念与计算

文章目录 第八讲 一元函数积分学的概念与计算不定积分原函数&#xff08;不定积分&#xff09;存在定理用导数介值定理解释 定积分变限积分不定积分与变限积分的比较 积分的奇偶性积分的周期性反常积分基本积分公式基本积分方法凑微分法换元法分部积分法&#xff1a; 有理函数的…

2022mathorcupD题思路交流

今年Mathorcup难度整体难度比较大&#xff0c;四道题对算法编程能力要求都较高&#xff0c;计算量都比较大。作为新手的话建议可以优先考虑A和D题&#xff0c;整体对新手稍微友好一些。这里给出D题我的思路&#xff0c;仅供大家参考。移动通信网络站址规划和区域聚类问题&#…

高等数学辅导讲义严选题辅导讲义(学习笔记)

第一章 函数 极限 连续&#xff08;选择题部分&#xff09;&#xff1a; 问题描述 问题分析&#xff1a; 思路&#xff1a;判断ABC三个选项比较复杂&#xff0c;D选项易于判断 解决方法&#xff1a; 问题描述 问题分析&#xff1a; 定理&#xff1a;若f&#xff08;x&#xff0…

【考研笔记】数学一 · 高等数学笔记

考研一战顺利上岸啦&#xff0c;报考专业计算机科学与技术&#xff0c;考的数一英一。现在离开学还有段时间&#xff0c;所以趁机把自己的笔记都整理一下&#xff0c;希望可以帮到一些备考的同学。 写在前面&#xff1a; 首先说一下自己的复习计划跟想法。数一今年有点难&am…

全国大学生数学竞赛备考——高数上(极限、导数、微分、积分、级数)

我真的会忘&#xff08;3&#xff09; 极限两个重要极限公式常用极限公式 导数、微分与积分牛顿-莱布尼茨公式莱布尼兹公式微分中值定理罗马中值定理拉格朗日中值定理柯西定理 泰勒公式几个常见的麦克劳林公式 洛必达曲率曲率圆牛顿迭代法积分中值定理分部积分法 级数正项级数审…

考研数学刷题知能行怎么样?

被考研数学折磨的小伙伴看过来&#xff01; 恭喜你&#xff0c;捡到宝了&#xff01;本人22考研数二选手&#xff0c;人在宿舍&#xff0c;刚下考场。本人从高中开始数学就一直很拉胯&#xff0c;学数学对我来说真的是太折磨了QAQ 从1月份开始准备考研数学&#xff0c;一开始真…

知能行考研数学的高数部分怎么样?大一可以用吗?

目录 方法一等价替换 方法二泰勒公式 方法三洛必达法则 一、值得一看的网课 二、带着问题听课 三、如何调整在学习高数时的心态 四、总结 我上大学的时候&#xff0c;面对这两部分知识点&#xff0c;也学得很吃力&#xff0c;尤其是微积分 但是后来我学明白之后&#x…