【深度学习】直观理解AUROC

文章目录

  • 前言
  • 如何计算
  • 直观解释
  • 常用计算方式

前言

AUROC常用于衡量二分类分类器的性能,本文旨在详解该指标计算过程

如何计算

设想我们有一个分类器,对数据做二分类。我们设输入数据为 x x x, 预测标签为 y y y, ground-truth标签为 y ^ \hat{y} y^。对每个 x x x,我们都预测 p ( y = 1 ∣ x ) p(y=1|x) p(y=1∣x),即将样本分类成正类的概率。
现在有一组带标注数据,其中一部分数据的真实标签 y ^ \hat{y} y^是0,另一部分的真实标签 y ^ \hat{y} y^是1 ,我们通过分类器预测 x x x属于正例的概率 p ( y = 1 ∣ x ) p(y=1|x) p(y=1∣x),对每个预测结果 y y y与真实标签 y ^ \hat{y} y^的匹配情况可分为四类
在这里插入图片描述
现在计算AUCROC,步骤如下

  • 确定一个概率阈值 λ \lambda λ , 当预测属于正例的概率大于 λ \lambda λ, 我们则将该样本分为正例
  • 在该阈值下,我们得到两个值
    • TPR (真阳性率) / 召回:所有真实标签为正的样本中,被预测为正例的数据所占的比例
      • T P F N + T P \frac{TP}{FN+TP} FN+TPTP
    • FPR (假阳率):所有真实标签为负的样本中,被预测为正例的数据所占的比例
      • F P T N + F P \frac{FP}{TN+FP} TN+FPFP
  • 以FPR为横轴,TPR为纵轴,我们绘制坐标轴,在坐标轴上画点
  • 取多种不同阈值可以得到多个点,将这些点连成线,所围成的面积就是AUROC
    在这里插入图片描述

直观解释

对于好的分类器,我们希望,对真实标签为正的样本,我们预测 p ( y = 1 ∣ x ) p(y=1|x) p(y=1∣x)能够比较大,对真实标签为负的样本,该值比较小。这里通过一个具体的例子对AUROC进行说明。
场景:我们数据的真实标签一半为0,一半为1,现在我们按预测的 p ( y = 1 ∣ x ) p(y=1|x) p(y=1∣x)对数据从小到大排序,左边一半就是 y ^ = 0 \hat{y}=0 y^=0的数据,右边一半是 y ^ = 1 \hat{y}=1 y^=1的数据。

  • 我们取一个很小的阈值,将所有样本都分类为正例, 此时,横纵坐标都为1,绘制点(1, 1)
    在这里插入图片描述

  • 我们取大一点的阈值,此时横坐标减小为 x 2 x_2 x2,纵坐标仍为1, 绘制点( x 2 x_2 x2, 1)
    在这里插入图片描述

  • 再大一点,此时横坐标为0,纵坐标仍为1,绘制点(0,1)
    在这里插入图片描述

  • 再大一点,横坐标为0,纵坐标变小为 y 2 y_2 y2,绘制点(0, y 2 y_2 y2)
    在这里插入图片描述

  • 最后,横坐标纵坐标都为0,绘制点(0,0)
    在这里插入图片描述

我们绘制的AUCROC曲线为红色部分,与坐标轴围成的面积为1。
在这里插入图片描述

可以看到,AUROC期望任意一个正样本被分类为正的概率大于任意一个负样本被分类为正的概率

  • ACROC最大值为1,越大说明分类效果越好
  • 不考虑正样本之间的概率相对大小以及负样本内部的概率大小
  • 不考虑实际的概率值大小
  • 实际使用中,我们往往取多个(100)阈值,或将样本中的每个概率都作为一次阈值来绘制曲线,以对分类效果进行细粒度评估

常用计算方式

from sklearn.metrics import roc_auc_score# 假设你有以下真实标签和预测概率
y_true = [0, 0, 1, 1]  # 真实标签
y_scores = [0.1, 0.4, 0.35, 0.8]  # 预测概率# 计算AUROC
auc = roc_auc_score(y_true, y_scores)
print(f"AUROC: {auc}")

图像参考:https://www.zhihu.com/question/428614381/answer/3423485003

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/404652.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker 拉取镜像 error pulling image configuration: download failed ****

问题: 在安装docker后拉取镜像的时候 出现error pulling image configuration: download failed ****异常 原因: 由于镜像源配置的问题引起的镜像拉取异常 解决 由于网络或者其他原因导致拉取镜像请求失败,报错: error pulli…

Oracle 用户-表空间-表之间关系常用SQL

问题: 当某一个表数据量特别大,突然插入数据一直失败,可能是表空间不足,需要查看表的使用率 用户-表空间-表之间关系:用户可以有多个表空间,表空间可以有多个表,表只能拥有一个表空间和用户 1.…

爱心动画代码HTML5

这段代码是一个HTML5 Canvas动画,它通过JavaScript创建了一个动态的爱心效果。页面初始化时,首先定义了一些基本设置,如粒子数量、持续时间、速度等。然后,定义了Point和Particle类,用于处理粒子的位置和运动。接着&am…

C语言数据类型和变量

数据类型介绍 数据类型介绍 C语言提供了丰富的数据类型来描述生活中的各种数据。 使用整型类型来描述整数,使用字符类型来描述字符,使用浮点型类型来描述小数。 所谓“类型”,就是相似的数据所拥有的共同特征,编译器只有知道了数…

软件测试经典面试题,助你面试加分

Hi,大家好,进入金九银十,很多小伙伴有被动跳槽的打算,所以更新一些经典的软件测试面试题,希望能帮到大家! 时间紧迫的情况下,如何做好测试工作? 对需求要明确,对需求的优…

iPhone如何全选删除照片:一步到位的清理指南

随着时间的推移,iPhone中的照片会迅速累积,最终可能占据大量的存储空间。无论是为了释放空间,还是整理照片库,iPhone如何全选删除照片成为许多用户的需求。然而,iPhone原生的“照片”应用并没有直接提供“全选删除”功…

汽车租赁管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图详细视频演示技术栈系统测试为什么选择我官方认证玩家,服务很多代码文档,百分百好评,战绩可查!!入职于互联网大厂,可以交流,共同进步。有保障的售后 代码参考数据库参…

SAIA触摸屏维修PCD7.D457VNCG03 SAIA-burgess

瑞士SAIA触摸屏维修SAIA-burgess思博控制器维修PCD7全系列。 触摸屏维修常见故障:黑屏、指示灯无任何显示,触摸屏上电无反应, 上电蓝屏、白屏,通电几分钟后屏幕变为蓝屏,主板故障,通讯时有时无&#xff0c…

LiveQing视频点播流媒体RTMP推流服务用户手册-概览:CPU使用、内存使用、在线人数、流量统计、带宽使用(Mbps)、存储使用、实时存储(MB/s)

LiveQing视频点播流媒体RTMP推流服务用户手册-概览:CPU使用、内存使用、在线人数、流量统计、带宽使用(Mbps)、存储使用、实时存储(MB/s) 1、概览1.1、CPU使用1.2、内存使用1.3、在线人数1.4、流量统计1.5、带宽使用(Mbps)1.6、存…

2024年系统集成企业数字化趋势与CRM研究报告

系统集成是一种新型的服务方式,是企业进行信息传递和共享的通用型智能工具,在企业系统优化升级、流程的打通和重构、数据的收集与分析应用,以及IT运维与安全保障等方面起着降低成本,提高效率的重要作用。 整体来看,近…

【乐吾乐大屏可视化组态编辑器】事件交互-场景交互

场景交互 在线使用:https://v.le5le.com/ 乐吾乐大屏可视化可以实现大屏页面与内嵌2d/3d场景相互通信,底层原理是利用了iframe通过postMessage发送消息。 下面以2d场景为例,实现步骤如下: 1. 首先配置场景2(被嵌入…

【分享】格力手机色界G0245D 刷REC、root、 救砖、第三方rom教程和资源

开门见山 帮别人弄了一台 格力G0245D,把找到的资源和教程分享一下 教程 这个写的很详细了格力手机色界G0245D-Root-最简指南 不过教程里刷rec这一步漏了加上电源键,加上就行了。 附加参考:格力手机2刷机 格力手机二代刷机 GREE G0215D刷机…

STM32如何设置自动代码提示?

首先: 点击Window--->Preferences 进来之后在左上方输入keys,然后点击Keys,在Scheme下方那一栏中输入Content Assist 然后点击Content Assist--->在下方Binding栏中选择Tab--->Apply--->Apply and Close 设置完成,测…

hutool发邮件功能如何配置SMTP服务器参数?

hutool发邮件的教程指南?hutool发邮件性能优化方法? Hutool作为一个轻量级的Java工具库,其邮件发送功能因其简单易用而受到广泛关注。AokSend将详细介绍如何通过配置SMTP服务器参数来实现Hutool发邮件的功能。 hutool发邮件:优势…

为什么要用数字化营销管理平台?

数字化营销管理平台是一种利用数字技术来整合和优化营销流程的工具。它能够帮助企业更高效地进行市场推广、客户关系管理以及销售活动。 一、主要功能 1.数据整合与分析 整合多渠道数据,包括网站流量、社交媒体互动、电子邮件营销反馈等。通过数据分析&#xff0…

k8s高版本(1,28)部署NodePort模式下的ingress-nginx的详细过程及应用案例

文章目录 前言环境ingress安装应用案例(ingress-http案例: 基于名称的负载均衡) 前言 这个是nodeport模式下的,如果需要loadbalancer模式下的,看看博主下面以前的博客 链接: k8s学习–负载均衡器matelLB的详细解释与安装 链接: k8s学习–ing…

RTA-VRTE适配Orin

RTA-VRTE适配Orin sudo minicom -w -D /dev/ttyACM0 用户名 nvidia密码 123456底下的的rj45 ,对应的是eqos_0, (本次porting使用该接口)底下的的DEBUG(USB Micro-B)串口连接(本次porting使用该接口)上侧边的rj45,对应的是mgbe0_0#设置Orin的IP和默认网卡eqos_0

【机器学习】随机森林

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 一、随机森林定义 随机森林(Random Forest, RF)是一种由 决策树 构成的 集成算法 ,采用的是 Bagging 方法,他在…

开发小运维-常用Linux资源监控命令

文章目录 简介常用命令/proc/meminfo(内存)free(内存信息)top(进程动态)df (磁盘信息)du(磁盘信息)ps(进程状态)vmstat(内…

Tita的OKR :销售部 OKR案例

销售集团目标 – OKR示例 目标:为我们的销售团队招募世界级精英 主要成果: KR1:在10月底之前雇用10个新的AE KR2:在11月底之前雇用20个新SDR KR3:到10月底雇用5名新的销售经理 KR4:维持 4:1的…