再聊一聊AUC指标

       关于模型评估的指标,之前已经写过不少这方面的文章,最近在实践中又有了一点新的思考,本文对模型评估中的AUC指标再进行一些简单的探讨。

       情况一,以下图中的数据为例,1代表用户发生逾期,标记为坏样本,模型预测的是用户发生逾期的概率。模型的KS为0.32,AUC为0.712,bin越小坏样本率越低。

       情况二,如果将1和0的定义进行互换,即1代表用户未逾期,0代表用户逾期,模型预测的是用户未逾期的概率。此时得到模型的KS为0.32,AUC为0.288,正好是1-0.712。所以预测目标如果变反,会导致AUC的值变成1-原来的AUC。特意又去翻了一下葫芦书,在介绍AUC的时候是这么写的:AUC的取值一般在0.5-1之间,如果不是的话,只要把模型预测的概率反转成1-p就可以得到一个更好的分类器。

       情况三,还是同最上面的例子,1代表用户发生逾期,标记为坏样本,模型预测的是用户发生逾期的概率。

        模型的AUC值为0.491,小于0.5,正常来说一般是大于0.5的。情况一中,bin越大坏样本率越高;情况二中,bin越大坏样本率越低,AUC小于0.5。所以情况三出现的原因应该是,在理应是bin越大坏样本率越高的情形中,出现了bin越大坏样本率越低的情况,简单来说就是出现了风险倒挂或者反向预测。看上表中坏样本率这一列,也可以发现bin1-2这两个bin的坏样本率出现了明显的倒挂。

        下面将每两个bin合成一个bin,再看下整体的区分度情况。除了bin1-2的坏账率明显倒挂之外,其余bin仍有一定的区分度。所以即使AUC接近0.5甚至小于0.5的情况下,也不能一概而论说该模型完全没有区分度。至于倒挂的原因,这里胡乱提一个,比如从组成该模型的各变量维度上看,bin1-2确实是被该模型识别出来更好的人,但是由于对这些人提额过度超过了其真实还款能力,所以发生逾期。抛转引玉,本文不再过多展开。

       最后,本文想传达的一个观点,在实践中遇到指标异常的情况,不要简单地归类为该变量/模型效果不好,还是要回到指标的计算逻辑,多思考背后的原因,一个指标也只是反映了某一部分的情况,这样也有利于加深对这些指标的理解和运用,带着好奇心去思考。

如需要文中案例,可后台回复“AUC指标”。往期关于指标的介绍文章可通过以下链接直达:

1、模型评估指标之间的联系

2、风险区分度—IV、KS和分布

【作者】:Labryant  
【原创公众号】:风控猎人  
【简介】:做一个有规划的长期主义者。
【转载说明】:转载请说明出处,谢谢合作!~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/300516.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#将Console写至文件,且文件固定最大长度

参考文章 将C#的Console.Write同步到控制台和log文件输出 业务需求 在生产环境中,控制台窗口不便展示出来。 为了在生产环境中,完整记录控制台应用的输出,选择将其输出到文件中。 但是,一次性存储所有输出的话,文件会…

Stable Diffusion介绍

Stable Diffusion是一种前沿的开源深度学习模型框架,专门设计用于从文本描述生成高质量的图像。这种称为文本到图像生成的技术,利用了大规模变换器(transformers)和生成对抗网络(GANs)的力量,以…

五分钟快速搭建五金行业小程序商城教程解析

作为五金行业的从业者,你可能想要拓展线上业务,提供更方便快捷的购物体验给顾客。而小程序商城成为了一种非常受欢迎的方式。但是,你可能觉得不懂代码无法实现这样的小程序商城。现在,我将通过以下步骤,教你如何在五分…

Github项目推荐-ChatGPT-Admin-Web

项目地址 https://github.com/AprilNEA/ChatGPT-Admin-Web 项目简介 通过api接入大模型,并基于此封装了一层用户管理的功能,适合团队内使用。 项目截图

Vue基础知识:Vue路由——重定向,以及?(可选符)的使用

当网页打开时,url默认是/路径(根路径),未匹配到组件时,会出现空白,为了解决这个问题 就要利用重定向 重定向:匹配path后,强制跳转path路径 重定向的语法: {path:匹配…

爬虫实战一、Scrapy开发环境(Win10+Anaconda3)搭建

#前言 在这儿推荐使用Anaconda进行安装,并不推荐大家用pythonpip安装,因为pythonpip的坑实在是太多了。 #一、环境中准备: Win10(企业版)Anaconda3-5.0.1-Windows-x86_64,下载地址,如果打不开…

易宝OA GetProductInv SQL注入漏洞复现

0x01 产品简介 易宝OA系统是一种专门为企业和机构的日常办公工作提供服务的综合性软件平台,具有信息管理、 流程管理 、知识管理(档案和业务管理)、协同办公等多种功能。 0x02 漏洞概述 易宝OA /SmartTradeScan/Inventory/GetProductInv 接口处存在SQL注入漏洞,未经身份…

nodejs应用程序不同部署环境下的差异配置方案

一、背景 nodejs应用程序,不同于java语言使用分布式配置,当部署于不同的环境里,因为环境的差异,配置项的值也不尽相同。 最常见的差异就是数据库的连接信息,而代码是一份,不能把生产环境的信息暴露在非生产…

day02 51单片机

51单片机学习 1闪烁LED 1.1 需求描述 这个案例,我们要让P00引脚对应的LED按照1秒闪烁1次。 1.2 硬件设计 1.1 软件设计 1)LED闪烁的代码 想让LED闪烁,就需要P00的值不断在0和1之间循环变化。实现这一功能的代码也很简单: #include <STC89C5xRC.H> //包含STC89…

xss【2】

1.xss钓鱼 钓鱼攻击利用页面&#xff0c;fish.php黑客钓鱼获取到账号密码存储的位置 xss进行键盘记录 2.xss常规防范 3.xss验证payload XSS&#xff08;跨站攻击&#xff09;_details/open/ontoggle-CSDN博客

数据结构(3)----栈和队列

目录 一.栈 1.栈的基本概念 2.栈的基本操作 3.顺序栈的实现 •顺序栈的定义 •顺序栈的初始化 •进栈操作 •出栈操作 •读栈顶元素操作 •若使用另一种方式: 4.链栈的实现 •链栈的进栈操作 •链栈的出栈操作 •读栈顶元素 二.队列 1.队列的基本概念 2.队列的基…

Annaconda的替代品miniforge!

用了多年的Annaconda竟然要收费了&#xff08;个人不收费&#xff0c;企业收费&#xff0c;但个人电脑在企业IP下&#xff0c;还是被警告了&#xff09;&#xff0c;只能用miniforge 全面替换了&#xff01; 一、卸载anaconda windows下卸载&#xff0c; 设置 -> 应用和功…

【算法】动态规划练习(一)

目录 1137. 第 N 个泰波那契数 分析 代码 面试题 08.01. 三步问题 分析 代码 746. 使用最小花费爬楼梯 分析 代码 泰波那契序列 Tn 定义如下&#xff1a; T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n&#xff0c;请返回第 n 个泰波…

C++进阶篇11---IO流

一、对C语言的输入输出的理解 C语言中我们经常用scanf()和printf()进行输入输出&#xff0c;形象的描述它们的作用如下 对于缓冲区的理解&#xff1a; 可以屏蔽掉低级I/O的实现&#xff0c;低级I/O的实现依赖操作系统本身内核的实现&#xff0c;所以如果能够屏蔽这部分的差异…

基于PHP的校园招聘管理系统

有需要请加文章底部Q哦 可远程调试 基于PHP的校园招聘管理系统 一 介绍 此校园招聘管理系统基于原生PHP开发&#xff0c;数据库mysql&#xff0c;前端bootstrap。系统角色分为个人用户&#xff0c;企业和管理员三种。 技术栈&#xff1a;phpmysqlbootstrapphpstudyvscode 二…

蓝桥杯第十四届C++C组

目录 三国游戏 填充 翻转 【单调队列优化DP】子矩阵 【快速幂、欧拉函数】互质数的个数 【tire树】异或和之差 【质因数分解】公因数匹配 子树的大小 三国游戏 题目描述 小蓝正在玩一款游戏。游戏中魏蜀吴三个国家各自拥有一定数量的士兵X, Y, Z (一开始可以认为都…

C语言整数和小数的存储

1.整数在内存中的存储 计算机使用二进制进行存储、运算&#xff0c;整数在内存中存储使用的是二进制补码 1.1原码、反码、补码 整数的2进制表⽰⽅法有三种&#xff0c;即 原码、反码和补码 三种表⽰⽅法均有符号位和数值位两部分&#xff0c;符号位都是⽤0表⽰“正”&am…

Qt实现无边框圆角窗口

我们在使用QDialog的时候许多场景下都不需要默认的标题栏&#xff0c;这时候我们需要设置他的标志位。 this->setWindowFlags(Qt::FramelessWindowHint);由于现代的窗口风格&#xff0c;我们一般会设置窗口为圆角边框的样式&#xff0c;我们可以使用qss的方式来进行设置。 …

汇编——SSE打包整数

SSE也可以进行整数向量的加法&#xff0c;示例如下&#xff1a; ;sse_integer.asm extern printfsection .datadummy db 13 align 16pdivector1 dd 1dd 2dd 3dd 4pdivector2 dd 5dd 6dd 7dd 8fmt1 db "Packed Integer Vector 1: %d, %d, %d, %d",…

提升团队工程交付能力,从“看见”工程活动和研发模式开始

作者&#xff1a;张裕、雅纯 理想中的研发团队应当具有以下特征&#xff1a; 总是工作在最高优先级的事项上 理想的研发团队能够识别并始终集中精力在当前最紧迫和最有价值的任务上。这需要团队具备出色的项目管理能力和决策能力&#xff0c;以便能够正确评估优先级&#xff0…