风控模型评估方法以及大数据风控模型概念


更新一下有效性指标中的区分能力指标:

KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估,指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。

KS的计算步骤如下:

1. 计算每个评分区间的好坏账户数。

2. 计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%)。

3. 计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计good%-累计bad%),然后对这些绝对值取最大值即得此评分卡的K-S值。

<img src="https://pic3.zhimg.com/50/v2-9ecc262b573c05e4e68dbc00596da79e_hd.png" data-rawwidth="457" data-rawheight="328" class="origin_image zh-lightbox-thumb" width="457" data-original="https://pic3.zhimg.com/v2-9ecc262b573c05e4e68dbc00596da79e_r.png"/</noscript alt="">

·GINI系数:也是用于模型风险区分能力进行评估。GINI统计值衡量坏账户数在好账户数上的的累积分布与随机分布曲线之间的面积,好账户与坏账户分布之间的差异越大,GINI指标越高,表明模型的风险区分能力越强。

GINI系数的计算步骤如下:

1. 计算每个评分区间的好坏账户数。

2. 计算每个评分区间的累计好账户数占总好账户数比率(累计good%)和累计坏账户数占总坏账户数比率(累计bad%)。

3. 按照累计好账户占比和累计坏账户占比得出下图所示曲线ADC。

4. 计算出图中阴影部分面积,阴影面积占直角三角形ABC面积的百分比,即为GINI系数。




以下是原文

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

楼主范围太广。不同的行业有不同的风控目标,不同的风控过程和程度,也有不同的风控结果。其次同一行业风险也分多种风险,对不同的风险(信用风险,操作风险,市场风险)也有不同的应对办法以及模型建设。



只讲一讲中国金融行业中的银行的信用风控与大数据的渊源。



1,风控意义与大数据建模分析优点:中国的金融行业必定在金融全球化的洗礼下一步步找到更大市场,相比中国制造业有成长更快的趋势。而此刻,风控就显得尤为重要。都知道收益越大风险越大,当然而我们更想的如果是在中间找到一个平衡点让收益大的情况下拥有尽可能小的风险。而大数据建模就可以尽可能实现这点:提高审批效率,降低人工成本,减少因非客观判断原因造成的失误的风险。



2,大数据建模目标。第一点目标做信贷工厂的量化建设:清洗银行历史数据用于数据建模形成评分卡,再与规则结合对贷款生命周期三个阶段(申请贷后催收)的好坏客户提供决策建议的预测框架(自动通过,人工审核,审慎审核,还是建议拒绝)。第二点目标内评合规:背景是巴塞尔协议:衡量银行的资本充足率和资本准备是符合巴塞尔协议的规定,如果不符合应该采取什么样的措施。



3,关于建模:前:建模的变量以及数据都是通过层层原始分析,挖掘分析,变量分组,变量降维,过度拟合VIF检测,以及业务逻辑选择出来的。中:而模型的建设本来有方差分析,相关性分析,逻辑回归,决策树,神经网络分析这几种。但是由于Y变量都一般为非线性所以基本都用LOGISTIC逻辑回归。后:模型建好后还需要用PSI检验模型客群的稳定性,用KS或者GINI函数检验模型的区分能力。(公式我就不给啦~感兴趣的孩子肯定有自己学习的方式)如果不太理想就再改进,这是一个做循环的闭环式过程直到选到最佳的。(PS:建模工具:SAS,由于可以处理相当庞大的数据且在美国极其权威的认证而著称的。别的我就不评价了嘿)



4,好的信用风控的评估效果一主要从准确性,稳定性,可解释性三个方面来评估模型。其中准确性指标包括感受性曲线下面积(ROC_AUC)和区分度指标(Kolmogorov-Smirnov,KS),稳定性指标主要参考群体稳定指数(Population Shift Index,PSI)。可解释性可通过指标重要度来进行评估,其中指标重要度用于衡量各个解释变量对算法预测结果影响的程度。注意:一定要将大数据建模与业务逻辑紧密联系!

分割线----------------------------------------------------------当然,个人觉得知道模型背后的理论也是非常有必要的。让我们顺着逻辑回归来讲。一首先是假设检验中假设建立。什么是假设检验呢,假设检验背后的原理是什么呢,我们模型中具体的假设是什么呢。

假设检验分为原假设H和备择假设H0,我们后面会推翻H来证明我们的H0是正确的。

假设检验的原理也就是我们要推翻的这个H的理由是:小概率事件不可能发生。(在此我举一个经典的例子)

在模型中我们的假设便是我们逻辑回归的因变量和自变量之间没有线性关系。

也就是这里面的beta们都是0。

二,never say yes.在原假设正确的前提下,确定检验统计数并计算出统计数的估计值(即构造统计量并计算统计量的估计值)

一般我们会把统计量构造成符合正态分布、卡方分布、F分布的情况,由构造的统计量不同可分为u检验、卡方检验、F检验等。

这里我们以卡方分布统计量为例子:

在各种假设情形下,实际频数与理论频数偏离的总和即为卡方值,它近似服从卡方为V的卡方分布,因此可以用卡方分布的理论来进行假设检验。



三、计算P值,或确定临界值,并比较临界值与统计数值的大小,根据”小概率事件在一次实验中几乎是不可能发生的原理“得出结论统计结果分析

显著性水平:这里的显著是一个统计学的概念,是指原假设发生是一个小概率事件,统计学上用来确定或否定原假设为小概率事件的概率标准叫做显著性水平。原假设发生的概率如果小于或等于5%,一般认为认为是小概率事件,这也是统计学上达到了”显著“,这时的显著性水平为5%。

拒绝域:当由样本计算的统计量落入该区域内则拒绝原假设,接受备择假设,拒绝域的边界称为临界值。当原假设正确时,它被拒绝的概率不得超过给定的显著性水平a(阿尔法),阿尔法通常取值为0.05,0.01,因此落在拒绝域内是一个小概率事件。

还是以卡方检验为例

以下是卡方分布的密度函数,X轴是卡方值,Y轴是发生的P概率。

换句简单易懂的话就是,我们计算实际频数与理论频数的偏离程度即卡方值非常大的情况下概率是非常小的是不会发生的,当X2卡方值远远大于3.84,相应的我们X轴远方对应的就是越来越小的P概率。那么也就是说我们的假设是不成立的,也就是说因变量和自变量之间他们是相关的。并且在原假设情况下卡方值越大也就代表越不可能不相关,也就是越可能相关。

当然在确定检验我们单个系数的时候会用来卡方检验,整个模型的检验的时候就会用到我们F检验,T检验,他们都和我们的卡方有一定的联系。


Logistic制作评分卡模型的衡量标准是K-S值的大小,依据数据质量和建模能力在0-0.5之间,一般在0.3以上才可用,好的模型可以达到0.35。

芝麻分模型的K-S值在0.32左右。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33780.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

风控评分模型

一 概述 余额支付的风险识别模型分为两类&#xff1a;&#xff08;1&#xff09;盗号交易识别风险 和 &#xff08;2&#xff09;盗卡交易识别风险。其中盗卡交易识别风险和余额有关主要是由于骗子注册号码帮盗来的卡&#xff0c;然后进行充值到余额&#xff0c;通过余额支付销…

惊艳!AI创意字体真绝了;6道AIGC高频面试题与解答;为啥语音助手还没集成LLM;深度学习算法红宝书 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 惊艳&#xff01;手把手教你使用 Stable Diffusion 制作AI创意字体 最近AI创意字体刷爆了 ShowMeAI 社群&#xff01;伙伴们纷纷惊叹这…

qt无法显示图片的原因

qt无法显示图片&#xff1a; 原因&#xff1a; 1.检查图片路径&#xff0c;将图片路径改为全路径 如图片路径单为./jpg时&#xff0c;找不到图片&#xff0c;为全路径时可以找到 2.检查图片格式&#xff0c;不要乱改图片的后缀&#xff08;如1.jpg改成1.png&#xff09;&#…

关于Chrome不显示图片的问题

chrome图片不显示的解决方案 如果 你的IE和火狐浏览器可以正常显示图片&#xff0c;但是唯独谷歌浏览器无法显示图片&#xff0c;并且右键在新窗口中打开图片也是没有问题的。主要原因是因为你的图片链接不是https协议&#xff0c;被浏览器认为是不安全的&#xff0c;所以被浏览…

谷歌浏览器csdn图片无法显示

前排提示&#xff0c;博客中的图片不显示&#xff0c;但是同样的连接放到其他浏览器比如Microsoft Edge应该就能正常显示&#xff0c;文章中有一些步骤截图&#xff0c;请将该文章链接拷贝到其他浏览器查看图片。 看了很多博客的方案都没有解决&#xff0c;综合一下我的解决方…

解决图片不显示的问题

我的副业&#xff1a;觉得我的文章写得不错就支持一下我的副业吧 手机卡、流量卡领取&#xff1a;https://lsqstudy.github.io/post/d76a15aa112345.html 阅读导航 跳转到总目录 解决步骤 1、下载所有图片 链接&#xff1a;https://pan.baidu.com/s/1Q3Xw2GLCX_1ZavS6hIjwKg 提…

ImageWatch无法显示图像

问题描述&#xff1a; 最近遇到一个问题&#xff0c;VS里用来查看Opencv图像的ImageWatch插件&#xff0c;一直显示invalid&#xff0c;如下图&#xff1a; 无效尝试&#xff1a; 重装过ImageWatch插件&#xff0c;没用&#xff0c;Release和Debug都无法查看&#xff0c;最后…

解决im.show()不能显示图片问题

在Python中有一个很有用的图像处理插件&#xff1a;PIL(Python Imageing Library)&#xff0c;PIL目前版本为1.1.7&#xff0c;在PIL处理图像的时候&#xff0c;有时show()一下图片&#xff0c;发现如下&#xff1a; 图(1)无法显示图片 出现该问题的原因如下&#xff1a; 解决…

html无法显示图片解决方法

规范书写 无论你采用服务器调用还是浏览器都要使用相对路径&#xff0c;不然代码迁移很麻烦 相对路径同目录下直接使用文件名 例如下面这种情况index.html 使用img标签可以直接这样写 <img src"firefox-icon.jpg" alt"firefox-icon">低级目录向高…

电脑PC微信头像和图片不能显示出来?

电脑PC微信头像和图片不能显示出来&#xff1f; 最近电脑微信更新了以后&#xff0c;微信头像和图片不能显示出来 小编百度了很多&#xff0c;试了删除缓存&#xff0c;更改网络代理等都不行&#xff0c;最后在一个一个知乎上找到一个解决方式&#xff0c; 具体步骤&#xff1…

ChatGPT大更新!联网/插件功能无需排队,Plus用户下周即可体验

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI 好消息&#xff0c;ChatGPT的联网和插件功能不用等了&#xff01; OpenAI刚刚宣布&#xff0c;ChatGPT Plus用户&#xff0c;下周开始不用排队&#xff0c;直接就能用上这些新功能。 具体来说&#xff0c;在最新的联网和插件Beta版中&a…

postgresql备份恢复

一、逻辑备份与恢复 pg_dump -d test >/tmp/test.sql -p 5433 --备份test这个数据库 psql -p 5433 </tmp/test.sql --恢复 pg_dump > /tmp/full.sql -p 5433 --备份整库 psql </tmp/full.sql -p 5433 --恢复 二、物理备份与恢复 1.开启归档 &#xf…

这可能是全网唯一的免费数据恢复软件,支持电脑和手机恢复,支持通话记录,信息,图片,视频等数据恢复!

自己不小心把电脑和手机中的文件给删除了&#xff0c;有个不少小伙伴遇到过吧&#xff0c;那么有没有方法找回这些删除的资料 有&#xff0c;你只需要今天小七提供的这款数据恢复软件&#xff0c;即可轻松的恢复手机和电脑中删除的文件 小七给大家提供了两个软件安装包&#…

4个免费数据恢复软件:免费恢复您的数据

意外的文件删除或文件损坏可能会令人头疼&#xff0c;尤其是在您不使用云存储的情况下。两者通常都支持已删除的文件恢复和版本控制&#xff0c;以帮助您摆脱此类困境。如果您不使用云&#xff0c;通常唯一的机会就是使用数据恢复软件来找回丢失或损坏的数据。 这种方法有两个…

ChatGPT解答:JavaScript保存当前网页页面图片为pdf文件或者word文件,前端用vue2,给出详细的方案和代码

ChatGPT解答&#xff1a;JavaScript保存当前网页页面图片为pdf文件或者word文件&#xff0c;前端用vue2&#xff0c;给出详细的方案和代码 ChatGPTDemo Based on OpenAI API (gpt-3.5-turbo). JavaScript保存当前网页页面图片为pdf文件或者word文件&#xff0c;前端用vue2&am…

展望AI时代,把握文档图像智能分析与处理的未来(文末送书)

【CCIG技术论坛回顾】展望AI时代&#xff0c;把握文档图像智能分析与处理的未来 前言 CCIG技术论坛 内容回顾及探讨一、人工智能大模型时代的文档识别与理解1.1 文档分析与识别 介绍1.2 文档识别历史回顾1.3 文档的种类与研究问题1.4 文档识别与理解研究现状1.5 大模型带来的挑…

90%国人推荐用的浏览器,不仅纯净,还容易上手

大家身边有没有亲戚朋友在用一些国产浏览器&#xff0c;就是时不时弹出一个广告&#xff0c;或是不知不觉给你下载了很多无用软件的浏览器。如果大家还在用这样浏览器&#xff0c;赶紧卸载了吧&#xff0c;不光占内存&#xff0c;还捆绑广告。今天给大家推荐2个很多网友觉得非常…

大模型时代来临,智能文档处理该走向何方?

自去年ChatGPT发布以来&#xff0c;大语言模型&#xff08;Large Language Model, LLM&#xff09;的发展仿佛瞬间驶入了快车道&#xff0c;每天都能听到对相关话题的讨论。 cite: 清华大学人工智能国际治理研究院微博 按照现行的标准&#xff0c;能被称为大语言模型至少要满足…

探索AI领域,AI图像安全技术助力行业健康发展

目录 一、AI时代降临二、AIOCR与传统OCR技术三、通过人工智能模型生成AI图片技术探索四、提前布局&#xff0c;合合信息AI图像安全技术助力行业健康发展1、识别医疗门诊发票和报告2、图像篡改检测升级&#xff0c;截图篡改检测3、AIGC判别&#xff0c;人脸伪造检测4、OCR对抗攻…