前言
反欺诈的本质更多的是校验借款人的身份,也就是证明你就是你,我就是我。反欺诈也有很多金融术语(参见:https://zhuanlan.zhihu.com/p/26197949),也便于我们更清楚欺诈风险点。针对信贷业务,主要有两种风险,欺诈风险和信用风险,从造成的损失来看欺诈风险是公司损失的主要风险;当前网络的欺诈从业人数超过200万,网络诈骗的市场规模约1200亿,因为骗贷、套现等手段造成倒闭的机构超过2000家。
欺诈风险分类大致有两种:
第一方欺诈——相似地址伪装、本人手机号小号、高级欺诈.....
第三方欺诈——团伙欺诈、身份冒用、养资料(设备农场、猫池)...
我们常用的手段有:策略反欺诈,直接欺诈类用户通过策略拒绝掉;反欺诈评分,信用风险向欺诈风险转移的用户通过反欺诈评分卡模型来搞定,模型能解决策略的局限性。
反欺诈模型实施要点
1. 特征选择
-
-
个人欺诈特征:比如命中法院执行名单、三方黑名单、三方欺诈分;详单数据(通话次数、详单中授信人数占比,一度、二度联系人数占比)
-
团伙欺诈特征:比如设备关联了多少身份证;IP登录异常、通讯录数据(e.g:通讯录中名字涉及到“贷款”的个数、通讯录中命中黑名单的人数)
-
特征细分类
-
基础信息:如年龄、申请授信次数
-
设备信息:如借款人对应手机个数
-
时间相关:如授信申请时间在0-6点
-
运营商相关:近180天通话时长(通讯录、通话详单可以单独挖掘,构建子模型)
-
三方:蜜罐手机灰度值、前海好信度评分等等
-
行为相关:7天内登录次数;首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等
-
复杂网络:借款人一度、二度联系人个数等
-
-
-
Label定义
-
黑名单用户
-
首单逾期用户
-
策略拒绝用户
-
人工标记用户
-
-
模型评估
-
线下表现
-
p值和分数的分布
-
训练集和测试集的AUC、KS
-
拒绝率:如果阈值设置高于某个值,则拒绝的人数占总人数的占比(主要用于对比线上情况是否一致,类似分层的概念)
-
-
线上评估(同线下)
-
常用个人(C端)反欺诈体系
身份信息校验——人脸比对、ocr、活体识别、人证比对、虹膜识别
手机号验证与识别——短信验证码、语音验证码、图形验证码、拖动滑块式验证码、运营商、二次放号,虚假,未实名等等
地址定位——验证居住地和工作地真实性和真假,申请地址GPS和手机设备GPS地址是否匹配
设备指纹——其他设备指纹相关的规则(白骑士)、设备关联不同姓名(年龄,地区)的身份证等
银行卡——三要素验证、四要素验证、银行卡号归属地在高危地区、银行卡号命中盗卡黑名单等
多头检测——检测申请人最近是否多次申请贷款,外部都头数据,同盾、百融、极光、聚信立等
风险名单库——内外部黑名单,司法数据,逾期名单,失联名单,贷款黑中介名单是否命中,公检法公开的失信、申诉、被执行、吸毒、涉黄,各类征信数据联盟的不良名单等
知识图谱——联系人是否命中黑名单,通讯录涉黑、涉黄等
人工交叉电核——经验性话术设计、勾稽比对、交叉检验等
贷中监控反欺诈——行为数据,手机使用状况、出行记录、电商平台交易数据、还款行为数据、短时间频繁交易,大额交易,补卡盗刷等
如下是反欺诈在全流程信贷中的关键指标:
一、注册
二、登录
三、实名认证
四、绑卡
五、授信
六、放款
七、提现
参考文章1:https://zhuanlan.zhihu.com/p/29068100
参考文章2:https://zhuanlan.zhihu.com/p/43785235
参考文章3:https://mp.weixin.qq.com/s/mBUAcAVaS8h66DvwzXUtHQ