金融风控项目-1

文章目录

一. 案例背景介绍
二. 代码实现
- 1. 加载数据
- 2. 数据处理
- 3. 查询
三. 业务解读

一. 案例背景介绍

通过对业务数据分析了解信贷业务状况
数据集说明
- 从开源数据改造而来，基本反映真实业务数据
- 销售，客服可以忽略
- 账单周期，放款日期
- 账单金额-实收金额 = 未收金额
- 应付日期为还款时间
- 账期分成两种 60天和90天
- 实际到账日为空白说明没还钱
通过对贷后业务数据的分析要分析出如下内容
- 每个季度账单金额和坏账率（逾期90天以上）
  - 所有未收金额/所有账单金额
  - 未收金额 = 账单金额-实收金额
- 每个季度60天账期入催率，90天账单入催率
- 不同逾期天数的回款情况
  - 历史逾期天数有逾期已经还完了
  - 当前逾期天数现在还欠着钱，没还完

二. 代码实现

1. 加载数据

import pandas as pd
import datetime
from pyecharts.charts import *
from pyecharts import options as opts
df1 = pd.read_excel('data/业务数据.xls') 
#要使用原始数据构建新指标，所以保留原始数据，copy新的数据，在新的数据中创建新指标
df2 = df1.copy()
df2.head()

在这里插入图片描述

df2.info()

在这里插入图片描述

2. 数据处理

填充缺失值,将日期时间类型转换成datetime类型

# 获取最大的日期，作为当前时间
today_time = pd.to_datetime(df2.实际到账日.fillna('0').max())df2['实收金额'] = df2.实收金额.fillna(0)
df2['开票金额'] = df2.开票金额.fillna(0)
df2['未收金额'] = df2.未收金额.fillna(0)df2['账单周期'] = pd.to_datetime(df2.账单周期)
df2['应付日期'] = pd.to_datetime(df2.应付日期)df2['实际到账日'] = pd.to_datetime(df2.实际到账日).fillna(today_time)
df2

在这里插入图片描述

df2.info()

在这里插入图片描述
为了后续计算，在原始数据基础上构造新的字段：是否逾期，是否逾期90天，未收金额2（校验原始数据中的未收金额），当前逾期天数，历史逾期天数

df2['是否到期'] = df2.apply(lambda x: '1' if (x.实际到账日 > x.应付日期) else '0',axis = 1)df2['是否到期90天'] =  ( today_time - df2.应付日期 ).map(lambda x : 1 if x.days >= 90 else 0)df2['未收金额2'] =  (df2.账单金额 - df2.实收金额)df2['历史逾期天数'] = df2.apply(lambda x : (x.实际到账日 -  x.应付日期).days if x.未收金额2 == 0  else  (today_time - x.应付日期).days,axis=1)df2['当前逾期天数'] = df2.apply(lambda x : (x.历史逾期天数) if x.未收金额2 > 0  else 0 ,axis = 1) 
df2

在这里插入图片描述

3. 查询

查询实际到账日期字段得知当前最近的到账日为2019年5月17日，如果以2019年5月17日为观察点，有些贷款还没到还款日，没法统计DPD90的数据，所以，这里只统计2019年之前的情况，下面将对应时间段的数据取出

df3 =df2.copy()
#创建’账单季度‘字段，将日期转换成季度
df3['账单季度'] = df3['账单周期'].map(lambda x : x.to_period('Q'))
#提取2017年3季度到2018年4季度数据
df3 = df3[(df3['账单季度']<='2018Q4') & (df3['账单季度']>='2017Q3')]
df3

在这里插入图片描述

#账单金额
fn1 = df3.groupby('账单季度')[['账单金额']].sum()
fn1.columns = ['账单金额']
fn1

在这里插入图片描述

#90天到期金额
df4 = df3[(df3.是否到期90天 == 1)]
fn2 = df4.groupby('账单季度')[['账单金额']].sum()
fn2.columns = ['到期金额']
fn2

在这里插入图片描述

df4 = df3[(df3.是否到期90天 == 1)]
fn3 = df4.groupby('账单季度')[['未收金额2']].sum()
fn3.columns = ['当前逾期90+金额']
fn3

在这里插入图片描述
合并数据计算逾期率

dfs = [fn1,fn2,fn3]
final1 = pd.concat(dfs,axis=1)
final1

在这里插入图片描述

final1['90+净坏账率'] = round(final1['当前逾期90+金额'] / final1.到期金额,3)
final1

在这里插入图片描述
pyecharts绘图

bar = (Bar().add_xaxis(list(final1.index.values.astype(str))).add_yaxis("账单金额",list(final1.账单金额),yaxis_index=0,color="#5793f3",).set_global_opts(title_opts=opts.TitleOpts(title="90+净坏账率"),).extend_axis(yaxis=opts.AxisOpts(name="90+净坏账率",type_="value",min_=0,max_=0.014,position="right",axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color="#d14a61")),axislabel_opts=opts.LabelOpts(formatter="{value}"),))
)
line = (Line().add_xaxis(list(final1.index.values.astype(str))).add_yaxis("90+净坏账率",list(final1['90+净坏账率']),yaxis_index=1,color="#675bba",label_opts=opts.LabelOpts(is_show=False),)
)
bar.overlap(line).render_notebook()

在这里插入图片描述
计算每个季度的60天账单入催金额，90天账单入催金额

#60天账期的账单金额
df4 = df3[(df3.账期 == 60)&(df3.是否到期 == "1")]
fn1 = df4.groupby('账单季度')[['账单金额']].sum()
fn1.columns = ['60天账期的账单金额']
fn1

在这里插入图片描述

#60天账期的入催金额
df4 = df3[(df3.账期 == 60)&(df3.是否到期 == "1")&(df3.历史逾期天数>0)]
fn2 = df4.groupby('账单季度')[['未收金额2']].sum()
fn2.columns = ['60天账期的入催金额']
fn2

在这里插入图片描述

#90天账期的账单金额
df4 = df3[(df3.账期 == 90)&(df3.是否到期 == '1')]
fn3 = df4.groupby('账单季度')[['账单金额']].sum()
fn3.columns = ['90天账期的账单金额']
fn3

在这里插入图片描述

#90天账期的入催金额
df4 = df3[(df3.账期 == 90)&(df3.是否到期 == '1')&(df3.历史逾期天数>0)]
fn4 = df4.groupby('账单季度')[['未收金额2']].sum()
fn4.columns = ['90天账期的入催金额']
fn4

在这里插入图片描述
计算入催率

dfs = [fn1,fn2,fn3,fn4]
final2 = pd.concat(dfs,axis=1)
# final2 = fn1.merge(fn2,on='账单季度').merge(fn3,on='账单季度',how='left').merge(fn4,on='账单季度')
final2['60天账期入催率'] = round(final2['60天账期的入催金额'] / final2['60天账期的账单金额'],3)
final2['90天账期入催率'] = round(final2['90天账期的入催金额']/final2['90天账期的账单金额'],3)
final2

在这里插入图片描述
pyecharts绘图

line = (Line().add_xaxis(list(final1.index.values.astype(str))).add_yaxis("60天账期入催率",list(final2['60天账期入催率']),yaxis_index=0,color="#675bba",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="不同账期入催率"),).add_xaxis(list(final1.index.values.astype(str))).add_yaxis("90天账期入催率",list(final2['90天账期入催率']),yaxis_index=0,color="#d14a61",label_opts=opts.LabelOpts(is_show=False),)
)
line.render_notebook()

在这里插入图片描述

df6 = df3[(df3.未收金额2 == 0)&(df3.是否到期 == '1')].copy()
df6

在这里插入图片描述

#使用cut，讲数据按照逾期天数分箱，然后添加分箱之后结果标签
df6['历史逾期天数'] = pd.cut(df6['历史逾期天数'],bins=[-999,0,5,10,15,20,30,60,90,999],right=True,labels=['0','1-5','6-10','11-15','16-20','21-30','31-60','61-90','91+'])
df6

在这里插入图片描述

final3 = df6.groupby('历史逾期天数')[['账期']].count()
final3.columns = ['回收账单数']
final3

在这里插入图片描述
pyecharts绘图

ydata = final3['回收账单数'].values.tolist()
bar = (Bar().add_xaxis(list(final3.index.values.tolist())).add_yaxis("收回账单数",ydata,yaxis_index=0,color="#675bba").set_global_opts(title_opts=opts.TitleOpts(title="不同逾期天数的已收回账单数"),)
)
bar.render_notebook()

在这里插入图片描述

三. 业务解读

业务解读

从数据中看出，在2018年Q2季度之前，运营策略比较保守，坏账金额和入催率都比较低，
2018年Q2之后，有可能是由于运营策略调整，给更多的人放贷，但坏账率和入催率均在3%一下，在合理范围内
不同逾期天数收回账单的数据看，30天内能收回绝大部分账单

● 知道常见信贷风险
○ 信用风险
○ 欺诈风险
● 知道机器学习风控模型的优势
○ 批量，迅速，准确，同时处理大量贷款请求
○ 在零售信贷业务场景下，与人工审核相比优势显著
● 知道信贷领域常用术语含义
○ DPD 逾期天数
○ FPD 首次逾期天数
○ bad rate 坏账率
○ M1 逾期一个月以内

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/16732.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！