实时图计算如何进行风控决策管理?

在金融行业中,账户之间是复杂、多层的关系,那么,数据在高速地发生动态变化的时候,如何进行高效的关联关系计量,如欺诈判定、归因分析等——这种挑战就是典型的深数据或者图数据的挑战。

01 从数据角度看信用卡欺诈风险

银行交易反欺诈也称作银行卡转账反欺诈,此中,银行卡既包括个人银行卡,也包括对公账户及结算卡,同时还包括非银行支付机构账户,即我们日常会频繁使用到的微信、支付宝等第三方支付。

银行卡的欺诈风险,比较常见的趋势是从个案、个例走向专业化、团伙化、国际化。所谓团伙化,如果从“图论”的角度来看,其实就是侧重于数据之间高度的关联性和网络性。

 如上图所示,在这种银行卡电信欺诈当中,上、中、下游其实已经分化为卡商、料商和号商。下游号商做的事情,就是我们经常听说的薅羊毛、刷单、刷粉等有害信息的分发,包括这种诈骗过程当中使用的各种各样的技术都是为了逃避风控与监管。

例如,两个账户之间转账,如果仅看到两个账户之间的这条潜在的转账交易,那么,到底是实施放行还是拦截,行方很难去决策;但如果我们能看到一个更大的图——账户1和账户2的外围延展的交易网络,就能发现账户1和账户2是一个更大的诈骗网络当中的关键中转节点。

02 传统反欺诈系统之痛点

面对层出不穷的欺诈风险和不断翻新的欺诈手段,传统的反欺诈系统面临着非常大的挑战:

实时性差、数据容量小。难以实时处理海量数据,现有的线上系统无法实时化(毫秒级)处理包含至少6个月的全量历史交易数据,并且解决方案部署与运维复杂、集群规模大、效率低,整体效果不好。

对欺诈网络挖掘不深、不广、不快。难以对账户交易资金的转账链条、路径、网络进行深入、快速、全量的计算与追踪。本质上是因为基于数仓或大数据框架的反欺诈系统不具备深度穿透、关联计算的能力,反欺诈的规则繁琐、低维、效率低下、准确性差。

模型风险。基于AI深度学习的很多反欺诈解决方案存在黑盒化、不可解释、不可追溯、难以审计等模型风险。

03 Ultipa 实时银行交易决策系统


银行拥有海量交易及第三方融合数据,对于风控系统最关键的原则有“快、稳、准、深、多、溯”六点;基于传统数仓、大数据平台的传统风控反欺诈系统是无法满足以上原则的。

而Ultipa实时图计算系统,对欺诈风险可以进行精准建模,实时计算引擎能在20毫秒内完成交易流水网络的图特征计算,可帮助发卡银行提升实时反欺诈决策能力,实现“早发现”、“早预警”、“实时拦截”,将欺诈团伙的行为扼杀在早期。

图决策模型

图数据建模,包含银行的海量交易流水、卡片统计、商户统计、地区特征、风险事件、欺诈样本(黑、灰、白名单)等数据,构建与欺诈相关的特征体系,完成数据清洗和特征筛选。

反欺诈场景的图模型包括交易对手双方上下游遍历、聚合、筛选、交易频率、特征、行为模式分析、欺诈特征相似度、区分度、社区识别等多维度进行分析。同时,图计算模型在多维度范围内分析交易网络历史欺诈形势,提高模型的准确性。

图:反欺诈从“个体—孤点”到“立体—网络”


从反欺诈规则的视角来看,反欺诈规则是由简到繁,可以看作是从“点”到“线‍”、到“面”、到“体”的网状形态,具有不同的维度,对应的算力需求也是逐级增加的。其中,“点”即研究个体,所谓个体是只看一笔交易或一个账户。

 从数据拆分的视角来看,如果从一条“线”着手,其实是资金的分散转出,即在下钻的过程当中,一个主账户会分出很多分账户。这种汇总的数据其实可以拆分到更细,因为从“点”到“线”再到“面”,分析明细数据会帮助我们建立更全局的认识。

从点、线、面、体看,如果反欺诈的规则同步升级,对算力的需求是逐级增加的,这是传统数据库没有办法解决的,包括传统大数据的框架也没有办法很好地解决实时风控的原因也基于此。与此同时,如果没有Ultipa GQL(嬴图查询语言)的应用,那么对多维数据间关联关系的查询、计算和表达也会相当地困难。

图:实时图计算反欺诈场景(交易网络实时化挖掘)

实时图计算风控系统

Ultipa 实时银行交易决策系统从架构上可划分为三层,分别是:

数据接入层

实时计算层

实时决策层

其中,数据接入层负责交易采集和存储,实时计算层负责交易数据的实时分析、交易维度的特征聚合、模型预测,实时决策层将风险评分实时传递至发卡银行,由发卡银行实时决策风险,实时拦截欺诈交易。该系统采用了超高吞吐量(高密度并发)及超低延时的图计算引擎,旨在确保每笔交易都在20毫秒内完成在线计算与分析。

对信用卡或者贷款的申请,如何判断是否存在欺诈问题?其实,两卡申请之间共享了大量的信息。如公司的信息、E-mail地址、设备ID、电话等,甚至包括介绍人的信息。那么,怎么做这种计算呢?一种办法是从某个账户出发去寻找是否存在一个4步的环路可以回到自身,即环路查询;另一种则更为高效,即查询两个贷款申请之间的邻居有多少共同的邻居。在数学中,第二种计算效率会更高。实际上,我们计算出来的结果也是这样的:在一个高并发的系统之内,查任意两个申请,完成的时间不超过5毫秒,完全可以做到以“纯实时、高并发”的方式完成,这是一个相对简单的例子,因为它聚焦的非常明确。

在数亿量级的电话号码当中,如何大海捞针般寻找到涉嫌欺诈的号码呢?其中,被5个以上申请用过的电话号码可能会存在欺诈风险。这其实是面向全量数据的计算。如果采用传统的大数据框架至少需要几十分钟、甚至几个小时(即便不算数据动态加载的时间);但如果用实时图计算去做,在一秒钟左右即可完成。这就相当于将传统的、需要批量处理的工作实时化完成。

怎么在图上挖掘信贷?比如,信贷资金是否有违规流入楼市、股市或其他情况。我们可以从借款人的放款账户出发查询,经过多手的转账之后,最终的资金是否流入了房地产开发商的账户。如果用传统的大数据框架做这样的查询,复杂程度非常之高,但利用图计算去做,再用Ultipa GQL (嬴图查询语言)搜索查询与分析—— 一句话即可以做完!

对比

基于Ultipa Graph的实时银行交易决策系统的性能与性价比,较其它系统有指数级的提升。见下图:

 通过上图可以看出,Ultipa实时图数据库技术的一个特点就是它要解决复杂查询、深度查询的问题。它的架构逻辑并不是去大规模地堆积机器,而是通过精简、高效的硬件架构来实现最大规模并发与算力的图计算系统,旨在更好地赋能银行业务迭代的诉求,提升客户体验,降低运营成本,提升社会效益等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32931.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

验证码在风控中的实际应用

前言:在业务场景中,企业的安全团队通常将验证码作为降低业务受损风险的方法,以减少撞库盗号、虚假注册、刷量作弊、信息盗窃、薅羊毛等风险事件发生的可能性。 今天将通过验证码在极验十周年特别活动的实际应用,探讨验证码在业务…

风控策略(下)

一、常用量化指标 首先,先了解下如何定义逾期。 过了最后还款日仍未还款,则为逾期。注意,一个客户只有一个账单日。如果想要获得最长免息还款期,则应该在上一个账单日的后一天进行消费。   还有,最重要的一点&#…

风控ML[10] | 风控建模中的自动分箱的方法有哪些

之前有位读者朋友说有空介绍一下自动分箱的方法,这个确实在我们实际建模过程前是需要解决的一个问题,简单来说就是把连续变量通过分箱的方式转换为类别变量。关于这个话题,我也借着这个主题来系统的梳理总结一下几点:为什么要分箱…

风控分析常用指标介绍

在信贷风控中,指标时反应业务变化最直观的手段,通过对指标的分析及时发现和定位业务开展过程中的问题,并及时采取相应的手段进行防控。本文列出工作中常关注的风险指标,介绍指标的定义及分析的方法,旨在精而不在全&…

全面了解风控策略体系

模型和策略的开发是一个系统工程,这其中需要有业务经验、统计理论、算法运用、和数据认知,是一个不断反思,不断积累经验的过程。沙滩上建不起摩天大楼。扎扎实实的基本功永远有价值,永远不会过时。 ——余旭鑫博士 说明 互联网…

金融风控实战——有监督分箱

卡方分箱 分箱的方法有很多,卡方分箱属于其中一种,属于有监督系列的。卡方分箱正是一种基于卡方检验的分箱方法,更具地说是基于上面提到的第二种应用,独立性检验,来实现核心分箱功能的。   卡方分箱算法简单来说&…

风控策略简介

【作者】:Labryant 【原创公众号】:风控猎人 【简介】:某创业公司策略分析师,积极上进,努力提升。乾坤未定,你我都是黑马。 【转载出处】:https://blog.csdn.net/lc434699300/article/details/1…

风控模型及特征的上线部署方法

序言: 作为年后的首篇实操干货文章,番茄风控一如既往向业内小伙伴输出相关的干货文章。有实操能落地,有数据可撸码,继续将会是番茄风控提供给各位小伙伴的业内标配内容。 近期,我们花费了时间容整理了目前业内各位小伙…

金融风控实战——社交网络分析

社交网络分析 上节课有同学希望能讲一些设备指纹的内容,所以这节课我们先讲一下设备指纹,作为反欺诈图谱的基础。 设备指纹 可以把手机设备理解成一个人,像人一样有身份证号和名字(设备序列号等),没有化…

风控数据测试概要

数据测试简介 简而言之,数据测试就是对数据的质量进行测试,查看该质量能不能被我方接受。在风控中,数据测试的主要目的是测试对方数据源是否可以较好地区分出我方申请用户的好坏,衡量质量的指标主要包括:Lift-Chart、A…

三分钟看懂大数据风控中用户行为数据的采集、分析及应用( 转 )

据统计,目前银行传统的风控模型对市场上70%的客户是有效的, 但是对另外30%的用户,其风控模型有效性将大打折扣。 大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制, 用户行为数据可以作为另外的30%客…

CAR-T药物|疗法适应症|市场销售-上市药品前景分析

对患有癌症的人来说,能够幸运地度过5年大关是一种成功,而能够成功地度过10年大关则是一种奇迹。Emily作为全球第一个接受CAR-T治疗成功的白血病儿童患者,至今已成功摆脱癌症11年之久。 ①CAR-T细胞治疗(Emily Whitehead治疗案例时…

股票数据分析查询接口,股票数据接口,沪深港股,股票api查询

一、接口介绍 查询历史数据的分析统计。本接口数据仅用于学习分析,不得用于对外展示!根据股票代码、日期获取股票历史数据及相关分析,返回日期、开盘价、收盘价、最高价、最低价、成交量、成交额、换手率、涨跌幅等,可绘制相应日…

微信AI助手

首先,感谢GitHub上的开源大佬!对微信AI助手项目我修改了少许部分,以实现在自己服务器上部署。这里是我的项目地址。 1、准备服务器 1.1 服务器密码及安全组规则修改 这里我是用的是腾讯云国内服务器,有条件的同学可以直接选择国…

Andrew Ng和OpenAI教你写prompt

课程地址: https://learn.deeplearning.ai/chatgpt-prompt-engb站搬运: https://www.bilibili.com/video/BV1No4y1t7Zn 教学人员:Lsa Fulford, Andrew NG LLM的两种样式 Base LLM:基于文本训练数据预测下一个词的概率&#xff0…

Android之输入银行卡号判断属于哪个银行

一&#xff1a;效果图&#xff1a; 二&#xff1a;实现步骤&#xff1a; 1.xml布局实现&#xff0c;两个edittext就行了 <LinearLayoutandroid:id"id/lin_yhkh"android:layout_width"fill_parent"android:layout_height"48dp"android:layou…

[项目管理-6]:软硬件项目管理 - 项目沟通管理(渠道、方法)

作者主页(文火冰糖的硅基工坊)&#xff1a;文火冰糖&#xff08;王文兵&#xff09;的博客_文火冰糖的硅基工坊_CSDN博客 本文网址&#xff1a;[项目管理-6]&#xff1a;软硬件项目管理 - 项目沟通管理 &#xff08;沟通渠道&#xff09;_文火冰糖的硅基工坊的博客-CSDN博客 目…

一键定制个性化语音,微软的AI语音落地实践

近日&#xff0c;微软与周迅AI语音红丹丹公益项目发起人鹿音苑文化传播公司、以及来自微软及各界的150名余志愿者&#xff0c;将创作的首批人工智能有声内容&#xff0c;包括鲁迅、老舍、萧红、朱自清等作家的一系列经典作品、红丹丹文化期刊&#xff0c;正式捐赠给北京市红丹丹…

Python 深度学习AI - 声音克隆、声音模仿、模拟特朗普声音唱《See You Again》,Real-Time-Voice-Cloning项目的安装与使用

Python 深度学习AI - 声音克隆、声音模拟 第一章&#xff1a;环境准备与安装① Real-Time-Voice-Cloning 项目源码下载② requirments 必要库安装③ TensorFlow 安装④ PyTorch 安装⑤ FFmpeg 下载环境变量配置⑥ 下载训练包第二章&#xff1a;效果测试① 命令行合成音频测试&a…

微软小冰的服务器在哪,微软小冰解锁三大小米入口

原标题&#xff1a;微软小冰解锁三大小米入口 微软小冰与小米小爱加深合作&#xff0c;解锁更多小米入口。具体内容请关注今天的小熊微科技【每日必读】栏目。 微软小冰解锁三大小米入口 好闺蜜&#xff0c;就是要形影不离。9月4日&#xff0c;微软小冰宣布解锁更多小米入口&am…