大模型时代下的“金融业生物识别安全挑战”机遇

作者:中关村科金AI安全攻防实验室 冯月

金融行业正在面临着前所未有的安全挑战,人脸安全事件频发,国家高度重视并提出警告,全行业每年黑产欺诈涉及资金额超过1100亿元。冰山上是安全事件,冰山下隐藏的是“裸奔”的技术防御系统,快速发展的生成式算法平均每1.5天就有一个新的变种出现,而防御技术的迭代上线周期超过90天,零日漏洞风险敞口超过88.5天。

其中核心问题是攻击数据的严重不足,“引擎缺乏燃料”,现有防御方法跟不上攻击方法的演变速度,基于事件的专家防御体系强依赖于人工数据采集、标注、处理的流程,以扩大corner case规模,该过程占据了技术迭代更新过程中超过90%的时间成本。

行业迫切需要一个针对“零日漏洞”的“零日修复”方案缩小风险敞口,下一代防伪技术金融领域的多模态防伪专有大模型为此提供了一个新思路,大模型可以同时解决燃料和引擎问题,实现“tesla的跑车油改电”、“福特的汽车代马车”。中关村科金通过使用超过2PB的海量数据对大模型进行专项调优,增广基础攻击数据类型、激发模型“涌现”潜能,激活其域外识别能力,将识别数量级从1个9提升到3个9,大幅缩小漏洞风险敞口。大模型是跨时代的产物,是当下解决金融机构面临的生物识别零日漏洞频发危机的唯一可行路径。

人脸安全事件层出不穷,国家多部门发出紧急警告

从具体事件来看,据媒体披露,2024年一家跨国公司香港分部的职员受“换脸、换声”技术欺骗,将2亿港元分别转账15次、转到5个本地银行账户内;2023年包头警方发布一起利用“换脸、换声”技术欺诈案例,福州市某科技公司法人代表郭先生10分钟内被骗430万元;2021年交通银行受到来自IP地址为中国台湾的犯罪分子攻击,7次通过了交通银行的人脸识别,6次通过活体检测。

从国家监管预警趋势看,公安部分两次于2020年、2022年向头部互联网服务机构发出预警,披露9种人脸安全风险;国家网信办于2021年、2023年发出警示,并要求各互联网机构提升人脸识别技术应用安全管理水平;国家金融管理中心,原中国银保监会,于2021年、2023年直接向金融机构下达指示,警惕利用AI新型技术实施诈骗、加强人脸识别技术应用安全管理。这只是冰山上的数字,如果我们下沉到海平面之下,深入到金融机构中,一家普通规模的金融机构一年就要面临超过1万次攻击;据联盟统计,全行业每年黑产欺诈涉及资金超1100亿元。

究其原因,金融是国民经济的血脉,也是被不法分子攻击的首要目标,可谓“野火烧不尽、春风吹又生”。

提升金融业技术防御水平已迫在眉睫,新攻击方法层出不穷,而金融机构科技建设严重滞后,形同裸奔

从机构建设速度看,最快更新时间需要90天。据公开招标信息披露,过去2年间,以国股行为首的头部金融机构已经完成了一轮技术升级,但相较于上一次技术升级,间隔在3-5年;而在金融机构采买的服务中,最短的升级速度也在90天以上,更常见的是1年1次的更新服务。

从攻击方法的创新速度看,平均1.5天就有一种新攻击方法出现。国际顶会CVPR2023仅一年便发布超过130篇关于图像、人脸、声音的生成方法,2024年sora发布仅一周后,阿里便发布了EMO算法,精细的还原了一个人的声音、面部表情、口型、舌动;在应用市场中,新增注入攻击、换脸换声软件超过百余种,包括uface、趣换脸、insightface、Xpression等。

从作案工具易得性看,在地下交易市场中,攻击道具交易已颇具规模,通常200元就能买到一次定点攻击服务。金融行业的技术更新速度已经严重制约了金融安全防御体系的建设零日漏洞(0-day)已经从操作系统、计算机网络下沉到了人工智能中,并深度影响着金融行业的健康发展,在新型攻势的88.5天(90-1.5)中,机构防御手段如同裸奔

金融机构防御体系建设慢的核心问题是攻击数据的有效性不足

这一方面是吃不饱导致的。攻击数据少是一个相对概念,是一种由认知偏差导致的数据的动态不足,而不是绝对数量的不足,“人不能知道自己不知道的东西(unconscious incompetence)”。防御方案需要针对攻击特点来设计,天然滞后于攻击的发生,这就带来了认知的客观时间差。金融机构的技术更新就是典型样例,防御升级通常围绕事件展开,如通过巡检、或者行业联盟共享的素材,而这些事件所提供的负样本数目非常少。这些数据是不足以支撑一次训练,也即无法提升专家模型的能力。因此,通常技术部门需要先对这些负样本(corner case)进行解析,分析其生成原理和特征,然后人工进行数据采集、数据标注、数据处理,最后用于训练,验证,最终完成技术升级,超过90%的时间成本被花在了数据的构建上,这也直接造成了机构“裸奔现象”。

更重要的,另一方面是吸收少导致的。从攻击数据到模型性能存在一个“能量转化率”,这是一种系统性能力不足,也可以比作“营养失调”、“肠胃差”。专家模型的认知方式与人有较大差异,从标注方式来看,专家模型训练数据真值(ground truth)是在采集前确定的,全部都有真值;人的训练数据是先对海量无标数据的归纳、然后通过极少数量的有标数据启发得来的。专家模型本身并不是拟合的“人的认知”,而是拟合的“特定攻击手法的作案特征”,这也就解释了为什么专家模型在针对同类攻击行为的检出上远高于人类,但对新攻击的识别远逊于人类。

业务目标是更快的补全漏洞,如果我们头疼医头、脚痛医脚只能陷入被动解决吸收问题更重要。因此,我们迫切需要一种划时代的应用,一个胃口好、消化好的铁胃来解决零日漏洞频发危机。

一种零日修复方案、下一代防伪技术,金融领域的多模态防伪专有大模型提供了一个新思路

更强的编码能力。谷歌在2018年提出了预训练模型,transformer技术崭露头角,基于transformer的BERT技术向我们证明了一切专家问题本质是编码问题,编码能力的提升直接影响着专家判断的准确性。

更强的数据承载能力。2020年,OpenAI发表了关于scaling laws的关键论文,并在2022年GPT3.0上证明了超大规模的数据可以产生“知识涌现”现象,如今大模型规模已经突破100B。

好胃口+好消化=超强的域外推理能力,大模型增强了对没见过问题的处理能力。2023年,google发布多模态大模型Gemini,中关村科金对其进行了防伪能力的专项测试,发现其不仅可以指出图片的真假,甚至可以讲出图片假在什么地方,如纹理、毛发、环境、一致性等。尽管此时的通用大模型能力还不如专有大模型,但我们快速将大模型引入了防伪体系建设中,我们在超过4亿规模的真人图像、音频样本数据集上,通过“基于超过100种基础伪造攻击算法实现的万倍数据增广方案”最终将数据集扩大到2PB。经过测试,“金融领域的多模态防伪专有大模型”相较于“传统专家模型”能力有显著提升,以针对“对抗样本攻击”的防御为例,我们将防御指标从1个9(90%),提升到了3个9(99.9%),大幅缩小漏洞风险敞口。

大模型是跨时代的产物,是当下解决金融机构面临的生物识别“零日漏洞”频发危机的唯一可行路径。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/290060.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32 PWM通过RC低通滤波转双极性SPWM测试

STM32 PWM通过RC低通滤波转双极性SPWM测试 📍参考内容《利用是stm32cubemx实现双极性spwm调制 基于stm32f407vet6》📺相关视频链接:https://www.bilibili.com/video/BV16S4y147hB/?spm_id_from333.788 双极性SPWM调制讲解以及基于stm32的代码…

主流公链 - BCH BSV BTG

为什么出现分叉 BTC是自由的,BTC社区也是自由的,自然而然的会出现不同观点的群体 1. 比特币现金(Bitcoin Cash,BCH) 分叉日期: 2017年8月1日主要目的: 提高比特币的交易吞吐量和降低交易费用技术…

文献学习(自备)

收官大作,多组学融合的新套路发NC!! - 知乎 (zhihu.com) Hofbauer cell function in the term placenta associates with adult cardiovascular and depressive outcomes | Nature Communications 病理性胎盘炎症会增加几种成人疾病的风险&a…

火车头通过关键词采集文章的原理

随着互联网信息的爆炸式增长,网站管理员和内容创作者需要不断更新和发布新的文章,以吸引更多的用户和提升网站的排名。而火车头作为一款智能文章采集工具,在这一过程中发挥着重要作用。本文将探讨火车头如何通过关键词采集文章,以…

【TB作品】MSP430G2553,超声波倒车雷达PCB,单片机,超声波SR04,键盘,oled,

题目 硬件:MSP430G2553、 SR04超声波传感器 、3*4键盘、 无源蜂鸣器、oled显示屏 软件 1 、实时显示测量得到的距离 2、按键设置一个报警门限数值,直接输入数值后确认 3、低于报警门限数值就开始报警,而且距离越近蜂鸣器的鸣叫频率越高 程序…

数据库索引及优化

数据库索引及优化 什么是索引? MySQL官方对索引的定义为:索引(INDEX)是帮助MySQL高效获取数据的数据结构。 索引的本质: 数据结构 为什么要引入索引? 引入索引的目的在于提高查询效率,就好像是…

深入浅出的揭秘游标尺模式与迭代器模式的神秘面纱 ✨

​🌈 个人主页:danci_ 🔥 系列专栏:《设计模式》 💪🏻 制定明确可量化的目标,坚持默默的做事。 🚀 转载自:设计模式深度解析:深入浅出的揭秘游标尺模式与迭代…

Zabbix6 - Centos7源码编译部署HA高可用集群手册

Zabbix6 - Centos7源码编译部署HA高可用集群手册 HA高可用集群 总所周知,在我们IT运维的圈圈中,HA高可用集群服务算是逼格最高的吧也是运维里保障力度最大的环境。 HA是HighlyAvailable缩写,是双机集群系统简称,提高可用性集群,是保证业务连续性的有效解决方案,一般有两个…

深入探讨多线程编程:从0-1为您解释多线程(下)

文章目录 6. 死锁6.1 死锁原因 6.2 避免死锁的方法加锁顺序一致性。超时机制。死锁检测和解除机制。 6. 死锁 6.1 死锁 原因 系统资源的竞争:(产生环路)当系统中供多个进程共享的资源数量不足以满足进程的需要时,会引起进程对2…

Fastadmin给列表数据绑定添加内容

不同及服务需要收集不同的字段,在服务列表处增加按钮,弹出管理字段列表,单独管理每个服务的字段。如下图,给不同的服务绑定不同表单字段,点击表单按钮弹出页面维护当前服务的字段。 实现代码 //初始化表格处添加按钮 …

Linux根据时间删除文件或目录

《liunx根据时间删除文件》和 《Linux 根据时间删除文件或者目录》已经讲述了根据时间删除文件或目录的方法。 下面我做一些补充,讲述一个具体例子。以删除/home目录下的文件为例。 首先通过命令: ls -l --time-style"%Y-%m-%d %H:%M:%S"…

软件验收报告都包含哪些内容?为什么要做验收测试?

验收测试报告用于评估软件产品是否满足预定的要求和标准,是软件测试的重要输出文档。 通过验收测试报告,开发团队可了解软件存在问题和改进方向,进行修复和优化。同时,报告也可作为软件交付用户时提供的必要文档之一,帮助用户更好…

初识C++ · 入门(1)

目录 前言: 1 命名空间 2 输入和输出 3 缺省参数 5 函数重载 前言: C与C语言是有一定交集的,可以理解为本贾尼在使用C语言的时候认为有缺陷,于是加了一些小语法进行改良,后来经过委员会的修改,C98问世…

华为云使用指南02

5.​​使用GitLab进行团队及项目管理​​ GitLab旨在帮助团队进行项目开发协作,为软件开发和运营生命周期提供了一个完整的DevOps方案。GitLab功能包括:项目源码的管理、计划、创建、验证、集成、发布、配置、监视和保护应用程序等。该镜像基于CentOS操…

【已修复】iPhone13 Pro 长焦相机水印(黑斑)修复 洗水印

iPhone13 Pro 长焦相机水印(黑斑)修复 洗水印 问题描述 iPhone13 Pro 后摄3倍相机有黑色斑点(水印),如图所示, 后摄相机布局如图所示, 修复过程 拆机过程有风险,没有把握最好不要…

HTB devvortex靶机记录

做这个靶机的师傅们我先提一句,不知道是否是因为网速还是其他因素影响,登录后台管理后,有大概率会被其他人挤下去,所以做这道题的师傅可以考虑在没人的时候去做。 打开靶场以后老规矩nmap扫一遍 这里爆出了80端口和22端口&#xf…

葵花卫星影像应用场景及数据获取

一、卫星参数 葵花卫星是由中国航天科技集团公司研制的一颗光学遥感卫星,代号CAS-03。该卫星于2016年11月9日成功发射,位于地球同步轨道,轨道高度约为35786公里,倾角为0。卫星设计寿命为5年,搭载了高分辨率光学相机和多…

AI大模型智能大气科学探索之:ChatGPT在大气科学领域建模、数据分析、可视化与资源评估中的高效应用及论文写作

本文深度探讨人工智能在大气科学中的应用,特别是如何结合最新AI模型与Python技术处理和分析气候数据。介绍包括GPT-4等先进AI工具,旨在帮助大家掌握这些工具的功能及应用范围。内容覆盖使用GPT处理数据、生成论文摘要、文献综述、技术方法分析等实战案例…

Web Components使用(一)

在使用Web Components之前,我们先看看上一篇文章Web Components简介,其中提到了相关的接口、属性和方法。 正是这些接口、属性和方法才实现了Web Components的主要技术:Custom elements(自定义元素)、Shadow DOM&#…

Unity2018发布安卓报错 Exception: Gradle install not valid

Unity2018发布安卓报错 Exception: Gradle install not valid Exception: Gradle install not valid UnityEditor.Android.GradleWrapper.Run (System.String workingdir, System.String task, System.Action1[T] progress) (at <c67d1645d7ce4b76823a39080b82c1d1>:0) …