【隐私计算篇】全同态加密应用场景案例(隐私云计算中的大模型推理、生物识别等)

1.题外话

        最近因为奖项答辩,一直在忙材料准备,过程非常耗费时间和精力,很难有时间来分享。不过这段时间虽然很忙碌,但这期间有很多新的收获,特别是通过与领域内专家的深入交流和评审过程,对密码学和隐私计算领域有了更深层次的理解。此外,也体会到工作中严谨和科学的工作方法的重要性。

2. 全同态加密应用案例

2.1 关于全流程加密、密算云的讨论

        近期在全同态加密算法的一些实践,特别是利用GPU来加速密文的处理(可以看下前段时间分享的《替换半同态使用全同态加速计算联邦机器学习算法的实证分析》)。在此过程中,全同态加密算法进行了多方面的改进,性能效率显著优化。让我们看到全同态在联邦机器学习、联邦深度学习上的性能潜力。

        近期行业内逐步出现密算云的实践,我称之为“隐私云计算”。密算是指整个数据以密算形式流通,保障它在存储计算、运维研发全链路是安全可控的【1】。全链路密算的概念,和2022年富数科技以及腾讯、2023年蓝象智联提出的全匿踪联邦学习、全链路加密处理【2】有相似之处,都强调全流程的安全可控以及密态形式数据流转,而不再是原来追求隐私计算的片面安全性,关于隐私计算的片面安全性,可以参考阅读《隐私计算使用不当也会泄露原始数据》。

2.2 关于全同态加密算法及应用案例

2.2.1 全同态加密算法略谈

        关于全链路密算的隐私计算模式,全同态加密算法是一种可行解。 全同态加密(Fully Homomorphic Encryption, FHE)允许对加密数据进行计算,而无需解密。这种特性使得在处理敏感数据时,可以在保护数据隐私的同时,仍然能够执行必要的计算操作。

        全同态加密的工作原理是,通过对数据进行加密后,任何对这些加密数据的计算结果都可以在不泄露原始数据的情况下,得到与直接在明文上计算相同的结果。这使得它在云计算和分布式计算环境中,面向需要保护用户隐私的场景中,有很好的应用潜力。

        在全链路密算中,全同态加密能够有效解决数据传输和存储中的隐私问题。无论是在数据收集、传输还是存储阶段,数据始终保持加密状态,避免了数据在传输过程中的潜在泄露风险。此外,通过全同态加密,参与方可以在保持各自数据隐私的前提下,协同完成复杂的计算任务,实现数据共享与合作。

        全同态加密算法,目前主流和常用的主要是BFV以及CKKS。其中BFV(Brakerski/Fan-Vercauteren)方案主要面向整数向量进行密文处理。基于 CKKS(Cheon-Kim-Kim-Song)方案则是面向实数向量进行密文处理。密文处理又涉及密文 - 密文向量以及密文 - 明文向量进行逐元素的加法、减法和乘法操作, 点积和矩阵乘法等【4】。

2.2.2 全同态加密算法应用案例

        【3】中介绍了几种密算云的应用案例,感觉不错,这里做下分享。

2.2.2.1 案例1--大模型密算

        大模型(云)能够辅助完成各种任务,从训练成本和实用功能的角度来看,具有显著的数据价值,通常作为通用服务提供给用户。然而,大模型应用中一个备受关注的问题是,用户提供给模型的输入可能包含敏感信息。当用户以明文形式输入这些信息时,一方面,模型服务方(云)可能直接获取这些敏感数据;另一方面,模型可能学习到输入内容,从而导致进一步的信息泄露。关于这一点,我会在后续的大模型评估中谈到,其实模型评估的时候也会遇到类似问题,你的prompt很快就会被作为微调或者训练语料被记忆到大模型中,导致静态评估的失效。

        为了解决这一问题,可以采用全同态加密技术。用户可以将自己的输入信息进行全同态加密,然后在密文状态下执行大模型的推理计算,从而生成密文形式的回答。最终,用户可以解密该回答,获得明文内容。在整个过程中,用户的输入和输出信息都得到了有效保护,未发生泄漏。同时,模型所有方也确保了计算过程在自己的服务器上进行,避免了模型信息的泄露。

2.2.2.2 案例2--生物识别

        关于生物识别,之前我们介绍了利用MPC实现人脸识别的案例,对VGG16深度学习模型进行密态推理,可以参考《利用多方安全计算MPC实现VGG16人脸识别隐私推理》。而本案例提出基于全同态加密的方式进行处理。

        公有云平台提供人脸识别及人脸数据库管理服务,应用方(如 APP 公司)可以将用户的人脸数据库委托给公有云进行管理。云平台不仅提供数据库的查询和修改服务,还提供人脸图像的比对、定位和分析等 AI 模型服务。由于人脸数据属于个人生物信息,相关法规要求使用人脸识别技术的产品必须确保人脸数据的安全。针对这一场景,可以采用全同态加密技术,以支持在密文状态下对人脸数据库进行处理和推理。通过将人脸数据库以密文形式托管,不仅可以确保应用方用户的个人数据隐私不被公有云泄露,还能有效防止潜在黑客获取存储在公有云数据库中的敏感信息。在MPC方案中,是通过对数据进行碎片化分布式保存,也就是黑客只要没有拿到全部的碎片或者说没有达到原始数据的恢复碎片数量阈值,就不可能窃取到明文人脸数据。基于全同态加密和安全多方计算实现数据安全保护的方式还是有比较大的差异的。

2.2.2.3 案例3--医疗数据

        基因数据是现代医学研究和疾病诊断的重要组成部分,但同时也涉及到个人隐私的关键数据。在基因诊断应用中,用户需提供自己的基因数据,但必须防止数据泄漏。同时,医疗机构(云)提供的生物信息算法也是其重要资产,机构同样希望保护这些信息不被泄露。通过使用全同态加密算法,用户可以将自己的基因片段加密后发送给医疗机构(云)。医疗机构(云)在密文状态下执行生物信息算法,并将所得结果返回给用户。用户随后解密结果,便可以获得诊断信息。在这一过程中,双方的隐私得到了有效保护,同时用户所获得的诊断结果与在明文数据下的结果一致。

        同样这个模式也适用其他敏感的医疗场景隐私数据的处理,比如用户关于某种自身罕见疾病的信息查询。

3. 参考材料

【1】大模型密算平台(隐语)

【2】全匿踪联邦学习(富数、腾讯、蓝象、洞见等)

【3】全同态密码云计算平台(格物)

【4】全同态加密张量运算库解读

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/460750.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【汇编语言】第一个程序(四)—— 谁在幕后启动程序 : 探讨可执行文件的装载与执行

文章目录 前言1. 可执行文件的加载与运行1.1 DOS中的程序加载过程1.2 问题1:谁加载了1.exe?1.3 问题2:程序运行结束后的返回过程1.4 操作系统的外壳1.5 回答问题1和问题21.6 汇编程序执行的完整历程 2. 使用Debug加载与跟踪1.exe2.1 Debug的加…

Unreal Engine 5 C++(C#)开发:使用蓝图库实现插件(一)认识和了解Build.cs

目录 引言 一、创建一个C插件TextureReader插件 二、Build.cs文件 三、ModuleRules 四、TextureReader插件的构造 4.1ReadOnlyTargetRules的作用 4.2TextureReaderd的构造调用 4.3设置当前类的预编译头文件的使用模式 4.4PublicIncludePaths.AddRange与PrivateInclude…

SELS-SSL/TLS

一、了解公钥加密(非对称加密) 非对称加密中,用于加密数据的密钥与用于解密数据的密钥不同。私钥仅所有者知晓,而公钥则可自由分发。发送方使用接收方的公钥对数据进行加密,数据仅能使用相应的私钥进行解密。 你可以将…

STM32FreeRTOS 使用QSPI驱动nandFlash

STM32FreeRTOS 使用QSPI驱动nandFlash 不清楚为什么STM32同时打开3个以上的音频文件时会出现播放问题,所以更换方案。因为SRAM的内存空间过小,用于存储音频文件不适合,所以使用大小为128MByte的nandFlash。 nandFlash使用华邦的W25N01GVZEI…

vscode的一些使用心得

问题1:/home目录空间有限 连接wsl或者remote的时候,会在另一端下载一个.vscode-server,vscode的插件都会安装进去,导致空间增加很多,可以选择更换这个文件的位置 参考:https://blog.csdn.net/weixin_4389…

1Panel应用商店开源软件累计下载突破200万次!

2024年10月23日,1Panel应用商店内开源软件累计下载突破200万次。 1Panel(github.com/1Panel-dev/1Panel)是一款现代化、开源的Linux服务器运维管理面板,它致力于通过开源的方式,帮助用户简化建站与运维管理流程。 为…

基于MATLAB多参数结合火焰识别系统

一、课题介绍 本设计为基于MATLAB的火焰烟雾火灾检测系统。传统的采用颜色的方法,误识别大,局限性强。结合火焰是实时动态跳跃的,采用面积增长率,角点和圆形度三个维度相结合的方式判断是否有火焰。该设计测试对象为视频&#xf…

利用摄像机实时接入分析平台LiteAIServer视频智能分析软件进行视频监控:过亮过暗检测算法详解

视频监控作为一种重要的安全和管理工具,广泛应用于各个领域,如安全监控、交通监管、员工监管、公共场所监控等。然而,在实际应用中,视频监控系统经常面临各种挑战,其中之一便是视频画面过亮或过暗的问题。过亮过暗检测…

python画图|坐标轴比例设置方法

【1】引言 在前序学习进程中,我们通过ax.set_box_aspect()函数掌握了坐标轴等比例设置方法。 担当我在回顾以前的学习文章时,发现ax.axis()函数也可以设置坐标轴比例,比如下述文章,文章可通过点击链接直达: python画…

[前端][基础]JavaScript

1,JavaScript简介 JavaScript 是一门跨平台、面向对象的脚本语言,而Java语言也是跨平台的、面向对象的语言,只不过Java是编译语言,是需要编译成字节码文件才能运行的;JavaScript是脚本语言,不需要编译&…

用于文档理解的局部特征

本文介绍了一种名为DocFormerv2的多模态Transformer模型,它专为视觉文档理解(VDU)而设计。该模型可以处理视觉、语言和空间特征,利用编码器-解码器架构,并通过不对称地使用新颖的无监督任务进行预训练,以促…

Chromium127编译指南 Linux篇 - 额外环境配置(五)

引言 在成功获取 Chromium 源代码后,接下来我们需要配置适当的编译环境,以便顺利完成开发工作。本文将详细介绍如何设置 Python 和相关的开发工具,以确保编译过程无碍进行。这些配置步骤是开发 Chromium 的必要准备,确保环境设置…

HTTP相关返回值异常原因分析,第二部分

今天我们讲讲HTTP相关返回值异常如何解决(实例持续更新中) 一、4xx状态码 这些状态码表示请求有问题,通常是由于客户端的错误引起的。 1.1 400 Bad Request: 请求格式不正确,服务器无法理解。 状态码400的含义: …

.NET内网实战:通过白名单文件反序列化漏洞绕过UAC

01阅读须知 此文所节选自小报童《.NET 内网实战攻防》专栏,主要内容有.NET在各个内网渗透阶段与Windows系统交互的方式和技巧,对内网和后渗透感兴趣的朋友们可以订阅该电子报刊,解锁更多的报刊内容。 02基本介绍 03原理分析 在渗透测试和红…

Spring Boot 实现文件分片上传和下载

文章目录 一、原理分析1.1 文件分片1.2 断点续传和断点下载1.2 文件分片下载的 HTTP 参数 二、文件上传功能实现2.1 客户端(前端)2.2 服务端 三、文件下载功能实现3.1 客户端(前端)3.2 服务端 四、功能测试4.1 文件上传功能测试4.2 文件下载功能实现 参考资料 完整案例代码&…

【数据结构】-数组

数组 特点: 数组的地址连续,可以通过下标获取数据。 1. 数组扩容 步骤: $1. 创建一个比原来数组更长的新数组 $2. 让原来数组当中的数据依次复制到新数组当中 $3. 让arr指向新数组,原数组空间释放 2. 数组插入 2.1 最后位置…

智慧小区:科技之光点亮幸福家园

智慧社区的未来发展方向与趋势 从智能化管理到便捷化服务,从环保节能到安全监控,智慧社区正以其前瞻性的视野和创新性的技术,引领着未来城市生活的新方向。从智慧社区的基本概念中通过运用现代科技手段,如物联网、云计算、大数据…

0,国产FPGA(紫光同创)-新建PDS工程

国产FPGA正在蓬勃发展,紫光同创FPGA是大家竞赛时经常遇到的一款国产FPGA,本专栏从IP核开始一直到后续图像处理等。 开发板:盘古50K标准板 1,新建PDS工程 点击File(1),然后是New Projects&#…

深入解析Sysmon日志:增强网络安全与威胁应对的关键一环

不断演进的网络安全领域中,保持对威胁的及时了解至关重要。Sysmon日志在这方面发挥了至关重要的作用,通过提供有价值的见解,使组织能够加强其安全姿态。Windows在企业环境中是主导的操作系统,因此深入了解Windows事件日志、它们的…