数据分析之数据相关性分析

相关性分析

作者:学者科技
时间:2022/12/25

应用场景

  1. 发现数据之间的关联性
    • 比如 啤酒 和 尿布
  2. 删减统计指标
    • 比如 城市里的温度传感器,相关性强的可以去掉以节约成本
  3. 挑选回归建模的变量
    • 选择与因变量相关性高的自变量
    • 自变量间如果有高度地相关性,也需要删减
  4. 验证主观判断

    决策层或者管理层经常会根据自己的经验,主观地形成一些逻辑关系。最典型的表述方式就是“我认为这个数据会影响到那个数据”。到底有没有影响?可以通过计算相关系数来判断。相关系数的应用能够让决策者更冷静,更少地盲目拍脑袋。虽然相关系数不能表达因果关系,但有联系的两件事情,一定会在相关系数上有所反映

协方差

推导

设X,Y是两个随机变量,则有
D ( X + Y ) = E ( ( ( X + Y ) − E ( X + Y ) ) 2 ) = E ( ( ( X + Y ) − E ( X ) − E ( Y ) ) 2 ) = E ( ( ( X − E ( X ) ) + ( Y − E ( Y ) ) ) 2 ) = E ( ( X − E ( X ) ) 2 ) + E ( ( Y − E ( Y ) ) 2 ) + 2 E ( ( X − E ( X ) ) ( Y − E ( Y ) ) ) = D ( X ) + D ( Y ) + 2 E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] \begin{align} D(X + Y) &= E(((X+Y) - E(X + Y))^2) \\ &= E(((X+Y) - E(X) - E(Y))^2) \\ &= E(((X - E(X)) + (Y - E(Y)))^2) \\ &= E((X - E(X))^2) + E((Y - E(Y))^2) \\ &\ \ + 2E((X-E(X))(Y - E(Y))) \\ &= D(X)+D(Y) + 2E [ (X - E(X))(Y- E(Y)) ] \end{align} D(X+Y)=E(((X+Y)E(X+Y))2)=E(((X+Y)E(X)E(Y))2)=E(((XE(X))+(YE(Y)))2)=E((XE(X))2)+E((YE(Y))2)  +2E((XE(X))(YE(Y)))=D(X)+D(Y)+2E[(XE(X))(YE(Y))]

X X X, Y Y Y相互独立时, X − E ( X ) X - E(X) XE(X) Y − E ( Y ) Y - E(Y) YE(Y) 也相互独立,因此

E ( ( X − E ( X ) ( Y − E ( Y ) ) = E ( X − E ( X ) ) ∗ E ( Y − E ( Y ) ) = ( E ( X ) − E ( X ) ) ∗ ( E ( Y ) − E ( Y ) ) = 0 \begin{align} E((X - E(X)(Y - E(Y)) &= E(X - E(X)) * E(Y - E(Y)) \\ &= (E(X) - E(X)) * (E(Y) - E(Y)) \\ &= 0 \end{align} E((XE(X)(YE(Y))=E(XE(X))E(YE(Y))=(E(X)E(X))(E(Y)E(Y))=0

于是
X , Y 相互独立 ⟹ E ( ( X − E ( X ) ( Y − E ( Y ) ) = 0 X, Y相互独立 \implies E((X - E(X)(Y - E(Y)) = 0 X,Y相互独立E((XE(X)(YE(Y))=0

它的逆否命题同样成立:

E ( ( X − E ( X ) ( Y − E ( Y ) ) ≠ 0 ⟹ X , Y 不相互独立 E((X - E(X)(Y - E(Y)) \neq 0 \implies X, Y不相互独立 E((XE(X)(YE(Y))=0X,Y不相互独立

E((X - E(X)(Y - E(Y)) 从某种程度上刻划了两个随机变量的相关性,为了方便我们把它称为协方差。记作:

C o v ( X , Y ) = E ( ( X − E ( X ) ( Y − E ( Y ) ) \rm{Cov}(X,Y) = E((X - E(X)(Y - E(Y)) Cov(X,Y)=E((XE(X)(YE(Y))

该式可继续推导成更加常用的公式:

C o v ( X , Y ) = E ( ( X − E ( X ) ( Y − E ( Y ) ) = E ( X Y − X E ( Y ) − E ( X ) Y + E ( X ) E ( Y ) ) = E ( X Y ) − E ( X ) E ( Y ) − E ( X ) E ( Y ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{align} \rm{Cov}(X,Y) &= E((X - E(X)(Y - E(Y)) \\ &= E(XY - XE(Y) -E(X)Y + E(X)E(Y)) \\ &= E(XY) - E(X)E(Y) - E(X)E(Y) + E(X)E(Y) \\ &= E(XY) - E(X)E(Y) \end{align} Cov(X,Y)=E((XE(X)(YE(Y))=E(XYXE(Y)E(X)Y+E(X)E(Y))=E(XY)E(X)E(Y)E(X)E(Y)+E(X)E(Y)=E(XY)E(X)E(Y)

根据协方差取值的不同,我们规定:

  • Cov(X,Y) > 0, X,Y正相关
  • Cov(X,Y) < 0, X,Y负相关
  • Cov(X,Y) = 0, X,Y不相关

例题

假设有如下X,Y的联合概率分布,计算 Cov(X,Y),并确定X,Y的相关性。

X\Y0123
00.070.090.060.01
10.070.060.070.01
20.060.070.140.03
30.020.040.160.04

解:首选计算X*Y的所有可能取值

XY0123
00000
10123
20246
30369

容易得到X,Y各自的边缘分布如下

X0123
P0.230.210.300.26
Y0123
P0.220.260.430.09

然后计算期望, 最后套用协方差公式:

E(XY) = 0 * 0.07 + 0 * 0.09 + ... +0 * 0.07 + 1 * 0.06 + ... +0 * 0.06 + 2 * 0.07 + ... +...= 2.55
E(X) = 1.59
E(Y) = 1.39
Cov(X, Y) = E(XY) - E(X)E(Y) = 0.34

Cov(X, Y) > 0 , 因此X,Y正相关

相关系数

定义

协方差是有量纲的。例如X表示身高(单位是m),Y表示体重(单位是kg)。则Cov(X,Y)带有量纲 ( m ⋅ k g ) (m\cdot kg) (mkg)

为了消除量纲,定义如下新的概念:

C o r r ( X , Y ) = C o v ( X , Y ) σ X σ Y , s . t . σ X , σ Y > 0 \rm{Corr}(X,Y) = \frac{\rm{Cov}(X,Y)}{\sigma_X \sigma_Y} \ \ \ , s.t. \ \sigma_X, \sigma_Y \gt 0 Corr(X,Y)=σXσYCov(X,Y)   ,s.t. σX,σY>0

这个概念被称为相关系数。可以看出,相关系数的符号与协方差相同,这说明相关系数的取值也可返映X与Y的相关性:

  • Corr(X,Y) > 0, X,Y正相关
  • Corr(X,Y) < 0, X,Y负相关
  • Corr(X,Y) = 0, X,Y不相关

相关系数是有取值范围的,由 施瓦茨(Schwarz)不等式导出。不等式推导如下:

首先考虑如下二次函数:

g ( t ) = E 2 ( t ( X − E ( X ) ) + Y − E ( Y ) ) = t 2 σ X 2 + σ Y 2 + 2 t ⋅ C o v ( X , Y ) > 0 \begin{align} g(t) &= E^2(t(X-E(X)) + Y - E(Y)) \\ &= t^2 \sigma^2_X + \sigma^2_Y + 2t\cdot \rm{Cov}(X, Y) \\ &> 0 \end{align} g(t)=E2(t(XE(X))+YE(Y))=t2σX2+σY2+2tCov(X,Y)>0

即 方程 g ( t ) = 0 g(t) = 0 g(t)=0 无解, 所以由 $\Delta = 4 \rm{Cov}^2(X, Y) - 4 \sigma^2_X \sigma^2_Y \le 0 $ 得到如下Schwarz不等式:

C o v 2 ( X , Y ) ≤ σ X 2 σ Y 2 \rm {Cov}^2(X,Y) \le \sigma_X^2 \sigma_Y^2 Cov2(X,Y)σX2σY2

所以得相关系数的取值范围为 -1~1。

C o r r 2 ( X , Y ) = C o v 2 ( X , Y ) σ X 2 σ Y 2 ≤ 1 \rm{Corr^2(X, Y)} = \frac{\rm {Cov}^2(X,Y) }{\sigma_X^2 \sigma_Y^2} \le 1 Corr2(X,Y)=σX2σY2Cov2(X,Y)1

其它结论:

  • Corr(X, Y) = 1 或 -1 时,X与Y呈线性相关。证明过程略
  • Corr(X, Y) = 0 时,X与Y不相关。 不相关是指X与Y没有线性关系,但可能有其它函数关系,譬如平方关系,对数关系等。
  • Corr(X, Y) = 其它 时,X与Y有一定程度的线性关系

例题

已知随机向量 ( X , Y ) (X, Y) (X,Y)的联合密度函数为 p ( x , y ) p(x,y) p(x,y),求相关系数 C o r r ( X , Y ) \rm{Corr}(X,Y) Corr(X,Y)

解:

p X ( x ) = ∫ − ∞ ∞ p ( x , y ) d y p Y ( y ) = ∫ − ∞ ∞ p ( x , y ) d x E ( X ) = ∫ − ∞ ∞ p X ( x ) ⋅ x d x E ( Y ) = ∫ − ∞ ∞ p Y ( y ) ⋅ y d y E ( X 2 ) = ∫ − ∞ ∞ p X ( x ) ⋅ x 2 d x E ( Y 2 ) = ∫ − ∞ ∞ p Y ( y ) ⋅ y 2 d y E ( X Y ) = ∫ − ∞ ∞ ∫ − ∞ ∞ p ( x , y ) ⋅ x ⋅ y d x d y D ( X ) = E ( X 2 ) − E 2 ( X ) D ( Y ) = E ( Y 2 ) − E 2 ( Y ) C o r r ( X , Y ) = C o v ( X , Y ) ( D ( X ) ) ( D ( Y ) ) = E ( X Y ) − E ( X ) E ( Y ) ( D ( X ) ) ( D ( Y ) ) p_X(x) = \int_{-\infty}^{\infty} p(x, y) dy \\ p_Y(y) = \int_{-\infty}^{\infty} p(x, y) dx \\ E(X) = \int_{-\infty}^{\infty} p_X(x) \cdot x \ dx \\ E(Y) = \int_{-\infty}^{\infty} p_Y(y) \cdot y \ dy \\ E(X^2) = \int_{-\infty}^{\infty} p_X(x) \cdot x^2 \ dx \\ E(Y^2) = \int_{-\infty}^{\infty} p_Y(y) \cdot y^2 \ dy \\ E(XY) = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} p(x, y) \cdot x \cdot y \ dxdy \\ D(X) = E(X^2) - E^2(X) \\ D(Y) = E(Y^2) - E^2(Y) \\ \rm{Corr}(X, Y) = \frac{\rm{Cov}(X, Y)}{ \sqrt(D(X)) \sqrt(D(Y)) } = \frac{E(XY) - E(X)E(Y)}{ \sqrt(D(X)) \sqrt(D(Y)) } pX(x)=p(x,y)dypY(y)=p(x,y)dxE(X)=pX(x)x dxE(Y)=pY(y)y dyE(X2)=pX(x)x2 dxE(Y2)=pY(y)y2 dyE(XY)=p(x,y)xy dxdyD(X)=E(X2)E2(X)D(Y)=E(Y2)E2(Y)Corr(X,Y)=( D(X))( D(Y))Cov(X,Y)=( D(X))( D(Y))E(XY)E(X)E(Y)

Spearman 秩相关系数(等级相关系数)

假设有 X X X Y Y Y两个随机变量并采集了N对样本 ( X i , Y i ) , i ∈ 1.. N (X_i, Y_i), i \in 1..N (Xi,Yi),i1..N

x i x_i xi表示 X i X_i Xi 在X样本中的次序, 用 y i y_i yi表示 Y i Y_i Yi 在Y样本中的次序。则Spearman 相关系数定义为:

ρ = ∑ i = 1 N ( x i − x ˉ ) ( y i − y ˉ ) ∑ i = 1 N ( x i − x ˉ ) 2 ∑ i = 1 N ( y i − y ˉ ) 2 = C o r r ( x , y ) \rho=\frac{\sum_{i=1}^{N}(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^{N}(x_i-\bar{x})^2 \sum_{i=1}^{N}(y_i-\bar{y})^2}}= \rm{Corr}(x,y) ρ=i=1N(xixˉ)2i=1N(yiyˉ)2 i=1N(xixˉ)(yiyˉ)=Corr(x,y)

举个例子:

请添加图片描述
请添加图片描述
请添加图片描述

Kendall 秩相关系数(等级相关系数)

假设有 X X X Y Y Y两个随机变量并采集了n对样本 ( X i , Y i ) , i ∈ 1.. n (X_i, Y_i), i \in 1..n (Xi,Yi),i1..n

Kendall有三种定义分别为 τ a , τ b , τ c \tau_a,\tau_b,\tau_c τa,τb,τc。 前者只适用于X,Y都没有重复值的情况。当X,Y都没有重复值时,前者将与后两者值相同。

τ a = ( P − Q ) n ( n − 1 ) / 2 τ b = P − Q ( P + Q + T ) ⋅ ( P + Q + U ) τ c = ( P − Q ) n 2 ( m − 1 ) / 2 m \begin{align} \tau_a&= \frac{ (P- Q)}{n(n-1)/2} \\ \tau_b&=\frac{P - Q}{\sqrt{(P+Q+T)\cdot (P+Q+U)}} \\ \tau_c&=\frac{(P-Q)}{n^2(m - 1)/2m} \end{align} τaτbτc=n(n1)/2(PQ)=(P+Q+T)(P+Q+U) PQ=n2(m1)/2m(PQ)

  • τ = 1 \tau = 1 τ=1 时,X,Y具有相关性
  • τ = − 1 \tau = -1 τ=1 时,X,Y具有相反的相关性
  • τ = 0 \tau = 0 τ=0 时,X,Y相互独立

其中,P表示一致的数量,Q不一致的数量,T表示在仅X中的ties个数,U表示仅在Y中的ties个数。n是样本数量。m是X或Y中独特值的个数中的较小值。如下图:

  • 一致: x i < x j x_i < x_j xi<xj y i < y j y_i < y_j yi<yj x i > x j x_i > x_j xi>xj y i > y j y_i > y_j yi>yj
  • 不一致: x i < x j x_i < x_j xi<xj y i > y j y_i > y_j yi>yj x i > x j x_i > x_j xi>xj y i < y j y_i < y_j yi<yj
  • 仅在X中的ties: x i = x j x_i = x_j xi=xj y i ≠ y j y_i \neq y_j yi=yj
  • 仅在Y中的ties: x i ≠ x j x_i \neq x_j xi=xj y i = y j y_i = y_j yi=yj

请添加图片描述

举个例子:

X = [85,19,19,15]
Y = [94,63,84,84]
# 先按照Y的顺序对X和Y调序,因为是同时调的,所有没啥影响
perm = argsort(Y)         # [1,2,3,0]
X, Y = X[perm], Y[perm]   # [19, 19, 15, 85], [63, 84, 84, 94]
y = dense(Y)              # [1, 2, 2, 3]
# 按照X的顺序排序。同理,除了顺序没啥影响
perm = argsort(X)         # [2, 0, 1, 3]
X, y = X[perm], y[perm]   # [15, 19, 19, 85], [2, 1, 2, 3]
x = dense(X)              # [1, 2, 2, 3]# 上述过程本质上是为X,Y中的元素确定一个序号。
# 如果是人工计算序号,可省略排序过程。# 有了x, y,如上图 可以计算P、Q、T、U等了
P=3
Q=1
T=1
U=1
n=4
m=3  # X中独特值个数是3,Y中独特值个数是3,取两者最小值,因此m=3
tau_b = (P - Q) / sqrt((P+Q+T)*(P+Q+U)) = 0.4
tau_c = (P - Q) / n*n*(m-1) / (2*m) = 0.375

Pearson系数:叫皮尔逊相关系数,也叫线性相关系数,用于进行线性相关分析,是最常用的相关系数,当数据满足正态分布时会使用该系数。
比如:身高和体重的相关性

Spearman系数:当数据不满足正态分布时,使用该系数。
比如:身高和“病情程度(初期、中期、晚期)”的相关性

Kendall系数:同Spearman系数

工具

  • pandas
  • numpy
  • scipy
import numpy as np
import pandas as pd
import scipy.stats as statsif __name__ == "__main__":x = np.array([1, 2, 3, 4, 5, 6, 7])y = np.array([1, 4, 8, 24, 16, 30, 50])df = pd.DataFrame({"x": x, "y": y})print(np.corrcoef([x, y]))print(df.corr(method='pearson'))print(df.corr(method='spearman'))print(df.corr(method='kendall'))#df.corrWith(Series|DataFrame)print(stats.pearsonr(x, y)[0])print(stats.spearmanr(x, y)[0])print(stats.kendalltau(x, y)[0])

请添加图片描述

参考

[1] 概率论与数理统计教程(第二版)

[2] https://zhuanlan.zhihu.com/p/136771737

[3] https://zhuanlan.zhihu.com/p/367920869

[4] https://baike.baidu.com/item/%E7%A7%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/3316537?fromModule=lemma_inlink

[5] 统计知识扫盲:相关系数

[6] Kendall tau distance理解与分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63322.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据特征分析技能—— 相关性检验

数据特征分析技能—— 相关性检验 相关性分析是指对两个或多个具备相关性的变量元素进行分析&#xff0c;从而衡量两个变量因素的相关密切程度 一般常用四种方法&#xff1a; - 画图判断 - pearson&#xff08;皮尔逊&#xff09;相关系数 - sperman&#xff08;斯皮尔曼&a…

印刷品的排版技巧

印刷品的精美离不开精美的排版&#xff0c;排版设计能够让书本杂志标题规整好看。随着设计素材的丰富&#xff0c;现在设计师可以有越来越多的选择&#xff0c;不过有时候过多的元素在设计并不能起到画龙点睛的作用&#xff0c;相反经常会发现一些排版设计十分杂乱&#xff0c;…

微信公众号排版方法及相关素材网站

作者&#xff1a;杨坤龙 链接&#xff1a;https://www.zhihu.com/question/23640203/answer/375921114 来源&#xff1a;知乎 著作权归作者所有。商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处。 关于排版 前段时间我发了条朋友圈&#xff1a;有哪些东西是你…

关于文案排版的一些基本技巧

一、主文案 1. 什么是主文案 关于首页&#xff0c;会涉及到主文案&#xff0c;副文案&#xff0c;装饰性文案等。一个文案中最重要的是主文案&#xff0c;所谓主文案就是你想突出什么&#xff0c;什么就是主文案&#xff0c;主文案一般就是口号类的&#xff0c;标语&#xff0c…

一些实用排版工具

三年前我什么都不懂的时候&#xff0c;就听闻了高大上的LaTeX&#xff0c;还去听了图书馆某工科博士开的LaTeX入门讲解&#xff0c;听的天花乱坠毫无头绪&#xff0c;回去兴冲冲地装上&#xff0c;运行&#xff0c;出现bug&#xff0c;然后傻眼了&#xff0c;解决不了&#xff…

【工具】用PPT排版打印海报时图片分辨率问题

版本&#xff1a;PPT 2013 PPT用来排版做海报也许不是那么好&#xff0c;但是可以用&#xff0c;也方便。【工具】PPT插入高清图片保存后图片变模糊的解决方法&#xff0c;这里解决了高清图片在PPT中被压缩的问题&#xff0c;但用PPT打印还会碰到问题。 将PPT打印为pdf时&…

135编辑器点击换图html,这5种换图姿势,只有排版高手才会!

换图教程 胖友们&#xff0c;欢迎来看二条&#xff01; 最近客服小姐姐一直催我写一篇关于换图的教程&#xff0c;我就不明白了&#xff01;去年答应你的事&#xff0c;我怎么能拖那么久...你怎么还记得那么清楚&#xff01; 好吧&#xff0c;教程开始。 135编辑器给图片/图片样…

ChatGLM的搭建过程

本次搭建的是清华大学开源的ChatGLM。源码地址。模型地址。 1、开启BBR加速 如何开启BBR加速可以去看我的这篇文章&#xff0c;Linux开启内核BBR加速。 2、拉取ChatGLM源码和ChatGLM模型 点击这里跳转到源码处。 点击这里跳转到模型下载处。 我这里在下载之前创建了一个目…

道指30只成分股的股价及历史股价抓取分析

1.获取数据: 想要获得道指30只成分股的最新股价 import requests import re import pandas as pddef retrieve_dji_list():try:r requests.get(https://money.cnn.com/data/dow30/)except ConnectionError as err:print(err)search_pattern re.compile(class"wsod_sym…

短信验证码接口的实现

代码&#xff1a; sendsms.java //接口类型&#xff1a;互亿无线触发短信接口&#xff0c;支持发送验证码短信、订单通知短信等。 // 账户注册&#xff1a;请通过该地址开通账户http://sms.ihuyi.com/register.html // 注意事项&#xff1a; //&#xff08;1&#xff09;调试…

交友项目【手机号验证码发送】功能实现

目录 1&#xff1a;注册登录需求分析 1.1&#xff1a;业务说明 1.2&#xff1a;需求分析 1.3&#xff1a;数据库表 1.4&#xff1a;实体类 2&#xff1a;发送短信验证码 2.1&#xff1a;登录验证码 2.2&#xff1a;接口说明 2.3&#xff1a;流程分析 2.4&#xff1a;…

免费的短信验证码接口

免费的短信验证码接口 改了唯ID的东西&#xff0c;大家可以用来玩玩&#xff0c;该服务明年6月到期&#xff0c;也希望大家能文明使用&#xff01; 不说废话了&#xff0c;直接上接口。 1、发送短信验证码接口 POST http://sms.usts.top/sms/sendCode?phone手机号2、…

短信验证码平台有哪些比较好用?

现如今&#xff0c;要想分辨短信验证码平台哪些比较好用&#xff0c;需要从速度、到达率、稳定性等几个方面来决定。短信验证码平台是很讲究时效性&#xff0c;所以速度快、到达率高是很关键的。另外&#xff0c;在选择短信验证码平台的时候&#xff0c;还要注意短信发送、接收…

短信验证码的实现

需求 发送验证码短信然后接收验证码再完成注册 具体操作 1>点击"获取验证码"的按钮,会发送sendVerifyCode的异步请求并带上参数phone(number) 查看前端代码html 查看对应的js代码 2>后端接口的实现 接口接收请求,获取到手机号,生成验证码code,拼接出短信,并…

目前可以用的短信验证码平台哪个比较好?

目前短信验证码大家应该都很熟悉了&#xff0c;尤其当你在一些购物网站等注册会员或者修改信息时都需要验证码。而短信验证码是商家为了降低重复注册或者非法注册&#xff0c;就需要短信验证码来帮忙用户的真实性。那么&#xff0c;目前可以用的短信验证码平台哪个比较好呢&…

短信验证码登录的实现

原理说明开发环境具体实现过程 原理说明 在网站登录时经常会遇到短信验证码登录的情况&#xff0c;其原理如下&#xff1a;首先我们需要一个短信发送接口&#xff0c;前端发送手机号码到后端&#xff0c;后端随机生成一个验证码并存入redis,并且设置该key的过期时间。(这里可以…

低代码真的是“行业毒瘤”?

低代码/零代码到底是“行业毒瘤”还是“大势所趋”&#xff1f;碰瓷“码农”万年户&#xff0c;低代码火了这些年&#xff0c;你还觉得是毒瘤吗&#xff1f; 低代码/零代码作为比较有争议的话题&#xff0c;常年被拿来碰瓷码农&#xff0c;也是很多行业大佬关注的对象。 阿里云…

chatgpt赋能python:Python如何下载人人文库

Python如何下载人人文库 人人文库是一个知识分享社区&#xff0c;用户可以在平台上上传、下载和分享文档。 Python是一种强大的编程语言&#xff0c;具有强大的网络和数据处理库。今天&#xff0c;我们将介绍如何使用Python来下载人人文库中的文档。 首先&#xff0c;我们需…

秘密共享差分隐私原理解析

1. 隐私计算全貌 &#xfffc;&#xfffc; 可以看到&#xff0c;隐私计算技术从1979年就开始了&#xff0c;历经四代从安全多方计算(MPC)、到差分隐私(DP)、到集中加密技术(TEE)&#xff0c;再到联邦学习(FL)。 2. 秘密共享 secret Sharing 就是“秘密分享”或者“秘密共享”…

保护个人隐私和数据安全的方法与策略

引言 随着信息技术的普及和发展&#xff0c;我们享受到了便捷的互联网服务&#xff0c;但与此同时&#xff0c;个人隐私和数据安全问题也日益受到威胁。在这个所谓的"裸奔"时代&#xff0c;网络攻击、数据泄露和隐私侵犯已经成为常态。然而&#xff0c;我们并不无助…