【Python实战因果推断】28_倾向分8

目录

Treatment Is Easy to Model


Treatment Is Easy to Model

第一个例子中,治疗分配的模型相当容易建立,但干预结果的模型却比较复杂。具体来说,干预遵循伯努利分布,其概率由以下倾向得分给出:

e(x)=\frac1{1+e^{-(1+1.5x)}}

如果您没有意识到,这正是逻辑回归所采用的形式,因此应该很容易对其进行估计。此外,由于P(T|X) 很容易建模,IPW 分数在这里找到真正的 ATE 应该没有问题,因为它接近 2。相比之下,由于结果 Y 比较棘手,回归模型可能会遇到一些麻烦:

 np.random.seed(123)n = 10000x = np.random.beta(1,1, n).round(2)*2e = 1/(1+np.exp(-(1+1.5*x)))t = np.random.binomial(1, e)y1 = 1y0 = 1 - 1*x**3y = t*(y1) + (1-t)*y0 + np.random.normal(0, 1, n)df_easy_t = pd.DataFrame(dict(y=y, x=x, t=t))print("True ATE:", np.mean(y1-y0))True ATE: 2.0056243152

下面两幅图显示了这些数据的情况。值得注意的是数据中的效应异质性,这在第二幅图中很容易看到。请注意,当 x 值较低时,效应为 0,而随着 x 值的增加,效应呈非线性增加。这种异质性往往是回归很难做到的:

现在,让我们看看回归在这个数据中的作用。在这里,我再次分别拟合m1和m0,并将ATE估计为整个数据集中不同预测的平均值,N^{-1}\Sigma\left(\widehat{m}_1(x)-\widehat{m}_0(X)\right)

 m0 = smf.ols("y~x", data=df_easy_t.query("t==0")).fit()m1 = smf.ols("y~x", data=df_easy_t.query("t==1")).fit()regr_ate = (m1.predict(df_easy_t) - m0.predict(df_easy_t)).mean()print("Regression ATE:", regr_ate)Regression ATE: 1.786678396833022

如果将预测值与原始数据进行对比,您就会发现原因所在。回归模型未能捕捉到对照组的曲率:

说白了,这并不意味着无法用回归法正确估计 ATE。如果您知道数据的真实曲率,您几乎可以建立正确的模型:

 m = smf.ols("y~t*(x + np.power(x, 3))", data=df_easy_t).fit()regr_ate = (m.predict(df_easy_t.assign(t=1))- m.predict(df_easy_t.assign(t=0))).mean()print("Regression ATE:", regr_ate)Regression ATE: 1.9970999747190072

当然,在现实中,你并不知道数据是如何产生的。因此,回归结果很可能会让你失望。相比之下,让我们看看 IPW 的表现如何。同样,由于建立干预分配模型相当容易,你应该会期望 IPW 在此数据上表现相当出色:

 est_fn = partial(est_ate_with_ps, ps_formula="x", T="t", Y="y")print("Propensity Score ATE:", est_fn(df_easy_t))print("95% CI", bootstrap(df_easy_t, est_fn))Propensity Score ATE: 2.00235038847401195% CI [1.80802227 2.22565667]

最后,就是您期待已久的时刻,让我们来看看 DR 估计的实际效果。请记住,DR 要求 P T X 或 E YtX 模型中的一个正确,但不一定两个都正确。在这个数据中,P T X 的模型是正确的,但 E Yt X 的模型是错误的:

 est_fn = partial(doubly_robust, formula="x", T="t", Y="y")print("DR ATE:", est_fn(df_easy_t))print("95% CI", bootstrap(df_easy_t, est_fn))DR ATE: 2.00161793426311695% CI [1.87088771 2.145382]

不出所料,DR 在这里的表现相当出色,也恢复了真正的 ATE。但还不止这些。请注意,95% CI 比纯 IPW 估计值要小,这意味着 DR 估计值更精确。这个简单的例子说明,当 P(T|X)很容易建模时,即使 DR 估算出的 E[Y_t|X] 是错误的,它也能表现出色。但反过来呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/373069.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

初识CPlusPlus

前言 也是好久没写博客了,那些天也没闲着,去练题去了。实际上练题也可以写练题的博客,但是觉得太简单了些,于是就没有继续写下去。如今又回来写博客,是因为有整理了新的知识C。内容不算多,大多数都是书本上…

行至第11年,追光动画距离“中国皮克斯”还有多远?

百花奖提名名单公布后,入围最佳影片大奖的唯一一部动画电影《长安三万里》,竟然成为了获奖呼声最高的电影。 去年暑期档上映的《长安三万里》以18.24亿票房一跃成为中国影史动画电影票房亚军,虽然这个数据在今年春节档被《熊出没逆转时空》超…

WPF UI 3D 基本概念 点线三角面 相机对象 材质对象与贴图 3D地球 光源 变形处理 动作交互 辅助交互插件 系列三

WPF UI交互专题 平面图形 Path Drawing 绘图 渐变 Brush 矩阵 Transform 变形 阴影效果 模糊效果 自定义灰度去色效果 系列二-CSDN博客 1软件中的3D基本概念 WPF 中 3D 功能的设计初衷并非提供功能齐全的游戏开发平台。 WPF 中的 3D 图形内容封装在 Viewport3D 元素中&#x…

2024前端面试真题【JS篇】

DOM DOM:文本对象模型,是HTML和XML文档的编程接口。提供了对文档的结构化的表述,并定义可一种方式可以使从程序中对该结构进行访问,从而改变文档的结构、样式和内容。 DOM操作 创建节点:document.createElement()、do…

MySQL:TABLE_SCHEMA及其应用

MySQL TABLE_SCHEMA及其应用 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.csdn.net/qq_28550263/ar…

13 - matlab m_map地学绘图工具基础函数 - 介绍创建管理颜色映射的函数m_colmap和轮廓图绘制颜色条的函数m_contfbar

13 - matlab m_map地学绘图工具基础函数 - 介绍创建管理颜色映射的函数m_colmap和轮廓图绘制颜色条的函数m_contfbar 0. 引言1. 关于m_colmap2. 关于m_contfbar3. 结语 0. 引言 本篇介绍下m_map中用于创建和管理颜色映射函数(m_colmap)和 为轮廓图绘制颜…

人工智能+病理组学的交叉课题,患者的临床特征如何收集与整理|顶刊专题汇总·24-07-09

小罗碎碎念 本期文献主题:人工智能病理组学的交叉课题,患者的临床特征如何收集与整理 我们在阅读文献的时候会发现,有的文章会详细给出自己的数据集分析表,分别列出训练集、验证集的数量,以及每个特征对应的患者人数。…

SpringSecurity 三更草堂学习笔记

0.简介 Spring Security是Spring家族中的一个安全管理框架。相比与另外一个安全框架Shiro,它提供了更丰富的功能,社区资源也比Shiro丰富。 一般来说中大型的项目都是使用SpringSecurity来做安全框架。小项目有Shiro的比较多,因为相比与Spring…

Retrofit框架源码深度剖析【Android热门框架分析第二弹】

Android热门框架解析,你确定不来看看吗? OkHttp框架源码深度剖析【Android热门框架分析第一弹】 Retrofit框架源码深度剖析【Android热门框架分析第二弹】 什么是Retrofit? 准确来说,Retrofit 是一个 RESTful 的 HTTP 网络请求…

【代码随想录】【算法训练营】【第59天】 [卡码110]字符串接龙 [卡码105]有向图的完全可达性 [卡码106]岛屿的周长

前言 思路及算法思维,指路 代码随想录。 题目来自 卡码网。 day 59,周五,继续ding~ 题目详情 [卡码110] 字符串接龙 题目描述 卡码110 字符串接龙 解题思路 前提: 思路: 重点: 代码实现 C语言 […

LLM大模型从入门到精通(1)--LLM基础知识介绍

1. 大语言模型 (LLM) 背景 2. 语言模型 (Language Model, LM) 1. 大语言模型 (LLM) 背景 大语言模型 (英文:Large Language Model,缩写LLM) 是一种人工智能模型, 旨在理解和生成人类语言. 大语言模型可以处理多种自然语言任务,如文本分类、问…

绝区伍--2024年AI发展路线图

2024 年将是人工智能具有里程碑意义的一年。随着新模式、融资轮次和进步以惊人的速度出现,很难跟上人工智能世界发生的一切。让我们深入了解 2024 年可能定义人工智能的关键事件、产品发布、研究突破和趋势。 2024 年第一季度 2024 年第一季度将推出一些主要车型并…

什么是O2O?线上线下怎么完美结合?

现如今互联网技术飞速发展,智能手机普及。O2O(Online To Offline)模式已经成为一种新的商业模式,人们的生活和消费习惯也逐渐被改变。经常听到企业提到“O2O”,它究竟是什么呢?对企业有着什么魅力呢&#x…

Flutter Inno Setup 打包 Windows 程序

转载自:flutter桌面应用从开发配置到打包分发 - 掘金 (juejin.cn) 五.打包 1.创建 release 版本的应用 flutter build release 执行完成后, release包位置在项目的build->windows->runer文件夹中 2.应用程序分发 Windows 为 Windows 平台构建…

AE-关键帧

目录 关键帧操作步骤(以位置变化为例) 1.确定动画起点 2.设置起点的位置属性 3.为起点打上关键帧 4.确定动画终点 5.设置终点的位置属性 改变动画速度 1.选中所有关键帧 2.拖拽 时间反向关键帧 1.选中要反向的关键帧 2.使用时间反向关键帧 …

Apache POI、EasyPoi、EasyExcel

目录 ​编辑 (一)Apache PoI 使用 (二)EasyPoi使用 (三)EasyExcel使用 写 读 最简单的读​ 最简单的读的excel示例​ 最简单的读的对象​ (一)Apache PoI 使用 (二&…

mp4视频太大怎么压缩不影响画质,mp4文件太大怎么变小且清晰度高

在数字化时代,我们常常面临视频文件过大的问题。尤其是mp4格式的视频,文件大小往往令人望而却步。那么,如何在不影响画质的前提下,有效地压缩mp4视频呢?本文将为您揭秘几种简单实用的压缩技巧。 在分享和存储视频时&am…

算法复杂度

目录 1. 数据结构前言 1.1 数据结构 1.2 算法 2. 算法效率 2.1 复杂度的概念 3. 时间复杂度 3.1 大O的渐进表示法 3.2 时间复杂度计算示例: 3.2.1 示例1 3.2.2 示例2 3.2.3 示例3 3.2.4 示例4 3.2.6 示例6 4. 空间复杂度 4.1 空间复杂度计算示例 4.1.1 示例1 …

【Python实战因果推断】18_线性回归的不合理效果8

目录 Saturated Regression Model Regression as Variance Weighted Average Saturated Regression Model 还记得我在本章开头强调回归和条件平均值之间的相似性吗?我向你展示了使用二元干预进行回归与比较干预组和对照组的平均值是完全一样的。现在,由…

Parallels Desktop 19下载及查找我的 Parallels Desktop for Mac 激活密钥

Parallels Desktop 19 for Mac v19.3.0.54924中文破解版是一款适用于Mac的虚拟化软件,parallels desktop 19中文版允许您在Mac计算机上同时运行多个操作系统。它使您能够创建虚拟机并在这些虚拟机中安装不同的操作系统,如Windows、Linux或macOS。使用Par…