英文题目:Treatment Allocation under Uncertain Costs
中文题目:不确定成本下的处理分配
单位:swager、uber
时间:2021
论文链接:https://arxiv.org/pdf/2103.11066.pdf
代码:
摘要:
我们考虑学习如何最优分配成本不确定的治疗方法的问题,并可能因治疗前协变量而异。如果我们需要优先考虑访问不同患者用于不同数量的时间的稀缺资源,或者在营销中,如果我们想要针对公司成本取决于使用折扣多少折扣,则该设置可能出现在医学中。在这里,我们推导出预算约束下的最佳治疗分配规则的形式,并提出了一种实用的基于随机森林的方法,使用来自随机试验的数据或更广泛地说,未混淆的数据来学习治疗规则。我们的方法利用了我们问题之间的统计联系,以及使用工具变量学习内生性下的异质治疗效果。我们发现我们的方法在模拟和营销应用中都表现出有希望的经验性能。
1 引言
数据驱动的资源分配在几个不同的领域越来越普遍。一种流行的方法首先建模治疗异质性。给定一个治疗(或干预)和感兴趣的结果,我们还收集了大量的(治疗前)协变量,并试图估计这些协变量如何调节治疗对结果的影响。然后,我们将治疗分配给那些根据协变量预测对其做出最强烈反应的个体。作为这种范式的例子,在医学、Basu、Sussman 和 Hayward [2017] 中,考虑分配更积极的治疗,以减少对估计从中受益的心血管疾病患者的血压;在营销中,Ascarza [2018] 和 Lemmens 和 Gupta [2020] 认为靶向保留为估计对其最响应的客户提供;而在经济学中,Kitagawa 和 Tetenov [2018] 讨论了将工作培训计划资格优先分配给那些估计从该计划中获得最大就业提升的工作申请人。然而,这一系列工作的一个限制是现有的治疗个性化方法在很大程度上忽略了分配治疗的成本。在上述所有三种情况下,这不是一个问题:在这里,处理任何特定的人成本大致相同作为处理另一个,因此仅基于结果分配治疗是有效的。然而,在问题设置中,处理不同人的成本并不相同,我们有一个预算限制我们可以在治疗上花费的总资源,优先考虑基于治疗异质性的人可能会适得其反。
作为医学的一个具体例子,考虑一个重症监护床不足的医院来治疗所有传入的患者,需要选择谁优先考虑给定的可用资源。此外,假设医院只有两种类型的传入患者。A型患者对治疗有反应,如果接受重症监护,他们生存的机会就会上升10%;然而,他们的恢复很慢,如果承认,他们会在单位里花费20天。相比之下,B 型患者如果入院,生存率机会增加 5%,但如果入院,只会在单位内花费 5 天。在这里,基于治疗异质性的目标将优先考虑 A 型患者,但这不是效用最大化的优先级规则:如果医院只针对 A 型患者,从长远来看,它可以每天保存 0.5 名患者和 100 名重症监护床,而如果它只针对 B 型患者,它可以每天将这个数字翻倍至 1 名患者和 100 名重症监护床。1 在营销中,如果想要瞄准可能根据客户参与多少费用来成本公司不同的报价,就会出现类似的问题,例如,当健身房发出“第一个月免费”报价,希望吸引新的长期客户。
在本文中,我们在预算有限的环境中形式化了最佳个性化问题,我们对感兴趣的处理的成本既有变量又不确定。因此,例如,在上述分配重症监护床的例子中,我们将允许协变量调节不同患者平均需要保持重症监护多长时间,但不假设医院先验地知道这种关系。然后,我们解决了种群最优处理优先级规则,并开发了一种基于广义随机森林估计该规则的实用非参数方法[Breiman, 2001, Athey, Tibshirani和Wager, 2019]。当应用于由“共享经济”公司运行的营销活动时,我们发现我们的方法大大优于忽略成本的 näıve 方法,以及一个简单的基线,它试图使用单独的森林学习成本和治疗异质性,然后合成它们的预测。
备注:
Stefan Wager 是斯坦福商业研究生院运营、信息技术助理教授。Wager对本出版物的贡献是一个付费顾问,不是他的斯坦福大学职责或责任的一部分。
2 以成本不确定为目标处理
2.1预算约束下的最优分配
2.2使用随机试验进行识别
2.3学习处理规则
乍一看,像 (5) 所示估计协方差比率的问题似乎是一个明确但可能困难的统计问题。然而,幸运的是,事实证明这是一个在文献中已经受到相当大的关注的问题,因为在尝试使用工具变量估计(条件)局部平均治疗效果时,统计等效的估计问题出现了 [Angrist, Imbens, and Rubin, 1996, Durbin, 1954]。
3实证研究
4讨论
在本文中,我们考虑了在预算约束下优化优先(或针对)处理的问题,同时允许将不同人视为变量和不确定的成本。这种结构的问题经常出现在医学、营销等领域;然而,除了少数例外,这种设置并不关注现有的数据驱动决策文献。在这里,我们使用 Dantzig [1957] 的解决方案推导出最优优先排序规则的形式到分数背包问题中,并使用工具变量建立了异构处理效果估计问题的统计联系,使我们能够通过从 Athey、Tibshirani 和 Wager [2019] 中重新利用现成的随机森林软件来估计最佳优先排序规则。在模拟和营销应用中,所提出的方法显示出相当大的前景,以帮助我们有效地学习谁优先考虑治疗。