医学交互作用分析的目的和用途(R语言)
医学交互作用分析一直是医学数据分析的组成部分,总结最近的一些认识。
目的:
- 在独立危险因素鉴定的研究中,(独立危险因素的)交互作用可以作为独立危险因素的属性之一来进行分析;
- 在预测模型构建的研究中,交互作用分析用于决定模型方程中交互项的取舍,以实现更高效能的模型,只适用于线性模型,因为非线性的树形模型不需要单独处理交互项。
所以,交互作用分析不是单独的数据分析类型,而是要与其他的分析过程进行整合,丰富分析内容,更全面说明问题。
步骤:
- 交互作用项的扫描,当方程中变量比较多的时候,逐个探索变量间交互作用是繁琐的工作,有一些方法可以批量扫描变量间的交互作用,略略探索,SHAP分析中使用xgboost算法时可以展示交互作用,iml包中可以计算交互作用强度,还有一个vivid包可以通过热图和网络图来批量展示交互作用。具体怎么理解筛选出的交互作用,还有待于进一步学习。
下图是iml包生成的交互作用强度图,vivid是值得尝试的一个包。
- 交互作用的逐个鉴定,当有了观察对象之后,就可以使用传统的交互作用分析方法来逐个鉴定变量间的交互作用,最终根据P值来确定是否是真正的交互作用并进行可视化。根据交互作用中两个变量类型的不同,采用不同的R包和算法,如果交互作用双方都是分类变量,可以使用Publish包进行亚组分析、epiR包和interactionR包,如果有一方是连续变量,可以使用interactions包。
下图是interactions包生成的交互作用图。
以上步骤鉴定出的作用,在不同的研究中,作为独立危险因素的一个属性来进行报道,整合到独立危险因素鉴定的相关研究流程中,或者用于构建线性的预测模型,都可以起到丰富研究内容的目的。