泛癌分析·找出各个癌症的预后相关基因
` 其他相关文章:
万物皆可pan分析·高分文章登山梯·for循环的熟练操作
前言
pan分析的第二篇我想写一下如何在TCGA整个基因集内实现COX单因素分析,将所有的预后相关基因筛选出来,同时得到这些基因的基本参数、统计量等信息。这样的分析的普遍性在于你可以把筛选出来的基因复集到你的目标基中。具体的应用场景如图:
这张图的C说明了肿瘤相关基因在作者感兴趣的目标基因集上的(可能是你要的功能基因集合,比如代谢相关基因,免疫相关基等)富集情况。图中,肝癌对比其他癌症在代谢相关基因集上更为富集。
本篇文章从最基础的数据材料出发,所以会很复杂繁琐,需要非常耐心才将整个过程重现,难度确实较一般分析大。所用代码虽然都很基础,但是非常复杂,需要比较深厚的后段代码基础、和对TCGA数据的理解、以及对cox分析的掌握。
数据准备
1、各个TCGA-项目的FPKM 表达谱数据。
2、对应的临床数据,必须包括删失。