1.TCGAplot简介
华科同济医院的王雄老师课题组利用TCGA数据库,开发了一个TCGA多组学数据泛癌分析和可视化R包TCGAplot[1]。用于泛癌表达以及基因表达与 TMB、MSI、TIME 和启动子甲基化之间相关性等分析。
2.TMB简介
肿瘤突变负荷(Tumor Mutation Burden,TMB)是指单位长度中检测到的突变总数。这些突变可以是单核苷酸突变,插入缺失等。
TMB = 体细胞突变数/每百万碱基(Mb)
一般来说,TMB值越高,意味着肿瘤细胞中的突变数量越多。高TMB的肿瘤通常会产生更多的新抗原,使免疫系统更容易识别和攻击肿瘤细胞。此外,不同肿瘤中,TMB 中位值和分布范围也不同。
3.一键在线绘制基因表达与TMB的相关性雷达图
然而,由于TCGAplot R包安装与使用需要相关专业知识。为了更好地帮助大家挖掘TCGA,经与王老师沟通,我们推出了在线版TCGAplot供大家免费使用。
今天,给大家带来的第4个函数:某个基因的表达与TMB的相关性雷达图。
3.1打开作图URL
微生信-在线TCGA泛癌基因表达与肿瘤突变负荷(TMB)相关性雷达图
3.2 填写感兴趣的基因,选择参数并提交
将感兴趣的基因symbol粘贴到输入框,由于基因名会更新(见:基因名坑你没商量 -- 有关基因名的坑),所以提交的基因symbol必需在所提供的genelist里边。例如这里填写基因KLF7,即Kruppel-like factor 7,它是一种转录因子,在生物体内各组织中广泛表达,并参与调控细胞的增殖、分化、再生以及肿瘤发生等重要的生理功能。
我们提供了统计方法,字体等参数供大家选择使用。选择好参数后,点击提交按钮。
3.3 下载图片及数据
由于需要从上万个样品中调取数据并绘图,约40秒后,会出来雷达图。我们提供了pdf、svg两种矢量图,png、tiff两种标量图供大家下载使用。同时也提供了图片对应的数据供下载。
图片说明:
雷达图中最外圈是33种癌症,按字母顺序顺时针排布。名字上的星号表示显著性水平:*表示p<0.05, **表示p<0.01, ***表示p<0.001, ****表示p<0.0001。这个雷达图包括5个圈,12点位置的刻度是每个圈对应的相关性大小,其中最外圈是0.2,最内圈是-0.4。此图中,距离外圈越近表示正相关越大,距离内圈越近表示负相关性越大。径向的轴对应具体某癌症,以ACC为例,其相关性约为0.2。共33个点连起来围成了一个N边型。这个图的关键在于看准刻度,最大值多少,最小值多少,0点在哪里,有没有星号,N边型的峰和谷对应的都是哪种癌症。
数据说明:
数据包括4列:
Caseid:TCGA数据库的ID
Cancer:肿瘤类型
KLF7:该基因的log2(TPM+1)值,由于存储空间及精度原因,这里仅保留了2位小数。
TMB:肿瘤突变负荷
相关性表格:
数据包括3列:
Cancer:肿瘤类型
Corr:相关性
Corr(p):显著性
注:这个表格是根据上个表格重新计算的,精度可能跟原图稍有差异,供参考。
4.TMB计算
使用maftools R包可以计算TMB值。通过运行作者所给的源码即可。
见TCGAplot/rawdata_code/TMB.R at main · tjhwangxiong/TCGAplot · GitHub
我们重新算了下发现,新的TMB结果跟TCGAplot github上的示例不太一样,我们以新的为准。
参考文献:
[1] Liao C, Wang X. TCGAplot: an R package for integrative pan-cancer analysis and visualization of TCGA multi-omics data. BMC Bioinformatics. 2023 Dec 17;24(1):483. doi: 10.1186/s12859-023-05615-3. PMID: 38105215; PMCID: PMC10726608
微生信助力高分文章,用户167000, 谷歌学术3100