新版TCGA的甲基化数据分析

文章目录

    • 加载数据
    • 甲基化差异分析
    • 甲基化可视化
    • 甲基化旭日图

TCGAbiolinks可以进行甲基化分析,但是功能不如 ChAMP强大,甲基化分析还是首推 ChAMP包。

不过为了了解TCGAbiolinks包,里面关于甲基化分析的部分还是要学习一下。

主要是甲基化差异分析,甲基化的一些可视化,甲基化和转录组数据的联合作图。

加载数据

我们还是使用之前下载好的TCGA-COAD的甲基化β值矩阵。

数据下载见这篇:使用TCGAbiolinks批量下载最新版TCGA数据库的各种组学数据!

library(TCGAbiolinks)
suppressMessages(library(SummarizedExperiment))
load(file = "G:/tcga/TCGA-dnaMethy/COAD_METHY_beta.Rdata")

查看一下数据,现在这个β值矩阵还是一个SummarizedExperiment对象:

beta.m <- data
beta.m
## class: RangedSummarizedExperiment 
## dim: 485577 352 
## metadata(1): data_release
## assays(1): ''
## rownames(485577): cg13869341 cg14008030 ... cg11478607 cg08417382
## rowData names(52): address_A address_B ... MASK_extBase MASK_general
## colnames(352): TCGA-D5-6530-01A-11D-1721-05
##   TCGA-AA-3660-11A-01D-1721-05 ... TCGA-A6-5664-01A-21D-1837-05
##   TCGA-D5-6533-01A-11D-1721-05
## colData names(107): barcode patient ... paper_vascular_invasion_present
##   paper_vital_status

甲基化差异分析

β矩阵不能含有缺失值,所以先去除缺失值,使用缺失值插补方法进行插补也是可以的:

beta.m <- subset(beta.m, subset = (rowSums(is.na(assay(beta.m))) == 0))

如果你的甲基化矩阵是直接使用TCGAbiolinks包整理好的SummarizedExperiment对象,那么这个甲基化差异分析就非常简单。

我们需要确定谁和谁进行相比,也就是要创建一个含有分组信息的列。

所有样本的信息都在SummarizedExperiment对象中的colData中,包括分组信息、生存信息、分期信息等,我们这里只要用到分组信息即可,所以先把colData简化一下。

如果你这里都看不懂,可以翻看之前的推文:

TCGA转录组数据的表达矩阵提取
使用TCGAbiolinks包进行差异分析

# 只要两列信息,其实只要sample_type一列也行
sample_info <- as.data.frame(colData(beta.m))[,c("barcode","sample_type")]# sample_type改成normal和tumor
sample_info[sample_info == "Solid Tissue Normal"] <- "normal"
sample_info[sample_info != "normal"] <- "tumor"table(sample_info$sample_type)
## 
## normal  tumor 
##     38    314# 重新变成coldata
colData(beta.m) <- DataFrame(sample_info)

有了SummarizedExperiment对象和相应的分组信息就可以进行甲基化差异分析了。

# 非常慢
res <- TCGAanalyze_DMC(data = beta.m,groupCol = "sample_type", # colData中这一列含有分组信息group1 = "normal", # normal组group2 = "tumor" # tumor组)## Group1:normal
## Group2:tumor
## Calculating the p-values of each probe...
## |=================================================================|100%                       Completed after 20 m 
## Saving volcano plot as: methylation_volcano.pdf

查看结果:

head(res)
##            mean.normal mean.tumor mean.normal.minus.mean.tumor
## cg21870274   0.7868787  0.5479701                   0.23890856
## cg16619049   0.2781233  0.2591982                   0.01892506
## cg18147296   0.7219909  0.6847735                   0.03721734
## cg13938959   0.6958773  0.4552416                   0.24063575
## cg12445832   0.4654454  0.2479300                   0.21751535
## cg23999112   0.7941180  0.5310289                   0.26308907
##            p.value.normal.tumor p.value.adj.normal.tumor
## cg21870274         9.732669e-18             2.668610e-16
## cg16619049         2.314279e-02             4.306785e-02
## cg18147296         1.024600e-01             1.566558e-01
## cg13938959         4.389698e-18             1.321596e-16
## cg12445832         2.608577e-18             8.391252e-17
## cg23999112         4.649043e-13             5.043637e-12
##                               status
## cg21870274 Hypermethylated in normal
## cg16619049           Not Significant
## cg18147296           Not Significant
## cg13938959 Hypermethylated in normal
## cg12445832 Hypermethylated in normal
## cg23999112 Hypermethylated in normal

可以看到和转录组的差异分析结果差不多,但是都是探针信息,基因信息需要注释才行。

同时也会在当前目录下生产一个PDF格式的火山图:

image-20220903154948951

保存结果:

save(res, file = "tcga-coad_de_methy.rdata")

甲基化可视化

使用箱线图可视化不同组别之间的甲基化值。

mdm <- TCGAvisualize_meanMethylation(data = beta.m,groupCol = "sample_type",print.pvalue = T)

会在目录下生成一个PDF文件:

image-20220903154914628

甲基化旭日图

可以在一张图中查看转录组数据和甲基化数据的情况。

需要准备转录组差异分析结果和甲基化差异分析结果。

转录组差异分析结果使用之前推文中得到的数据

# 这个数据只是部分差异基因,你可以用所有基因的结果
load(file = "coadDEGs.Rdata")

甲基化差异分析结果就用本次的结果。

有了两个差异分析的结果,就可以画旭日图了:

starburst <- TCGAvisualize_starburst(met = res, exp = coadDEGs,group1 = "normal",group2 = "tumor",met.platform = "Illumina Human Methylation 450",genome = "hg38",met.p.cut = 10^-5, exp.p.cut = 10^-5,names = TRUE
)

会在当前目录下生成一个png格式的旭日图:

starburst

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32781.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

转录组-差异基因热图

top_de_exp<-dplyr::slice(de_result2,1:20)%>%#挑取差异最大的select(-c(2:8))%>%#去掉2-8列column_to_rownames(var"id")#列变行 de_result2为上一篇转录组-火山图得到的数据&#xff01; #第一种做图方式 library(pheatmap) pheatmap(log10(top_de_ex…

【bioinfo】二代测序在肿瘤突变检测中的错误来源和解决策略

文章目录 文献摘要NGS工作流程中的错误来源1&#xff09;FFPE样本&#xff1a;2&#xff09;DNA打断&#xff1a;3&#xff09;PCR扩增和聚合酶保真度&#xff1a;4&#xff09;测序平台&#xff1a;5&#xff09;数据分析&#xff1a; NGS工作流错误解决策略使用UID不使用UID …

Cell | 深度突变学习预测SARS-CoV-2受体结合域组合突变对ACE2结合和抗体逃逸的影响...

本文介绍一篇来自于苏黎世联邦理工学院的Joseph M. Taft在Cell上发表的工作——《Deep Mutational Learning Predicts ACE2 Binding and Antibody Escape to Combinatorial Mutations in the SARS-CoV-2 Receptor Binding Domain》。 SARS-CoV-2的持续变异以及对疫苗和中和抗体…

DNA 8. 癌症的突变异质性及寻找新的癌症驱动基因(MutSigCV)

点击关注&#xff0c;桓峰基因 桓峰基因 生物信息分析&#xff0c;SCI文章撰写及生物信息基础知识学习&#xff1a;R语言学习&#xff0c;perl基础编程&#xff0c;linux系统命令&#xff0c;Python遇见更好的你 120篇原创内容 公众号 桓峰基因公众号推出基于基因组变异数…

生物(一)ctDNA突变检测应用于肿瘤早期筛查

原创&#xff1a;yongzhe 提到cfDNA应用于肿瘤早期筛查&#xff0c;是一个充满希望和挑战的问题。目前的热门方向是甲基化&#xff0c;相当多一部分公司以此为研发方向&#xff0c;还包括ctDNA突变检测&#xff0c;cnv检测&#xff0c;CTC&#xff0c;外泌体检测等都在探索研究…

利用GATK4.1 mutect2寻找体细胞突变(SNV和INDEL)

今天梳理一下最最最最(最X100)常用的mutect2体细胞变异分析流程。主要用来分析肿瘤配对样本,寻找体细胞突变比如SNV和INDEL。官网上已经有了详细的英文版教程。 软件版本:GATK4.1.1.0 官网教程:https://gatk.broadinstitute.org/hc/en-us/articles/360035894731-Somatic…

GATK4 最佳实践-生殖细胞突变的检测与识别

欢迎关注"生信修炼手册"&#xff01; GATK4 对于体细胞突变和生殖细胞突变的检测分别给出了对应的pipeline: Germline SNPsIndelsSomatic SNVs Indels 本篇主要关注生殖细胞突变的分析流程Germline SNPsIndels。示意图如下&#xff1a; 图中红色方框部分的从Analysi…

GATK4最佳实践-体细胞突变的检测与识别

欢迎关注"生信修炼手册"&#xff01; 分析体细胞突变时&#xff0c;通常采用tumor_vs_nomal 的实验设计。在检测时&#xff0c;由于同时会检测出生殖细胞突变和体细胞突变&#xff0c;需要做的就是去除生殖细胞突变位点&#xff0c;那么剩下的就是体细胞突变位点了&a…

TCGA差异表达分析|2022.5.1更新

作者&#xff1a;Squirrelity 2022-07-18 补充说明 最近R更新了&#xff0c;很多包都用不了&#xff0c;如果遇到报错或者是运行不了有可能是因为版本问题。 一、加载对应的R包 这里用到十三个包&#xff08;距离上次更新之后又新增了不少方法/包&#xff09;&#xff1a; lib…

病理基因突变综述

颜锐, 梁智勇, 李锦涛, 任菲. 基于深度学习和H&E染色病理图像的肿瘤相关指标预测研究综述[J]. 计算机科学, 2022, 49(2): 69-82. YAN Rui, LIANG Zhi-yong, LI Jin-tao, REN Fei. Predicting Tumor-related Indicators Based on Deep Learning and H&E Stained Patholo…

maftools|TCGA肿瘤突变数据的汇总,分析和可视化

之前介绍了使用maftools | 从头开始绘制发表级oncoplot&#xff08;瀑布图&#xff09; R-maftools包绘制组学突变结果&#xff08;MAF&#xff09;的oncoplot或者叫“瀑布图”&#xff0c;以及一些细节的更改和注释。 本文继续介绍maftools对于MAF文件的其他应用&#xff0c;为…

生信-记一次NCBI-R语言-淋巴癌突变与未突变基因的差异分析

关键词&#xff1a;基因芯片、R、筛选、预处理、差异分析 NCBI-淋巴癌突变与未突变基因的差异分析 PS&#xff1a;好久没分享生信了&#xff0c;这是一年前做的一次生信task&#xff08;准确来说是2018年11月了&#xff09;&#xff0c;这里分享一下给大家&#xff0c;有助于一…

TCGA 亚型突变负荷代码

#1、准备文件/数据并加载相应的包 #1.1下载并加载相应的包&#xff0c;有就直接加载&#xff0c;没有就下载后再加载。 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::install("TCGAbiolinks") library(t…

四、肿瘤全基因组学体细胞点突变特征(The repertoire of mutational signatures in human cancer)

全文链接 一、肿瘤突变特征&#xff1a;碱基置换及插入、缺失突变 单碱基置换&#xff08;49种特征类型&#xff0c;single-base-substitution&#xff0c;SBS&#xff09; 双碱基置换&#xff08;11种特征类型&#xff0c;doublet-base-substitution&#xff0c;DBS&#xf…

TCGA_联合GTEx分析2_查看批次效应

在 TCGA_联合GTEx分析1_得到表达矩阵.tpm_老实人谢耳朵的博客-CSDN博客 中&#xff0c;获取了TCGA和GTEx中样本的表达矩阵数据&#xff0c;数据格式均为tpm。本文对二者进行合并后&#xff0c;通过PCA分析、绘制内参箱线图等方法&#xff0c;查看是否存在批次效应。 关于批次效…

提取TCGA 中体细胞突变数据的表达矩阵

#因为之前的命令调用GDCquery_Maf 发现用不了 #故找到了一些其他的方法&#xff0c;并且自己试着将其弄成了一个表达矩阵。 #代码如下 #1、下载加载相应的包 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::insta…

chatgpt赋能python:Python抢票的绝招

Python 抢票的绝招 随着互联网技术的不断发展&#xff0c;越来越多的人开始享受网购的便利。但是&#xff0c;随着一些热门事件的到来&#xff0c;如演唱会、体育比赛等&#xff0c;大家面临同一个问题&#xff1a;如何抢到热门事件的门票&#xff1f;这时&#xff0c;Python …

CSDN问答

近期AI成为热点话题&#xff0c; ChatGPT&#xff0c; GPT4&#xff0c; new bing&#xff0c; Bard&#xff0c;AI 绘画&#xff0c; AI 编程工具引发大量讨论。请结合自身学习经历&#xff0c;一起来聊聊你对 AI 技术以及其今后发展的看法吧。请在下面的问题中选择一些来回答…

起名源码PHP(宝宝取名源码)

起名源码有助于更好的借助八字风水来帮助起名的需求&#xff0c;其参考了一部中国古代经典文本易经。以这种方式咨询的过程包括通过随机生成的方法确定卦&#xff0c;然后阅读与该卦相关的文本。      演示&#xff1a;m.appwin.top      部分源码&#xff1a;texts.py…

携程英语口语测验题目

携程入职前会有两个测验&#xff1a;CATA能力测验、英语测验&#xff08;部分岗位可能没有英语测验&#xff09; 这两个测验通过&#xff0c;方可进入下面流程&#xff0c;所有这两个测验一定要引起重视&#xff1b; 题型分布 携程英语测验 题型攻略 携程英语测验 总共六部分…