maftools|TCGA肿瘤突变数据的汇总,分析和可视化

之前介绍了使用maftools | 从头开始绘制发表级oncoplot(瀑布图) R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”,以及一些细节的更改和注释。

本文继续介绍maftools对于MAF文件的其他应用,为更易理解和重现,本次使用TCGA下载

数据部分

#载入R包和数TCGA-LIHC的maf数据
library(maftools)
laml.maf = read.csv("TCGA.LIHC.mutect.maf.csv",header=TRUE)#本次只展示maf的一些统计绘图,只读入组学数据,不添加临床数据
laml = read.maf(maf = laml.maf)
#查看数据的基本情况
laml
An object of class  MAF ID summary   Mean Median1:             NCBI_Build       1     NA     NA2:                 Center       1     NA     NA3:                Samples     364     NA     NA4:                 nGenes   12704     NA     NA5:        Frame_Shift_Del    1413  3.893      36:        Frame_Shift_Ins     551  1.518      17:           In_Frame_Del     277  0.763      08:           In_Frame_Ins     112  0.309      09:      Missense_Mutation   28304 77.972     63
10:      Nonsense_Mutation    1883  5.187      4
11:       Nonstop_Mutation      45  0.124      0
12:            Splice_Site    1051  2.895      2
13: Translation_Start_Site      65  0.179      0
14:                  total   33701 92.840     75

#可以将MAF文件的gene ,sample的 summary 的信息,输出到laml前缀的summary文件

write.mafSummary(maf = laml, basename = 'laml')

laml_geneSummary.txt

aaf9f8cb4c412047e450d611cce3d34c.png

laml_sampleSummary.txt

f3abae4f14c1da2ef9c2759bfc22829d.png

分析,可视化

1,绘制MAF文件的整体结果图

plotmafSummary(maf = laml, rmOutlier = TRUE, addStat = 'median', dashboard = TRUE, titvRaw = FALSE)

f76d47ff74805f39aade7ca963c42a5c.png

2,绘制oncoplot图

#oncoplot for top 20 genes.
oncoplot(maf = laml, top = 20)

a562e8ede14c2280c72c68ca70912b6b.png

添加SCNA信息,添加P值信息,添加临床注释信息,更改颜色等可参考 maftools | 从头开始绘制发表级oncoplot(瀑布图)

3,绘制Oncostrip

可以使用 oncostrip 函数展示特定基因在样本中的突变情况,此处查看肝癌中关注较多的'TP53','CTNNB1', 'ARID1A'三个基因,如下:

oncostrip(maf = laml, genes = c('TP53','CTNNB1', 'ARID1A'))

735e194e250f7579b8475eb62a8fe2bb.png

4 Transition , Transversions

titv函数将SNP分类为Transitions_vs_Transversions,并以各种方式返回汇总表的列表。汇总数据也可以显示为一个箱线图堆积条形图显示每个样本中的转换比例

laml.titv = titv(maf = laml, plot = FALSE, useSyn = TRUE)
#plot titv summary
plotTiTv(res = laml.titv)

1742f21f4bf173f956e0e82c9e5b6f1b.png

5 Rainfall plots

使用rainfallPlot参数绘制rainfall plots,展示超突变的基因组区域。detectChangePoints设置为TRUE,rainfall plots可以突出显示潜在变化的区域.

rainfallPlot(maf = laml, detectChangePoints = TRUE, pointSize = 0.6)

49504c16137eac8a274eab4f7d00ea2c.png

6 Compare mutation load against TCGA cohorts

通过tcgaComapre函数实现laml(自有群体)与TCGA中已有的33个癌种队列的突变负载情况的比较。

#cohortName 给输入的队列命名
laml.mutload = tcgaCompare(maf = laml, cohortName = 'LIHC-2')

f5289ea7d576617b4063d4cc4b087ed1.png

7 Genecloud

使用 geneCloud参数绘制基因云,每个基因的大小与它突变的样本总数成正比。

geneCloud(input = laml, minMut = 15)

522df79ba372f74e2af3140c4f0f88a0.png

8 Somatic 交互性

癌症中的许多引起疾病的基因共同发生或在其突变模式中显示出强烈的排他性。可以使用somaticInteractions函数使用配对Fisher 's精确检验来分析突变基因之间的的co-occurring 或者exclusiveness。

#exclusive/co-occurance event analysis on top 10 mutated genes.
Interact <- somaticInteractions(maf = laml, top = 25, pvalue = c(0.05, 0.1))
#提取P值结果
Interact$gene_sets

                 gene_set       pvalue

 1:   AXIN1, TP53, CTNNB1 0.0001359059

 2:  TP53, CTNNB1, ARID1A 0.0017044866

 3:     AXIN1, TP53, APOB 0.0083559763

 4:      AXIN1, TP53, ALB 0.0166487594

 5: AXIN1, CTNNB1, ARID1A 0.0354069454

 6:      AXIN1, ALB, APOB 0.0503831670

可以看到TP53和CTNNB1之间有较强的exclusiveness,也与文献中的结论一致。

9 两个队列比较(MAFs)

由于癌症的突变模式各不相同,因此可是 mafComapre参数比较两个不同队列的差异突变基因

#输入另一个 MAF 文件
Our_maf <- read.csv("Our_maf.csv",header=TRUE)
our_maf = read.maf(maf = Our_maf)#比较最少Mut个数为5的基因
pt.vs.rt <- mafCompare(m1 = laml, m2 = our_maf, m1Name = 'LIHC', m2Name = 'OUR', minMut = 5)
print(pt.vs.rt)

e3230537bd70f4d87a0c8544e4dccec4.png

  • result部分会有每个基因分别在两个队列中的个数以及P值和置信区间等信息。

  • SampleSummary 会有两个队列的样本数。

1) Forest plots

比较结果绘制森林图

forestPlot(mafCompareRes = pt.vs.rt, pVal = 0.01, color = c('royalblue', 'maroon'), geneFontSize = 0.8)

4e24cac4a989b7b3b3e0ea9974173151.png

10 Oncogenic 通路

OncogenicPathways 功能查看显著富集通路

OncogenicPathways(maf = laml)
#会输出统计结果
Pathway alteration fractionsPathway  N n_affected_genes fraction_affected1:    RTK-RAS 85               68         0.80000002:        WNT 68               55         0.80882353:      NOTCH 71               52         0.73239444:      Hippo 38               30         0.78947375:       PI3K 29               24         0.82758626: Cell_Cycle 15               11         0.73333337:        MYC 13               10         0.76923088:   TGF-Beta  7                6         0.85714299:       TP53  6                5         0.8333333
10:       NRF2  3                2         0.6666667

15a3570e8900eed4f3666290546aea22.png

可以对上面富集的通路中选择感兴趣的进行完成的突变展示:

PlotOncogenicPathways(maf = laml, pathways = "PI3K")

e5f5bf5420f30ed260b84a2e03b6391a.png

好了,以上就是使用maftools包对MAF格式的组学数据的汇总,分析,可视化。

 生信宝典后台回复“maf文件”即可获得示例的maf文件和代码

258e968ba2ef5852fae3f019a9d405df.png

【觉得不错,右下角点击赏个“在看”,转发就是赞赏,谢谢!】

3abb3b8766ae393c1dd38a18709e3512.png

GEO/TCGA数据

  • UCSC XENA - 集大成者(TCGA, ICGC)

  • ICGC数据库使用

  • TCGA数据库在线使用

  • BROAD开发的TCGA分析平台,强大的下载功能

  • cBioPortal功能强大的TCGA再分析平台

  • 这是数据更新最实时的TCGA网站,功能强大

  • 不懂R,如何进行GEO数据库表达谱的差异分析、富集分析、蛋白互作、可视化?

  • 典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集

  • 典型医学设计实验GEO数据分析 (step-by-step) - 数据获取到标准化

  • 这个只需一步就可做富集分析的网站还未发表就被CNS等引用超过350次

  • 一个逆天的small RNA-seq数据挖掘神器

  • 用了这么多年的PCA可视化竟然是错的!!!

生信工具

  • OrthoMCL鉴定物种同源基因 (安装+使用)

  • 微生物组学数据分析工具综述 16S+宏基因组+宏病毒组+宏转录组

  • 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版)

  • 39个转录组分析工具,120种组合评估(转录组分析工具大比拼 (完整翻译版))

  • 无参转录组分析工具评估和流程展示

  • Graphpad,经典绘图工具初学初探

  • 维恩(Venn)图绘制工具大全 (在线+R包)

  • 别人的电子书,你的电子书,都在bookdown

  • Rfam 12.0+本地使用 (最新版教程)

  • 轻松绘制各种Venn图

  • ETE构建、绘制进化树

  • psRobot:植物小RNA分析系统

  • 生信软件系列 - NCBI使用

  • 掌握这个网站,万方、维普、CNKI等众多数据库文献统统可以免费下载!

  • 拿到基因两眼一抹黑?没关系,先做个基因富集分析吧!

  • 科研小萌新,掌握这些技巧,轻松玩转各个基因!

  • 引起相变的无序结构域(IDRs)怎么预测?跟踪热点,提升文章档次!

  • 如果你经常用PubMed,那么这个插件将非常好用!

  • 基于人工智能的文献检索,导师查找,更聪明

  • GeenMedical:文献查询、筛选、引用排序、相似文献、全文下载、杂志分区、影响因子、结果导出、杂志评述、直接投稿,一站服务

  • 如何快准狠地找到相关领域的经典文献?

  • Excel改变了你的基因名,30% 相关Nature文章受影响,NCBI也受波及

  • 这些基因的名字太有才了,研究一下都可以发10分文章

  • 文献检索新姿势,教你如何直搜文中的科研图片!

  • Endnote X8云同步:家里单位实时同步文献笔记,有网随时读文献

  • 还在慌?Endnote的个性化文献引用助毕业论文一臂之力

  • 参考文献中杂志名字格式混乱问题一次解决 - 修改style是没用的

  • 参考文献中杂志名字格式混乱问题一次解决

  • 实用网站和在线工具推荐

  • 在线浏览器,在线PS,在线AI,在线编程 …

  • Gephi轻松绘制超美网络图

  • 微生物组间差异分析神器-STAMP简明教程 中文帮助文档

  • 微生物网络构建:MENA, LSA, SparCC和CoNet  

  • FUNGuild:真菌功能注释

  • 在线RaxML构建系统发育树

  • MetaboAnalyst 4.0,代谢组学研究利器的升级

  • RepeatMasker:基因组重复序列注释

  • 基因组注释 1重复序列 2非编码和编码基因3功能注释Prokka

  • 去东方,最好用的在线GO富集分析工具

  • 超简便的国产lncRNA预测工具

  • LGC简单漂亮的在线生信绘图工具

  • MicrobiomeAnalyst:可视化微生物组网页工具

  • NAR:MicrobiomeAnalyst微生物组分析师——统计、可视化和元分析微生物组数据的网页工具

  • Docker的基本使用-Ubuntu18.04

  • Linux命令screen—终端切换,工作环境保存,画面同步,防断网

  • Bioconda软件安装神器:多版本并存、环境复制、环境导出

  • CIRCOS圈图绘制 - circos安装

  • QIIME2中文教程-把握分析趋势

  • 9个模块+40余款软件+老司机辣评 16S信息分析流程软件和数据库合集

  • 扩增子分析神器USEARCH 简介 v11新功能v11命令大全OTU表抽平otutab_rare核心OTU鉴定otutab_core

  • 扩增子分析神器VSEARCH 分析流程 2.8.1中文帮助文档

往期精品

画图三字经 生信视频 生信系列教程 

心得体会 TCGA数据库 Linux Python 

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信 2019影响因子 GSEA 单细胞 

后台回复“生信宝典福利第一波”获取教程合集

e27c2d2c1267e4778b450cee0491d373.png

3ca00d0aa7e0ac8ce3c4c1bc2e0267b2.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32770.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生信-记一次NCBI-R语言-淋巴癌突变与未突变基因的差异分析

关键词&#xff1a;基因芯片、R、筛选、预处理、差异分析 NCBI-淋巴癌突变与未突变基因的差异分析 PS&#xff1a;好久没分享生信了&#xff0c;这是一年前做的一次生信task&#xff08;准确来说是2018年11月了&#xff09;&#xff0c;这里分享一下给大家&#xff0c;有助于一…

TCGA 亚型突变负荷代码

#1、准备文件/数据并加载相应的包 #1.1下载并加载相应的包&#xff0c;有就直接加载&#xff0c;没有就下载后再加载。 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::install("TCGAbiolinks") library(t…

四、肿瘤全基因组学体细胞点突变特征(The repertoire of mutational signatures in human cancer)

全文链接 一、肿瘤突变特征&#xff1a;碱基置换及插入、缺失突变 单碱基置换&#xff08;49种特征类型&#xff0c;single-base-substitution&#xff0c;SBS&#xff09; 双碱基置换&#xff08;11种特征类型&#xff0c;doublet-base-substitution&#xff0c;DBS&#xf…

TCGA_联合GTEx分析2_查看批次效应

在 TCGA_联合GTEx分析1_得到表达矩阵.tpm_老实人谢耳朵的博客-CSDN博客 中&#xff0c;获取了TCGA和GTEx中样本的表达矩阵数据&#xff0c;数据格式均为tpm。本文对二者进行合并后&#xff0c;通过PCA分析、绘制内参箱线图等方法&#xff0c;查看是否存在批次效应。 关于批次效…

提取TCGA 中体细胞突变数据的表达矩阵

#因为之前的命令调用GDCquery_Maf 发现用不了 #故找到了一些其他的方法&#xff0c;并且自己试着将其弄成了一个表达矩阵。 #代码如下 #1、下载加载相应的包 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::insta…

chatgpt赋能python:Python抢票的绝招

Python 抢票的绝招 随着互联网技术的不断发展&#xff0c;越来越多的人开始享受网购的便利。但是&#xff0c;随着一些热门事件的到来&#xff0c;如演唱会、体育比赛等&#xff0c;大家面临同一个问题&#xff1a;如何抢到热门事件的门票&#xff1f;这时&#xff0c;Python …

CSDN问答

近期AI成为热点话题&#xff0c; ChatGPT&#xff0c; GPT4&#xff0c; new bing&#xff0c; Bard&#xff0c;AI 绘画&#xff0c; AI 编程工具引发大量讨论。请结合自身学习经历&#xff0c;一起来聊聊你对 AI 技术以及其今后发展的看法吧。请在下面的问题中选择一些来回答…

起名源码PHP(宝宝取名源码)

起名源码有助于更好的借助八字风水来帮助起名的需求&#xff0c;其参考了一部中国古代经典文本易经。以这种方式咨询的过程包括通过随机生成的方法确定卦&#xff0c;然后阅读与该卦相关的文本。      演示&#xff1a;m.appwin.top      部分源码&#xff1a;texts.py…

携程英语口语测验题目

携程入职前会有两个测验&#xff1a;CATA能力测验、英语测验&#xff08;部分岗位可能没有英语测验&#xff09; 这两个测验通过&#xff0c;方可进入下面流程&#xff0c;所有这两个测验一定要引起重视&#xff1b; 题型分布 携程英语测验 题型攻略 携程英语测验 总共六部分…

Ubuntu软件安装新选择—星火应用商店(QQ、微信等一网打尽)

Ubuntu软件安装新选择—星火应用商店&#xff08;QQ、微信等一网打尽&#xff09; 1. 星火应用商店介绍2. 下载安装星火应用商店3. 使用星火应用商店安装软件4. 使用星火应用商店更新软件5. 日常软件推荐6. 星火应用商店交流群 1. 星火应用商店介绍 官网地址 http://spark-app…

学生信息后台管理系统(GUI)

一、目的 通过制作学生信息后台管理系统熟悉java中JDBC和CUI(图形用户接口)的使用。 二、实验工具 1.Eclipse IDE Version: 2020-12 (4.18.0) 2.mysql 3.Navicat Premium 15(数据库管理工具) 4.WindowBuilder(java图形用户界面插件) 具体下载和使用可以参考以下链接: 下…

数影周报:SpaceX设计图纸被泄露,拍明芯城正式在纳斯达克上市

本周看点&#xff1a;LockBit勒索软件团伙扬言泄露SpaceX设计图纸&#xff1b;亚马逊宣布将停止 Kindle Newsstand 服务&#xff1b;“拍明芯城”正式在纳斯达克上市...... 数据安全那些事 LockBit勒索软件团伙扬言泄露SpaceX设计图纸 近日&#xff0c;勒索软件组织LockBit给埃…

小米汽车设计图纸泄露,官方称非最终文件;微软裁员遣散费高达8亿美元,人均获赔54万元;苹果暂停自研Wi-Fi芯片|极客头条...

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…

为什么要使用低代码 – 前端角度的思考

为什么要使用低代码 – 前端角度的思考 文章目录 为什么要使用低代码 – 前端角度的思考当前前端发展现状低代码的热潮已经掀起千层浪UI工程师常常面临一些令人尴尬的场景低代码化解场景思路低代码对于外包型企业或软件研发企业在前端有什么优势呢&#xff1f;这里简单列举三点…

《互联网大厂推荐算法实战》上线啦!

为什么是“上线”而非“出版”&#xff1f; 你没眼花&#xff0c;我也没写错&#xff0c;是“上线”而非“出版”&#xff0c;个中原因&#xff0c;请容我慢慢道来。如果你对八卦不感兴趣&#xff0c;可以直接跳到本文的第2部分&#xff0c;看看我给出的“你需要读这本书”的理…

石塔西的《互联网大厂推荐算法实战》上线啦!

PS&#xff1a;史塔西的文章还是很有质量的&#xff0c;成体系的内容输出更是有质量保障&#xff0c;感兴趣的可以关注下&#xff08;感觉好像我也得努力下了&#xff0c;数据与广告系列还没有完&#xff0c;也给自己加个油&#xff09;。 为什么是“上线”而非“出版”&#x…

在中国月收入1万是什么水平?今天这两个热搜很多人都有话说!

上一篇&#xff1a;阿里版 ChatGPT已进入测试&#xff01;中文聊天截图曝光&#xff0c;达摩院出品 今天一早一个热搜引发网友热议——#在中国月收入1万是个什么样的水平#。 之后&#xff0c;又有一个话题词紧跟其后上了热搜——#很体面但工资不高的工作#。 你觉得多少月薪能满…

解决:将Ubuntu系统打包成ios镜像并制作U盘系统

将Ubuntu系统打包成ios镜像并制作U盘系统 一、安装 Systemback二、将创建的.sblive镜像文件转为.iso格式三、写入U盘进行安装四、制作系统U盘 一、安装 Systemback Currently supported Ubuntu releases: - 14.04.X LTS - 15.04 - 15.10 - 16.04.X LTS - 16.10Systemback的作者…

一些国内镜像 快速源

maven 阿里云仓库&#xff1a; <repositories><repository><id>nexus-aliyun</id><name>nexus-aliyun Repository</name><url>http://maven.aliyun.com/nexus/content/groups/public/</url><releases><enabled>tr…

MaaS来临,SaaS进入「奇点」时刻|产业深度

大模型热度持续发酵。MaaS的到来&#xff0c;不仅改变了云厂商的竞争格局&#xff0c;SaaS行业也将迎来「奇点」时刻。未来十年&#xff0c;基于MaaS底座&#xff0c;国内SaaS甚至可能会出现Salesforce一样的巨头。 作者|思杭 编辑|皮爷 出品|产业家 大模型热度正在持续发酵。…