GATK4最佳实践-体细胞突变的检测与识别

欢迎关注"生信修炼手册"!

分析体细胞突变时,通常采用tumor_vs_nomal 的实验设计。在检测时,由于同时会检测出生殖细胞突变和体细胞突变,需要做的就是去除生殖细胞突变位点,那么剩下的就是体细胞突变位点了,GATK4 采用Mutect2 检测体细胞突变,分析流程如下:

1. 根据normal 样本得到 panel of normal

首先对每个normal 样本,运行Mutect2

gatk Mutect2 \-R reference.fa \-I normal1.bam \-tumor normal1_sample_name \--germline-resource af-only-gnomad.vcf.gz \-O normal1_for_pon.vcf.gz

然后使用CreateSomaticPanelOfNormals命令创建panel of normal

gatk CreateSomaticPanelOfNormals \-vcfs normal1_for_pon_vcf.gz \-vcfs normal2_for_pon_vcf.gz \-vcfs normal3_for_pon_vcf.gz \-O pon.vcf.gz

2. normal_vs_turmor 得到体细胞突变

命令如下:

gatk Mutect2 \-R reference.fa \-I tumor.bam \-tumor tumor_sample_name \-I normal.bam \-normal normal_sample_name \--germline-resource af-only-gnomad.vcf.gz \--af-of-alleles-not-in-resource 0.00003125 \--panel-of-normals pon.vcf.gz \-O somatic.vcf.gz

mutect2检测时,是成对检测的,需要一个normal bam 和 turmor bam, germline-resource指定一个生殖细胞突变的vcf文件,这里选择的是gnomAD数据库 ,链接如下

http://gnomad.broadinstitute.org

这个数据库收集了大量外显子和全基因组测序的SNP calling结果。af-of-alleles-not-in-resource指定germline-resource 变异位点的频率,低于该频率的位点认为是一个不可靠的生殖细胞突变位点。panel-of-normals指定第一步生成的pon.vcf.gz文件。

3. 过滤VCF文件

第一步,运行GetPileupSummaries

gatk-launch GetPileupSummaries \-I tumor.bam \-V small_exac_common_3.vcf \-O pileups.table

第二步,运行CalculateContamination

gatk-launch  CalculateContamination \-I pileups.table \-O contamination.table

第三步,运行FilterMutectCalls

gatk FilterMutectCalls \-V somatic.vcf.gz \-contamination-table contamination.table \-O filtere

扫描关注微信号,更多精彩内容等着你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32773.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TCGA差异表达分析|2022.5.1更新

作者:Squirrelity 2022-07-18 补充说明 最近R更新了,很多包都用不了,如果遇到报错或者是运行不了有可能是因为版本问题。 一、加载对应的R包 这里用到十三个包(距离上次更新之后又新增了不少方法/包): lib…

病理基因突变综述

颜锐, 梁智勇, 李锦涛, 任菲. 基于深度学习和H&E染色病理图像的肿瘤相关指标预测研究综述[J]. 计算机科学, 2022, 49(2): 69-82. YAN Rui, LIANG Zhi-yong, LI Jin-tao, REN Fei. Predicting Tumor-related Indicators Based on Deep Learning and H&E Stained Patholo…

maftools|TCGA肿瘤突变数据的汇总,分析和可视化

之前介绍了使用maftools | 从头开始绘制发表级oncoplot(瀑布图) R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”,以及一些细节的更改和注释。 本文继续介绍maftools对于MAF文件的其他应用,为…

生信-记一次NCBI-R语言-淋巴癌突变与未突变基因的差异分析

关键词:基因芯片、R、筛选、预处理、差异分析 NCBI-淋巴癌突变与未突变基因的差异分析 PS:好久没分享生信了,这是一年前做的一次生信task(准确来说是2018年11月了),这里分享一下给大家,有助于一…

TCGA 亚型突变负荷代码

#1、准备文件/数据并加载相应的包 #1.1下载并加载相应的包,有就直接加载,没有就下载后再加载。 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::install("TCGAbiolinks") library(t…

四、肿瘤全基因组学体细胞点突变特征(The repertoire of mutational signatures in human cancer)

全文链接 一、肿瘤突变特征:碱基置换及插入、缺失突变 单碱基置换(49种特征类型,single-base-substitution,SBS) 双碱基置换(11种特征类型,doublet-base-substitution,DBS&#xf…

TCGA_联合GTEx分析2_查看批次效应

在 TCGA_联合GTEx分析1_得到表达矩阵.tpm_老实人谢耳朵的博客-CSDN博客 中,获取了TCGA和GTEx中样本的表达矩阵数据,数据格式均为tpm。本文对二者进行合并后,通过PCA分析、绘制内参箱线图等方法,查看是否存在批次效应。 关于批次效…

提取TCGA 中体细胞突变数据的表达矩阵

#因为之前的命令调用GDCquery_Maf 发现用不了 #故找到了一些其他的方法,并且自己试着将其弄成了一个表达矩阵。 #代码如下 #1、下载加载相应的包 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::insta…

chatgpt赋能python:Python抢票的绝招

Python 抢票的绝招 随着互联网技术的不断发展,越来越多的人开始享受网购的便利。但是,随着一些热门事件的到来,如演唱会、体育比赛等,大家面临同一个问题:如何抢到热门事件的门票?这时,Python …

CSDN问答

近期AI成为热点话题, ChatGPT, GPT4, new bing, Bard,AI 绘画, AI 编程工具引发大量讨论。请结合自身学习经历,一起来聊聊你对 AI 技术以及其今后发展的看法吧。请在下面的问题中选择一些来回答…

起名源码PHP(宝宝取名源码)

起名源码有助于更好的借助八字风水来帮助起名的需求,其参考了一部中国古代经典文本易经。以这种方式咨询的过程包括通过随机生成的方法确定卦,然后阅读与该卦相关的文本。      演示:m.appwin.top      部分源码:texts.py…

携程英语口语测验题目

携程入职前会有两个测验:CATA能力测验、英语测验(部分岗位可能没有英语测验) 这两个测验通过,方可进入下面流程,所有这两个测验一定要引起重视; 题型分布 携程英语测验 题型攻略 携程英语测验 总共六部分…

Ubuntu软件安装新选择—星火应用商店(QQ、微信等一网打尽)

Ubuntu软件安装新选择—星火应用商店(QQ、微信等一网打尽) 1. 星火应用商店介绍2. 下载安装星火应用商店3. 使用星火应用商店安装软件4. 使用星火应用商店更新软件5. 日常软件推荐6. 星火应用商店交流群 1. 星火应用商店介绍 官网地址 http://spark-app…

学生信息后台管理系统(GUI)

一、目的 通过制作学生信息后台管理系统熟悉java中JDBC和CUI(图形用户接口)的使用。 二、实验工具 1.Eclipse IDE Version: 2020-12 (4.18.0) 2.mysql 3.Navicat Premium 15(数据库管理工具) 4.WindowBuilder(java图形用户界面插件) 具体下载和使用可以参考以下链接: 下…

数影周报:SpaceX设计图纸被泄露,拍明芯城正式在纳斯达克上市

本周看点:LockBit勒索软件团伙扬言泄露SpaceX设计图纸;亚马逊宣布将停止 Kindle Newsstand 服务;“拍明芯城”正式在纳斯达克上市...... 数据安全那些事 LockBit勒索软件团伙扬言泄露SpaceX设计图纸 近日,勒索软件组织LockBit给埃…

小米汽车设计图纸泄露,官方称非最终文件;微软裁员遣散费高达8亿美元,人均获赔54万元;苹果暂停自研Wi-Fi芯片|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

为什么要使用低代码 – 前端角度的思考

为什么要使用低代码 – 前端角度的思考 文章目录 为什么要使用低代码 – 前端角度的思考当前前端发展现状低代码的热潮已经掀起千层浪UI工程师常常面临一些令人尴尬的场景低代码化解场景思路低代码对于外包型企业或软件研发企业在前端有什么优势呢?这里简单列举三点…

《互联网大厂推荐算法实战》上线啦!

为什么是“上线”而非“出版”? 你没眼花,我也没写错,是“上线”而非“出版”,个中原因,请容我慢慢道来。如果你对八卦不感兴趣,可以直接跳到本文的第2部分,看看我给出的“你需要读这本书”的理…

石塔西的《互联网大厂推荐算法实战》上线啦!

PS:史塔西的文章还是很有质量的,成体系的内容输出更是有质量保障,感兴趣的可以关注下(感觉好像我也得努力下了,数据与广告系列还没有完,也给自己加个油)。 为什么是“上线”而非“出版”&#x…

在中国月收入1万是什么水平?今天这两个热搜很多人都有话说!

上一篇:阿里版 ChatGPT已进入测试!中文聊天截图曝光,达摩院出品 今天一早一个热搜引发网友热议——#在中国月收入1万是个什么样的水平#。 之后,又有一个话题词紧跟其后上了热搜——#很体面但工资不高的工作#。 你觉得多少月薪能满…