今天梳理一下最最最最(最X100)常用的mutect2体细胞变异分析流程。主要用来分析肿瘤配对样本,寻找体细胞突变比如SNV和INDEL。官网上已经有了详细的英文版教程。
软件版本:GATK4.1.1.0
官网教程:https://gatk.broadinstitute.org/hc/en-us/articles/360035894731-Somatic-short-variant-discovery-SNVs-Indels-
看下分析的流程图,然后我们从bam文件出发分步讲解:
现在假设你已经有了normal.bam和tumor.bam文件,参考文件为reference.fasta,目标区域文件为intervals.interval_list。
1. 构建normal panel
如果你有多个normal.bam做对照,在开始之前,可以利用这些normal bam构建一个normal panel作为第2步原始候选变异检测的输入参数。(这个命令行和GATK3.8相比改动比较大了)
gatk Mutect2 -R reference.fasta -I normal1.bam -max-mnp-distance 0 -O normal1.vcf.gz
gatk Mutect2