突变检测数据分析专题

欢迎关注”生信修炼手册”!

随着NGS测序技术的发展,以WES, WGS, 靶向捕获测序为主的高通量数据分析广泛应用,本文整理了以SNP位点为主的突变检测数据分析资料。

首先是snp calling, 就不得不提gatk及其配套的最佳实践

  • 外显子测序简介

  • GATK4基本概念整理

  • GATK官方推荐的workflow语言-WDL

  • GATK4最佳实践-数据预处理篇

  • bwa 软件用法简介

  • MarkDuplicates 的意义与作用

  • GATK BQSR的意义与作用

  • GATK4 最佳实践-生殖细胞突变的检测与识别

  • GATK4最佳实践-体细胞突变的检测与识别

  • VCF格式介绍

除了gatk之外,也有一些其他的工具可以进行snp  calling

  • freebayes进行SNP calling

  • bcftools进行SNP calling

  • Varscan检测de novo mutation

得到SNP信息之后,我们需要对SNP进行注释,这时就需要对应的软件和数据库,首先是数据库

  • dbSNP数据库简介

  • HGVS制订的变异位点命名规则

  • HapMap-人类基因组单倍型图谱

  • 1000 Genome Project

  • gnomAD 数据库简介

  • ESP数据库简介

  • OMIM数据库简介

  • clinvar数据库简介

  • HGMD数据库简介

  • COSMIC数据库简介

  • CADD数据库简介

  • SIFT score 预测基因突变对蛋白质功能的影响

  • PolyPhen:分析人类非同义突变对蛋白质的影响

  • DANN:利用神经网络算法评估变异位点的有害程度

  • 通过Eigen score衡量变异位点的功能重要性

其次是软件

    

  • ANNOVAR变异位点注释软件

  • ANNOVAR gene-based annotation

  • ANNOVAR region-based annotation-上篇

  • ANNOVAR region-based annotation-下篇

  • ANNOVAR Filter-based Annotation

  • snpEff : 突变位点注释的又一利器

  • 使用SnpSift filter对VCF文件进行筛选

  • SnpSift学习笔记(一)

  • SnpSift学习笔记(二)

  • SnpSift学习笔记(三)

  • tabix操作VCF文件

  • bcftools安装简介

  • bcftools学习笔记(一)

  • bcftools学习笔记(二)

  • bcftools csq分析基因突变对蛋白水平的影响

突变检测的基本内容就是snp calling加SNP位点的注释,注释的软件不多,但是数据库是非常多的,理解每个数据库的注释是突变检测的核心。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

  • 自己动手进行逻辑回归,你也可以!

  • GWAS大家都知道,Gene-Based GWAS你了解吗?

  • 3步搞定GWAS中的Gene Set Analysis

  • 你听说过Epistasis吗?

  • GWAS中的Gene-Gene Interactions如何分析?看这里

  • 终于搞清楚了Lasso回归和Ridge回归的区别

  • odd ratio置信区间的计算,你学会了吗?

  • 多元回归分析存在多重共线性了怎么办?

  • 基因型与表型的交互作用如何分析,多元回归来搞定

  • 曼哈顿图就够了吗?你还需要LocusZoom

  • GWAS做完了,下一步做什么?

  GWAS meta分析

  • GWAS样本量不够怎么办,meta分析了解一下

  • 你没看错,搞定GWAS meta分析只需一行代码!

  • meta分析的森林图不会画?看这里

  • GWAMA:GWAS meta-analysis的又一利器

  • 点击鼠标即可完成GWAS meta分析,任何人都可以!

  • 用R进行gwas meta分析,原来如此简单

  基因型填充

  • GWAS中的genotype imputation简介

  • 基因型填充中的phasing究竟是什么

  • 基因型填充前的质控条件简介

  • 使用shapeit进行单倍型分析

  • gtool:操作genotype data的利器

  • 使用IMPUTE2进行基因型填充

  • 使用Beagle进行基因型填充

  • 使用Minimac进行基因型填充

  • 使用Eagle2进行单倍型分析

  • X染色体的基因型填充

  • 文献解读|不同基因型填充软件性能的比较

  • Haplotype Reference Consortium:最大规模的单倍型数据库

  • Michigan Imputation Server:基因型填充的在线工具

  CNV分析

  • aCGH芯片简介

  • aCGH芯片分析简介

  • 基于SNP芯片进行CNV分析中的基本知识点

  • PennCNV:利用SNP芯片检测CNV

  • DGV:人类基因组结构变异数据库

  • dbvar:染色体结构变异数据库

  • DGVa:染色体结构变异数据库

  • CNVD:疾病相关的CNV数据库

  • DECIPHER:疾病相关的CNV数据库

  • 全基因组数据CNV分析简介

  • 使用CNVnator进行CNV检测

  • 使用lumpy进行CNV检测

  • CNVnator原理简介

  • WES的CNV分析简介

  • XHMM分析原理简介

  • 使用conifer进行WES的CNV分析

  • 使用EXCAVATOR2检测WES的CNV

  • 靶向测序的CNV分析简介

  • 使用CNVkit进行CNV分析

  • DECoN:最高分辨率的CNV检测工具

  TCGA

  • TCGA数据库简介

  • 使用GDC在线查看TCGA数据

  • 使用gdc-client批量下载TCGA数据

  • 一文搞懂TCGA中的分析结果如何来

  • 通过GDC Legacy Archive下载TCGA原始数据

  • 使用GDC API查看和下载TCGA的数据

  • 使用GDC下载TCGA肿瘤患者的临床信息

  • 使用TCGAbiolinks下载TCGA的数据

  • 使用TCGAbiolinks进行生存分析

  • 使用TCGAbiolinks分析TCGA中的表达谱数据

  • 使用TCGAbiolinks进行甲基化和转录组数据的联合分析

  • Broad GDAC:TCGA数据分析中心

  • 使用cBioPortal查看TCGA肿瘤数据

  • UCSC  Xena:癌症基因组学数据分析平台

  • GEPIA:TCGA和GTEx表达谱数据分析平台

  • TANRIC:肿瘤相关lncRNA数据库

  • SurvNet:基于网络的肿瘤biomarker基因查找算法

  • TCPA:肿瘤RPPA蛋白芯片数据中心

  • TCGA Copy Number Portal:肿瘤拷贝数变异数据中心

  生存分析

  • 生存分析详细解读

  • 用R语言进行KM生存分析

  • 使用OncoLnc进行TCGA生存分析

  • 用R语言进行Cox回归生存分析

  • 使用kmplot在线进行生存分析

  肿瘤数据库

  • ICGC:国际肿瘤基因组协会简介

  • HPA:人类蛋白图谱数据库

  • Oncomine:肿瘤芯片数据库

  • ONGene:基于文献检索的肿瘤基因数据库

  • oncomirdb:肿瘤相关的miRNA数据库

  • TSGene:肿瘤抑癌基因数据库

  • NCG:肿瘤驱动基因数据库

  • mutagene:肿瘤突变频谱数据库

  • CCLE:肿瘤细胞系百科全书

  • mSignatureDB:肿瘤突变特征数据库

  • GTEx:基因型和基因表达量关联数据库

  肿瘤免疫和新抗原

  • Cancer-Immunity Cycle:肿瘤免疫循环简介

  • TMB:肿瘤突变负荷简介

  • 肿瘤微环境:Tumor microenvironment (TME)简介

  • 肿瘤浸润免疫细胞量化分析简介

  • 使用EPIC预测肿瘤微环境中免疫细胞构成

  • TIMER:肿瘤浸润免疫细胞分析的综合网站

  • quanTIseq:肿瘤浸润免疫细胞定量分析

  • The Cancer Immunome Atlas:肿瘤免疫图谱数据库

  • 肿瘤新抗原简介

  • TSNAdb:肿瘤新抗原数据库

  • 使用NetMHCpan进行肿瘤新抗原预测分析

  Hi-C数据分析

  • chromosome-territories:染色质疆域简介

  • chromosome conformation capture:染色质构象捕获技术

  • 3C的衍生技术简介

  • 解密Hi-C数据分析中的分辨率

  • A/B compartment:染色质区室简介

  • TAD:拓扑关联结构域简介

  • chromatin loops:染色质环简介

  • Promoter Capture Hi-C:研究启动子区染色质互作的利器

  • 使用HiCUP进行Hi-C数据预处理

  • Juicer:Hi-C数据处理分析的利器

  • Juicer软件的安装详解

  • Juicebox:Hi-C数据可视化利器

  • Juicer实战详解

  • HiC-Pro:灵活的Hi-C数据处理软件

  • HiC-Pro实战详解

  • 3D Genome Browser:Hi-C数据可视化工具

  • HiCPlotter:Hi-C数据可视化工具

  • 3CDB:基于3C技术的染色质互作信息数据库

  • 3DIV:染色质空间互作数据库

  • 4DGenome:染色质相互作用数据库

  • 4D nucleome project:染色质三维结构研究必不可少的参考项目

  • 3dsnp:SNP在染色质环介导的调控网络中的分布数据库

  • iRegNet3D:疾病相关SNP位点在三维调控网络中的作用

  • 使用WashU Epigenome Browser可视化hi-c数据

  • HiGlass:高度定制的Hi-C数据可视化应用

  • Hi-C Data Browser:Hi-C数据浏览器

  • 使用FitHiC评估染色质交互作用的显著性

  • 使用TADbit识别拓扑关联结构域

  • 使用pyGenomeTracks可视化hi-c数据

  • hi-c辅助基因组组装简介

  • 文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装

  chip_seq数据分析

  • Chip-seq简介

  • chip_seq质量评估之计算样本间的相关性

  • chip_seq质量评估之查看抗体富集效果

  • chip_seq质量评估之PCA分析

  • chip_seq质量评估之coverage分析

  • chip_seq质量评估之FRiP Score

  • chip_seq质量评估之cross correlation

  • chip_seq质量评估之文库复杂度

  • depth, bedgraph, bigwig之间的联系与区别

  • bigwig归一化方式详解

  • 使用igvtools可视化测序深度分布

  • 使用UCSC基因组浏览器可视化测序深度分布数据

  • 使用deeptools查看reads分布特征

  • 使用phantompeakqualtools进行cross correlation分析

  • blacklist regions:NGS测序数据中的黑名单

  • MACS:使用最广泛的peak calling软件之一

  • MACS2 peak calling实战

  • 使用SICER进行peak calling

  • 使用HOMER进行peak calling

  • peak注释信息揭秘

  • PAVIS:对peak区域进行基因注释的在线工具

  • 使用UPORA对peak进行注释

  • 使用GREAT对peak进行功能注释

  • annoPeakR:一个peak注释的在线工具

  • 使用ChIPpeakAnno进行peak注释

  • 使用ChIPseeker进行peak注释

  • 使用PeakAnalyzer进行peak注释

  • 使用homer进行peak注释

  • 利用bedtools预测chip_seq数据的靶基因

  motif

  • 关于motif你需要知道的事

  • 详解motif的PFM矩阵

  • 详解motif的PWM矩阵

  • 使用WebLogo可视化motif

  • 使用seqLogo可视化motif

  • 使用ggseqlogo可视化motif

  • MEME:motif分析的综合性工具

  • 使用MEME挖掘序列中的de novo motif

  • 使用DREME挖掘序列中的de novo motif

  • 使用MEME-ChIP挖掘序列中的de novo motif

  chip_seq数据库

  • ENCODE project项目简介

  • FactorBook:人和小鼠转录因子chip_seq数据库

  • ReMap:人类Chip-seq数据大全

  • IHEC:国际人类表观基因组学联盟

  • Epifactors:表观因子数据库

  • GTRD:最全面的人和小鼠转录因子chip_seq数据库

  • ChIP-Atlas:基于公共chip_seq数据进行分析挖掘

  • Cistrome DB:人和小鼠的chip_seq数据库

  • chipBase:转录因子调控网络数据

  • unibind:human转录因子结合位点数据库

  • chip_seq在增强子研究中的应用

  • DENdb:human增强子数据库

  • VISTA:人和小鼠的增强子数据库

  • EnhancerAtlas:人和小鼠的增强子数据库

  • FANTOM5:人类增强子数据库

  • TiED:人类组织特异性增强子数据库

  • HEDD:增强子疾病相关数据库

  • HACER:human增强子数据库

  • SEdb:超级增强子数据库简介

  • dbSUPER:人和小鼠中的超级增强子数据库

  • dbCoRC:核心转录因子数据库

  • 使用ROSE鉴定超级增强子

  18年文章目录

  • 2018年推文合集

扫描下方二维码,关注我们,解锁更多精彩内容!

生物信息入门

只差这一个

公众号

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32783.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新冠病毒分型和突变分析(SARS-CoV2_ARTIC_Nanopore)

新冠病毒分型和突变分析(SARS-CoV2_ARTIC_Nanopore) 一. 本文使用Artic官方提供环境对Nanopore minion SARS-Cov-2测序数据,对新冠病毒突变及分型鉴定 二. 概览:按照惯例,先上一张概览图,浏览下分析流程步…

新版TCGA的甲基化数据分析

文章目录 加载数据甲基化差异分析甲基化可视化甲基化旭日图 TCGAbiolinks可以进行甲基化分析,但是功能不如 ChAMP强大,甲基化分析还是首推 ChAMP包。 不过为了了解TCGAbiolinks包,里面关于甲基化分析的部分还是要学习一下。 主要是甲基化差…

转录组-差异基因热图

top_de_exp<-dplyr::slice(de_result2,1:20)%>%#挑取差异最大的select(-c(2:8))%>%#去掉2-8列column_to_rownames(var"id")#列变行 de_result2为上一篇转录组-火山图得到的数据&#xff01; #第一种做图方式 library(pheatmap) pheatmap(log10(top_de_ex…

【bioinfo】二代测序在肿瘤突变检测中的错误来源和解决策略

文章目录 文献摘要NGS工作流程中的错误来源1&#xff09;FFPE样本&#xff1a;2&#xff09;DNA打断&#xff1a;3&#xff09;PCR扩增和聚合酶保真度&#xff1a;4&#xff09;测序平台&#xff1a;5&#xff09;数据分析&#xff1a; NGS工作流错误解决策略使用UID不使用UID …

Cell | 深度突变学习预测SARS-CoV-2受体结合域组合突变对ACE2结合和抗体逃逸的影响...

本文介绍一篇来自于苏黎世联邦理工学院的Joseph M. Taft在Cell上发表的工作——《Deep Mutational Learning Predicts ACE2 Binding and Antibody Escape to Combinatorial Mutations in the SARS-CoV-2 Receptor Binding Domain》。 SARS-CoV-2的持续变异以及对疫苗和中和抗体…

DNA 8. 癌症的突变异质性及寻找新的癌症驱动基因(MutSigCV)

点击关注&#xff0c;桓峰基因 桓峰基因 生物信息分析&#xff0c;SCI文章撰写及生物信息基础知识学习&#xff1a;R语言学习&#xff0c;perl基础编程&#xff0c;linux系统命令&#xff0c;Python遇见更好的你 120篇原创内容 公众号 桓峰基因公众号推出基于基因组变异数…

生物(一)ctDNA突变检测应用于肿瘤早期筛查

原创&#xff1a;yongzhe 提到cfDNA应用于肿瘤早期筛查&#xff0c;是一个充满希望和挑战的问题。目前的热门方向是甲基化&#xff0c;相当多一部分公司以此为研发方向&#xff0c;还包括ctDNA突变检测&#xff0c;cnv检测&#xff0c;CTC&#xff0c;外泌体检测等都在探索研究…

利用GATK4.1 mutect2寻找体细胞突变(SNV和INDEL)

今天梳理一下最最最最(最X100)常用的mutect2体细胞变异分析流程。主要用来分析肿瘤配对样本,寻找体细胞突变比如SNV和INDEL。官网上已经有了详细的英文版教程。 软件版本:GATK4.1.1.0 官网教程:https://gatk.broadinstitute.org/hc/en-us/articles/360035894731-Somatic…

GATK4 最佳实践-生殖细胞突变的检测与识别

欢迎关注"生信修炼手册"&#xff01; GATK4 对于体细胞突变和生殖细胞突变的检测分别给出了对应的pipeline: Germline SNPsIndelsSomatic SNVs Indels 本篇主要关注生殖细胞突变的分析流程Germline SNPsIndels。示意图如下&#xff1a; 图中红色方框部分的从Analysi…

GATK4最佳实践-体细胞突变的检测与识别

欢迎关注"生信修炼手册"&#xff01; 分析体细胞突变时&#xff0c;通常采用tumor_vs_nomal 的实验设计。在检测时&#xff0c;由于同时会检测出生殖细胞突变和体细胞突变&#xff0c;需要做的就是去除生殖细胞突变位点&#xff0c;那么剩下的就是体细胞突变位点了&a…

TCGA差异表达分析|2022.5.1更新

作者&#xff1a;Squirrelity 2022-07-18 补充说明 最近R更新了&#xff0c;很多包都用不了&#xff0c;如果遇到报错或者是运行不了有可能是因为版本问题。 一、加载对应的R包 这里用到十三个包&#xff08;距离上次更新之后又新增了不少方法/包&#xff09;&#xff1a; lib…

病理基因突变综述

颜锐, 梁智勇, 李锦涛, 任菲. 基于深度学习和H&E染色病理图像的肿瘤相关指标预测研究综述[J]. 计算机科学, 2022, 49(2): 69-82. YAN Rui, LIANG Zhi-yong, LI Jin-tao, REN Fei. Predicting Tumor-related Indicators Based on Deep Learning and H&E Stained Patholo…

maftools|TCGA肿瘤突变数据的汇总,分析和可视化

之前介绍了使用maftools | 从头开始绘制发表级oncoplot&#xff08;瀑布图&#xff09; R-maftools包绘制组学突变结果&#xff08;MAF&#xff09;的oncoplot或者叫“瀑布图”&#xff0c;以及一些细节的更改和注释。 本文继续介绍maftools对于MAF文件的其他应用&#xff0c;为…

生信-记一次NCBI-R语言-淋巴癌突变与未突变基因的差异分析

关键词&#xff1a;基因芯片、R、筛选、预处理、差异分析 NCBI-淋巴癌突变与未突变基因的差异分析 PS&#xff1a;好久没分享生信了&#xff0c;这是一年前做的一次生信task&#xff08;准确来说是2018年11月了&#xff09;&#xff0c;这里分享一下给大家&#xff0c;有助于一…

TCGA 亚型突变负荷代码

#1、准备文件/数据并加载相应的包 #1.1下载并加载相应的包&#xff0c;有就直接加载&#xff0c;没有就下载后再加载。 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::install("TCGAbiolinks") library(t…

四、肿瘤全基因组学体细胞点突变特征(The repertoire of mutational signatures in human cancer)

全文链接 一、肿瘤突变特征&#xff1a;碱基置换及插入、缺失突变 单碱基置换&#xff08;49种特征类型&#xff0c;single-base-substitution&#xff0c;SBS&#xff09; 双碱基置换&#xff08;11种特征类型&#xff0c;doublet-base-substitution&#xff0c;DBS&#xf…

TCGA_联合GTEx分析2_查看批次效应

在 TCGA_联合GTEx分析1_得到表达矩阵.tpm_老实人谢耳朵的博客-CSDN博客 中&#xff0c;获取了TCGA和GTEx中样本的表达矩阵数据&#xff0c;数据格式均为tpm。本文对二者进行合并后&#xff0c;通过PCA分析、绘制内参箱线图等方法&#xff0c;查看是否存在批次效应。 关于批次效…

提取TCGA 中体细胞突变数据的表达矩阵

#因为之前的命令调用GDCquery_Maf 发现用不了 #故找到了一些其他的方法&#xff0c;并且自己试着将其弄成了一个表达矩阵。 #代码如下 #1、下载加载相应的包 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::insta…

chatgpt赋能python:Python抢票的绝招

Python 抢票的绝招 随着互联网技术的不断发展&#xff0c;越来越多的人开始享受网购的便利。但是&#xff0c;随着一些热门事件的到来&#xff0c;如演唱会、体育比赛等&#xff0c;大家面临同一个问题&#xff1a;如何抢到热门事件的门票&#xff1f;这时&#xff0c;Python …

CSDN问答

近期AI成为热点话题&#xff0c; ChatGPT&#xff0c; GPT4&#xff0c; new bing&#xff0c; Bard&#xff0c;AI 绘画&#xff0c; AI 编程工具引发大量讨论。请结合自身学习经历&#xff0c;一起来聊聊你对 AI 技术以及其今后发展的看法吧。请在下面的问题中选择一些来回答…