Nature Reviews:给医生的菌群分析指南(下)

本文转载自“态昌基因”,己获授权。

Nature Reviews:给医生的菌群分析指南(上),主要从实验阶段介绍了以下7方面,不清楚的请点击链接跳转原文阅读。

1. 样本选择

2. 样本的采集

3. 样本的保存与保护剂

4. DNA提取

5.我到底应该选择多样性测序还是宏基因组测序?

6.测序区域选择

7.测序平台的选择

今天我们开始菌群分析指南(下),从分析实战开始:

1. 多样性分析和宏基因组分析的基本流程
2. 多样性分析

3宏基因组分析

1多样性分析和宏基因组分析的基本流程

下面的图片是针对多样性分析和宏基因组分析的基本流程。

2多样性分析

QIIMEMothurUSEARCH等是分析16S rRNA 多样性比较常用的软件。

我们的分析流程是这样的:

① 质控和过滤

Illumina平台的下机数据根据引物序列和barcode序列拆分,而后进行数据的质控和过滤(针对质量低、片段短、含有模糊碱基的序列)。

软件:USEARCH

② OTU聚类

为了研究样本的物种的组成多样性信息,对所有样本的有效序列,以97%的相似性将序列聚类成为OTUs (Operational Taxonomic Units )。OTU是物种多样性分析中的基本分类单元。在这里需要注意的是,“OTU”的概念与“种”的概念是不同的。OTU是在系统发生学或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,属,种、分组等)设置的同一标志。有些时候,一个OTU可以对应一个种,但有些时候,一个OTU只能对应一个属,或者并不能划分到某个具体的分类单元。

软件:USEARCH

③ OTU物种注释

为了得到每个OTU对应的物种分类信息,采用RDP classifier贝叶斯算法对97%相似水平的OTU代表序列进行分类学分析,并分别在各个分类水平:domain(域),kingdom(界),phylum(门),class(纲),order(目),family(科),genus(属),species(种)统计各样本的群落组成。人类的16S细菌和古菌核糖体数据库一般使用silva数据库。大鼠、小鼠数据使用RDP在线数据库。

软件: Qiime

OTU注释之后,我们会对样本内的物种信息进行分析。最主要的分析内容和所用的软件如下:

④ α-多样性分析

多样性指数计算:mothur、R

稀释曲线:mothur、R

Rank-Abundance曲线:mothur、R

Specaccum物种累积曲线:R

⑤ 物种组成分析

相对丰度图: R

优势物种Heatmap图:R软件vegan包的vegdist和hclust进行距离计算和聚类分析;样本间距离算法:Bray-Curtis,聚类方法:complete;物种间距离算法:spearman,聚类算法:complete。

⑥ β-多样性分析

样本间距离计算: 样本间的物种丰度分布差异程度可通过统计学中的距离进行量化分析,使用统计算法Euclidean,Bray-Curtis,Unweighted_unifrac,weighted_unifrac,计算两两样本间距离,获得距离矩阵,可用于后续进一步的beta多样性分析和可视化统计分析。软件:Qiime计算beta多样性距离矩阵

PCA/PCoA/NMDS分析: Qiime计算beta多样性距离矩阵,R软件vegan软件包作PCoA分析和作图。

⑦ 差异分析

随机森林分析:Qiime(http://qiime.org/scripts/supervised_learning.html?highlight=random%20forest)

ROC曲线:R

Wilcoxon秩和检验分析:R

差异菌群Heatmap分析:R

Shannon多样性指数比较盒状图:R

LEfSe分析:可以去网站http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=lefse_upload上根据分类学组成对样本按照不同的分组条件进行线型判别分析(LDA),找出对样本划分产生显著性差异影响的群落或物种。

ANOSIM相似性分析:R软件vegan包或QIIME

Adonis多因素方差分析:R软件vegan包或QIIME

⑧ 关联分析

RDA/CCA分析:R软件vegan包中rda或者cca分析和作图。

OTU共表达网络分析:Cytoscape或R

⑨ 16S代谢功能预测

PICRUSt详细预测过程可参考

http://picrust.github.io/picrust/tutorials/algorithm_description.html

啧啧,这些东西对于不懂代码的我一点也不难嘛(MMP),继续往下看宏基因组分析吧

3宏基因组分析

宏基因组不是针对单个目的基因进行分析,而是针对样本中的全部基因组信息进行分析。分析过程中涉及到序列的组装问题。

① 基因的组装

组装时,使用基于De-Brujin graph原理的拼接软件SOAPdenovo(http://soap.genomics.org.cn/,Version 1.06)对优化序列进行拼接组装,根据kmer间的重叠(overlap)关系,构建De-Brujin graphs,获得contigs;把reads mapping到contig上,根据成对reads之间的双端(pair-end)关系把contigs构建成scaffolds。拼接主要参数k-mer值设范围为39-47。在scaffolds内部gap处,将scaffolds打断成新的contigs,并对大于等于500bp的contigs进行统计,从中选择最优组装结果。

② 基因预测和功能分析

基因组装之后,可以使用MetaGene (http://metagene.cb.k.u-tokyo.ac.jp/)对拼接结果中的contig进行ORF预测。选择核酸长度大于等于100bp的基因,并将其翻译为氨基酸序列。

③ 基因序列聚类

来自相同环境的样品之间有很多微生物(或基因)是共有的,不同基因的丰度在样本之间的变化可以反映样本之间的共性和差异。因此可以通过构建一个非冗余基因集(non-redundant gene catalog),来描述该类环境所有基因的整体信息。将所有样品预测出来的基因序列,用CD-HIT软件(http://www.bioinformatics.org/cd-hit/)进行聚类(参数为:95% identity、90% coverage),每个类取最长的基因作为代表序列,构建非冗余基因集。

④ 基因丰度计算

使用SOAPaligner 软件(http://soap.genomics.org.cn/),分别将每个样品的高质量reads与非冗余基因集进行比对(95% identity),统计基因在对应样品中的丰度信息。

⑤ 物种与功能注释

1) 物种分类学注释

使用BLASTP(BLAST Version 2.2.28+,http://blast.ncbi.nlm.nih.gov/Blast.cgi)将基因集与NR数据库进行比对(BLAST比对参数设置期望值e-value为1e-5),并通过NR库对应的分类学信息数据库获得物种注释,然后使用物种对应的基因丰度总和计算该物种的丰度,并在Domain(域)、Kingdom(界)、Phylum(门)、Class(纲)、Order(目)、Family(科)、Genus(属)、Species(种)各个分类学水平上统计物种在各个样品中的丰度,从而构建相应分类学水平上的丰度谱(abundance profile)。

2) COG功能注释

使用BLASTP(BLAST Version 2.2.28+,http://blast.ncbi.nlm.nih.gov/Blast.cgi)将基因集序列与eggNOG数据库进行比对(BLAST比对参数设置期望值e-value为1e-5),获得基因对应的COG (Clusters of orthologous groups of proteins,直系同源序列聚类),然后使用COG对应的基因丰度总和计算该COG的丰度。

3) KEGG功能注释

运用BLAST(BLAST Version 2.2.28+,http://blast.ncbi.nlm.nih.gov/Blast.cgi)将基因集序列与KEGG的基因数据库(GENES)进行比对,BLAST比对参数设置期望值e-value为1e-5。根据比对结果使用KOBAS 2.0(KEGG Orthology Based Annotation System,http://kobas.cbi.pku.edu.cn/home.do)进行功能注释。使用KO、Pathway、EC、Module对应的基因丰度总和计算该功能类别的丰度。

4) 碳水化合物活性酶注释

使用CAZy数据库的对应工具hmmscan(http://hmmer.janelia.org/search/hmmscan)将基因集与CAZy数据库(CAZy,http://www.cazy.org/)进行比对,比对参数设置期望值e-value为1e-5,获得基因对应的碳水化合物活性酶注释信息,然后使用碳水化合物活性酶对应的基因丰度总和计算该碳水化合物活性酶的丰度。

5) 抗生素抗性基因注释

运用BLAST(BLAST Version 2.2.28+,http://blast.ncbi.nlm.nih.gov/Blast.cgi)将基因集与ARDB数据库(ARDB,http://ardb.cbcb.umd.edu/)进行比对,比对参数设置期望值e-value为1e-5,获得基因对应的抗生素抗性功能注释信息,然后使用抗生素抗性功能对应的基因丰度总和计算该抗生素抗性功能的丰度。

其它的像是物种与功能组成分析、物种与功能差异分析、样本间比较分析等所用的方法与软件与多样性类似。

猜你喜欢

10000+:肠道细菌 人体上的生命 宝宝与猫狗 梅毒狂想曲 提DNA发Nature 实验分析谁对结果影响大  Cell微生物专刊

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:生信宝典 学术图表 高分文章 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板 Shell  R Perl

生物科普  生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外150+ PI,1300+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56789.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于儿童急性感染性腹泻

腹泻是一种常见的症状,可导致儿童生长发育迟滞和营养不良。根据世界卫生组织(WHO)发布的数据显示,急性腹泻在5岁以下儿童死亡原因中排第二位,仅次于肺炎。引起儿童腹泻的原因包括感染和非感染因素,后者主要…

MPO抗体对丨CalBioreagents 中英文说明书

艾美捷CalBioreagents MPO抗体对英文参数说明: CATALOG NUMBER: M684 PRODUCT DESCRIPTION: Mouse Monoclonal anti-human Insulin IMMUNOGEN: Purified human MPO IMMUNOGLOBULIN ISOTYPE: IgG1 PURIFICATION: Purified by DEAE chromatography. BUFFER: Sup…

PICRUSt2菌群功能预测分析

生科云网址:https://www.bioincloud.tech 01 课程简介 PICRUSt2的原理是基于已测微生物基因组的序列,推断它们的共同祖先的基因功能谱,对数据库中其它未测物种(基因组未知)的基因功能谱进行推断,构建微生物…

病毒组学数据分析 -03 CheckV病毒序列识别

CheckV 是一个完全自动化的命令行管道,用于评估单重叠群病毒基因组的质量,包括识别集成原病毒的宿主污染、估计基因组片段的完整性以及识别封闭基因组。 管道可以分为4个主要步骤:A:去除原噬菌体上的宿主污染 根据与自定义 HMM 数…

新冠病毒分型和突变分析(SARS-CoV2_ARTIC_Illumina)

SARS-CoV2_ARTIC_Illumina新冠病毒分型和突变分析 一. 本文适用于使用Artic扩增子扩增,Illumina双端测序,用于分析新冠病毒突变及分型鉴定 二. 概览:按照惯例,先上一张概览图 流程输入SRR22216743_1.fastq.gz SRR22216743_2.fas…

还真不错,今天 Chatgpt 教会我如何开发一款小工具开发(Python 代码实现)

上次使用 Chatgpt 写爬虫,虽然写出来的代码很多需要修改后才能运行,但Chatgpt提供的思路和框架都是没问题。 这次让 Chatgpt 写一写GUI程序,也就是你常看到的桌面图形程序。 由于第一次测试,就来个简单点的,用Python…

Android中文图混排时文图的居中对齐

http://www.jianshu.com/p/2650357f7547 先上效果图 看订阅号时间发现的,前一阵子项目要做一个比较复杂的图文混排,但是最后没有做,今天看到,回过头来学习下 代码还是他们的代码,我就不复制了 下来说一下这种形式…

赢在微点答案专区英语_掌握这一招!快速提高英语阅读理解成绩(终生受益)...

一、经常有学生向老师倒苦水,说学英语花了很多时候,总是提不高英语成绩?为什么? 你是否还在为英语阅读成绩而烦恼呢? 你的阅读成绩是否还总是提不高呢? 你的阅读速度是不是还很慢呢? 你阅读的准…

Android中文图混排时文图的居中对齐 FontMetrics以及自定义ImageSpan实现

文章转自:http://www.sohu.com/a/150059234_611601 本文作者CnPeng的博客地址: http://www.jianshu.com/p/2650357f7547 这个标题有点长,乍一看这么个标题你可能没明白啥意思,且听我慢慢道来。 公司的项目中新增了一个“心动”…

实战 | Android中文图混排时文图的居中对齐 FontMetrics以及自定义ImageSpan实现

这个标题有点长,乍一看这么个标题你可能没明白啥意思,且听我慢慢道来。 公司的项目中新增了一个“心动” 的功能,用户初次使用时需要给一个引导页,就是下面图中的这个样子(这就是做完之后的效果了)。 在上图…

英文期刊论文翻译格式要求和文献要求

英文期刊论文翻译格式要求和文献要求 一、全文翻译,句式尽量简单易懂(借助谷歌有道,同时借鉴前人文献写法)1、论文的翻译不能直译。 二、套入模板,调整格式(文章、参考文献)1、论文直接粘贴到模…

时文直播:2015年通信运营业统计公报

2015年,我国通信运营业认真贯彻落实中央各项政策措施,围绕实施网络强国战略,推动网络提速降费,提升4G网络和宽带基础设施水平,积极推动移动互联网、IPTV等新型信息服务普及,全面服务国民经济和社会发展&…

FontMetrics以及自定义ImageSpan实现TextView中文图混排时文图的居中对齐

这个标题有点长,乍一看这么个标题你可能没明白啥意思,且听我慢慢道来。 公司的项目中新增了一个“心动” 的功能,用户初次使用时需要给一个引导页,就是下面图中的这个样子(这就是做完之后的效果了)。 Paste_Image.png 在上图中整体…

单词测试通关学英语的软件,推荐5款最火的英语学习类app

学习英语很累很吃力吗?小编推荐5款最火的英语学习类app,希望对你有所帮助。 如果你是高中生的话,蝶变高中是你必备的app,里面除了正常的励志电台和各科知识点外,还有历年的高考英语听力真题、高中英语课文音频、以及很多英语美文的音频。 1、推荐5款最火的英语学习类app:…

计算机专业英语邱仲潘版英语翻译,计算机英语邱仲潘

本书共分为20章,每章由正文、难句解释、关键词、练习和课外阅读等部分组成,此外,每章还提供了参考译文。本书由一线教师编写,其了解学生的知识水平、接受能力和需求点,而且翻译过大量计算机图书,有丰富的翻…

新编计算机英语,新编计算机英语

《新编计算机英语》以计算机和IT领域的*英语时文和经典原版教材为基础,通过精心挑选难度适中的新闻记者材料和悉心编写的学习指南,配以详尽的注释和练习,使读者能够快速掌握计算机英语的一般特点和大量专业词汇,并提高阅读和检索计…

快讯 | OpenAI 推出漏洞赏金计划,奖励最高 2 万美元;马斯克被曝明面上呼吁暂停 AI 研究,暗中却购买上万个 GPU 推进 AIGC 项目

一分钟速览新闻点 复旦大学与阿里云共建中国高校最大的科研智算平台 科大讯飞将于 5 月 6 日发布讯飞预训练大模型的详细信息 国家网信办就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见 毫末智行正式发布自动驾驶生成式大模型DriveGPT O…

OpenAI向ChatGPT社区致歉:承认数据泄露 CEO称感觉糟糕

雷递网 乐天 3月26日 人工智能企业OpenAI日前发布公告,承认部分ChatGPT Plus服务订阅用户可能泄露部分个人隐私和支付信息。 OpenAI称,由于开源库中的一个错误,本周早些时候将ChatGPT下线,该错误允许一些用户看到另一个活跃用户的…

如何用 Midjourney 绘制你自己的皮克斯风格头像?

元宇宙时代,有个卡通形式的头像(Avatar)似乎是刚需了。我看到很多小伙伴都给自己弄了一个头像。大多保持了神似,很是羡慕。 我也想自己弄一个,不过雇人设计绘制太贵,自己画嘛,你知道的…… 我的…

联邦学习(FL)安全威胁

MPC、DP等:通过降低模型性能或系统效率为代价来确保隐私安全 一、FL安全问题 训练过程中,联邦学习仍然存在模型更新过程中向第三方或中央服务器透露敏感信息的情况FL协议设计存在漏洞,任一参与方可能获得全局参数并能控制这些参数的上传模型…