二代测序群体进化-GWAS分析及案例解析

群体进化-gwas分析

在这里插入图片描述

群体进化基础分析

PCA

  • 分析原理
    • PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1,2个轴正交的平面中方差最大的。依次类推,可以得到n个这样的坐标轴。通过这种方式获得的新的坐标轴,我们发现,大部分方差都包含在前面k个坐标轴中,后面的坐标轴所含的方差几乎为0。于是,我们可以忽略余下的坐标轴,只保留前面k个含有绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为0的特征维度,实现对数据特征的降维处理。
    • 简洁点来讲现在有这样的数据,100个样品,2M标记,即是2000000X100的矩阵,那么就通过数学降维的方法简化到100X3甚至100X2乘(即PC1,PC2)
  • 分析软件
    • GCTA
    • tassel
  • EIGENSTRAT
  • 结果展示
    • PCA结果矩阵(特征向量)
GWAS_1	0.0295707	0.0174155	-0.0245656
GWAS_10	0.0212291	-0.0552983	-0.0280335
GWAS_100	-0.0645872	0.00456635	0.00588907
GWAS_101	-0.0779853	-0.0317529	0.0138288
GWAS_102	-0.0790227	-0.0295285	0.0147819
GWAS_105	-0.0845384	0.000685319	0.0108059
GWAS_108	-0.0779536	-0.00380985	0.0101755
GWAS_109	-0.0789908	-0.00534946	0.012742
GWAS_11	0.0152839	0.0185823	-0.0305629
GWAS_110	-0.080786	-0.00255263	0.0131448
	*	第一列样品名称,第二列PC1的值,第三列PC2的值,第四列PC3的值(也就是平时看到的结果图的横纵坐标来源)
*	PCA解释数据结果(特征值)
54.402
32.2402
25.6809
18.0063
13.7968
9.6096
9.46086
9.00158
8.16587
7.60115
	*	这个结果每一个值对应的维度的解释情况,行数与样品数量一致,第一行代表第一维,依次类推;每一行除以所有行数的和即是其第几维解释的比例
  • PCA结果图

  • 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 结果要点

    • 结果图中相对分群结果合理,大部分跟生产经验相一致
    • 解释度可接受,这个方面想了解的话,可以看看文献的,不是硬标准

TREE

  • 分析原理

    • 系统发育分析中,最重要和最常见的内容为构建系统发育树。系统发育树也称为系统发生树(phylogenetic tree)、聚类树或者进化树(evolutionary tree)。以树状结构表示各个节点的进化关系,枝点可以是物种、同一物种的样本、基因等单元。
    • 根据SNP或者Indel 构建其系统进化树,可以展示群体中不同个体的相互关系,基因变异相似的往往会在同一个树的cluster中,一颗好的树可以给你一个群体大概的分类(你这个群体中有多少个cluster,一般同一个亚种或者有亲缘关系的个体会形成一个cluster),这是群体遗传中重要的一部分。其构建的核心原理就是把每个位点SNPs的信息提取,然后计算每个变异位点的差异得到算法中的“距离”。
  • 分析软件

    • treebest
    • mega
    • taseel
    • snphylo
    • phylip
  • 算法

    • nj 临近算法
    • ml 最大似然值
  • 结果展示
    在这里插入图片描述
    在这里插入图片描述

  • 结果要点

    • 分群清晰,大部分样品与已知生产经验一致

STructure

  • 分析原理

    • 先预设群体由若干亚群(k=x)构成,通过模拟算法找出在k=x的情况下,最合理的样本分类方法。最后再根据每次模拟的最大似然值,找出最适用这群体的K值。
  • 分析软件

    • STRUCTURE
    • ADMIXTURE
    • FRAPPE
    • fast-STRUCTURE
  • 算法

    • 亚群内符合哈温平衡
      • 那么,软件在如何确定样本的最优分类方法呢?其实基于一个假设:在各个亚群内部个体应该符合哈代-温伯格平衡(哈温平衡的概念可以在百度查询),那么这个亚群内的基因频率分布应该可通过哈温平衡检验。例如,现在有40个个体的1个SNP位点的基因型,我预设亚群数k=2。我先随机将40个个体分成两份,然后检验是否符合哈温平衡。如果不符合,我继续调整分类策略,直到找到一种最优的分类方法:40个个体被分为了两份,每个亚群都由若干个体构成,每个亚群内部都最大程度地符合哈温平衡。
    • 每个位点是独立的
      • 同一个体基因组上的不同SNP可能来源不同亚群体,软件是对每个位点单独进行分群的,然后统计比例,所以要求进行分析的每个位点是独立,不然会造成比例的不准确
    • 每个样本的血统构成
      • 以k=2为例,解释一下structure是如何找到样本的最优分类。其实简单说来,就是利用了计算机超强的运行能力,一开始计算机只是随机将样本分为两份,然后在每个亚群内进行哈温平衡检验。如果不符合哈温平衡(拍脑袋的分类,一开始当然是惨不忍睹),计算机继续调整分类,然后继续检验。
      • 如此这般,在计算n次后,计算机再从这一堆结果中找到最佳的分类。这个过程称为“隐马科夫-蒙特卡罗链”的过程,计算次数n就是这个链的长度,这是structure一个重要的参数“Number of MCMC Reps”,需要预先设定。
      • 但因为这个计算的过程是从随机模拟开始的。如果一开始拍脑袋拍的不好(随机分类与真实分类差距太大),计算机一黑到底,最后把n次用完了,都没有找到一个合理的分类。所以,分析软件往往有个预实验的过程。
      • 就是在正式进行大规模运算前,计算机先尝试各种各样的随机分类,运行非常短的次数,然后评估哪种随机分类是最合理的。之后,在根据最优的随机分类,进行后续的大规模运算。这个过程就称为burn-in period,预实验的次数就称为burin-in的次数。这也是structure分析另外一个重要的参数“length of burn-in period”。
    • 选择使用那种模型
      • 主要涉及两种模型 no admixture model和admixture model。前者假设亚群间不存在杂交,后者则假设亚群间存在杂交。在绝大部分情况下,当然是选择admixture 模型更合理了。
  • 结果展示
    在这里插入图片描述

  • 结果要点

    • 最终k值选取的结果跟实际生产相符性
    • 一般会以该结果的0.8或者0.6以上血缘比例的作为标准(血缘复杂的根据情况有些可以追溯原因)

LD

  • 分析原理

    • 只要两个基因不是完全独立遗传,就会表现出某种程度的连锁,这种情况就叫连锁不平衡。
    • 由于HLA不同基因座某些基因经常连锁在一起遗传,而连锁的基因并非完全的随机的组成单体型,有些基因总是较多的在一起出现,致使某些单体型在群体中呈现较高的频率,从而引起连锁不平衡。
    • 假如位于同一染色体的两个等位基因(AB)同时存在的概率大于人群中因随机分布而同时出现的概率,称这两点处于LD状态。
    • LD的基本单位是D,但是度量观察到的单倍型频率与平衡状态下期望频率的偏差。
    • 虽然D能够很好的表达LD的基本含义,但是由于其严格依赖于等位基因频率(allele frequency),故不适合应用于表述实际的LD强度。
    • 所以一般在LD的度量中最常见的是D’和r2。二者各有各的特点和用途,但都是基于D的。
      • 当D’=0,r2=0时,处于完全连锁平衡状态
      • 当D’=1,r2=1时,处于完全连锁不平衡状态。
      • 其中,从0—1之间的度量越高,LD越高,如果两个位点连锁,连锁程度也越高。
  • 分析软件

    • plink
    • haploview
  • 算法

    • 1、设有两个位点(A、B),等位基因分别是A、a、B、b,在群体中对应频率f(A)、f(a)、f(B)和f(b)
    • 2、两个位点共有四种单倍型AB、Ab、aB、ab,对应频率f(AB)、f(Ab)、f(aB)和f(ab)
    • 3、计算:Dab=f(AB)-f(A)*f(B)
      • 当Dab=0时,处于连锁平衡状态;
      • 当Dab≠0时,处于连锁不平衡状态。
    • LD度量:
      • 当Dab>0,|D’|=(Dab)2/min(f(AB), f(ab));
      • 当Dab<0,|D’|=(Dab)2/min(f(Ab), f(aB));
      • r2=(Dab)2/(f(A)*f(a)*f(B)*f(b));
  • 结果展示
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 结果要点

    • 一般如果是GWAS项目,没有明显的分群的话,会做这个作为一个平均连锁距离的依据(文章中大多采用两种策略:1.LD的R2降到最高点的一半时的距离作为平均连锁距离;2.LD的R2降到0.2时的距离作为平均连锁距离)
    • 如果是群体进化项目,会有非常明确的群体划分,各自群体分别进行LD分析,能够从一定程度上讨论进化快慢等信息
    • 倒三角的具体区段的连锁图一般结合具体的GWAS等的位点一块展示,这个是不可能全基因组绘制的

GWAS

  • 分析原理
    • 基本思想:应用于复杂性状,采用CASE-CONTROL试验设计,比较全基因组范围内所有SNP位点的等位基因或者基因型频率在case与control组中的差异,如果某个snp位点等位基因或者等位基因型case组中的频率明显高于或者低于caontrol组,则认为该位点与该疾病间存在关联
  • 分析软件
    • MVP
    • GEmma
    • plink
    • taseel
    • GAPIT
    • FarmCpu
  • 算法
    • LM
    • MLM
    • FarmCpu
  • 方案设计要点
    • 群体大小 >300
    • 群体分层不明显(具有一致的遗传背景或者资源的群体)
    • 覆盖全基因组的高密度的标记(至少保证平均一个block内有一个标记,中玉金标记公司内现有芯片只有660k符合)
    • 表型数据记录准确性
    • 植物数据尽量是多年多点的数据
    • 表型分布比较广泛(大体成正太分布)
  • 分析流程

#[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qhoNTAgd-1583331001025)(/Volumes/18401702983/生信内部产品信息资料/imge/pip.png)]

  • 结果展示
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 结果要点

群体进化高级分析-群体选择消除分析

pi

  • 分析原理

    • π用来分析碱基多态性,多态性越低,受选择程度越高。
  • 分析软件

    • vcftools
  • 算法

  • 结果展示

  • 结果要点

fst

  • 分析原理
    • 群体的固定系数F反映了群体等位基因杂合性水平。固定系数F是F统计量(Fst)的一个特例。Fst分析表示群体的分化程度,值越大,群体分化程度越高,受选择程度越高。
  • 分析软件
    • vcftools
  • 算法
  • 结果展示

在这里插入图片描述

  • 结果要点

XP-LXR

  • 分析原理
  • 分析软件
  • 算法
  • 结果展示
  • 结果要点

D

w

ROH

群体进化高级分析-种群动态等

PSMC

  • 分析原理

  • 分析软件

  • 算法

  • 结果展示
    在这里插入图片描述

  • 结果要点

Treemix

  • 分析原理

  • 分析软件

  • 算法

  • 结果展示
    在这里插入图片描述

  • 结果要点

案例解读

群体进化

案例一:NG-熊猫群体进化-2012

  • 文章:Whole-genome sequencing of giant pandas provides insights into demographic history and local adaptation

  • 基础数据:34只熊猫,4.7x覆盖深度

  • 分析结果:

    • 群体结构分析
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0wlvyp0X-1583331001032)(/Volumes/18401702983/生信内部产品信息资料/imge/2012-xiongmao-ng-1.png)]

    • 种群历史动态分析
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HerR1D39-1583331001032)(/Volumes/18401702983/生信内部产品信息资料/imge/2012-xiongmao-ng-2.png)]

    • 选择消除分析结果注释情况
      • 该项目使用fst进行选择消除分析,分析后受选择的基因进行KEGG富集分析
        在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CrXqx3d4-1583331001033)(/Volumes/18401702983/生信内部产品信息资料/imge/2012-xiongmao-ng-3.png)]

案例二:NC-牦牛群体进化-2015

  • 文章:Yak whole-genome resequencing reveals domestication signatures and prehistoric population expansions

  • 基础数据:13野生牦牛和59驯化品种,6.7X测序深度,14.56M高质量SNP

  • 分析结果

    • 群体结构分析
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X1SbpJn0-1583331001033)(/Volumes/18401702983/生信内部产品信息资料/imge/2015-maoniu-nc-1.png)]

    • 选择消除分析
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Rw2sJfu2-1583331001034)(/Volumes/18401702983/生信内部产品信息资料/imge/2015-maoniu-nc-2.png)]

    • 种群历史动态分析 && 统计分析
      *
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T2gK0GqD-1583331001034)(/Volumes/18401702983/生信内部产品信息资料/imge/2015-maoniu-nc-3.png)]

gwas

案例一:NG-韩斌2010年经典水稻14农艺性状GWAS文章

  • 文章:Genome-wide association studies of 14 agronomic traits in rice landraces
  • 基础数据:517水稻样品,3.6M SNP,水稻indica,japonica
  • 看下文章的作者
    在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zn6cKqYU-1583331001034)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-1.png)]

  • 分析结果

    • tree && LD && maf
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oV3ItDv9-1583331001035)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-2.png)]

    • tree && PCA
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Zl00QZj3-1583331001035)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-3.png)]

    • imputation 准确性评估(2010年测序成本还很高,所以进行的地深度测序,进行缺失推断)
      • 这里评估了LD,测序错误,测序覆盖情况,样品数量对推断结果的影响
        在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4twAEqXc-1583331001036)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-4.png)]

    • GWAS结果曼哈顿图和QQ图展示
      • 使用了两种算法,一般线性模型和混合线性模型
        在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SZ2dj35s-1583331001036)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-5.png)]

    • gwas关联定位情况统计表格
      • 展示基本的性状,定位染色体,位点,两种基因型,最小等位基因频率,p值以及前期研究的积累的情况

在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YbUVe1Lo-1583331001036)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-6.png)]* GWAS结果曼哈顿图局部展示与基因结构展示

在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YSccpzJu-1583331001037)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-7.png)]* 定位位点及数量统计* 其实是有对比两种算法的结果

在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CLfiTpRO-1583331001037)(/Volumes/18401702983/生信内部产品信息资料/imge/2010-hanbin-14phe-rice-8.png)]

案例二:NG-韩斌2011年水稻开花期与果实性状GWAS文章

  • 文章:Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm

  • 基础数据:950水稻样品,来源于33个国家,4.1M snp

  • 数据过滤:maf 0.05

  • 为什么可以很快又发一篇NG

    • 样品来源范围及样品数量扩大
    • 性状改变
    • 重点进行了结果单体型的分析
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4FNioARO-1583331001038)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-1.png)]

  • 分析结果

    • tree && fst
      • 相对于2010年的文章,该次进行了群体间fst分析
        在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-u12h1CuS-1583331001039)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-2.png)]

    • 6个已定位基因的关键变异信息

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EGOwzp4w-1583331001040)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-3.png)]
    在这里插入图片描述

    • 单体型的结果展示

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YOBovQw0-1583331001041)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-4.png)]
    在这里插入图片描述

    • 单体型的数据统计

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ayCqxpYL-1583331001041)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-5.png)]
    在这里插入图片描述

    • GWAS结果曼哈顿图和QQ图
      • 这次可以看到没有一般线性模型了,那是因为上篇比较过,没必要再进行比较了

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cLOjk7tu-1583331001041)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-6.png)]
    在这里插入图片描述

    • GWAS定位基因情况
      • 本篇中比较简洁,性状,染色体,物理位置,基因,基因的描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-E5nwqsYj-1583331001042)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-7.png)]
    在这里插入图片描述

    • 局部定位结果及基因结构情况
      • 注意,这里加入了表达量的情况

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iUHemq9l-1583331001042)(/Volumes/18401702983/生信内部产品信息资料/imge/2011-hanbin-rice-8.png)]
    在这里插入图片描述

案例三:NG-日本2016年水稻开花相关基因性状GWAS分析

  • 文章:Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice

  • 基础数据:176japonica,5.8X,383g,426k snp,67k indel

  • 过滤maf:0.05

  • 分析结果

    • 表型数据信息,以及176样品能够代表413样品(我记得该文章是从之前文章的数据中拿了176样品进行的GWAS分析)

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aWLjlBwt-1583331001042)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-1.png)]
    在这里插入图片描述

    • 表型处理后分布统计情况及PCA展示群体情况
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6l4EwNUU-1583331001042)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-2.png)]

    • 不同性状GWAS分析结果情况
      • 文章证据充分:
      1. 做了转基因(转的不同的单体型)的对照实验
      2. 单体型分析到位:包含snp和indel
      3. 对gwas定位结果的分级,为后期验证的顺序有指导意义
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-72P3SzK1-1583331001043)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-7.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IrQeZIcZ-1583331001043)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-3.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ehJIhXiX-1583331001043)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-4.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LjbkJMVn-1583331001044)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-5.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sIivYP4h-1583331001044)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-6.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IwqVDmo8-1583331001044)(/Volumes/18401702983/生信内部产品信息资料/imge/2016-japan-gwas-rice-8.png)]

案例四:NG-棉花-纤维相关性状GWAS分析

  • 文章:Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield

  • 基础数据:419样品,6.55X数据,3.66M snp,13个性状

  • 第一批棉花gwas项目,对A,D基因组差异进行了分析,环境有12个,有相应的拟南芥过表达表型验证

  • 分析结果

    • 数据注释统计
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0vI4FxPY-1583331001045)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-1.png)]

    • 群体结构分析

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PqCKKHus-1583331001045)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-2.png)]
    在这里插入图片描述

    • 亚群多态性和LD分析
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tinLqz0I-1583331001045)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-3.png)]

    • GWAS分析结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WWoWtbKS-1583331001046)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-4.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-m9VtEwnz-1583331001046)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-5.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5H8QBMvz-1583331001046)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-6.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Mq7ySXvT-1583331001047)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-7.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vA3GkFWH-1583331001047)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-8.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ynoib1xq-1583331001047)(/Volumes/18401702983/生信内部产品信息资料/imge/2018-cotton-gwas-novogene-9.png)]

在这里插入图片描述

群体进化+GWAS

案例一:NBT-田志喜-大豆-2014群体gwas文章

  • 文章:resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean

  • 基础数据:302个野生,栽培,地方品种大豆,11X,

  • 分析结果

    • 样品来源与群体结构
      在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZnOZ7u5Q-1583331001048)(/Volumes/18401702983/生信内部产品信息资料/imge/2014-tianzx-soybean-gwas-pop-1.png)]

    • LD分析

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EGcgE4XD-1583331001048)(/Volumes/18401702983/生信内部产品信息资料/imge/2014-tianzx-soybean-gwas-pop-2.png)]
    在这里插入图片描述

    • 选择消除分析与GWAS分析结果

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-234LH143-1583331001048)(/Volumes/18401702983/生信内部产品信息资料/imge/2014-tianzx-soybean-gwas-pop-3.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0BXw6A6k-1583331001049)(/Volumes/18401702983/生信内部产品信息资料/imge/2014-tianzx-soybean-gwas-pop-4.png)]
    在这里插入图片描述
    在这里插入图片描述

    • fst统计分析

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ycb8I8ON-1583331001049)(/Volumes/18401702983/生信内部产品信息资料/imge/2014-tianzx-soybean-gwas-pop-5.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3BITBnj5-1583331001049)(/Volumes/18401702983/生信内部产品信息资料/imge/2014-tianzx-soybean-gwas-pop-6.png)]

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21023.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

差异表达基因分析[转载]

转自&#xff1a;https://wenku.baidu.com/view/2532ab5176c66137ef06191a.html 1.转录组 2.转录组研究重要性 3.转录组研究技术 3.1三种的比较 3.2技术比较 4.高通量测序技术的应用 5.转录组数据分析 6.差异表达基因分析 4.1FC法——差异表达倍数法 那么也就是说A与B是2倍的关…

【生信】初探基因定位和全基因组关联分析

初探QTL和GWAS 文章目录 初探QTL和GWAS实验目的实验内容实验题目第一题&#xff1a;玉米MAGIC群体的QTL分析第二题&#xff1a;TASSEL自带数据集的关联分析 实验过程玉米MAGIC群体的QTL分析① 包含的数据② 绘制LOD曲线株高对应的QTL TASSEL自带数据集的关联分析TASSEL简介实际…

TCGA/GTEx泛癌数据任意基因表达量展示

有了泛癌的数据之后就可以进行各种分析了&#xff0c;当然这些都是在R语言的基础上进行的。如果你不会R语言&#xff0c;也可以通过各种各样的网页工具实现。 我们今天就简单展示下任意基因在泛癌图谱中的表达量情况。 TCGA,GTEx,TCGAGTEx的泛癌数据都整理好了&#xff0c;大…

公共基因表达数据分析系统genevestigator,再也不愁表达数据的查询和比较了

还在为不会分析大数据发愁吗&#xff1f; 还在为无法查询和比较发表文章中感兴趣基因表达值抱怨吗&#xff1f; 使用genevestigator&#xff0c;高效利用已经有研究结果&#xff0c;轻松与同行研究结果比较&#xff01;&#xff01;&#xff01; GENEVESTIGATOR “基因研究…

TBtools:基因家族分析简单流程

写在前面&#xff1a;非常感谢CJ开发出如此强大的TBtools工具。作者&#xff08;CJchen-0410&#xff09;在B站上有新手教程&#xff0c;大家可以给大神点个关注。 本文以《Genome-wide identification and phylogenetic analysis of rice FTIP gene family》为例&#xff0c;…

新版TCGA的突变SNP数据添加临床信息

文章目录 加载数据和R包读取数据 今天给大家演示下如何用自己的数据完成maftools的分析&#xff0c;主要是snp文件和临床信息的制作&#xff0c;其实很简单&#xff0c;但是网络上的教程都说的不清楚。 这次我们直接用之前TCGA-COAD和TCGA-READ合并后的数据演示&#xff0c;合…

Git专题:历史记录清理:保留代码并删除一年前的提交记录

29.1 克隆最后一个版本 我们在克隆一个使用了很久的 Git 仓库时候可能会发现耗费的时间非常长&#xff0c;这是因为 Git 会拉取所有的历史版本导致&#xff0c;如果我们想让 Git 在克隆代码的时候快一些&#xff0c;可以在git clone命令行后面加--depth1参数&#xff0c;这样 …

清除 input 的历史记录

问题描述 当input框输入数据时&#xff0c;会显示之前的输入的数据 原因 input的属性autocomplete默认为on&#xff0c;其含义代表让浏览器自动记录之前输入的值 解决办法 在input标签添加autocomplete"off"属性 <input type"text" autocomplete&qu…

git 清除所有历史记录

git 清除所有历史记录 有些时候&#xff0c;git 仓库累积了太多无用的历史更改&#xff0c;导致 clone 文件过大。如果确定历史更改没有意义&#xff0c;可以采用下述方法清空历史 先 clone 项目到本地目录 (以名为 mylearning 的仓库为例) $ git clone gitgitee.com:badboyco…

清除微信登录历史、自定义默认文件保存位置以及聊天记录还原

这篇文章的本意呢&#xff0c;其实对个人用户意义不大&#xff0c;因为桌面端微信本身提供了自定义用户数据文件存放路径的设置项&#xff0c;那么为什么要写出来这么一篇看似无用的教程来呢&#xff1f;是因为微信本身的特殊性&#xff0c;需要用户登录以后才可以修改设置&…

如何清除Git历史变更记录

以前公司的一个项目代码&#xff0c;从2014年一直存活到了2021年&#xff0c;目前应该还在被使用。整个代码将近2G&#xff0c;git文件极大&#xff0c;其中很大的一个原因是代码里存放过apk文件。如此大的项目&#xff0c;导致下载、发布很困难。 最初打算创建一个新的远程仓…

LLM时代NLP研究何去何从?一个博士生的角度出发

深度学习自然语言处理 原创作者&#xff1a;Winni 前言 最近&#xff0c;大语言模型&#xff08;LLMs&#xff09;在许多任务上表现出接近人类水平的性能&#xff0c;这引发了行业兴趣和资金投入的激增&#xff0c;有关LLMs的论文最近也层出不穷。 看起来&#xff0c;NLP领域似…

AIhelp智能问答

前言 2023年,科技圈里,持续爆火的科技应用,毫无疑问是生成式AI,chatGPT了的,之所以令人惊叹,正是因为它的强大 可以这么认为,chatGPT能够解决很多问题,尤其是问答,问题答案的搜索,远比百度,google要精准,方便得多 如何提出高质量的问题,写好一个promot提示词,尤为重要,提出问题…

RLHF-基于人类反馈的强化学习

RLHF 文章目录 RLHF强化学习基础回顾为什么要使用基于人类反馈的强化学习大纲RLHF的起源大预言模型中的RLHF案例 ChatGPT RLHF中的技术细节预训练语言模型训练奖励模型基于RL进行微调 RLHF 的未来 强化学习基础回顾 智能体通过采取行动与环境进行交互&#xff0c;并返回状态和奖…

GPT-4 API 接口调用及价格分析

GPT-4 API 接口调用及价格分析 15日凌晨&#xff0c;OpenAI发布了万众期待的GPT-4&#xff01;新模型支持多模态&#xff0c;具备强大的识图能力&#xff0c;并且推理能力和回答准确性显著提高。在各种专业和学术基准测试上的表现都媲美甚至超过人类。难怪OpenAI CEO Sam Altm…

穷人应该先买房还是先创业?

我个人建议先买房。既然是穷人&#xff0c;那么肯定资金不宽裕&#xff0c;这种情况下不应该是先买房来保障自己的生活&#xff0c;让自己过的安稳吗&#xff1f; 可能大家会问&#xff0c;为什么不能先创业呢&#xff1f;功成名就&#xff0c;买车买房不香吗&#xff1f;但是我…

穷人的新年红包系统,单节点 12W TPS

每年春节都是红包漫天飞&#xff0c;今年百度红包成为了最耀眼的明星。本届春晚红包活动&#xff0c;百度APP 最终累计互动量达到 208 亿次&#xff0c;百度 DAU 峰值突破 3 亿。面对这些数字&#xff0c;我不由感叹大厂技术的强大&#xff0c;机器资源的海量。作为一个穷人&am…

世界上到处都是有才华的穷人

我们每个人都自认为自己很有才华&#xff0c;不觉得自己哪方面比别人差什么&#xff0c;但为什么我们没有变更富有&#xff1f;是我们根本没有才华吗&#xff1f;如果有才华&#xff0c;我们自己真正出众的才华是什么&#xff1f;有几个人真正的清楚了解自己的才华是什么&#…

穷人实现阶级跨越有多难

经常看我们的读者应该知道&#xff0c;周末一般会发一些个人感悟或者分享一些我个人认为比较的文章或者观点&#xff0c;这样看起来公众号内容不是很冰冷&#xff0c;有温度&#xff0c;毕竟我们的生活中除了学习还有更多其他的思考。 周末在起点财经看到一篇文章&#xff0c;跟…

为什么穷人不敢创业?

对于“穷人大多不敢创业”的观点&#xff0c;持中性看法&#xff0c;不认为是对的&#xff0c;也不认为是错的。因为从身边的情况来讲&#xff0c;有钱人往往更加不敢创业&#xff0c;没钱的朋友也有很多喜欢“折腾”的。 创业&#xff0c;最重要的是看创业者的性格、行动&…