教程:群体演化方法分析玉米的驯化与改良

一般文章在筛选 正选择区间 时,大多 不考虑 群体的 演化历史,即不考虑 群体大小 的变化,只进行亚群之间各种群体遗传参数的对比,这可能会产生大量的假阳性。另一方面,研究一般也 不考虑 遗传信息的 迁移。所以作者希望将群体演化历史及遗传信息的迁移纳入选择区间的考量因素中,以提高结果的准确性。

值得注意的是,此方法误差的主要来源为 预测 的群体演化历史与 真实 历史间的差异。其中影响预测的因素众多,且较多因素 无法确定,如碱基突变率,有的研究预测结果为 3.3 × 1 0 − 8 3.3×10^{-8} 3.3×108,有的研究结果为 4.8 × 1 0 − 8 4.8×10^{-8} 4.8×108,而群体迁移率更是难以估计。所以,演化历史是在各种猜测的基础上推演出来,准确性难以保证。演化历史又是后续所有分析的基石,所以本方法建议用于 定性讨论,而非定量分析。


步骤

  1. SNP 过滤,本文先使用 LD 进行过滤,然后使用 等间距保留,形成了 密度均一(SNP 间隔约为 2 kb)的 SNP 集合。
  2. 样本集的 群体结构 分析(PCA、STRUCTURE)。
  3. 样本过滤,提高样本之间的 区分度。本文去除样本集中主成份(main membership probability)占比 < 0.6 的样本。
  4. 亚群遗传差异分析,使用 Fst、SNP 数量、SFS、群体特异性 SNP、MAF、LD。结果可用于进一步筛选样本及 SNP。
  5. 亚群演化历史分析,使用 MSMC、∂a∂i 和 中性 SNP 推算亚群的演化历史,然后再根据历史模型生成 模拟数据,与真实数据比对,验证 演化历史的准确性。
  6. 亚群遗传片段血统分析,通过 IBD 在群体中的频率间接表示驯化、改良过程中片段被选择的强度。IBD 频率越高,选择强度越大,作者使用 Top 5% 的 IBD 区间视为正选择区间。

PS:文章前后内容不一致,正文与附表也不一致,可能是文章投稿期间经历了反复的改动且改动篇幅较大。如 Table S1 中描述 MSMC 的输入样本中不包含 SS 亚群,但在文中图 2 中则包含了 SS 亚群。另一方面,文章各段落使用数据不一致,阅读的连续性较差。如推测群体演化是不考虑 SS,但讨论 IBD 时会考虑 SS。所以,更多的是学习本文的研究思路。


Li, X., Jian, Y., Xie, C. et al. Fast diffusion of domesticated maize to temperate zones. Sci Rep 7, 2077 (2017). https://doi.org/10.1038/s41598-017-02125-0



材料

本文数据使用 Fu 等人测定的 368 个玉米自交系(NSS、SS、TS、Mixed)的 RNA 序列数据,总共包含 102.6 w 个 SNP,样本集内存在清晰的群体结构。


368 群体详情参见:玉米关联群体:155、368、527 自交系群体简介(Yan Jianbing,2010、2013)


结果

1. 亚群遗传差异分析

Fst、SNP 数量、SFS、群体特异性 SNP、MAF、LD ,5 个角度观察 SS、NSS、TS 亚群之间差异。为保证数据具有可比性,作者每次从 3 个子群中各抽取 50 个个体,重复 10 次(图 1)。

  1. Fst 分布情况显示,温带亚群内 NSS-SS 差异小,温热亚群间 NSS-TS、SS-TS 差异大。
  2. SNP 数量 TS > NSS > SS,SS 中 SNP 数量最少,遗传多样性 最低。
  3. rare SNP 占比 SS > NSS > TS,可能是 SS 受到的 选择压力 较强,有害 SNP 频率升高较难。
  4. LD 衰减 到稳定 r 2 = 0.1 r^2=0.1 r2=0.1 的速度 TS > NSS > SS,平均距离分别是 170/186/224 bp 。衰减速度可能与 驯化时间有效群体大小 有关,如热带品系驯化改良完成较早或有效群体较大,历史上重组、突变积累较多。

在这里插入图片描述


2. 亚群演化历史分析

使用 MSMC 和 ∂a∂i 两种方法推断玉米从热带分化到温带。

  1. 使用 MSMC遗传背景差异清晰 的个体,推断 3 个亚群的群体大小变化。样本选自 Hapmap 3 的 916 个玉米自交系中遗传血统(genetic ancestry)大于 99% 的 TS、NSS、SS 品系。结果显示(图 2a),群体大小先下降后快速上升,其中驯化完成时间顺序为 TS > NSS ≈ SS,群体大小为 TS > NSS > SS;共祖率(coalescence rate,图 2b)在 3000-5000 年前大幅下降,遗传信息差异大幅增加,作者推测此时约为温热分化的时间节点。

    PS:MSMC 中突变率设定为 μ = 3 × 1 0 − 8 \mu=3×10^{-8} μ=3×108;因为是初步判断,所以作者没有对 SNP 数据进行筛选。

在这里插入图片描述

  1. 使用 ∂a∂i中性、密度均一 的 SNP、MSMC 结果,推断群体的演化历史,筛选 SNP 过程如下。最终,作者因为 SS 有效群体太小而将 SS 排除,仅使用 NSS 代表温带玉米群体。如果 SS 与 NSS 合并,可能会由于两者遗传多样性差异较大,统一分析产生大量的假阳性。

    1. 筛选 fastSTRUCTURE 中主要关系概率(main membership probability)> 0.6 的样本,同时,作者使用 R 中 SNPRelate 包的 snpgdsIBS 函数计算 IBS,进而估算个体之间的亲缘关系,随机剔除了亲缘关系大于 0.5 组合中的 1 个样本,;
    2. 使用 SnpEff 鉴定出的 24.7w 同义 SNP 进行分析,以排除驯化、改良等选择造成的影响;
    3. 使用 plink 的 --thin 参数随机采样 SNP 以确保它们之间 相距 > 2 kb,筛选后有 3.36 w(13.6%)SNP 被保留。

    PS:群体大小 N a Na Na 使用方程 θ = 4 μ L N a \theta = 4μLNa θ=4μLNa 计算得到,其中 μ μ μ 是突变率, L L L 是有效序列长度。 L L L 的总长度是包含 SNP 的外显子长度的总和, L = 3.8 M b L = 3.8 Mb L=3.8Mb ;突变率参考文献, μ = 4.8 × 1 0 − 8 μ = 4.8 × 10^{−8} μ=4.8×108,由于非同义词突变与同义突变的比值为 1.14,所以同义突变率 μ s = 2.2 × 1 0 − 8 μ_s = 2.2 × 10^{−8} μs=2.2×108

  2. 作者使用 3 种群体演化模型(中性平衡、两时期、三时期)与 ∂a∂i 的结果来模拟数据,通过标准似然比检验(standard likelihood-ratio test)评估 模拟群体真实群体 之间的差异,进而判断 ∂a∂i 结果的准确性。结果显示,两时期、三时期模型之间没有显著差异,都优于中性平衡模型,推测 TS 和 NSS 群体分别在 4000 和 3000 年前发生了一次群体收缩。

    PS:两时期是指群体发生了 1 次群体数量的瞬时改变,三时期是指发生了 2 次,一收一放,类似瓶颈模型。

  3. 因为考古和分子数据都表明玉米是 单一驯化(single domestication),所以作者假设 NSS 是直接从 TS 驯化得到。使用 ∂a∂i 预测群体演化历史。作者构建了 4 种模型(图 3)。作者以 AIC(Akaike information criterion)值作为模型评价标准,AIC 值越低,模型拟合的越好。因为模型 3、4 拟合相似,作者选择了较为简单的模型 3(迁移率对称,图 3c、图 4a),并展示了模型 3 下 ∂a∂i 推测的各参数的最适值(图 4b)。

在这里插入图片描述在这里插入图片描述
PS:Na(祖先种群大小)、nu1(分裂后 TS 种群大小)、nu2(分裂后 NSS 种群大小)、T1(驯化)、T2(亚群分离)、T3(亚群分化)和 m(种群之间的迁移率)。



3. 亚群遗传片段血统分析

作者计算了亚群之间 IBD 的情况,研究亚群之间的基因流动与选择区间。

  1. 作者使用 fastIBD 计算 IBD,然后剔除 IBD < 1cM 的片段,因为较小的 IBD 容易受到背景 LD 影响。结果显示, TS 群体内 IBD 片段较少,可能是 TS 驯化完成较早,群体内 IBD 片段被重组和突变破坏而无法识别。
  2. 作者讨论了人工选择使温热品系之间的基因 相互渗透 的情况。比如 Mixed 可能就是温带、热带相互杂交的结果。
  3. 作者认为具有广泛 IBD 共享的区间与驯化、改良中的正选择有关,IBD 共享比例越高,选择强度越大。据此,作者绘制了 IBD 频率图(图 5),选择频率 Top 5% 的 IBD 区间作为 驯化、改良 的候选区间。作者使用蛋白质结构域比对(pfam HMM),举例研究了 bin 3.08、bin 8.06 中的基因功能。

在这里插入图片描述



附录

硬粒玉米、马齿玉米、NSS、SS

Flint,硬粒玉米,籽粒 顶部四周 胚乳都是 角质 淀粉,仅 中心 近胚部分为 粉质 淀粉,外表半透明有光泽、坚硬饱满,主要用作粮食或饲料。

Dent,马齿玉米,籽粒 两侧 胚乳为 角质 淀粉,中间和顶部粉质 淀粉,籽粒成熟时顶部干燥凹陷呈马齿状。马齿玉米单产高,但对肥水要求也高,是大面积生产应用的主要品种。籽粒食味较差,多作 饲料 或作为淀粉、酒精等工业的 原料

温带玉米中 SS 与 NSS(Stiff Stalk Synthetic,SS,硬秆综合种;non-stiff stalk,NSS,非硬秆综合种)是被广泛用于杂交育种的两个群体。SS 和 NSS 起源相似,都是 Northern Flint(硬粒玉米)、Southern Dent(马齿玉米)、Tropical highland 的杂交后代。



群体演化历史推断方法简介

目前,各类推断群体演化历史的算法包括:

  1. 溯祖模拟(Coalescent)模拟
  2. 近似贝叶斯计算(approximate Bayesian computation,ABC)
  3. 复合似然法(composite likelihood approach),如 Diffusion Approximation for Demographic Inference(∂a∂i),扩散近似群体推断方法。
  4. 马尔可夫溯祖分析(Markovian coalescent analysis,MSMC)

相比于 ABC 方法,MSMC 与 ∂a∂i 更适合处理基因组数据,计算速度更快,本文使用这两种方法研究玉米群体演化历史,因为 ∂a∂i 需要提供一个预制的群体演变历史,而 MSMC 不需要,所以作者先用 MSMC 分析,MSNC 推断 TS 和 NSS 的分离时间约 3000-5000 年前。然后将 MSMC 输出的群体演变模型作为预制模型输入 ∂a∂i,推断瓶颈发生的持续时间与强度。最后挖掘可能与人工选择有关的同源片段(identical-by-descent tracts,IBD tracts),作为后续育种研究的目标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/43831.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

教程:群体遗传学方法分析玉米的驯化与改良

本文是 Edward S Buckler、Matthew B Hufford 等人于 2012 年在 NG 上发表的 letter&#xff0c;作为玉米 HapMap2 的子课题。作为资源数据的说明文章&#xff0c;本文没有创新性的方法&#xff0c;内容中规中矩&#xff0c;使用多种群体遗传学分析手段&#xff0c;比较了驯化和…

产品读书《人类简史》

上个月看了有关人工智能技术在当今社会的应用与广大的应用前景&#xff0c;不禁让我想起了最近读过的一本尤瓦尔赫拉利的《人类简史》&#xff0c;事实上之前已经读过尤瓦尔赫拉利的《人类简史》和《未来简史》&#xff0c;不知道你听说了吗&#xff0c;最近又出了一本《今日简…

Mac-M1驯化gitbook踩坑记录

这两天帮老师将项目的md文件整理成gitbook&#xff0c;以下是本人亲身经历的一些坑&#xff0c;希望能对需要的朋友有所帮助&#xff5e;&#xff5e;&#xff5e; 1 安装mathjax插件时各种报错&#xff0c;be like:"PluginError: Error with plugin "mathjax-pro&q…

反脆弱 读书笔记

整体上来说&#xff0c;先是从各种现象证明了所谓反脆弱性能够带来的好处&#xff0c;以及为什么会有这种现象。接下来就是反思了我们目前提倡的所谓知识模式是否正确&#xff0c;一味的强调可叙述性和共性&#xff0c;而忽视各种特殊性&#xff0c;会给整个知识体系带来致命的…

我的读书笔记 -《裸猿》

2019-7-20 这是裸猿三部曲的第一部 “《裸猿》从比较动物学和生物人类学的角度研究原始先民和部落人的行为模式&#xff0c;涉及的主题有人类进化、性行为、育儿、探索、领地、进食、安抚以及人与动物的比较。该书研究我们祖先的进化过程&#xff0c;对人类根深蒂固的生物学特性…

【读书笔记】《月亮与六便士》- [英] 威廉·萨默塞特·毛姆 - 1919年出版

不停的阅读&#xff0c;然后形成自己的知识体系。 2023.07.12 读 一直听说毛姆的大名&#xff0c;却一直没有拜读。记得《小王子》中有读者提到这本书&#xff0c;看了眼作者竟然发现是毛姆。那么毫不犹豫的&#xff0c;赶紧拜读一番。 想读国外名著&#xff0c;还是要将人物名…

我的读书清单

这个清单是我从大学以来读过的书以及简要的书评&#xff0c;最初是在豆瓣上写的书评&#xff0c;后来逐渐认同了读书对于自己各方面的好处&#xff0c;认认真真的读完一本好书&#xff0c;要比花同样时间去阅读网络上的碎知识或者鸡汤文章要有益的多。在这里先做一个整理&#…

彩票算法系列讲座(一)

第一式&#xff1a;加勒比海盗 相传&#xff0c;一群加勒比海盗&#xff08;10人&#xff09;遇到风暴船要沉没&#xff0c;必须要扔一个到海里去&#xff0c;扔谁呢&#xff1f; 船长说&#xff0c;以昨天的3D开奖号来定吧&#xff1f;10个按年龄顺时针坐一圈&#xff0c;如下…

JAVA观察者模式(买彩票案例)

定义了对象之间的一对多的依赖&#xff0c;这样一来&#xff0c;当一个对象改变时&#xff0c;它的所有的依赖者都会收到通知并自动更新。 源码地址&#xff1a;https://gitee.com/yang-kairui/design-pattern JAVA的JDK和很多框架都用到了观察者模式&#xff0c;最典型的比如说…

输入密码提示格式错误信息

给密码设置提示信息&#xff1a; 输入密码之后&#xff0c;点击页面其他地方会提示密码信息&#xff0c;输入的密码不满足格式要求&#xff0c;则提示密码格式输入错误信息&#xff1b;满足要求则提示输入正确。 如图&#xff1a; 输入错误时&#xff1a; 输入正确&#xff…

登录失败,用户名或密码错误

在录入人员前选择录入设备&#xff1a;人证核验设备&#xff0c;提示登录失败&#xff0c;用户名或密码错误&#xff0c; 解决方法&#xff1a; 1、ping人证核验设备ip&#xff0c;看一下是否能正常通信&#xff0c;如果返回以下内容&#xff0c;代表通信正常。 2、按照以下操…

WordPress后台登录一直显示密码错误,但是密码是正确的。

这种情况&#xff0c;之前就出现过&#xff0c;我把浏览器数据清除之后&#xff0c;重新登录就会这样。明明邮箱或者是用户名都能对的上&#xff0c;甚至我去查了word press中的数据库账户&#xff0c;确定邮箱跟账户没问题&#xff0c;但是就是密码对不上&#xff0c;而且点击…

linux下mysql登陆时显示密码问题的错误

数据库的登录mysql -h localhost -u root -p 出现错误 使用命令&#xff1a;sudo mysql -u root -p 来设置密码 这就成功了 退出是ctrl d

输入密码显示星号

#include<stdio.h> #include<conio.h> #define max 20void input_password(char *password) {int i0;char c;printf("请输入您的密码(取前20位&#xff09;&#xff1a;\n");while((cgetch())!\r){if(c!\b){password[i] c;printf("*");}else{…

在登录页面中输入正确的信息还是显示用户名或密码错误

今天在做某马的Demo时遇到一个问题&#xff1a;数据库中正确的username&#xff0c;和password在页面上都输入正确后&#xff0c;提交表单时却显示用户名或密码错误&#xff0c;如图&#xff1a; 开始我认为时Dao层&#xff08;去数据库查找时&#xff09;出现了问题&#xff0…

通过关系网络进行欺诈检测和欺诈团伙发现

近年来搞金融诈骗的越来越厉害啦&#xff0c;除了团伙化、组织化的趋势&#xff0c;有的居然每个月还有固定的推广费呢。那么&#xff0c;如何从数据的角度去鉴别诈骗团伙呢&#xff1f;以下“朝阳35处”出品的这篇文章&#xff0c;介绍了如何利用关系网络&#xff0c;通过无监…

新的RA Group勒索软件针对美国组织进行双重勒索攻击

一个名为“RA Group”的新勒索软件组织针对美国和韩国的制药、保险、财富管理和制造公司。 新的勒索软件行动始于 2023 年 4 月&#xff0c;当时他们在暗网上启动了一个数据泄露站点&#xff0c;以发布受害者的详细信息和被盗数据&#xff0c;采用了大多数勒索软件团伙使用的典…

超千万安卓用户安装某诈骗APP、英国勒索软件攻击数量翻倍|10月27日全球网络安全热点

安全资讯报告 攻击者劫持Craigslist电子邮件传播恶意软件 Craigslist内部电子邮件系统本月被攻击者劫持以传递令人信服的消息&#xff0c;最终目的是避免Microsoft Office安全控制来传递恶意软件。 这些电子邮件从真实的Craigslist IP地址发送&#xff0c;通知用户他们发布的广…

深入诈骗团队

最近接到任务&#xff0c;调查一个诈骗团伙 上面有一个注册接口&#xff0c;直接先注册一个用户看看他们怎么诈骗的 好家伙&#xff0c;用户赚了8个亿&#xff0c;充值过的用户直呼内行。这种站点一看就是那种诈骗团伙的杀猪盘&#xff0c;使用的那种tp5的框架一键搭建&#xf…