TBtools:基因家族分析简单流程

写在前面:非常感谢CJ开发出如此强大的TBtools工具。作者(CJchen-0410)在B站上有新手教程,大家可以给大神点个关注。


本文以《Genome-wide identification and phylogenetic analysis of rice FTIP gene

family》为例,介绍TBtools基因家族分析的流程。

本文内容
1、从结构域出发鉴定基因家族成员
2、顺式作用元件分析
3、保守结构域分析
4、多物种共线性分析

准备工作

本文主要介绍TBtools的用法,复现文章中作者用到TBtools的地方。

1、工具

(1) TBtools 1.09852 (下载地址:https://github.com/CJ-Chen/TBtools/releases)

(2) MEGA

(3) Pfam

(4) PlantCARE

2、数据集下载

(1) EnsemblPlants


1、从结构域出发鉴定基因家族成员

(1) 从 Pfam下载所有的结构域的hmm格式文件

Pfam-A 是 人工标注的结构域,Pfam-B 是预测的结构域

(2)EnsemblPlants 下载水稻的所有蛋白序列(pep),基因序列(fa),全基因组序列(fa),全基因组注释(gff3) ( 我用的是MSU的水稻数据,MSU 和 NCBI 的基因注释差别不大)

基因组序列
注释文件
蛋白序列

基因序列

其他物种的相关序列也可以在这下载。

(3)文献作者是利用C2结构域和PRT-C结构域查找OsFTIPs基因家族成员,在Pfam上找到两个相关结构域的登录号PF00168,PF08372。新建个文本

image

(4) 利用TBtools的hmm search 工具 查找

image

这里其实是做了个 hmmer 软件的接口 。往常要用hmmer来找结构域需要在Pfam 上 下载 结构域的模型 ,而且hmmer 这个软件 win版本不太友好,这里是给出了个优化方案,TBtools内置了部分 hmmer 使其直接调用。

(4)输出结果

结果

每个结构域都会有两部分 分数 ,分别是序列得分和结构域得分,可以通过结果太多可以用E-value 筛选。我用excel筛选了下,找个交集,共找到13个,和文献中一致。

image

(5) 得到目标基因的蛋白序列、基因序列、启动子序列、注释文件

利用TBtools的 Fasta Extract 工具提取蛋白序列、基因序列

要注意蛋白和mRNA序列的ID是有版本号的,如 LOC_Os06g41090.1 的.1。 提取蛋白序列需要标版本号,提取DNA序列则需要把版本号去掉。总之就是输入的目标ID要和fasta文件中的ID对应。

image

结果

利用GXF Selector 筛选目标基因的注释文件

image

利用Gtf/Gff3 Sequences Extract 提取启动子

输入上步目标基因的注释文件和基因组序列文件,选择参数。输入注释文件后需要按下初始化,不然start是灰的。如果需要 基因组所有基因 的启动子 可以输入 全基因组的注释文件。

image

结果

(6) 可视化

TBtools 画的是矢量图,可以改颜色 样式 ,比较方便。具体操作如下,结果就不一一展示了。

基因在染色体上的位置

基因结构

同时,TBtools也支持NCBI、MEME的预测结果

基于Pfam结果的motif可视化

Pfam预测

当然还有更加酷炫的进化树、基因结构、motif分析的三合一图,请出门向左(https://my.oschina.net/u/4579431/blog/4834581)。

2、顺式作用元件预测

文献中作者是用PlantCARE进行预测的。拿出提取到的启动子序列扔上去等邮件就好了,一般在半个小时左右。

PlantCARE预测

邮件中的tab文件是所有结果的汇总。得到的启动子序列往往比较多,需要手动筛选下,主要保留响应元件。需要整理成TBtools能识别的格式和一个序列长度的文件。

整理后的数据格式

启动子长度文件

image

3、保守结构域分析

TBtools上可以直接运行MEME。

image

可视化 用到输出的 xml 文件

image

作者还写过一个更全的版本,出门右转(https://www.jianshu.com/p/b8ffd0fd1cbf)

4、多物种共线性分析

(1)需要两个物种的基因组序列(fa)和基因组注释文件(gff3) 这里用水稻和拟南芥为例。原理就是blast。这一步运行时长主要还是和基因组大小和电脑线程数有关,条件允许的情况下可以多开几个线程。

image

结果文件

(2)运行过程中可能会弹出警告,但没事儿。这主要是注释文件的问题

(3)可视化 主要用到结果中的gff文件、ctl文件、collinearity文件

灰色的是基因组比对上的地方,红色的是比对上的目标基因(没比对上就没有。还可以放多个物种的比对结果。也可以物种内共线性比对,查看是否发生基因复制事件(https://www.meiwen.com.cn/subject/ljltbctx.html),思路和方法也是差不多的

结果


TBtools 不止能做基因家族分析,随着TBtools这个社区的壮大,已经有了很多教程,也有很多作者贡献了十分有用的插件,小的方面可以完成批量重命名、热图、维恩图、火山图、Logo、气泡图,大的方面能够完成转录组分析和注释,WGCNA等工作。同时也感谢这些作者降低了生信分析的门槛,更好的帮助科研工作~~(凑结果)~~ 。作者也写了很多的教程 可以关注公众号:生信药丸。

参考文献:

Genome-wide identification and phylogenetic analysis of rice FTIP gene family

愚见 | 解读文稿 BMC Plant Biology 本氏烟类成束蛋白阿拉伯半乳聚糖基因家族分析

TBtools: An Integrative Toolkit Developed for Interactive Analyses of Big Biological Data

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21017.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新版TCGA的突变SNP数据添加临床信息

文章目录 加载数据和R包读取数据 今天给大家演示下如何用自己的数据完成maftools的分析,主要是snp文件和临床信息的制作,其实很简单,但是网络上的教程都说的不清楚。 这次我们直接用之前TCGA-COAD和TCGA-READ合并后的数据演示,合…

Git专题:历史记录清理:保留代码并删除一年前的提交记录

29.1 克隆最后一个版本 我们在克隆一个使用了很久的 Git 仓库时候可能会发现耗费的时间非常长,这是因为 Git 会拉取所有的历史版本导致,如果我们想让 Git 在克隆代码的时候快一些,可以在git clone命令行后面加--depth1参数,这样 …

清除 input 的历史记录

问题描述 当input框输入数据时&#xff0c;会显示之前的输入的数据 原因 input的属性autocomplete默认为on&#xff0c;其含义代表让浏览器自动记录之前输入的值 解决办法 在input标签添加autocomplete"off"属性 <input type"text" autocomplete&qu…

git 清除所有历史记录

git 清除所有历史记录 有些时候&#xff0c;git 仓库累积了太多无用的历史更改&#xff0c;导致 clone 文件过大。如果确定历史更改没有意义&#xff0c;可以采用下述方法清空历史 先 clone 项目到本地目录 (以名为 mylearning 的仓库为例) $ git clone gitgitee.com:badboyco…

清除微信登录历史、自定义默认文件保存位置以及聊天记录还原

这篇文章的本意呢&#xff0c;其实对个人用户意义不大&#xff0c;因为桌面端微信本身提供了自定义用户数据文件存放路径的设置项&#xff0c;那么为什么要写出来这么一篇看似无用的教程来呢&#xff1f;是因为微信本身的特殊性&#xff0c;需要用户登录以后才可以修改设置&…

如何清除Git历史变更记录

以前公司的一个项目代码&#xff0c;从2014年一直存活到了2021年&#xff0c;目前应该还在被使用。整个代码将近2G&#xff0c;git文件极大&#xff0c;其中很大的一个原因是代码里存放过apk文件。如此大的项目&#xff0c;导致下载、发布很困难。 最初打算创建一个新的远程仓…

LLM时代NLP研究何去何从?一个博士生的角度出发

深度学习自然语言处理 原创作者&#xff1a;Winni 前言 最近&#xff0c;大语言模型&#xff08;LLMs&#xff09;在许多任务上表现出接近人类水平的性能&#xff0c;这引发了行业兴趣和资金投入的激增&#xff0c;有关LLMs的论文最近也层出不穷。 看起来&#xff0c;NLP领域似…

AIhelp智能问答

前言 2023年,科技圈里,持续爆火的科技应用,毫无疑问是生成式AI,chatGPT了的,之所以令人惊叹,正是因为它的强大 可以这么认为,chatGPT能够解决很多问题,尤其是问答,问题答案的搜索,远比百度,google要精准,方便得多 如何提出高质量的问题,写好一个promot提示词,尤为重要,提出问题…

RLHF-基于人类反馈的强化学习

RLHF 文章目录 RLHF强化学习基础回顾为什么要使用基于人类反馈的强化学习大纲RLHF的起源大预言模型中的RLHF案例 ChatGPT RLHF中的技术细节预训练语言模型训练奖励模型基于RL进行微调 RLHF 的未来 强化学习基础回顾 智能体通过采取行动与环境进行交互&#xff0c;并返回状态和奖…

GPT-4 API 接口调用及价格分析

GPT-4 API 接口调用及价格分析 15日凌晨&#xff0c;OpenAI发布了万众期待的GPT-4&#xff01;新模型支持多模态&#xff0c;具备强大的识图能力&#xff0c;并且推理能力和回答准确性显著提高。在各种专业和学术基准测试上的表现都媲美甚至超过人类。难怪OpenAI CEO Sam Altm…

穷人应该先买房还是先创业?

我个人建议先买房。既然是穷人&#xff0c;那么肯定资金不宽裕&#xff0c;这种情况下不应该是先买房来保障自己的生活&#xff0c;让自己过的安稳吗&#xff1f; 可能大家会问&#xff0c;为什么不能先创业呢&#xff1f;功成名就&#xff0c;买车买房不香吗&#xff1f;但是我…

穷人的新年红包系统,单节点 12W TPS

每年春节都是红包漫天飞&#xff0c;今年百度红包成为了最耀眼的明星。本届春晚红包活动&#xff0c;百度APP 最终累计互动量达到 208 亿次&#xff0c;百度 DAU 峰值突破 3 亿。面对这些数字&#xff0c;我不由感叹大厂技术的强大&#xff0c;机器资源的海量。作为一个穷人&am…

世界上到处都是有才华的穷人

我们每个人都自认为自己很有才华&#xff0c;不觉得自己哪方面比别人差什么&#xff0c;但为什么我们没有变更富有&#xff1f;是我们根本没有才华吗&#xff1f;如果有才华&#xff0c;我们自己真正出众的才华是什么&#xff1f;有几个人真正的清楚了解自己的才华是什么&#…

穷人实现阶级跨越有多难

经常看我们的读者应该知道&#xff0c;周末一般会发一些个人感悟或者分享一些我个人认为比较的文章或者观点&#xff0c;这样看起来公众号内容不是很冰冷&#xff0c;有温度&#xff0c;毕竟我们的生活中除了学习还有更多其他的思考。 周末在起点财经看到一篇文章&#xff0c;跟…

为什么穷人不敢创业?

对于“穷人大多不敢创业”的观点&#xff0c;持中性看法&#xff0c;不认为是对的&#xff0c;也不认为是错的。因为从身边的情况来讲&#xff0c;有钱人往往更加不敢创业&#xff0c;没钱的朋友也有很多喜欢“折腾”的。 创业&#xff0c;最重要的是看创业者的性格、行动&…

Numpy练习小例题(1)--穷人借钱

一个穷人到富人那里去借钱&#xff0c;原以为富人不愿意&#xff0c;哪知富人一口答应了下来&#xff0c;但提出了如下条件: 在30天中&#xff0c;富人第一天借给穷人1万元&#xff0c;第二天借给2万&#xff0c;以后每天所借的钱数都比上一天的多一万; 但借钱…

穷孩子就活该这样吗?10幅漫画扎破穷人真相

文/北妈、刘娜 阅读本文需要 3.0分钟 作者丨刘娜 来源 | 闲时花开&#xff08;ID&#xff1a;xsha369&#xff09; 最近看到一组漫画&#xff0c;真实到震撼人心。 它来自新西兰漫画家Toby Morris&#xff0c;这个漫画叫On a Plate——《盘子上》。 漫画描述了两个在不同环境中…

★为什么不要和“穷人”做朋友?

不要和“穷人”做朋友&#xff08;深度好文&#xff09; 他穷的&#xff0c;不仅仅是物质条件&#xff0c;他穷的&#xff0c;更是视野和格局。 01 我工作在三里屯&#xff0c;那里人多车多&#xff0c;所以停车是一个特别麻烦的事情。 我很少开车&#xff0c;但凡开车&#xf…

EleutherAI GPT-Neo: 穷人的希望

前面一篇blog finetune一个GPT3&#xff0c;借助openai的api finetune了一个GPT3&#xff0c;使用下来确实太贵&#xff0c;生成了1w条数据&#xff0c;花掉了60多美刀。肉痛&#xff0c;所以穷人只能想想穷人的办法&#xff0c;脑子就浮现出好朋友EleutherAI的GPT-Neo来。gith…

路径依赖:穷人很难逆袭突破的科学道理

路径依赖 为什么要了解路径依赖原理 马云说&#xff1a;“晚上想想千条路&#xff0c;早上醒走原路。“我们会看到一些社会现象&#xff0c;为什么穷人最终大部分还是穷人&#xff0c;即使告诉他方法&#xff0c;提供给他资金&#xff0c;最终还是穷人&#xff1f;为什么很多…