利用PfamScan寻找同源基因家族

基因家族鉴定---pfam保守结构域的查找

  • hmmer的安装
  • Pfam_scan的使用

Pfam是一个蛋白家族数据库,其中Pfam-A是手工确定的高质量的蛋白家族,Pfam-B是自动注释的,是对A的补充。目前已更新到34.0,下载地址为ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/,任选一版本即可,需要两个文件, Pfam-A.hmm.gzPfam-A.hmm.dat.gz

hmmer的安装

由于Pfam-A需要进行二进制的转换,方便运算,所以需要用到hmmer软件。
安装过程如下:

$ wget http://eddylab.org/software/hmmer/hmmer.tar.gz
$ tar zxvf hmmer.tar.gz
$ cd hmmer-3.3
$ ./configure --prefix=`pwd`
$ make
$ make install

安装完成后,最好把hmmer的bin目录添加到PATH中去,方便pfam_scan.pl的调用。

  • Pfam文件的转化:
$ hmmpress Pfam-A.hmm
  • hmmer也可以直接鉴定pfam
$ hmmscan -o out.txt --tblout out.tbl  -E 1e-5 Pfam-A.hmm query.fa

Pfam_scan的使用

  • Pfam_scan.pl的安装特别简单,直接下载解压即可。
$ wget ftp://ftp.ebi.ac.uk/pub/databases/Pfam/Tools/PfamScan.tar.gz
$ gunzip PfamScan.tar.gz
  • 安装完成后PfamScan目录下主要有三个文件ChangeLog, pfam_scan.pl,README以及一个文件夹Bio(主要存放需要的模块),可以直接使用pfam_scan.pl脚本即可运行(其需要调用hmmer的hmmscan),其参数如下:
    pfam_scan.pl参数
    一般情况下,我们只需要用到三个参数:
    -fasta 需要检索的蛋白序列的fasta文件;
    -dir 存放Pfam-A数据库的目录;
    -outfile 需要输出的文件名字。

  • 命令如下:

$ perl pfam_scan.pl -fasta query.fa -dir ~/pfam-A -outfile out.pfam

在最终的输出结果里面,我们一般可以通过两种方式去检索自己所需要的基因:

  1. 已知蛋白的PF编号,如红框1;
  2. 已知蛋白的名字,如红框2.
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29945.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Open CV的植物图像分类识别项目

一、项目简介 1.主要内容 本项目主要是基于Open CV进行植物图像进行分类识别。展示部分采用了网页的形式(VueElement.net Core),由用户上传图片,服务器返回该图片的分类结果。Web服务(.net Core)和c图像处…

RNA-seq——五、根据差异基因画火山图、在火山图上标记基因名

目录 1. 设置阈值来显示对应的基因名2. 指定基因名展示 写在前面——之前写的RNA-seq(一到四)是根据别人文章中提到的数据进行一系列分析的,但是找公司做的单细胞测序,一般不需要自己进行数据清洗之类的操作,公司会直接…

如何通过图片识别植物?识别植物软件有哪些?

想必大家都有这样的经历,当我们在外面散步时,看到一种美丽的植物,但是却不知道它的名字。现在,有一种神奇的技术可以帮助我们解决这个问题,那就是通过图片识别植物。现在你只需要拍下这种植物的照片,然后上…

识别各种花草植物是什么软件?这些识别软件可以帮你识别

小伙伴们平时要是在路边看到一些比较好看的花花草草时,会不会像我一样,特别好奇想知道这些花花草草叫什么吗?由于花花草草,很多都长得相似,只能靠文字来描述它们,很难知道它的身份。但其实我们可以借助一些…

基于分子对接与体外实验数据的一致性研究预测出槲皮素衍生物可以为α-Glucosidase 新的抑制剂

摘要:本文通过运用Discovery Studio中的CDOCKER方法,验证了α-Glucosidase 抑制剂与体外实验数据的一致性,并预测出槲皮素衍生物(compound 7)可以作为潜在α-Glucosidase 抑制剂的骨架分子并且具有治疗肥胖的作用。 分…

植物表型组学研究平台建设及技术应用

在生物学和遗传育种领域,表型是指构成生物体的全部特征,包括外观、基本维度、形态和颜色,是基因型和环境因素互相作用的结果。表型采集分析是指以定性和定量的方式测量这些特征。表型组(phenome)则是指某一生物的全部性状特征,不仅局限于农艺性状&#x…

教程 | 规模化物种同源基因分析 - orthofinder [上篇]

写在前面 基因组测序项目已然是几乎所有课题组都可以负担的水平。相比于几年前火爆的通过转录组测序挖掘生物学问题策略,通过基因组,尤其是比较基因组分析,往往可以给我们带来更多确定性结果,如相比于近源物种A为何物种B的果皮更…

部分植物基因组数据库汇总

牛年大吉 植物基因组数据库:1、NCBI中的genome,直接下载NCBI上的基因组文件 ftp://ftp.ncbi.nlm.nih.gov/genomes/ 2、植物基因组数据库(包含约30个左右的植物,具体查看:) 30个左右植物基因组对应列表下载 http://www.…

【4】RagTag-基于近缘/同物种的基因组同源组装

RagTag简介 RagTag可以进行错误组装校正、scaffold组装和修补、scaffold合并等,一共分四步:correct,scaffold,patch,merge。之后,可以用Liftoff进行基因注释。 RagTag的conda安装 conda install -c bioco…

iMeta | 兰大张东等使用PhyloSuite进行分子系统发育及系统发育树的统计分析

点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方 法 ● 原文链接DOI: https://doi.org/10.1002/imt2.87 ● 2023年2月16日,兰州大学张东团队在 iMeta 在线发表了题为“Using PhyloSuit…

易基因|植物育种:ChIP-seq(组蛋白)揭示H3K36me修饰影响温度诱导的植物可变剪接和开花

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 2017年,荷兰瓦格宁根大学分子实验室RGH Immink团队以“Histone H3 lysine 36 methylation affects temperature-induced alternative splicing and flowering in plants”在《…

Kaggle图像识别竞赛 Plant Seedlings Classification(植物幼苗分类)具体实现

目录 0. 前言1. 总体设计2. import部分3. 具体实现步骤一、数据预处理(一)均衡化(二)提取图片中叶子(绿色)的部分 二、提取特征(一)SIFT提取关键点(二)BOW(Ba…

易基因:禾本科植物群落的病毒组丰度/组成与人为管理/植物多样性变化的相关性 | 宏病毒组

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 现代农业通过简化生态系统、引入新宿主物种和减少作物遗传多样性来影响植物病毒的出现。因此,更好理解农业生态中种植和未种植群落中的病毒分布,以及它们之间的病…

植物激素基因高级分析来啦~

很多植物转录组学文章中,都有整合激素相关基因和表达数据的pathway图,直观地展示通路及其中重要基因的位置和功能。 植物激素(Phytohormone)亦称植物天然激素或植物内源激素,是指植物体内产生的一些微量而能调节&…

⁡⁡‍⁤⁡⁣⁢‍⁢​​‌​⁡⁡ ​​‍⁡⁢⁤⁡​⁤‍​⁣​⁤‌‍⁤⁢​⁤ ​ ⁢ ​⁡⁣GPT/AIGC/LLM/NLP/ChatGPT学习资料汇总(互联网活菩萨)

一些群友写的文档,干货很多 有关 ⁡⁡‍⁤⁡⁣⁢‍⁢​​‌​⁡⁡​​‍⁡⁢⁤⁡​⁤‍​⁣​⁤‌‍⁤⁢​⁤​⁢​⁡⁣GPT/AIGC/LLM/NLP/ChatGPT ,干货很多,原幕布的产品负责。 https://go…

大学生问AI

大学生问AI 写在最前面2,描述你在学习工作中碰到的最高级的 AI 是什么?1,你人生中第一次接触到 “人工智能” 的概念和产品是什么? 让你觉得 “人类做得东西的确有智能”?3,你听说过最近的 GPT,…

#41 AI-002-十分钟理解ChatGPT的技术逻辑及演进(前世 、今生)

#41 AI-002-十分钟理解ChatGPT的技术逻辑及演进(前世、今生) 目录 目录0、 前言1、什么是GPT2、GPT之技术演进时间线3、GPT之T-Transformer(2017) 3.1、重点在好,还是重点在人?3.2、对不起,你是个好人3.3、回归正题&am…

渗透测试part(二):Vulnhub配置(以EMPIRE: BREAKOUT为例)

注:哈尔滨工程大学-渗透测试-2020065122 -0.21 在part(一)中,简要介绍了渗透测试的基本概念,并在第七部分提及了Vulnhub靶场。本文主要针对Vulnhub靶场的配置以及攻击机Kali的配置进行说明,希望能够帮助大…

腾讯云发布5G远程驾驶云;中国电信发布通用视觉大模型2.0;Meta推新语言模型Toolformer丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 腾讯云联合中国联通宁夏、福建分公司发布5G远程驾驶云 4月28日,在第六届数字中国建设峰会上,腾讯云携手中国联通宁夏、福建两省区分公司,首次对外发布了“基于闽宁云的5G远程…

互联网晚报 | 一季度全国居民人均可支配收入10870元;郑渊洁称维权艰难将不再发表作品;苹果版余额宝上线,年利率4.15%...

国家统计局:一季度全国居民人均可支配收入10870元,比上年同期名义增长5.1% 据国家统计局官网,一季度,全国居民人均可支配收入10870元,比上年同期名义增长5.1%,扣除价格因素,实际增长3.8%。分城乡…