iPHoP:病毒宿主预测-CSDN博客
之前介绍了这个方法来预测病毒宿主,今天来介绍另一种比较用的多的方法CRISPR比对
CRISPR spacers数据库
Dash 在这可以下载作者搜集的spacers用于后期比对
CRT和PILER-CR
使用 CRT 和 PILERCR 识别 CRISPR 间隔区,合并冗余 CRISPR 阵列,并格式化输出
用的是别人写好的代码(好用就行,这两软件太老了,别人帮忙下好,配置好了)
Metagenomic compendium of 189,680 DNA viruses from the human gut microbiome | Nature Microbiology
MGV/crispr_spacers at master · snayfach/MGV · GitHub
#运行
software="/home/zhongpei/hard_disk_sda2/zhongpei/Software/MGV/crispr_spacers"
out_dir="/home/zhongpei/hard_disk_sda2/zhongpei/database/SPACER_rumen_MAGs"
gunzip -k *
dir_name=$(basename $(pwd))
mkdir ${out_dir}/${dir_name}
for i in *.fa
donum=${i%%.fa}dir=$(pwd)cd ${software}identify_crispr.py -i ${dir}/${num}.fa -o ${out_dir}/${dir_name}/${num}_spacermerge_crispr.py ${out_dir}/${dir_name}/${num}_spacer/crt ${out_dir}/${dir_name}/${num}_spacer/pilercr ${out_dir}/${dir_name}/${num}_spacer/mergedcd ${dir}
done
rm *.fa
spacers比对
我们现在有了两组spacers,一组是NAR文章整理的,一组是宿主MAG提取的。
使用Blastn进行比对(viral contigs和spacers)
参考文献的Viral host prediction部分:A metagenomic catalog of the early-life human gut virome | Nature Communications
blastn -query ${fa}/fetal_5.0_95.fa -db ${database} -evalue 0.0000001 -gapopen 10 -gapextend 2 -reward 1 -penalty -1 -word_size 5 -perc_identity 100 -max_target_seqs 10000 -out ${out}/fetal_vOTU_spacerDB.txt -outfmt 6 -num_threads 150