RNA-seq——五、根据差异基因画火山图、在火山图上标记基因名

目录

  • 1. 设置阈值来显示对应的基因名
  • 2. 指定基因名展示

写在前面——之前写的RNA-seq(一到四)是根据别人文章中提到的数据进行一系列分析的,但是找公司做的单细胞测序,一般不需要自己进行数据清洗之类的操作,公司会直接给个clean_data,以及所有的你需要的文件,或者一个云系统的账号。所以我们最终要做的就是根据这些数据,来绘制达到文章发表级别的图,来说明我们实验想表达的事情。
注:本文虽然是RNA-seq——五,但与前几个使用的并不是同一个数据集,本文数据集是私有数据集。

参考:
给火山图上标记基因名字
火山图|给你geneList,帮我标到火山图上
多种方法在火山图上标记感兴趣基因(差异基因,或者通路)

1. 设置阈值来显示对应的基因名

library(readxl)
library(ggrepel)# 读取差异基因数据集
exprSet <- read_xlsx("allgene.xlsx")
colnames(exprSet) <- c("Gene ID", "Gene Symbol", "Type", "log2FC", "Pvalue", "Qvalue")# 设置阈值,整理数据
# 阈值不同,结果不同
cut_off_qvalue = 0.01
cut_off_logFC = 2
exprSet$Sig <- ifelse(exprSet$Qvalue < cut_off_qvalue & abs(exprSet$log2FC) >= cut_off_logFC, ifelse(exprSet$log2FC > cut_off_logFC ,'Up','Down'),'no-DEGs')exprSet <- data.frame(exprSet)
# tmp <- tmp %>% drop_na(Sig)
table(exprSet$Sig)ggplot(exprSet, aes(x = log2FC, y = -log10(Qvalue), colour=Sig)) +geom_point(alpha=0.4, size=3.5) +scale_color_manual(values=c("#546de5", "#d2dae2","#ff4757")) + xlim(c(-16, 16)) + # 辅助线geom_vline(xintercept=c(-cut_off_logFC,cut_off_logFC),lty=4,col="black",lwd=0.8) +geom_hline(yintercept = -log10(cut_off_qvalue),lty=4,col="black",lwd=0.8) +# 坐标轴labs(x="Fold Change", y="-log10 (Q-value)") +# 主题theme_bw() +# 标题ggtitle("Q-value vs Fold Change") +# 图例theme(plot.title = element_text(hjust = 0.5), legend.position="right", legend.title = element_blank() ) +  # 给点标上基因名geom_text_repel(# 可以设置跟上面不同的阈值,用数值替换即可data = subset(exprSet, exprSet$Qvalue < cut_off_qvalue & abs(exprSet$log2FC) >= cut_off_logFC),aes(label = Gene.Symbol), size = 3,box.padding = unit(0.5, "lines"),point.padding = unit(0.8, "lines"), segment.color = "black", show.legend = FALSE )

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以看到,有一千八百多个基因名无法显示,这里我们可以把qvalue和flod change设置的再严格一些,或者直接指定一些基因来标注。

2. 指定基因名展示

library(dplyr)
library(ggrepel)# 将geneList中的基因全部标注
# my_label <- label_1
# gene <- my_label$`Gene Symbol`
# gene <- data.frame(gene)
# gene$geneList <- gene$gene
# tmp <- exprSet %>% left_join(gene,by = c("Gene.Symbol" = "gene"))# 简单粗暴的标注
gene_tmp <- c("'cfd'", "'c9'", "'fga'", "'c3a.1'", "'fgg'","'il2rga'", "'ccl25b'", "'cxcl8b.3'", "'xcr1b.2'", "'ccl20a.3'","'mhc2dab'", "'col1a2'", "'gna14'", "'akt1'", "'fcer1g'","'ptgdsb'", "'ptgdsb.2'", "'ggt1a'", "'pla2g12b'", "'ptges'", "'ptgs2a'","'il1b'")
gene_tmp <- data.frame(gene_tmp)
gene_tmp$geneList <- gene_tmp$gene_tmptmp <- exprSet %>% left_join(gene_tmp,by = c("Gene.Symbol" = "gene_tmp"))ggplot(tmp, aes(x = log2FC, y = -log10(Qvalue), colour=Sig)) +geom_point(alpha=0.4, size=3.5) +scale_color_manual(values=c("#546de5", "#d2dae2","#ff4757")) + xlim(c(-16, 16)) + # 辅助线geom_vline(xintercept=c(-cut_off_logFC,cut_off_logFC),lty=4,col="black",lwd=0.8) +geom_hline(yintercept = -log10(cut_off_qvalue),lty=4,col="black",lwd=0.8) +# 坐标轴labs(x="Fold Change",y="-log10 (Q-value)")+theme_bw()+ggtitle("Q-value vs Fold Change")+# 图例theme(plot.title = element_text(hjust = 0.5), legend.position="right", legend.title = element_blank() ) +  geom_label_repel(aes(label=geneList), fontface="bold",color="grey50", box.padding=unit(0.35, "lines"),point.padding=unit(0.5, "lines"), segment.colour = "grey50")

在这里插入图片描述
在这里插入图片描述
竟然有几个不显示,估计字体设置的太大了,挤不下。方法掌握,之后就可以自己慢慢的去调数值了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29943.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何通过图片识别植物?识别植物软件有哪些?

想必大家都有这样的经历&#xff0c;当我们在外面散步时&#xff0c;看到一种美丽的植物&#xff0c;但是却不知道它的名字。现在&#xff0c;有一种神奇的技术可以帮助我们解决这个问题&#xff0c;那就是通过图片识别植物。现在你只需要拍下这种植物的照片&#xff0c;然后上…

识别各种花草植物是什么软件?这些识别软件可以帮你识别

小伙伴们平时要是在路边看到一些比较好看的花花草草时&#xff0c;会不会像我一样&#xff0c;特别好奇想知道这些花花草草叫什么吗&#xff1f;由于花花草草&#xff0c;很多都长得相似&#xff0c;只能靠文字来描述它们&#xff0c;很难知道它的身份。但其实我们可以借助一些…

基于分子对接与体外实验数据的一致性研究预测出槲皮素衍生物可以为α-Glucosidase 新的抑制剂

摘要&#xff1a;本文通过运用Discovery Studio中的CDOCKER方法&#xff0c;验证了α-Glucosidase 抑制剂与体外实验数据的一致性&#xff0c;并预测出槲皮素衍生物&#xff08;compound 7&#xff09;可以作为潜在α-Glucosidase 抑制剂的骨架分子并且具有治疗肥胖的作用。 分…

植物表型组学研究平台建设及技术应用

在生物学和遗传育种领域,表型是指构成生物体的全部特征&#xff0c;包括外观、基本维度、形态和颜色,是基因型和环境因素互相作用的结果。表型采集分析是指以定性和定量的方式测量这些特征。表型组(phenome)则是指某一生物的全部性状特征&#xff0c;不仅局限于农艺性状&#x…

教程 | 规模化物种同源基因分析 - orthofinder [上篇]

写在前面 基因组测序项目已然是几乎所有课题组都可以负担的水平。相比于几年前火爆的通过转录组测序挖掘生物学问题策略&#xff0c;通过基因组&#xff0c;尤其是比较基因组分析&#xff0c;往往可以给我们带来更多确定性结果&#xff0c;如相比于近源物种A为何物种B的果皮更…

部分植物基因组数据库汇总

牛年大吉 植物基因组数据库&#xff1a;1、NCBI中的genome&#xff0c;直接下载NCBI上的基因组文件 ftp://ftp.ncbi.nlm.nih.gov/genomes/ 2、植物基因组数据库&#xff08;包含约30个左右的植物&#xff0c;具体查看:&#xff09; 30个左右植物基因组对应列表下载 http://www.…

【4】RagTag-基于近缘/同物种的基因组同源组装

RagTag简介 RagTag可以进行错误组装校正、scaffold组装和修补、scaffold合并等&#xff0c;一共分四步&#xff1a;correct&#xff0c;scaffold&#xff0c;patch&#xff0c;merge。之后&#xff0c;可以用Liftoff进行基因注释。 RagTag的conda安装 conda install -c bioco…

iMeta | 兰大张东等使用PhyloSuite进行分子系统发育及系统发育树的统计分析

点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页&#xff1a;http://www.imeta.science 方 法 ● 原文链接DOI: https://doi.org/10.1002/imt2.87 ● 2023年2月16日&#xff0c;兰州大学张东团队在 iMeta 在线发表了题为“Using PhyloSuit…

易基因|植物育种:ChIP-seq(组蛋白)揭示H3K36me修饰影响温度诱导的植物可变剪接和开花

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 2017年&#xff0c;荷兰瓦格宁根大学分子实验室RGH Immink团队以“Histone H3 lysine 36 methylation affects temperature-induced alternative splicing and flowering in plants”在《…

Kaggle图像识别竞赛 Plant Seedlings Classification(植物幼苗分类)具体实现

目录 0. 前言1. 总体设计2. import部分3. 具体实现步骤一、数据预处理&#xff08;一&#xff09;均衡化&#xff08;二&#xff09;提取图片中叶子&#xff08;绿色&#xff09;的部分 二、提取特征&#xff08;一&#xff09;SIFT提取关键点&#xff08;二&#xff09;BOW(Ba…

易基因:禾本科植物群落的病毒组丰度/组成与人为管理/植物多样性变化的相关性 | 宏病毒组

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 现代农业通过简化生态系统、引入新宿主物种和减少作物遗传多样性来影响植物病毒的出现。因此&#xff0c;更好理解农业生态中种植和未种植群落中的病毒分布&#xff0c;以及它们之间的病…

植物激素基因高级分析来啦~

很多植物转录组学文章中&#xff0c;都有整合激素相关基因和表达数据的pathway图&#xff0c;直观地展示通路及其中重要基因的位置和功能。 植物激素&#xff08;Phytohormone&#xff09;亦称植物天然激素或植物内源激素&#xff0c;是指植物体内产生的一些微量而能调节&…

⁡⁡‍⁤⁡⁣⁢‍⁢​​‌​⁡⁡ ​​‍⁡⁢⁤⁡​⁤‍​⁣​⁤‌‍⁤⁢​⁤ ​ ⁢ ​⁡⁣GPT/AIGC/LLM/NLP/ChatGPT学习资料汇总(互联网活菩萨)

一些群友写的文档&#xff0c;干货很多 有关 ⁡⁡‍⁤⁡⁣⁢‍⁢​​‌​⁡⁡&#xfeff;​​‍⁡⁢⁤⁡​⁤‍​⁣​⁤‌‍⁤⁢​⁤&#xfeff;​&#xfeff;⁢&#xfeff;​⁡⁣GPT/AIGC/LLM/NLP/ChatGPT &#xff0c;干货很多&#xff0c;原幕布的产品负责。 https://go…

大学生问AI

大学生问AI 写在最前面2&#xff0c;描述你在学习工作中碰到的最高级的 AI 是什么&#xff1f;1&#xff0c;你人生中第一次接触到 “人工智能” 的概念和产品是什么&#xff1f; 让你觉得 “人类做得东西的确有智能”&#xff1f;3&#xff0c;你听说过最近的 GPT&#xff0c;…

#41 AI-002-十分钟理解ChatGPT的技术逻辑及演进(前世 、今生)

#41 AI-002-十分钟理解ChatGPT的技术逻辑及演进&#xff08;前世、今生&#xff09; 目录 目录0、 前言1、什么是GPT2、GPT之技术演进时间线3、GPT之T-Transformer(2017) 3.1、重点在好&#xff0c;还是重点在人&#xff1f;3.2、对不起&#xff0c;你是个好人3.3、回归正题&am…

渗透测试part(二):Vulnhub配置(以EMPIRE: BREAKOUT为例)

注&#xff1a;哈尔滨工程大学-渗透测试-2020065122 -0.21 在part&#xff08;一&#xff09;中&#xff0c;简要介绍了渗透测试的基本概念&#xff0c;并在第七部分提及了Vulnhub靶场。本文主要针对Vulnhub靶场的配置以及攻击机Kali的配置进行说明&#xff0c;希望能够帮助大…

腾讯云发布5G远程驾驶云;中国电信发布通用视觉大模型2.0;Meta推新语言模型Toolformer丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 腾讯云联合中国联通宁夏、福建分公司发布5G远程驾驶云 4月28日&#xff0c;在第六届数字中国建设峰会上&#xff0c;腾讯云携手中国联通宁夏、福建两省区分公司&#xff0c;首次对外发布了“基于闽宁云的5G远程…

互联网晚报 | 一季度全国居民人均可支配收入10870元;郑渊洁称维权艰难将不再发表作品;苹果版余额宝上线,年利率4.15%...

国家统计局&#xff1a;一季度全国居民人均可支配收入10870元&#xff0c;比上年同期名义增长5.1% 据国家统计局官网&#xff0c;一季度&#xff0c;全国居民人均可支配收入10870元&#xff0c;比上年同期名义增长5.1%&#xff0c;扣除价格因素&#xff0c;实际增长3.8%。分城乡…

世界上首条主要为互联网服务的海底光缆开通 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 3 月 7 日&#xff0c;在 1765 年的今天&#xff0c;法国发明家约瑟夫涅普斯&#xff08;Joseph Niepce&#xff09;出生。涅普斯是拍摄了现存最早照片的人&…

​阿里辟谣在新加坡建全球总部;​马斯克盛赞中国竞争对手:最努力最聪明;​GitHub 官宣用户破亿|极客头条...

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…