TCGA_联合GTEx分析2_查看批次效应

在 TCGA_联合GTEx分析1_得到表达矩阵.tpm_老实人谢耳朵的博客-CSDN博客 中,获取了TCGA和GTEx中样本的表达矩阵数据,数据格式均为tpm。本文对二者进行合并后,通过PCA分析、绘制内参箱线图等方法,查看是否存在批次效应。

关于批次效应的说明,可参看 批次效应(Batch effect)解读

一、数据准备

1 合并后的表达矩阵 

exp_tcga.tpm <- read.csv(file = "exp_tcga.tpm.csv", header=T, row.names=1,check.names=FALSE)
exp_gtex.tpm <- read.csv(file = "exp_gtex.tpm.csv", header=T, row.names=1,check.names=FALSE)t_index=intersect(rownames(exp_gtex.tpm),rownames(exp_tcga.tpm))
exp_m = cbind(exp_tcga.tpm[t_index,],exp_gtex.tpm[t_index,])
rm(exp_tcga.tpm,exp_gtex.tpm)

View(exp_tcga.tpm) 

包括500个TP,52个NT

View(exp_gtex.tpm)

包括100个NT

View(exp_m)

2 分组信息

group = ifelse(colnames(exp_m[,1:552]) %in% t_dataSmTP,'tcgaTP','tcgaNT')
group = c(group,rep('gtexNT',ncol(exp_m)-length(group)))
barcode=colnames(exp_m)design = data.frame('Barcode'=barcode,'Group'=group)

View(design)

 

二、 主成分分析(Principal Component Analysis)查看批次效应

R语言如何绘制PCA图(四)_心有灵犀啦的博客-CSDN博客_r语言绘制pca图

PCA分析是查看批次效应的最佳方式,如果样本明显按照批次聚类,说明存在批次效应。 

library(ggplot2)
library(ggbiplot)

1 数据准备——转置矩阵

exp_m_t=as.data.frame(t(exp_m))

主成分分析,绘制的总是“行变量”的聚类图,因为想看的是barcode的聚类而不是基因的聚类,所以进行转置,使barcode转成行变量。

View(exp_m_t)

 2 PCA分析

pca_result <- prcomp(exp_m_t,scale=T)  # 一个逻辑值,指示在进行分析之前是否应该将变量缩放到具有单位方差ggbiplot(pca_result, var.axes=F,            # 是否为变量画箭头obs.scale = 1,         # 横纵比例 groups = design$Group, # 添加分组信息,将按指定的分组信息上色ellipse = T,           # 是否围绕分组画椭圆circle = F) +
ggtitle('PCAplot_tcga&gtex') +
xlim(-100, 200) + ylim(-200, 100) #限制横纵轴范围

PCA图中,tcgaNT 和 gtexNT 明显分为两个亚群,表明存在较强的批次效应。

 

三、 内参表达箱线图查看批次效应

library(ggplot2)
library(reshape2)

1 数据准备——构造 exp_Reshape 用于绘制箱线图

exp_R = melt(as.matrix(log2(exp_m+1)))     #melt()的输入必须为matrix,得到的exp_R为dataframe
colnames(exp_R) = c('Gene','Barcode','Value')
exp_R$Group = rep(group,each=nrow(exp_m))

View(exp_R)

 

2 ggplot2绘图

gene='All_gene'p_allgene = ggplot(exp_R,aes(x=Group, y=Value,fill=Group)) + #fill进行颜色填充geom_boxplot() +stat_summary(fun="mean",geom="point",shape=23, size=4,fill="white") + #添加均值点ggtitle(paste0('Expression of ',gene)) +xlab('Group') + ylab('log2(tpm+1)') + #x轴y轴标签ylim(0, 5)
p_allgene

 所有样本 All_genes 表达量的平均值

 

 

gene='ACTB'p_actb = ggplot(exp_R[exp_R$Gene==gene,],aes(x=Group, y=Value,fill=Group)) + #fill进行颜色填充geom_boxplot() +stat_summary(fun="mean",geom="point",shape=23, size=4,fill="white") + #添加均值点ggtitle(paste0('Expression of ',gene)) +xlab('Group') + ylab('log2(tpm+1)') + #x轴y轴标签ylim(10, 15)
p_actb

 所有样本 ACTB 表达量的平均值  

 

 

gene='RPLP0'p_rplp0 = ggplot(exp_R[exp_R$Gene==gene,],aes(x=Group, y=Value,fill=Group)) + #fill进行颜色填充geom_boxplot() +stat_summary(fun="mean",geom="point",shape=23, size=4,fill="white") + #添加均值点ggtitle(paste0('Expression of ',gene)) +xlab('Group') + ylab('log2(tpm+1)') + #x轴y轴标签ylim(7, 12)
p_rplp0

 所有样本 RPLP0 表达量的平均值   

 

从内参表达箱线图中,不太容易看出批次效应。 All_genes图中批次效应明显一些。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32766.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

提取TCGA 中体细胞突变数据的表达矩阵

#因为之前的命令调用GDCquery_Maf 发现用不了 #故找到了一些其他的方法&#xff0c;并且自己试着将其弄成了一个表达矩阵。 #代码如下 #1、下载加载相应的包 install.packages("pacman") library(pacman) p_load(TCGAbiolinks,DT,tidyverse) BiocManager::insta…

chatgpt赋能python:Python抢票的绝招

Python 抢票的绝招 随着互联网技术的不断发展&#xff0c;越来越多的人开始享受网购的便利。但是&#xff0c;随着一些热门事件的到来&#xff0c;如演唱会、体育比赛等&#xff0c;大家面临同一个问题&#xff1a;如何抢到热门事件的门票&#xff1f;这时&#xff0c;Python …

CSDN问答

近期AI成为热点话题&#xff0c; ChatGPT&#xff0c; GPT4&#xff0c; new bing&#xff0c; Bard&#xff0c;AI 绘画&#xff0c; AI 编程工具引发大量讨论。请结合自身学习经历&#xff0c;一起来聊聊你对 AI 技术以及其今后发展的看法吧。请在下面的问题中选择一些来回答…

起名源码PHP(宝宝取名源码)

起名源码有助于更好的借助八字风水来帮助起名的需求&#xff0c;其参考了一部中国古代经典文本易经。以这种方式咨询的过程包括通过随机生成的方法确定卦&#xff0c;然后阅读与该卦相关的文本。      演示&#xff1a;m.appwin.top      部分源码&#xff1a;texts.py…

携程英语口语测验题目

携程入职前会有两个测验&#xff1a;CATA能力测验、英语测验&#xff08;部分岗位可能没有英语测验&#xff09; 这两个测验通过&#xff0c;方可进入下面流程&#xff0c;所有这两个测验一定要引起重视&#xff1b; 题型分布 携程英语测验 题型攻略 携程英语测验 总共六部分…

Ubuntu软件安装新选择—星火应用商店(QQ、微信等一网打尽)

Ubuntu软件安装新选择—星火应用商店&#xff08;QQ、微信等一网打尽&#xff09; 1. 星火应用商店介绍2. 下载安装星火应用商店3. 使用星火应用商店安装软件4. 使用星火应用商店更新软件5. 日常软件推荐6. 星火应用商店交流群 1. 星火应用商店介绍 官网地址 http://spark-app…

学生信息后台管理系统(GUI)

一、目的 通过制作学生信息后台管理系统熟悉java中JDBC和CUI(图形用户接口)的使用。 二、实验工具 1.Eclipse IDE Version: 2020-12 (4.18.0) 2.mysql 3.Navicat Premium 15(数据库管理工具) 4.WindowBuilder(java图形用户界面插件) 具体下载和使用可以参考以下链接: 下…

数影周报:SpaceX设计图纸被泄露,拍明芯城正式在纳斯达克上市

本周看点&#xff1a;LockBit勒索软件团伙扬言泄露SpaceX设计图纸&#xff1b;亚马逊宣布将停止 Kindle Newsstand 服务&#xff1b;“拍明芯城”正式在纳斯达克上市...... 数据安全那些事 LockBit勒索软件团伙扬言泄露SpaceX设计图纸 近日&#xff0c;勒索软件组织LockBit给埃…

小米汽车设计图纸泄露,官方称非最终文件;微软裁员遣散费高达8亿美元,人均获赔54万元;苹果暂停自研Wi-Fi芯片|极客头条...

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…

为什么要使用低代码 – 前端角度的思考

为什么要使用低代码 – 前端角度的思考 文章目录 为什么要使用低代码 – 前端角度的思考当前前端发展现状低代码的热潮已经掀起千层浪UI工程师常常面临一些令人尴尬的场景低代码化解场景思路低代码对于外包型企业或软件研发企业在前端有什么优势呢&#xff1f;这里简单列举三点…

《互联网大厂推荐算法实战》上线啦!

为什么是“上线”而非“出版”&#xff1f; 你没眼花&#xff0c;我也没写错&#xff0c;是“上线”而非“出版”&#xff0c;个中原因&#xff0c;请容我慢慢道来。如果你对八卦不感兴趣&#xff0c;可以直接跳到本文的第2部分&#xff0c;看看我给出的“你需要读这本书”的理…

石塔西的《互联网大厂推荐算法实战》上线啦!

PS&#xff1a;史塔西的文章还是很有质量的&#xff0c;成体系的内容输出更是有质量保障&#xff0c;感兴趣的可以关注下&#xff08;感觉好像我也得努力下了&#xff0c;数据与广告系列还没有完&#xff0c;也给自己加个油&#xff09;。 为什么是“上线”而非“出版”&#x…

在中国月收入1万是什么水平?今天这两个热搜很多人都有话说!

上一篇&#xff1a;阿里版 ChatGPT已进入测试&#xff01;中文聊天截图曝光&#xff0c;达摩院出品 今天一早一个热搜引发网友热议——#在中国月收入1万是个什么样的水平#。 之后&#xff0c;又有一个话题词紧跟其后上了热搜——#很体面但工资不高的工作#。 你觉得多少月薪能满…

解决:将Ubuntu系统打包成ios镜像并制作U盘系统

将Ubuntu系统打包成ios镜像并制作U盘系统 一、安装 Systemback二、将创建的.sblive镜像文件转为.iso格式三、写入U盘进行安装四、制作系统U盘 一、安装 Systemback Currently supported Ubuntu releases: - 14.04.X LTS - 15.04 - 15.10 - 16.04.X LTS - 16.10Systemback的作者…

一些国内镜像 快速源

maven 阿里云仓库&#xff1a; <repositories><repository><id>nexus-aliyun</id><name>nexus-aliyun Repository</name><url>http://maven.aliyun.com/nexus/content/groups/public/</url><releases><enabled>tr…

MaaS来临,SaaS进入「奇点」时刻|产业深度

大模型热度持续发酵。MaaS的到来&#xff0c;不仅改变了云厂商的竞争格局&#xff0c;SaaS行业也将迎来「奇点」时刻。未来十年&#xff0c;基于MaaS底座&#xff0c;国内SaaS甚至可能会出现Salesforce一样的巨头。 作者|思杭 编辑|皮爷 出品|产业家 大模型热度正在持续发酵。…

GPT-4老板:AI可能会杀死人类,已经出现我们无法解释的推理能力

来源: 量子位 微信号&#xff1a;QbitAI “AI确实可能杀死人类。” 这话并非危言耸听&#xff0c;而是OpenAI CEO奥特曼的最新观点。 而这番观点&#xff0c;是奥特曼在与MIT研究科学家Lex Fridman长达2小时的对话中透露。 不仅如此&#xff0c;奥特曼谈及了近期围绕ChatGPT…

在疯狂三月之后,深入浅出分析AIGC的核心价值 (上篇)|【AI行研商业价值分析】

Rocky Ding WeThinkIn 写在前面 【AI行研&商业价值分析】栏目专注于分享AI行业中最新热点/风口的思考与判断。也欢迎大家提出宝贵的优化建议&#xff0c;一起交流学习&#x1f4aa; 大家好&#xff0c;我是Rocky。 2023年3月21日&#xff0c;微软创始人比尔盖茨在其博客文…

OpenAI CEO:AI可能会杀死人类,已经出现我们无法解释的推理能力

来源&#xff1a;量子位 | 公众号 QbitAI “AI确实可能杀死人类。” 这话并非危言耸听&#xff0c;而是OpenAI CEO奥特曼的最新观点。 而这番观点&#xff0c;是奥特曼在与MIT研究科学家Lex Fridman长达2小时的对话中透露。 不仅如此&#xff0c;奥特曼谈及了近期围绕ChatGPT产…

拥抱数字时代 | 第十六届中国大数据技术大会成功举办

2月26日&#xff0c;由中国计算机学会&#xff08;CCF&#xff09;主办&#xff0c;苏州市吴江区人民政府支持&#xff0c;CCF大数据专家委员会、苏州市吴江区工信局、吴江区东太湖度假区管理办公室、苏州市吴江区科技局、苏州大学未来科学与工程学院、DataFountain数联众创承办…