Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~

1写在前面

医院天天叫我们填问卷,我真是不能理解。🫠

动不动就问我们对医院的福利满意吗,对自己的收入满意吗,觉不觉得工作负荷太重了???🙂

我们满不满意,觉不觉得累,医院心里没点数吗!?~~~🤒

不能再说了,再说我的号就要被河蟹掉了。🥸

今天的教程是相对比较基础的了,分享一下我处理Expression matrix时经常遇到的一个小问题,就是重复基因名或者探针名的问题。🤪

这个问题的处理起来也简单也复杂,你可以随机取一个,可以都去掉,可以取最大值,可以取均值,仁者见仁,智者见智吧。🧐

接着是今天的正文,盘点一下我个人常用的几种处理重复基因的方法!~🥳

2用到的包

rm(list = ls())
library(tidyverse)
library(limma)
library(IOBR)

3示例数据

今天是随机生成的数据,20个样本,30个基因。🙃

set.seed(123456)

exprSet <- matrix(runif(600, 1, 10), ncol= 20)

colnames(exprSet) <- paste0("Sample",1:20)

genes <- paste0("Gene", sample(LETTERS, 30, replace=T))

exprSet <- data.frame(genes,exprSet)

DT::datatable(exprSet)
alt

看一下有几个重复的基因吧,10个。😘

table(duplicated(exprSet$genes))
alt

4方法一(取高值)

这里需要注意一下哦,对于相同的基因,应该挑选行平均值大的一整行,而不应该打乱。🥳

index <- order(rowMeans(exprSet[,-1]),decreasing = T)

exprSet_ordered <- exprSet[index,]

keep <- !duplicated(exprSet_ordered$genes)

exprSet_max <- exprSet_ordered[keep,]

DT::datatable(exprSet_max)
alt

再看一下重复的基因去掉了没有,好的,任务完成。😙

table(duplicated(exprSet_max$genes))
alt

5方法二(取均值)

5.1 aggregate函数法

exprSet_mean <- aggregate(.~genes, mean, data = exprSet)

DT::datatable(exprSet_mean)
alt

table(duplicated(exprSet_mean$genes))
alt

5.2 avereps函数法

exprSet_avereps <-  avereps(exprSet,ID = exprSet$genes) %>% 
as.data.frame()

DT::datatable(exprSet_avereps)
alt

table(duplicated(exprSet_avereps$genes))
alt

6方法三(IOBR包)

最后介绍一下IOBR包的remove_duplicate_genes()函数,非常好用!~🤓

虽然这里method写的是mean,但实际上是挑选了平均值最大的一行,我个人也是比较喜欢这种方法。🤨

exprSet_IOBR_mean <- remove_duplicate_genes(exprSet, column_of_symbol = "genes", method = "mean")

DT::datatable(exprSet_IOBR_mean)
alt

table(duplicated(rownames(exprSet_IOBR_mean)))
alt

alt
最后祝大家早日不卷!~

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

📍 往期精彩

📍 🤣 chatPDF | 别再自己读文献了!让chatGPT来帮你读吧!~
📍 🤩 WGCNA | 值得你深入学习的生信分析方法!~
📍 🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!
📍 🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/45213.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生信分析案例 Python简明教程 | 视频14

开源生信 Python教程 生信专用简明 Python 文字和视频教程 源码在&#xff1a;https://github.com/Tong-Chen/Bioinfo_course_python 目录 背景介绍 编程开篇为什么学习Python如何安装Python如何运行Python命令和脚本使用什么编辑器写Python脚本Python程序事例Python基本语法 数…

“去高精地图”跟“轻高精地图”有啥区别?落地的挑战又是啥? | 九章自动驾驶随笔之一...

交流群 | 进“传感器群/滑板底盘群/汽车基础软件群/域控制器群”请扫描文末二维码&#xff0c;添加九章小助手&#xff0c;务必备注交流群名称 真实姓名 公司 职位&#xff08;不备注无法通过好友验证&#xff09; 编辑 | 苏清涛 真正影响Mapless技术路线落地的最大难点在于…

登录微软账号的Windows电脑如何远程?

一般情况下&#xff0c;我们都使用的是Windows电脑的本地账户。但是随着Windows 10的推广&#xff0c;现在微软也开始主推微软账号登录Windows电脑了。 现在遇到一个问题&#xff0c;就是远程Windows电脑时&#xff0c;提示连接不上&#xff0c;刚开始以为是远程服务没有开&am…

win10微软商店/账号登录一直转圈

解决win10登录微软账户或者微软商店时无法登录问题&#xff1a; 1.右键wifi按钮&#xff0c;打开“网络和Internet”设置。 2.更改适配器选项 3.右键当前的网络连接&#xff0c;选择“属性” 4.找到IPv4一项&#xff0c;点击“属性”按钮 5.自定义DNS服务器地址&#xf…

微软账户登录不了问题

问题描述: 为了使用newbing需要登录微软账号&#xff0c;但是公司电脑访问微软账号十分的慢&#xff0c;一登录就转圈。 问题原因&#xff1a; 和宽带采用的上网方式&#xff08;IPV4和IPV6&#xff09;和dns解析有关系由于国内基本都采用IPV4的方式&#xff0c;下文对IPV4的…

我让ChatGPT写了一篇php现状和趋势的文章

我给出的指令是&#xff1a; 写一篇介绍php的2023年现状和未来趋势的文章 下面是ChatGPT返回的结果&#xff1a; 2023年PHP&#xff1a;现状和未来趋势 编程语言PHP于1994年开发&#xff0c;并从此成为世界上使用最广泛的语言之一。它用于创建动态网站&#xff0c;是web开发世界…

ChatGPT “火出圈” 测试工程师的饭碗还能保住吗

ChatGPT已经在国内火了一个多月了&#xff0c; 这个让AI巨头神仙打架的智能对话机器人 到底火到了什么程度&#xff1f; 随处可见的经验分享&#xff1a;ChatGPT让我一天之内学会技能&#xff01; 到处传播的社会新闻&#xff1a;某岗位又被ChatGPT给干失业了&#xff01; …

没想ChatGPT两个月用户破亿的世界记录,这么快就被打破了!5天!

上线第一天&#xff0c;用户超3000万&#xff0c;上线后5天&#xff0c;用户破1亿&#xff0c;Threads无疑创造了技术产品用户数破亿的新纪录&#xff0c;而前记录还是今年ChatGPT创下的2个月。 Threads创造了有史以来最快的用户破亿纪录(来源&#xff1a;World Of Statistics …

VScode终端插件

Terminal 使用方法 安装Terminal&#xff0c;在VScode编辑器里的项目文件中【右键】 → 【open in Integrated Terminal】即可。 你会看到如图所示的终端&#xff0c;它等同于cmd&#xff0c;可以很方便的在VScode中实时查看。

【Vscode】隐藏的端口转发功能,大多数人都不知道怎么用

引言 Python 编程中有两款 IDE 深受广大开发者的喜爱&#xff0c;一是微软出品的 Vscode&#xff0c;以小巧、轻量、插件丰富而闻名&#xff0c;另一款则是大名鼎鼎的专为 Python 编程而打造的 Pycharm。这两款工具各有优缺点&#xff0c;这里不吹不黑&#xff0c;在博主看来&…

关闭vscode烦人的提示框

vscode有两种烦人的提示框&#xff1a; 第一种是&#xff1a;鼠标放到html标签上的悬浮提示框&#xff0c;如图&#xff1a; 第二种是&#xff1a;输入的时候有悬浮窗&#xff0c;并不是智能提示的框&#xff0c;而是解释型的提示框&#xff0c;如图&#xff1a; 这两种框基本…

vscode屏蔽文件

1. 基于工程“uboot-imx-rel_imx_4.1.15_2.1.0_ga”. 2.方法一 2.1&#xff09;shiftP快捷键&#xff0c;输入“settings”,打开settings.json文件 2.2&#xff09;输入以下代码&#xff0c;即可对configs文件夹指定的内容进行屏蔽 "files.exclude": {"configs/…

VsCode文件屏蔽

在分析uboot源码时&#xff0c;许多文件都不需要&#xff0c;要将该文件的目录屏蔽并且设置搜索范围 在工程目录下&#xff0c;建立.vscode文件夹&#xff0c;在.vscode 文件夹中新建settings.json的文件&#xff0c;然后在 settings.json 中输入如下内容&#xff1a; {"…

【vscode】代码调试时直接显示在vscode终端,而不弹出新的终端

tasks.json文件修改&#xff0c;加入语句&#xff1a; "presentation": {"panel": "shared"}launch.json文件修改&#xff0c;加入语句&#xff1a; // 调试时是否显示控制台窗口&#xff0c;设置为true则显示在新的windows终端控制台 "e…

vscode运行C/C++不弹出黑色终端解决办法

1.首先打开扩展(CtrlShiftX) 2.选择C/C Compile Run 3.点击管理-->扩展管理 4.勾选以下选择框 5.按F6实现终端页面弹出

文心一言 vs GPT-4实测!百度背水一战!

编辑部 发自 凹非寺 量子位 | 公众号 QbitAI GPT-4发布一天之后&#xff0c;压力全部给到百度这边。 就在刚刚&#xff0c;百度交卷。 文心一言&#xff0c;百度全新一代知识增强大语言模型&#xff0c;正式在百度总部“挥手点江山”会议室里发布。 在一片静寂的氛围里&#xf…

Adept AI,颠覆“产品学“的产品

1.三体降临&#xff0c;产品学不存在了&#xff1f; 兄弟们&#xff0c;你们敢想象以后我们都会有用自己的贾维斯吗&#xff1f;我们不需要在安装一大堆APP&#xff0c;不需要适应各种APP交互&#xff0c;只需一句话你能快速达到你想要的目的吗&#xff1f;你能想象那种科幻大…

实测:文心一言 vs GPT-4

转自&#xff1a;量子位 | 公众号 QbitAI GPT-4发布一天之后&#xff0c;压力全部给到百度这边。 就在刚刚&#xff0c;百度交卷。 文心一言&#xff0c;百度全新一代知识增强大语言模型&#xff0c;正式在百度总部“挥手点江山”会议室里发布。 在一片静寂的氛围里&#xff0c…

Stata回归结果输出

1. 问题 在实证分析中&#xff0c;我们经常需要在模型中加入行业虚拟变量、年度虚拟变量等&#xff0c;以便控制不可观测的行业个体效应或年度个体效应。然而&#xff0c;在正式报告结果时&#xff0c;我们无需报告这些虚拟变量的系数&#xff0c;否则结果表格会变得非常冗长。…

Stata:用交互项做分组回归,结果如何分析

这是来自&#xff1a;纪洋,王旭,谭语嫣,黄益平.经济政策不确定性、政府隐性担保与企业杠杆率分化[J].经济学(季刊),2018,17(02):449-470.的部分结果。 分析交互性结果&#xff1a;就看&#xff08;1&#xff09;就行。 基准回归系数是0.036&#xff1b;而交互性系数 为-0.058…