自测scRNA-Seq+scWGBS=3分三区文章?

写在前面

最近在捣鼓表观遗传学,处理了一批Bulk RNA-Seq和WGBS(Whole Genome Bisulfite Sequencing)的数据。熟悉我风格的粉丝都知道,我一般会读几篇文献再下手,遂于PubMed中检索了几篇文章,发现一个2022年发表的题为"WGBS combined with RNA-seq analysis revealed that Dnmt1 affects the methylation modification and gene expression changes during mouse oocyte vitrification"似乎能给我带来一些分析思路上的启示,一读摘要,其中赫然写着scRNA-Seq(single cell RNA sequencing)和scWGBS(single cell whole genome bisulphite),但是一看<>期刊的影响因子才2.92,在生物类分区里属第三区,这文章必有蹊跷,值得一读。

具体内容

生殖医学的内容不是我们研究的重点,此处不作介绍,简单来说现在有一种玻璃化(vitrification)冻存法可用于低温冻存卵母细胞,利用这种方法保存的卵母细胞虽然存活率和受精能力已经较传统方法大大提升。但与新鲜的卵母细胞仍存在差异,而此前的研究发现二者之间在转录组水平与基因组甲基化水平上差异甚微(Introduction是这么说的),作者遂著此文。
点进来之前我是很好奇的,我的记忆中卵母细胞体积较大,并且即便使用一些雌激素促进超数排卵,也不能够获得足够的细胞数量,所以理应不太适合做单细胞水平的建库。我们来看看Methods,作者通过对6-8周龄的ICR小鼠使用PMSG、HCG促进排卵后,获取了117个卵母细胞用于玻璃化冻存与复苏。scRNA-Seq方面,作者依托的技术是SMART-Seq2,而WGBS方面似乎是直接将细胞裂解用于DNA提取并经重亚硫酸盐处理后直接走Illumina的建库流程。具体内容还需要通过Results来了解一下。在经过基本的数据处理后作者对WGBS获得的甲基化评分与SMART-Seq2的log2(normalized counts)分别进行了各样本的相关性分析(A-B)与UMAP降维分析©,初步证明了组内的一致性与组间的异质性。但是我有一个小小的疑惑,说好的SMART-Seq和scWGBS呢?为何这些图看起来都是以生物学重复为基本单位而不是单细胞水平展现的。相关性分析以生物学重复为单位尚可理解,UMAP图不以单细胞为分辨率作展示就很奇怪了。

与此同时,作者发现与以往的报道不同,玻璃化冻存的卵母细胞(A组)与新鲜的卵母细胞(B组)之间不仅存在转录组水平基因表达量与基因组水平甲基化评分的差异(玻璃化冻存后的卵母细胞基因甲基化水平整体降低),在基因的各个区域中,intergenic、intron、promoter中也展示出了极显著的差异。

此后作者对比了甲基化程度高低区域的序列长度,发现高甲基化序列的DMR(differentialy methlyated regions)长度更短(A),且包含的DMR区域更少(B)。这里我稍微有些疑惑,难道不是应该比较组间的DMR分布差异或甲基化区域长度差异,为何做起了高甲基化区域与低甲基化区域的对比?

接下来作者进行了转录组的差异分析(A-B),发现下调(对比是Vitrified vs Fresh,这里为什么又换回组间差异分析了,这不就和上面的甲基化分析对不上号了吗)的基因数量要远多于上调的基因,这里我也有个小小的疑惑,一般来说甲基化水平的上升不利于基因的表达,为何Vitrified组甲基化水平降低了,总体的差异基因确实下调的。随后的GO富集分析显示A组(就是Vitrified组,一张图一个说法,无力吐槽)下调的基因主要富集在mitochondrial organization、ATP metabolic process等能量代谢相关通路,上调的基因主要富集在histone H2A monoubiquitination、histone monoubiquitination、endoplasmic reticulum tubular metwork等染色质、细胞质结构相关的通路。

此后作者展开了甲基化数据的组间差异研究,发现雌鼠的20条染色体上均有不同数量的DMR分布(A)。在包含的1285个DMR中大都属于非基因编码区域,仅97个DMR坐落在RNA-Seq差异基因的启动子或基因编码区域(B)。这97个基因中的上调基因富集于cell-cell adhesion mediated by integin、regulation of presynaptic cytosolic calciumion concentration、lipoprotein等通路,下调基因富集于cellular responses to gonadotropic stimulus、follicle stimulating hormone通路©。之后作者关注了几种与甲基化形成相关的酶在组间(E)以及高低甲基化样本中的表达量差异,组间差异仅Dnmt1具有显著的差异,在A组(即Vitrified组)中明显下调。这是一种既能维持DNA原有的甲基化水平(具甲基转移活性)、又能对DNA进行从头甲基化的酶,这能在一定程度上解释Vitrified组整体甲基化水平下调的现象。

此后作者通过SCENIC的转录因子预测(这一工具的教程我们后续会出)发现Dnmt1具有531个下游基因,而Kcnq1ot1(很好奇这个基因又是从哪来的)可作为51个转录因子的下游基因(A)。这两种基因的相关基因集也被用于富集分析(B-C)。

紧接着作者又展示了Dnmt1Kcnq1ot1相关DMR在基因不同区域由甲基化程度高低带来的数量差异(D)。随后由展示了两组间与Dnmt1与Kcnq1ot1所属regulon的差异基因(E),这里我又有一点小小的疑惑,Kcnq1ot1为何又不见了

随后作者做了在我看来唯一与其研究目的相符的分析——卵母细胞相关(D)及受精能力相关基因(E)的表达量组间差异,发现这些相关基因均在Virified组中下调,所以导致了Virified组受精能力与胚胎发育能力的减弱(啊这不是写文章前就知道的麽。。。)。

聊聊读后感

在看完摘要之后我是抱着替作者打抱不平的心态阅读全文的,毕竟做了6个样本的SMART-Seq和WGBS,费用肯定是在数十万元这个档次的,发表一篇三分不到的文章显然有些不值。但是读完之后我仿佛明白了很多事情,我无德无能,但是让我站在事后诸葛的角度来评价的话,我觉得这篇文章有以下问题/需要修改的地方:

1、说是单细胞水平的转录组测序,但是分析过程完全没体现出单细胞分辨率下的任何分析内容,包括SCENIC其实可以绘制AUCell score的UMAP图或AUC曲线,这些都是可以丰富文章内容的点,但完全没有任何展示。而甲基化部分的内容也声称为scWGBS,但分析结果看起来也都与bulk一致。感兴趣的同学可以下载原始数据看一看,如果这篇文章的测序真的是在单细胞水平下完成的,建议展示一些单细胞分辨率的分析,不要自降身段。

2、可能是我的问题,我不是很理解为何要做高甲基化区域与低甲基化区域DMR数量、长度的对比,我认为最主要的差异分析应该为vitrified与fresh组间差异分析

3、该文的图注中一会A组一会B组,一会vitrified vs fresh,建议全文统一,否则读者读起来真的很累。

4、对于作者研究内容的生物学意义而言,应当在文章伊始就找出与卵母细胞受精与胚胎发育相关基因的表达量与甲基化水平组间差异,后文围绕这些基因进一步寻找上下游调控基因进行讨论。而不是像文章那样以卵母细胞受精与胚胎发育相关基因的讨论作为结尾,这导致作者给出的结论几乎是其他文章中已报道过的表象,有种听君一席话、就是一席话的感觉。

5、Kcnq1ot1基因一会出现、一会消失,不知所云。

6、如果有条件的话可以对关键基因做一些QPCR或焦磷酸测序(其他一代测序也可以),相比于本文涉及到的各个组学,这些实验成本都不高,并且容易完成。

7、一模一样的作者声明居然重复了两次,这就没办法吐槽了,不知道是作者的锅还是编辑的锅:

如何联系我们

公众号后台消息更新不及时,超过48h便不允许回复读者消息,这里给大家留一下领取资料、免费服务器的微信号,方便各位随时交流、提建议(科研任务繁重,回复不及时请见谅)。此外呼声一直很高的交流群也建好了,欢迎大家入群讨论:永久免费的千人生信、科研交流群

大家可以阅读完这几篇之后添加
给生信入门初学者的小贴士
如何搜索公众号过往发布内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/112620.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么JVM调优一般都是针对堆内存的,以及堆内存的设置对GC的影响

1、为什么JVM调优一般都是针对堆内存的&#xff1f; 首先JVM的四部分组成&#xff1a;ClassLoader&#xff08;类装载器&#xff09;、Runtime data area 运行数据区、Execution Engine 执行引擎、Native Interface 本地接口。 其中运行数据区&#xff08;Runtime Data Area&am…

python-数据可视化-下载数据-CSV文件格式

数据以两种常见格式存储&#xff1a;CSV和JSON CSV文件格式 comma-separated values import csv filename sitka_weather_07-2018_simple.csv with open(filename) as f:reader csv.reader(f)header_row next(reader)print(header_row) # [USW00025333, SITKA AIRPORT, A…

零知识证明(zk-SNARK)(一)

全称为 Zero-Knowledge Succinct Non-Interactive Argument of Knowledge&#xff0c;简洁非交互式零知识证明&#xff0c;简洁性使得运行该协议时&#xff0c;即便statement非常大&#xff0c;它的proof大小也仅有几百个bytes&#xff0c;并且验证一个proof的时间可以达到毫秒…

C++进阶之继承

继承 继承的概念及定义基类和派生类对象赋值转换继承中的作用域派生类的默认成员函数继承与友元继承与静态成员复杂的菱形继承及菱形虚拟继承继承的总结和反思 继承的概念及定义 在C中&#xff0c;继承是一种面向对象编程的重要概念&#xff0c;它允许一个类&#xff08;称为子…

java-初识Servlet,Tomcat,JDBC

文章目录 前言一、ServletServlet 生命周期Servlet 实例Servlet 过滤器 二、TomcatJDBCJDBC连接数据库实例 总结 前言 java入门须知的重要概念/名词/技术 等 一、Servlet Servlet是Java Web开发中的一个核心组件&#xff0c;它是基于Java语言编写的服务器端程序&#xff0c;…

火热的大模型AIGC对数据中心存储趋势有什么影响?

随着人工智能和大数据技术的不断发展&#xff0c;业内AIGC&#xff08;人工智能、图形处理和云计算&#xff09;和大模型的发展趋势正在对数据中心存储发展方向产生深远的影响&#xff0c;主要集中对数据量和高性能计算的诉求。 大模型的普及要求数据中心存储具备更大的容量。大…

基于Googlenet深度学习网络的螺丝瑕疵检测matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 ....................................................................................% 获…

踏进字节的那一瞬间,我泪目了,这457天的外包经历值了....

一年半吗&#xff1f;我只记得437个日日夜夜 没有绝对的天才&#xff0c;只有持续不断的付出。对于我们每一个平凡人来说&#xff0c;改变命运只能依靠努力幸运&#xff0c;但如果你不够幸运&#xff0c;那就只能拉高努力的占比。 2021年8月&#xff0c;我有幸成为了字节跳动…

C语言面向对象的编程思想

面向对象编程 面向对象编程Object-Oriented Programming&#xff0c;OOP&#xff09; 作为一种新方法&#xff0c;其本质是以建立模型体现出来的抽象思维过程和面向对象的方法。模型是用来反映现实世界中事物特征的。任何一个模型都不可能反映客观事物的一切具体特征&#xff0…

MVC OR DDD

MVC OR DDD 说明&#xff1a;这篇是标题党&#xff0c;不包含相关概念说明 前段时间跟随师兄学习了解了DDD领域驱动模型&#xff0c;觉得这个思想更好&#xff0c;进行下面解析和学习方面的思考和实践&#xff0c;觉得很好&#xff0c;耐心读下去。希望对您有所帮助。 首先&am…

基于ADAU1452 DSP ANC和AEC算法的实现

是否需要申请加入数字音频系统研究开发交流答疑群(课题组)?加我微信hezkz17, 本群提供音频技术答疑服务,+群附加赠送,DSP音频项目核心开发资料, 1 使用Sigma中的NLMS算法模块 对应C源代码:

JavaSE 集合框架及背后的数据结构

目录 1 介绍2 学习的意义2.1 Java 集合框架的优点及作用2.2 笔试及面试题 3 接口 interfaces3.1 基本关系说明3.2 Collection 常用方法说明3.3 Collection 示例3.4 Map 常用方法说明3.5 Map 示例 4 实现 classes5 Java数据结构知识体系5.1 目标5.2 知识点 1 介绍 集合&#xf…

如何自己实现一个丝滑的流程图绘制工具(七)bpmn-js 批量删除、复制节点

背景 希望实现批量删除和复制节点&#xff0c;因为bpmn-js是canvas画的&#xff0c;所以不能像平时页面上的复制一样直接选择范围&#xff0c;会变成移动画布。 思路是&#xff1a; 绘制一个选择的效果框&#xff0c;这样才可以看出来选的节点有哪些。 上面的选中范围框效果…

K8S最新版本集群部署(v1.28) + 容器引擎Docker部署(下)

温故知新 &#x1f4da;第三章 Kubernetes各组件部署&#x1f4d7;安装kubectl&#xff08;可直接跳转到安装kubeadm章节&#xff0c;直接全部安装了&#xff09;&#x1f4d5;下载kubectl安装包&#x1f4d5;执行kubectl安装&#x1f4d5;验证kubectl &#x1f4d7;安装kubead…

Go死码消除

概念: 死码消除(dead code elimination, DCE) 是一种编译器优化技术, 作用是在编译阶段去掉对程序运行结果没有任何影响的代码 和 逃逸分析[1],内联优化[2]并称为 Go编译器执行的三个重要优化 效果: 对于 const.go代码如下: package mainimport "fmt"func max(a, b i…

wireshark过滤器的使用

目录 wiresharkwireshark的基本使用wireshark过滤器的区别 抓包案例 wireshark wireshark的基本使用 抓包采用 wireshark&#xff0c;提取特征时&#xff0c;要对 session 进行过滤&#xff0c;找到关键的stream&#xff0c;这里总结了 wireshark 过滤的基本语法&#xff0c;…

芯科科技宣布推出下一代暨第三代无线开发平台,打造更智能、更高效的物联网

第三代平台中的人工智能/机器学习引擎可将性能提升100倍以上 Simplicity Studio 6软件开发工具包通过新的开发环境将开发人员带向第三代平台 中国&#xff0c;北京 - 2023年8月22日 – 致力于以安全、智能无线连接技术&#xff0c;建立更互联世界的全球领导厂商Silicon Labs&…

java定位问题工具

一、使用 JDK 自带工具查看 JVM 情况 在我的机器上运行 ls 命令&#xff0c;可以看到 JDK 8 提供了非常多的工具或程序&#xff1a; 接下来&#xff0c;我会与你介绍些常用的监控工具。你也可以先通过下面这张图了解下各种工具的基本作用&#xff1a; 为了测试这些工具&#x…

从LeakCanary看内存快照解析

在从LeakCanary看内存快照生成一节中&#xff0c;我们已经了解了hprof的生成&#xff0c;并且将生成的hprof文件通过Android Studio进行解析&#xff0c;确实发现了内存泄漏对象MainActivity&#xff0c;但是在实际开发中&#xff0c;要求开发者自己去手动pull hprof文件进行解…

5.基于多能互补的热电联供型微网优化运行

MATLAB代码链接&#xff1a;基于多能互补的热电联供型微网优化运行 MATLAB代码&#xff1a;基于多能互补的热电联供型微网优化运行 关键词&#xff1a;多能互补 综合需求响应 热电联产 微网 优化调度 参考文档&#xff1a;《基于多能互补的热电联供型微网优化运行》基本完全…