文章目录
- 介绍
- 加载R包
- 导入数据
- 消除测序深度影响
- 评估细胞周期的影响
- 识别高度可变的特征
- 缩放数据
- 降维聚类
- 输出结果
- 总结
介绍
scRNA-seq的标准化是一个重要的预处理步骤,目的是消除技术变异(比如比如测序深度和基因长度等因素),使基因表达和/或样本之间的比较更加可靠。标准化方法可以是简单的全局缩放和统一转换,也可以是更复杂的基于每个基因的校正。重要的是要认识到不同方法可能适用于不同的数据集和研究目标,并且了解这些方法的假设和局限性对于正确解释结果至关重要。
-
**标准化(scaling)**的第一步是将每个UMI(唯一分子标识符)计数乘以一个特定于细胞的因子,以使所有细胞具有相同的UMI计数。我们为什么要这样做?不同的细胞含有不同量的mRNA;这可能是由于细胞类型之间的差异,或者是同一细胞类型内由于一滴中的化学作用效果与另一滴不同而产生的变化。在任何情况下,我们都不关心比较这些细胞之间的绝对计数。相反,我们感兴趣的是比较浓度,而缩放有助于实现这一点。
-
下一步是转换(Transformation),简单的转换是对每个单独测量应用相同函数的方法。常见的例子包括对数转换(在原始Seurat工作流程中应