GRN前沿:利用DigNet从scRNA-seq数据中生成基于扩散的基因调控网络

1.论文原名:Diffusion-based generation of gene regulatory network from scRNA-seq data with DigNet

2.出版时间:2024.12.18

3.doi: 10.1101/gr.279551.124

摘要:

基因调控网络(GRN)在细胞内基因的身份和功能之间编码了相互联系,最终塑造了细胞特异性。尽管经过了几十年的努力,从基因表达分析数据中反向工程GRN仍然是一个巨大的挑战,特别是在重建适合精确细胞和遗传环境的细胞特异性GRN方面。为了从数据中替代性地进行网络重建,我们提出了一种离散扩散生成模型,称为DigNet,能够从高通量单细胞RNA测序(scRNA-seq)数据中生成相应的GRN。DigNet将网络生成过程嵌入到具有马尔可夫性质的多步骤恢复过程中。每个中间步骤都有一个特定的模型来恢复一部分基因调控架构。因此,它可以通过独特的多步骤扩散过程确保全局网络结构和调控模块之间的兼容性。此外,通过元细胞整合和非欧几里得离散空间建模,DigNet可以稳健地抵抗scRNA-seq数据的噪声和GRN的稀疏性。与数十种最先进的网络推断方法的基准评估结果表明,DigNet在各种单细胞GRN重建实验中表现出色。此外,DigNet提供了对乳腺癌免疫反应的独特见解,这些见解源于在T细胞中识别的差异基因调控。作为一个开源软件,DigNet为从scRNA-seq数据生成细胞特异性GRN提供了一个强大而有效的工具。

关键词:扩散生成网络模型(DigNet);基因调控网络;非欧图嵌入;乳腺癌生物标志物

DigNet框架

如图 1 所示,DigNet 从 scRNA-seq 数据生成细胞特异性 GRN。总体而言,DigNet 将网络推理任务分解为可逆的、具有马尔可夫性质的多步骤恢复过程,包括特征提取、基于扩散的去噪和反向推理。因此,它允许为每个时间阶段定义一个独特的网络模型,从而增强其以更细粒度辨别和重建网络结构的能力。此外,采用具有自注意力机制的图转换器来学习 scRNA-seq 数据中的复杂数据分布,并解决实验噪声、高维性和可扩展性等挑战(请参阅补充说明 1)。一旦获得完全训练的模型参数,DigNet 可以轻松生成给定任何细胞基因表达谱的 GRN。具体来说,初始阶段涉及优化基因表达数据,以减轻单细胞丢失事件的影响并提高数据质量(图 1A)。随后,DigNet 采用时间步长方法逐步去噪污染的网络,直到实现清洁网络(图 1B)。在训练阶段,DigNet 在“网络污染”和“噪声去除”阶段之间交替进行,直到收敛。DigNet 从随机网络结构开始进行测试,并使用时间步长逐步修正。训练和测试阶段都涉及网络编码和贝叶斯推理过程,这些过程对其性能至关重要(图 1C 和 D)。最后,DigNet 采用集成学习策略来抵消来自随机采样的不稳定性问题(图 1E)。在经过单细胞 GRN 和相应转录组数据训练后,DigNet 可以为新的基因表达谱生成适当的网络,促进各种下游分析任务,如细胞差异基因表达分析和生物标志物发现(图 1F)。

得益于扩散生成框架,DigNet 是少数几个能够直接从 scRNA-seq 数据生成全局网络架构的模型之一(详见补充图 S1A-B 和补充说明 2)。它强调整个架构的整体网络生成过程,特别强调确保全局调控网络结构与基因表达谱之间的兼容性,从而改变理解细胞调控机制的方法。此外,它将传统的单步网络推断范式转变为多步网络生成过程。这使得所提出的方法能够更加关注与基因表达相对应的全局架构中的网络结构的详细动态。此外,网络生成过程的可逆性使 DigNet 能够学习精确的网络架构,这些架构可以灵活应用于重要的反向操作中,强调了其在各种分析环境中的适应性和稳健性。

实验效果

对模拟数据的广泛基准测试证实了DigNet 的效率

DigNet在特定的单细胞中生成可靠的GRN

结论

在本文中,我们介绍了一种名为 DigNet 的网络生成方法,用于从单细胞 RNA 测序(scRNA-seq)数据中推导细胞特异性基因调控网络(GRN)。DigNet 利用贝叶斯推断和图转换器技术,通过迭代优化初始随机网络,构建个体细胞的全面且详细的 GRN。非欧几里得离散扩散建模使 DigNet 能够生成具有丰富结构特征的全局网络架构。同时,渐进式生成过程和可逆性使 DigNet 能够捕捉整个网络中的结构细节,确保生成的网络整体结构与输入的基因表达谱保持一致。DigNet 的独特性可以总结为三个关键方面:使用离散扩散模型从基因表达数据生成 GRN;多时间步扩散技术用于降噪和网络优化;以及与混合模型架构的生成深度学习的整合。通过在不同生物学背景和数据集上的严格基准测试,我们证明了 DigNet 的效率、稳健性和优越性,特别是在再现细胞类型基因调控特异性方面。此外,DigNet 能够从 scRNA-seq 数据中实现单细胞特异性基因调控网络推断,识别导致细胞类型特异性的关键调控网络节点和因果模块。DigNet 引入了一种新颖的 GRN 逆向工程生成网络模型,使其能够通过渐进式去噪过程而非组装孤立的调控信号,以更合适的网络架构响应单细胞基因表达谱。

通过生成模型恢复 GRN 架构提供了一种新颖的逆向工程范式和基因表达数据的替代方案,带来了多重挑战。DigNet 面临的一个关键挑战是,简单的随机采样可能导致同一时间步的输出结果出现轻微变化,这可能会无意中引入由新颖性驱动的重连和不必要的随机性。与常规扩散模型不同,DigNet 没有纳入特定的条件控制器来决定哪些网络更适合,主要是因为缺乏明确的标准或理由来过滤不同细胞环境中的特定网络架构。为解决这一问题,我们的解决方案策略围绕通过统计估计调控事件的概率,通过计算多个网络中调控信号的激活频率来进行,提供了一种简单而有效的学习方法。与其他基于 GNN(图神经网络)的方法相比,DigNet 利用基于扩散模型的生成策略,消除了对预构建初始图的需求(补充说明 9)。这种方法增强了 GRN 推断的适应性和准确性。DigNet 的一个潜在未来发展方向是纳入细胞发育轨迹,以模拟细胞发育过程中的动态 GRN。此外,整合多组学数据(包括基因组序列信息、染色质可及性数据、转录因子活动和蛋白质-蛋白质相互作用网络(Badia-i-Mompel 等人,2023 年))成为提升 DigNet 能力的关键未来方向。通过利用这些多样的多组学数据,我们预见在从复杂数据集中重建动态 GRN 的准确性和精确性将有显著提升。此外,通过这种综合整合,转录因子信息的参与度将大幅提升。有关更详细的扩展和局限性,请参阅补充说明 10。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12191.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AnswerRocket:通过 AI 辅助简化分析

AnswerRocket是一家专注于人工智能驱动数据分析和商业智能的领先企业,其核心产品是一款增强型分析平台,旨在通过自然语言处理(NLP)、机器学习(ML)和生成式AI技术,简化复杂数据的分析过程&#x…

小程序设计和开发:如何研究同类型小程序的优点和不足。

一、确定研究目标和范围 明确研究目的 在开始研究同类型小程序之前,首先需要明确研究的目的。是为了改进自己的小程序设计和开发,还是为了了解市场趋势和用户需求?不同的研究目的会影响研究的方法和重点。例如,如果研究目的是为了…

我的AI工具箱Tauri版-ZoomImageSDXL全图超清放大TILE+SDXL

本教程基于自研的AI工具箱Tauri版进行ComfyUI工作流ZoomImageSDXL全图超清放大TILESDXL。 ZoomImageSDXL全图超清放大TILESDXL 借助ControlNet的Tile技术与SDXL大模型,该工具能够在放大图像的同时,精准还原细节和纹理,确保输出效果既清晰锐利…

Java设计模式:行为型模式→状态模式

Java 状态模式详解 1. 定义 状态模式(State Pattern)是一种行为型设计模式,它允许对象在内部状态改变时改变其行为。状态模式通过将状态需要的行为封装在不同的状态类中,实现对象行为的动态改变。该模式的核心思想是分离不同状态…

蓝桥与力扣刷题(234 回文链表)

题目:给你一个单链表的头节点 head ,请你判断该链表是否为回文链表。如果是,返回 true ;否则,返回 false 。 示例 1: 输入:head [1,2,2,1] 输出:true示例 2: 输入&…

【面经】字节南京一面部分题目记录

南京字节一面题,可能因为项目不太匹配,全程八股比较多,也有两道手撕代码题,强度还是有的。为了方便大家学习,大部分答案由GPT整理,有些题给出了我认为回答比较好的博客链接。 文章目录 一、python2 和 pyth…

【C语言篇】“三子棋”

一、游戏介绍 三子棋,英文名为 Tic - Tac - Toe,是一款简单而经典的棋类游戏。游戏在一个 33 的棋盘上进行,两名玩家轮流在棋盘的空位上放置自己的棋子(通常用 * 和 # 表示),率先在横、竖或斜方向上连成三个…

vscode软件操作界面UI布局@各个功能区域划分及其名称称呼

文章目录 abstract检查用户界面的主要区域官方文档关于UI的介绍 abstract 检查 Visual Studio Code 用户界面 - Training | Microsoft Learn 本质上,Visual Studio Code 是一个代码编辑器,其用户界面和布局与许多其他代码编辑器相似。 界面左侧是用于访…

【B站保姆级视频教程:Jetson配置YOLOv11环境(六)PyTorchTorchvision安装】

Jetson配置YOLOv11环境(6)PyTorch&Torchvision安装 文章目录 1. 安装PyTorch1.1安装依赖项1.2 下载torch wheel 安装包1.3 安装 2. 安装torchvisiion2.1 安装依赖2.2 编译安装torchvision2.2.1 Torchvisiion版本选择2.2.2 下载torchvisiion到Downloa…

于动态规划的启幕之章,借 C++ 笔触绘就算法新篇

注意:代码由易到难 P1216 [IOI 1994] 数字三角形 Number Triangles 题目链接:[IOI 1994] 数字三角形 Number Triangles - 洛谷 题目描述 观察下面的数字金字塔。 写一个程序来查找从最高点到底部任意处结束的路径,使路径经过数字的和最大。每…

分页按钮功能

前言 在前端开发中,分页功能是一个常见的需求,特别是当需要展示大量数据时,它能有效提升用户体验。该文章结合运用了HTML,CSS,JS实现网页的分页按钮功能,并且可以选择每页显示的条数试试更新总页数及显示当…

SAP HCM 回溯分析

最近总有人问回溯问题,今天把12年总结的笔记在这共享下: 12年开这个图的时候总是不明白是什么原理,教程看N次,网上资料找一大堆,就是不明白原理,后来为搞明白逻辑,按照教材的数据一样做&#xf…

gitea - fatal: Authentication failed

文章目录 gitea - fatal: Authentication failed概述run_gitea_on_my_pkm.bat 笔记删除windows凭证管理器中对应的url认证凭证启动gitea服务端的命令行正常用 TortoiseGit 提交代码备注END gitea - fatal: Authentication failed 概述 本地的git归档服务端使用gitea. 原来的用…

X Window System 架构概述

X Window System 架构概述 1. X Server 与 X Client ​ 这里引入一张维基百科的图,在Linux系统中,若用户需要图形化界面,则可以使用X Window System,其使用**Client-Server**架构,并通过网络传输相关信息。 ​ ​ X…

Linux防火墙基础

一、Linux防火墙的状态机制 1.iptables是可以配置有状态的防火墙,其有状态的特点是能够指定并记住发送或者接收信息包所建立的连接状态,其一共有四种状态,分别为established invalid new related。 established:该信息包已建立连接&#x…

[论文学习]Adaptively Perturbed Mirror Descent for Learning in Games

[论文学习]Adaptively Perturbed Mirror Descent for Learning in Games 前言概述前置知识和问题约定单调博弈(monotone game)Nash均衡和Gap函数文章问题定义Mirror Descent 方法评价 前言 文章链接 我们称集合是紧的,则集合满足&#xff1…

Go学习:类型转换需注意的点 以及 类型别名

目录 1. 类型转换 2. 类型别名 1. 类型转换 在从前的学习中,知道布尔bool类型变量只有两种值true或false,C/C、Python、JAVA等编程语言中,如果将布尔类型bool变量转换为整型int变量,通常采用 “0为假,非0为真”的方…

使用Pygame制作“吃豆人”游戏

本篇博客展示如何使用 Python Pygame 编写一个简易版的“吃豆人(Pac-Man)” 风格游戏。这里我们暂且命名为 Py-Man。玩家需要控制主角在一个网格地图里移动、吃掉散布在各处的豆子,并躲避在地图中巡逻的幽灵。此示例可帮助你理解网格地图、角…

ubuntu磁盘扩容

ubuntu磁盘扩容 描述先在虚拟机设置里面扩容进入Ubuntu 配置使用命令行工具parted进行分区输出如下完成 描述 执行命令,查看 fs 类型是什么 lsblk -o NAME,FSTYPE,MOUNTPOINT将60G扩容到100G,其中有些操作我也不知道什么意思,反正就是成功了&#xff0…

redis底层数据结构

底层数据结构 了解下这些咱常用的数据其底层实现是啥 在提到使用哪类数据结构之前,先来了解下redis底层到底有多少种数据结构 1,sds动态字符串 概念与由来 redis是一种使用C语言编写的nosql,redis存储的key数据均为string结构&#xff0…