肾癌的多模态预测模型-临床-组织学-基因组

目录

摘要

技术路线

① lncRNA的预测模型

②病理 WSI 的分类器

③临床病理分类器

模型结果

与别的模型比较

同行评审学习

1)使用lncRNA的原因

2)模型临床使用意义

3)关于截止值的使用


摘要

A multi-classifier system integrated by clinico-histology-genomic analysis for predicting recurrence of papillary renal cell carcinoma

整合基因组学和组织学用于癌症预后显示出前景。在这里,我们开发了一个多分类器系统,集成了基于 lncRNA 的分类器、基于深度学习全玻片图像的分类器和临床病理分类器,以准确预测术后局部(I-III 期)状肾细胞癌 (pRCC) 复发。与在训练集和两个验证集中单独使用三个单一分类器相比,多分类器系统对无复发生存期 (RFS) 的预测准确性显著提高 (C 指数 0.831-0.858 vs. 0.642-0.777,p < 0.05)。我们的多分类器定义的高风险 I/II 期和 1/2 级组的 RFS 明显差于低风险 III 期和 3/4 级组 (p < 0.05)。我们的多分类器系统是术后局部 pRCC 复发的实用且可靠的预测器,可与当前的分期系统一起使用,以更准确地预测疾病进程并为个体化辅助治疗的策略提供信息。


技术路线
① lncRNA的预测模型

为了开发基于 lncRNA 的分类器来预测肿瘤复发,我们首先通过发现集中的 RNA-seq 分析了 53 对新鲜冷冻的 pRCC 和邻近的正常组织,并寻找与整个基因组中的正常组织相比,pRCC 肿瘤中差异表达的 lncRNA(图 .基于对 lncRNA 的全基因组分析,40 个 lncRNA 被鉴定为显著差异表达的基因(图 D)。1A;补充表 1)。热图清楚地区分了肿瘤中这 40 个 lncRNA 与邻近正常组织中的水平(图 D)。然后,使用多变量 LASSO Cox 回归模型选择四个 lncRNA,为每位患者生成基于 lncRNA 的 RFS 风险评分。(筛选出4个lnc RNA的预后模型)

②病理 WSI 的分类器

为了构建基于 WSI 的分类器,我们从训练集中总共选择了 182 名 pRCC 患者,这些患者作为开发集具有明显的良好或不良结果。术后随访超过 7 年且无复发记录的患者被分配到不同的良好结局组 (n = 127)。明显的不良结局组由术后 3 年内复发记录的患者组成 (n = 55)。然后,我们使用每位患者具有代表性的 H&E 染色 FFPE 肿瘤组织切片来扫描他们的数字 WSI,并应用深度学习创建基于 WSI 的分类器,用于预测 pRCC 患者的复发。

③临床病理分类器

在单因素和多因素 Cox 回归分析中评估了包括年龄、性别、等级和病理分期在内的几个临床病理因素,发现等级和病理分期是预测训练集中 RFS 的重要因素。进一步的多变量分析显示,调整年龄和性别后,分级和病理分期也是独立的预后因素。

使用 lncRNA 表达数据、 WSIs 和临床病理因子分别开发 3 个分类器。然后,我们将这三个分类器集成在一起,开发了一个多分类器系统。A 基于 lncRNA 的分类器的发展。面板左上:比较 pRCC 中 lncRNA 表达与邻近正常组织 (n = 53) 的火山图。生物学意义 (log2倍数变化 (FC)) 在 x 轴上表示,统计显著性 (−log10 P) 在 y 轴上表示。用 log 鉴定了 40 个 lncRNA2FC > 1,错误发现率为 <10−25.图右上方:热图显示了 53 对 pRCC 中 40 个 lncRNA 的表达水平。面板左中:LASSO Cox 回归分析,用于选择要包含在分类器中的 lncRNA。使用最小标准(右)和 1 减去标准误差 (1−s.e.) 标准(左)以最佳值绘制两条垂直虚线。面板右中:40 个差异表达的 lncRNA 的 LASSO 系数曲线。使用最小标准在最佳值处绘制一条垂直线,从而产生四个非零系数。最后使用 LASSO Cox 回归模型选择了 4 个 lncRNAs 来构建 4 个基于 lncRNA 的评分。下面板:流程图。B 使用深度学习开发基于 WSI 的分类器。C 临床病理学分类器的发展。病理分期的图片是用 BioRender.com 创建的。源数据作为 源数据 文件提供。

模型结果

A 基于基于 lncRNA 的分类器、基于 WSI 的分类器和临床病理危险因素的列线图,用于预测 pRCC 患者术后 3 年、 5 年和 7 年无复发概率。B 列线图的校准曲线,用于预测训练集 (n = 382)、独立验证集 (n = 207) 和 TCGA 集 (n = 204) 中 3 年、 5 年和 7 年 RFS。实际结果绘制在 y 轴上,列线图预测结果绘制在 x 轴上。模型性能是相对于 45° 线显示的,代表预测结果与实际结果完全对应的理想列线图的性能。误差带表示观测值周围的 95% 置信区间。

与别的模型比较

A 204 名患者的热图,包括基于多分类器的风险评分、来自 TCGA 的已建立的基于聚类的分子分类器和临床特征。根据基于多分类器的风险评分对案例进行排列。B 使用使用双侧未配对学生 t 检验分析的散点图,根据患者的肿瘤是否具有 CIMP 高甲基化模式,患者之间基于多分类器的风险评分进行比较。散点图中的蓝色、橙色和红色点分别表示使用基于多分类器的风险评分确定的低风险、高风险和超高风险患者。C 根据肿瘤是否具有 CIMP 模式对 RFS 进行 Kaplan-Meier 分析。与非 CIMP 相关肿瘤患者 (n = 198) 相比,CIMP 相关肿瘤患者 (n = 6) 的 RFS 显着缩短,包括低风险组 (n = 102) 和高危组 (n = 96) 患者根据多分类器系统。P 值采用对数秩检验计算。


同行评审学习

Microsoft Word - Peer Review File.docx (springer.com)

1)使用lncRNA的原因

使用lncRNA而不使用mRNA或其他分子特征的基本原理是什么? 将选择的mRNA/miRNA/甲基化/基因组特征与 WSI评分和临床病理导致了比较甚至更好的预测?

(1) pRCC 中基于预后特征的 lncRNA 谱的探索和验证是创新的。pRCC 的分子表征由 TCGA 研究网络 (N. Engl. J. Med., 2016) 进行,其中包括拷贝数改变、基因突变、mRNA 表达、DNA 甲基化模式和 miRNA 表达。由此,成功构建了 pRCC 中的几个预后特征,包括 mRNA 、 DNA 甲基化和 miRNA 特征。然而,在该研究中,没有详细分析 pRCC 中的 lncRNA 表达。因此,我们基于 lncRNA 谱的研究设计补充了 TCGA 研究网络 4 的先前工作。近年来,越来越多的证据表明 lncRNA 具有相对稳定的结构,参与生物过程的多层次调控,具有癌症靶向治疗的潜力,是一种可以有效预测癌症临床结局的新型生物标志物,激励我们追求 pRCC 的 lncRNA 特征。

(2) mRNA 特征的预后准确性并不总是优于或等于表观遗传特征。一项研究将基于 4-lncRNA 的特征与两个值得注意的 mRNA 特征(16 基因检测和 ClearCode34)在三个独立的集合中进行了比较,其中包括 1,869 名 ccRCC 患者。预测基于 4-lncRNA 的特征的总生存期的准确性高于两个已建立的 mRNA 特征5、6、7。在我们目前的研究中,我们将基于 lncRNA 的特征与 TCGA 研究网络在 pRCC 中开发的 mRNA 特征和其他分子特征进行了比较。我们基于 lncRNA 的特征比 mRNA 特征、miRNA 特征、DNA 甲基化和 DNA 拷贝数特征更准确地预测临床结果(C 指数:0.777 vs 0.569-0.660,所有比较的 p<0.001)。

2)模型临床使用意义

该系统可以为辅助治疗策略提供信息。是否有证据表明该系统对辅助治疗的治疗意义?

感谢您提出这个重要观点。3 期 EVEREST 试验的最新结果表明,极高风险组的 RCC(包括 pRCC)患者可以从辅助治疗中受益,而辅助治疗不会为中高危亚组的患者带来生存获益1。这种区分表明,被归类为极高危的患者可能是辅助治疗的候选者,而被归类为中高危和低风险患者的患者可能会避免此类干预,从而避免与过度治疗相关的风险。值得注意的是,EVEREST 研究和其他 RCC 研究中使用的风险分层方法主要依赖于分期和 2 级。我们的研究更进一步,不仅将这些参数纳入我们的临床病理学分类器,而且还集成到其他重要的分类器中:基于 lncRNA 的分类器和基于全玻片图像 (WSI) 的分类器。所得的多分类器系统显着提高了预测准确性,超过了三组中单独的临床病理分类器(C 指数 0.831-0.858 vs. 0.642 0.755,p < 0.05)。为了更好地指导评估辅助治疗的临床试验的入组筛选,我们启动了一项临床试验(接受辅助治疗的 III 期状肾细胞癌分层的多分类系统,NCT06146777),该试验采用我们的多分类系统来选择 pRCC 患者进行辅助治疗。

3)关于截止值的使用

The author should approach and describe the data with greater care, precision, and accuracy. For example, why did the author apply the same cutoff from training set for the validation set, but use a different median value for TCGA set (Line 185-190)? The p value for prediction of OS using the multi-classifier system is 0.004 or 0.042 instead of <0.001 in Supplementary Table 5 and 7 (Line 195). The number at risk and the plot for overall survival do not match (Fig. S6C). One of them must be wrong.

感谢您的仔细审查和这些建议。(1) 在 TCGA 集和其他两组之间应用不同截断值的原因是由于 lncRNA 表达数据源的变化。训练集和独立验证集中 lncRNAs 的表达水平均来自 qRT-PCR 结果,而 TCGA 集中的表达水平来自 RNA-seq 数据(补充图 2)。这导致 TCGA 集和其他两组之间用于四种 lncRNA 表达水平的测量单位发生变化。因此,我们对训练集和独立验证集应用了相同的截止值,但 TCGA 集需要不同的截止值。基于 WSI 的分类器的相同截断值应用于所有三个集合,因为它们的数据源完全是 WSI。在最初的手稿中,我们将基于 lncRNA 的分类器和基于 WSI 的分类器的临界值分别放在补充图 3 和 5 的图例中,而多分类器系统的临界值位于结果部分(第 166-168 行和第 183-189 行)。为了更好地阐明我们设置这些截止值的原因并确保这些值更容易找到,我们在修订后的手稿的“结果”部分和“方法”部分添加了相应的描述。

文献:

A multi-classifier system integrated by clinico-histology-genomic analysis for predicting recurrence of papillary renal cell carcinoma - PubMed (nih.gov)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/429526.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

树莓派3B驱动ST7735(内核)(代码篇)(TODO)

书接上回&#xff1a;树莓派3B驱动ST7735&#xff08;内核&#xff09;&#xff08;配置篇&#xff09;_st7735s驱动固件下载-CSDN博客&#xff0c;这次主要是精读一下树莓派内核中的ST7735驱动源码 &#xff08;TODO&#xff09;

Elasticsearch不停机切换(上云)方案

如何给飞行中的飞机换引擎? 背景 业务背景 略 技术背景 线下集群40个索引左右&#xff0c;总数据量不大,不到100G因为ES承担的业务鉴权业务&#xff0c;所以不能接受停机割接 还有就是ES中数据来自各个业务方&#xff0c;推送的时机不定&#xff0c;也没有完备的重推机制&…

ChatGPT 在国内使用的方法

AI如今很强大&#xff0c;聊聊天、写论文、搞翻译、写代码、写文案、审合同等等&#xff0c;ChatGPT 真是无所不能~ 作为一款出色的大语言模型&#xff0c;ChatGPT 实现了人类般的对话交流&#xff0c;最主要是能根据上下文进行互动。 接下来&#xff0c;我将介绍 ChatGPT 在国…

重生之我们在ES顶端相遇第15 章 - ES 的心脏-倒排索引

文章目录 前言为什么叫倒排索引数据结构如何生成如何查询TF、IDF参考文档 前言 上一章&#xff0c;简单介绍了 ES 的节点类型。 本章&#xff0c;我们要介绍 ES 中非常重要的一个概念&#xff1a;倒排索引。 ES 的全文索引就是基于倒排索引实现的。 本章内容建议重点学习&…

Win10 安装Node.js 以及 Vue项目的创建

一、Node.js和Vue介绍 1. Node.js Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。它允许你在服务器端运行 JavaScript&#xff0c;使得你能够使用 JavaScript 来编写后端代码。以下是 Node.js 的一些关键特点&#xff1a; 事件驱动和非阻塞 I/O&#xff1a;Node…

Parallels Desktop 20(Mac虚拟机) v20.0.0 for Mac 最新破解版(支持M系列)

Parallels Desktop 20 for Mac 正式发布&#xff0c;完全支持 macOS Sequoia 和 Windows 11 24H2&#xff0c;并且在企业版中引入了全新的管理门户。 据介绍&#xff0c;新版本针对 Windows、macOS 和 Linux 虚拟机进行了大量更新&#xff0c;最大的亮点是全新推出的 Parallels…

数据库提权【笔记总结】

文章目录 UDF提权以有webshell只有数据库权限条件复现msf工具sql语句提权 MOF提权前言条件复现msf工具php脚本提权 sqlserver提权前言条件xp_cmdshell提权复现 沙盒提权介绍复现 Oracle提权靶场搭建执行任意命令复现 通过注入存储过程提权&#xff08;低权限提升至DBA&#xff…

安全帽佩戴识别摄像机:守护安全的智能之眼

在现代工业和建筑等诸多领域中&#xff0c;安全始终是重中之重。每一处施工现场、每一个生产车间都潜藏着可能对人员造成伤害的风险因素。而安全帽&#xff0c;作为保护工作人员头部免受伤害的关键装备&#xff0c;其是否被正确佩戴就显得尤为关键。此时&#xff0c;安全帽佩戴…

智创未来,景联文科技提供全方位数据采集服务

随着科技的日新月异&#xff0c;人工智能技术正在改变我们的生活与工作方式&#xff0c;数据成为推动人工智能&#xff08;AI&#xff09;技术发展的基石。 高质量的数据对于训练机器学习模型、提升算法性能以及实现智能应用的广泛部署至关重要。 景联文科技凭借卓越的技术实力…

Kafka 为什么这么快?

Kafka 是一款性能非常优秀的消息队列&#xff0c;每秒处理的消息体量可以达到千万级别。今天来聊一聊 Kafka 高性能背后的技术原理。 1 批量发送 Kafka 收发消息都是批量进行处理的。我们看一下 Kafka 生产者发送消息的代码&#xff1a; private Future<RecordMetadata>…

PowerMill 2025简体中文版百度云资源分享下载

如大家所了解的&#xff0c;PowerMill是一款专业的CAM&#xff08;计算机辅助制造&#xff09;软件。主要用于加工行业&#xff0c;可以帮助用户进行高效、精准的加工工艺设计和数控编程&#xff0c;以达到生产部件的高精度和高质量。 对于初次接触的小伙伴来说&#xff0c;目…

GAMES101(15节)

Irradiance辐射度量学 辐射度量学在渲染领域&#xff0c;可以帮助理解基于物理的光照模型 radiant energy辐射能量Q&#xff0c;累计总能量&#xff08;单位J joule焦耳&#xff09;&#xff0c;就像太阳能板&#xff0c;光照时间越长接收能量越多&#xff0c;收到的能量总和…

前后端分离,使用MOCK进行数据模拟开发,让前端攻城师独立于后端进行开发

mock是什么 Mock生成随机数据,拦截Ajax 请求&#xff0c;前后端分离&#xff0c;让前端攻城师独立于后端进行开发。 增加单元测试的真实性 通过随机数据,模拟各种场景。 在实际开发过程中&#xff0c;前端是通过axios来请求数据的&#xff0c;很多时候前端开发者就是通过写固定…

浅谈Spring Cloud:OpenFeign

RestTemplate 方式调用存在的问题&#xff1a; String url "http://userservice/user/" order.getUserId(); User user restTemplate.getForObject(url, User.class); 这是通过URL地址来访问的。但是&#xff1a; 代码可读性差&#xff0c;编程体验不统一参数复…

Lucene详解介绍以及底层原理说明

文章目录 什么是Lucene?示意图Lucene 的使用场景&#xff1a;Lucene 的生态系统&#xff1a; 相关概念1. **Document&#xff08;文档&#xff09;**2. **Field&#xff08;字段&#xff09;**3. **Analyzer&#xff08;分析器&#xff09;**4. **Tokenizer&#xff08;分词器…

前端基础知识+算法(一)

文章目录 算法二分查找条件注意方式基本原理左闭右闭正向写法 左闭右开正向写法 前端基础知识定时器及清除盒子垂直水平居中的方式垂直水平1.flex布局2.grid布局3.定位对于块级元素 解决高度塌陷的方式1.给父元素一个固定的高度2.给父元素添加属性 overflow: hidden;3.在子元素…

深度学习-从零基础快速入门到项目实践,这本书上市了!!!

此书地址&#xff1a; 《【2024新书】深度学习 从零基础快速入门到项目实践 文青山 跟我一起学人工智能 机器学习算法原理代码实现教程 深度学习项目分析 深度学习 从零基础快速入门到项目实践》【摘要 书评 试读】- 京东图书 除深度学习外我还写了一本软件测试书。我大概是国…

[Excel VBA办公]如何使用VBA批量删除空行

在处理Excel数据时&#xff0c;空行可能会干扰数据分析和展示。以下是一个VBA代码示例&#xff0c;帮助你批量删除工作表中的空行。 1. 代码说明 此代码将遍历指定工作表&#xff0c;删除所有空行&#xff0c;确保数据整洁。 2. VBA代码 删除sheet1的空行 Sub DeleteEmptyRow…

VMware虚拟机因磁盘空间不足黑屏无法登录

在虚拟机里存储了一些文件之后&#xff0c;再打开发现进不去了&#xff0c;只有光标一直在左上角&#xff0c;登录的框都是黑的&#xff0c;具体如下&#xff1a; 明明知道登录框的存在却怎么也触碰不到它T_T &#xff0c;先说解决方法&#xff1a; 产生这个问题的原因是因为磁…

大数据Flink(一百二十一):Flink CDC基本介绍

文章目录 Flink CDC基本介绍 一、什么是CDC 二、CDC的实现机制 三、​​​​​​​​​​​​​​传统 CDC ETL 分析 四、​​​​​​​​​​​​​​基于 Flink CDC 的 ETL 分析 五、​​​​​​​​​​​​​​什么是 Flink CDC 六、​​​​​​​​​​​​​​…