小罗碎碎念
这篇文章综述了人工智能在鼻咽癌诊断和治疗中的应用进展、当前挑战和未来前景。
角色 | 姓名 | 单位名称(中文) |
---|---|---|
第一作者 | 杨 | 四川大学华西医院肿瘤中心生物治疗科,生物治疗国家重点实验室 |
通讯作者 | 陈 | 四川大学华西医院血管外科,普通外科 |
文献检索
(“artificial intelligence” OR “machine learning” OR “deep learning”) AND (“nasopharyngeal carcinoma” OR “nasopharyngeal cancer”)
文献速览
文章首先介绍了AI的基本概念,包括传统机器学习和深度学习算法,以及它们在医学领域的应用。接着,文章详细讨论了AI在NPC的检测、评估、治疗和预后预测中的临床应用。
此外,文章还指出了当前AI技术的主要限制,包括可解释性问题、隐私和安全问题以及对大量标注数据的需求。最后,文章讨论了使用AI诊断和治疗NPC的剩余挑战和未来前景。
文章的主要内容包括:
-
AI和其技术:介绍了AI在医学影像分析中的作用,特别是在肿瘤的早期诊断、治疗和预后预测中的应用。提到了多种医学影像技术,如超声、CT、MRI和PET-CT,并讨论了AI如何自动分析和解释这些复杂的数据。
-
AI在NPC诊断中的应用:讨论了AI如何辅助内窥镜检查、病理活检和影像学检查,以提高NPC的诊断准确性和效率。
-
AI在NPC治疗中的应用:探讨了AI在化疗反应预测、放疗计划制定以及个性化治疗计划设计中的应用。
-
AI在NPC预后预测中的应用:分析了AI如何通过处理数据和分析重要特征来准确预测癌症生存时间和疾病进展。
-
AI算法的现状:讨论了用于NPC诊断和治疗的最先进的AI算法,以及它们在不同数据集上的表现。
-
训练和测试方法:评估了数据集大小、类别平衡、验证策略和数据处理策略对AI算法性能的影响。
-
当前挑战:指出了将AI研究转化为临床应用所面临的挑战,包括数据的标准化注释、多中心数据源的需求、模型的可解释性、隐私保护和数据安全等问题。
-
结论和展望:文章总结了AI在NPC临床领域的潜力,并预测了AI与医学更紧密结合的未来,包括开发更少侵入性的技术、建立大型样本量和跨人群种族数据库以支持AI技术预测预后等。
整体而言,这篇文章提供了AI在鼻咽癌诊断和治疗中应用的全面概述,并强调了未来研究和临床实践的潜在方向。
一、绪论
鼻咽癌(NPC)是一种在鼻咽黏膜上发展的上皮癌,常见于咽隐窝处[1]。
NPC的诊断通常需进行内镜检查,随后对可疑部位进行内镜下活检[2,3]。
然而,内镜活检可能遗漏位于黏膜下或咽隐窝侧方的小型癌症,这给诊断带来了重大挑战。
由于症状出现晚且解剖结构特殊,NPC的早期诊断较为困难。大多数NPC患者在晚期才被诊断,导致预后不佳[4]。得益于影像技术和放疗的快速发展,早期NPC病例的局部控制率已达到95%[5]。尽管先进的放疗技术和化疗策略改善了NPC的预后[6,7],但晚期患者的预后仍然不容乐观。
因此,探讨人工智能(AI)是否能提高NPC的诊断、治疗及预后预测水平,具有一定的研究意义。
AI是计算机科学的一个分支,它识别智能的本质并创造一种能展现类人行为的智能机器[8]。AI在医学、通信、交通和金融等多个领域得到应用[9]。
在医学领域,AI主要用于疾病诊断、治疗和预后预测。医学AI分为虚拟和物理两大类[10]。虚拟部分主要包括深度学习(DL)和机器学习(ML),它们为构建稳健的计算机辅助方法提供了可能。物理部分则包括机器人和医疗设备[10]。近期研究表明,AI在NPC的诊断和治疗中的应用可以提高早期诊断效率和患者预后[11–13]。
尽管已有关于AI在NPC中应用的综述[13,14],但AI技术发展迅速,有必要对这些综述进行频繁更新。本文综述分析了AI技术在NPC的诊断、治疗和预后预测方面的研究进展和临床应用,全面展示了AI在主要临床领域的现状。
同时,本文还研究了AI在临床实施的状态以及在该领域取得进步所需付出的努力。我们希望这些信息对关注AI在NPC临床护理中应用的医护人员和研究人员有所帮助。
二、人工智能技术背景
在过去几十年中,多种医学成像技术在疾病的早期发现、诊断和治疗中发挥了关键作用,包括超声、计算机断层扫描(CT)、磁共振成像(MRI)和正电子发射计算机断层扫描(PET-CT)[15]。
近期,人工智能(AI)取得了显著进展,使得机器能够自动分析和解释复杂数据[16]。AI在需要准确和大量图像数据分析的肿瘤学、放射学和病理学等医学领域得到了广泛应用。医生通常通过视觉评估头颈部医学图像来检测、描述和监测头颈部疾病,这种评估往往基于经验且具有一定的主观性。
与此不同,AI可以通过自动识别成像信息进行定量评估[17]。包括传统机器学习(ML)和深度学习(DL)在内的AI技术,使得医生能够做出更准确、更快速的影像诊断,并大幅减轻工作负担。
传统ML算法是医学成像中AI方法之一,它严重依赖于预定义的工程特征,这些特征通过数学方程(例如肿瘤纹理)定义,并可以使用计算机程序量化。将这些特征输入ML模型中,帮助医生对患者进行分类并做出临床决策。
传统ML包括大量已建立的方法,如k-最近邻(KNN)、支持向量机(SVM)、随机森林(RF)等。这些方法在放射学中广泛用于通过图像处理方法将图像数据转换为特征向量,并构建预测模型以从相同的图像数据中提取特定信息。放射组学在一些小型的回顾性研究中得到了评估,试图从肿瘤的医学图像中预测组织亚型、对特定治疗的反应、预后等信息。
DL作为ML的一个子集,基于受人类大脑启发的神经网络结构。ML模型必须定义和提取图像特征,其性能依赖于特征的质量。相比之下,DL算法无需预先定义特征[18],它们可以自动学习特征并进行图像分类和任务处理。这种数据驱动的模型更具信息性和实用性。
在医学图像分析和处理中常用的DL算法包括人工神经网络(ANN)、深度神经网络(DNN)、卷积神经网络(CNN)和循环神经网络(RNN)。目前,CNN是医学图像分析领域最受欢迎的DL架构类型[19]。
CNN由多个层组成,通常包括卷积层、池化层和全连接层。图像中的像素通过卷积层的聚类和转换来聚合和转换,以自动提取高级特征。深度卷积神经网络(DCNN)使用更多的卷积层和更大的参数空间来拟合大规模数据集。U-net使用全卷积层和图像增强,在有限的数据集上获得良好的准确性。RNN在处理时间序列数据方面尤为独特。
不同的DL算法具有不同的特性和应用场景。
三、人工智能在鼻咽癌中的应用分析
在《柳叶刀》杂志上,每隔几年就会发表一系列关于鼻咽癌的综述文章[1,20–22]。近年来,医学人工智能在鼻咽癌研究中的应用日益受到关注。许多研究者致力于鼻咽癌肿瘤检测、预后以及放疗和化疗效果的预测研究(见图1)。
3-1:人工智能与鼻咽癌诊断
鼻咽癌的诊断是适当治疗的前提,可分为定性诊断和分期诊断。
目前,鼻咽癌的定性诊断主要依靠内镜下活检组织的收集进行病理检查。分期诊断主要依赖于影像学检查,如CT、MRI和PET-CT。
纤维鼻咽镜是一种纤维光学设备,可以通过显微镜的视觉技术将可疑病变放大数千倍。外科医生可以使用自己的手术钳对可疑病变组织进行活检。活检组织随后被选取并制作成石蜡切片,在显微镜下进行组织学检查,必要时可借助电子显微镜或免疫组化。
CT通过X射线束扫描人体的一定厚度,探测器接收通过该层的X射线。转换器将X射线转换为数字信号,计算机使用数字信号生成图像。MRI利用核磁共振原理检测施加梯度磁场后发射的电磁波。磁场基于物质内不同结构环境中释放的能量衰减,可用于映射物体的内部结构。PET-CT根据示踪剂选择性反映组织和器官的代谢,以及人体组织在分子层面的生理、病理、生化和代谢变化。
同时,CT图像对核医学图像的全能量衰减进行校正。因此,核医学图像能够完全实现定量目的,并显著提高诊断的准确性,实现了功能图像和解剖图像的互补信息。
由于肿瘤症状的复杂性和个体差异,进行准确的肿瘤诊断较为困难。人工智能技术可以帮助临床医生减轻工作负担,提高影像图像的可读性,从而提高诊断的准确性和效率。
1、人工智能在鼻咽镜检查中的应用
鼻咽镜检查允许直接观察鼻咽壁上的病变,医生可以分析和筛选病变图像,以确定病变是否与鼻咽癌相关。
目前,鼻咽癌的诊断是通过使用白光反射内镜可视化可疑组织部位并采取活检。在先前的研究中,研究者利用鼻咽内镜图像开发了不同的AI模型,以区分鼻咽癌和鼻咽良性增生。
研究表明,检测鼻咽癌的效果与放射科医生[23]相比没有显著差异,甚至表现更佳[24]。2018年,Mohammed等人在三项研究中专注于使用基于鼻咽内镜图像的神经网络检测鼻咽癌[25–27]。在这三项研究中,他们使用了不同的神经网络模型,并都取得了非常好的准确性、敏感性和特异性。
Li等人利用27,536张白光成像鼻咽镜图像开发了一个深度学习模型,用于检测鼻咽癌,报告在回顾性和前瞻性测试集上的准确率分别为88.7%和88.0%[28]。
然而,传统白光内镜往往容易遗漏浅表黏膜病变。为此,Xu等人设计并训练了一个Siamese DCNN,该网络可以利用白光和窄带成像图像提高鼻咽癌和非癌病变分类的性能。他们收集了4783张鼻咽镜图像进行深度学习,并验证了模型对鼻咽镜结果的预测力。根据患者预测水平,模型的总体准确性和敏感性分别为95.7%和97.0%[29]。
2、 人工智能在病理活检中的应用
在鼻咽癌的诊断中,病理活检是必需的,但由于大多数样本中的非角化癌分化程度低,且含有大量混合淋巴细胞,使得病理活检仍然具有挑战性。然而,活检样本的诊断结果通常由病理学家主观评估,这可能导致观察者之间的差异。
病理学家诊断鼻咽癌的效果不佳,通常会导致结果的不一致性。通过使用人工智能技术,可以自动对活检样本进行分类和诊断,提高诊断的准确性和效率,降低成本。
研究者利用726例鼻咽癌活检标本训练和验证了DL模型,报告了在斑块级别和切片级别接收者操作特征曲线(AUCs)下的面积分别为0.9900和0.9848[31]。
其他研究者也开发了类似的依赖DL的自动化病理诊断模型,该模型基于验证数据集,对鼻咽癌诊断的AUC达到了0.869[32]。
结果表明,DL算法能够识别鼻咽癌,并帮助病理学家提高其效率和准确性。总之,人工智能在识别和处理图像、组织分割方面在鼻咽癌中扮演着重要角色(见表2)。
尽管一些人工智能应用尚未完全实现,但其协助鼻咽癌诊断的潜力是毋庸置疑的。
3-2:人工智能与鼻咽癌治疗
鼻咽癌的主要治疗方法包括放疗、化疗和其他综合治疗。在鼻咽癌治疗中应用人工智能技术可以帮助临床医生为患者设计更个性化和精确的治疗方案。
1、人工智能在鼻咽癌化疗中的应用
化疗与放疗的结合是治疗晚期鼻咽癌的一大进步。
精确的化疗前评估可以帮助鼻咽癌患者选择个性化治疗,改善预后。在2020年,一个研究小组开发了一个将临床数据与放射组学特征整合的放射学图谱,以预测接受诱导化疗(IC)的鼻咽癌患者的反应和生存情况。根据生存分析,IC应答者的无进展生存期显著优于非应答者[33]。
在杨等人的研究中,利用CT纹理分析作为开发DL模型的基础,以识别鼻咽癌IC的应答者和非应答者。他们通过迁移学习方法提取了预训练CNN的DL特征,并通过支持向量机(SVM)分类建立了最佳性能模型ResNet50。
该模型的AUC为0.811[34]。这些模型可用于预测局部晚期鼻咽癌对IC的治疗反应,并可能成为决定治疗策略的实际工具。
预训练网络是一个已保存的CNN,它之前已在大型数据集上进行了训练。
原始数据集足够大且通用,因此预训练网络学习到的空间层次结构可以作为从视觉世界中提取特征的有效模型。即使新问题与任务与原始任务不同,学到的特征在问题之间是可迁移的,这是DL的一个重要优势。它使DL对于小数据问题非常有效。
为了评估DL在基于PET-CT的放射组学对晚期鼻咽癌个体化IC中的有效性,Peng等人创建了放射组学特征和诺模图。根据诺模图成像分析,将高风险和低风险患者分为两组,其中高风险患者从IC中受益,而低风险患者则不然。将其作为未来晚期鼻咽癌的管理工具,将是一种新颖且有益的创新[35]。
2、人工智能在鼻咽癌放疗中的应用
放疗是鼻咽癌不可或缺的治疗手段,其中肿瘤靶区分割和剂量计算尤为关键。然而,整个放疗计划过程通常受到图像质量和勾画肿瘤靶区的繁重工作量的影响。研究者已将人工智能应用于放疗计划,以解决这些问题。
图像质量是放疗计划的基础。然而,由于机器限制和放疗过程中避免人类辐射,通常无法获得高质量的CT图像。人工智能可用于增强图像质量。例如,一项研究使用深度学习(DL)方法生成了合成千伏CT图像,在phantom研究中,合成千伏CT图像的信号噪声比、图像均匀性和对比度显著高于兆伏CT[36]。
同样,另一项研究使用深度卷积神经网络(DCNN)从锥形束CT生成合成CT图像,并将其应用于鼻咽癌的剂量计算[37]。还有研究利用DCNN基于T2加权MRI生成CT图像,与真实CT相比,大多数软组织和骨骼区域可以被准确重建[38]。
研究者还开发了一种先进的DCNN架构,用于从MRI生成合成CT图像,用于鼻咽癌患者的调强质子治疗计划。所有合成CT图像的(3 mm/3%)伽马通过率均超过97.32%[39]。通过这些方法,图像质量可以得到提高,这有利于肿瘤靶区分割和剂量计算。
此外,单模态图像通常无法提供足够的信息来准确描述肿瘤靶区。由于多模态图像提供了互补信息,因此可以开发更好的放疗治疗计划。例如,一项研究构建了一种利用加权CT-MRI配准图像进行鼻咽癌勾画的方法,称为“SNAKE”[40]。
另一项研究开发了一种多模态分割结构,使用卷积神经网络(CNN),包括多模态CNN和组合CNN,用于自动分割CT和MR图像[41]。还有研究开发了一种新型多模态MRI融合网络,用于准确分割鼻咽癌[42]。另一项研究提出了一种基于完全卷积网络的自动分割双模态PET-CT图像的方法,并辅以辅助路径[43]。
在当前的临床实践中,靶区和危及器官(OARs)通常由临床医生在CT图像上手动勾画,这既费时又费力。为了解决这些问题,许多研究者提出了自动分割方法。例如,一项研究提出了一种基于自组织映射的自适应阈值技术,用于半自动分割鼻咽癌[44]。
此外,该团队还开发了基于区域生长的技术,用于识别CT图像中的鼻咽癌区域[45,46]。另一项研究提出了一个基于位置分割框架的NPC-Seg深度学习(DL)算法,用于NPC分割。在StructSeG-NPC数据集上进行了在线评估,测试数据集的平均Dice相似系数(DSC)为61.81%[47]。
另一项研究提出了一种基于深度学习(DL)的CNN模型,使用两阶段分割策略来确定最终的NPC分割,通过整合来自冠状、轴向和矢状图像的三个结果。该研究的DSC分别为0.87、0.85和0.91[48]。
另一项研究创建了一个名为U-net的DL模型,用于NPC分割。在训练U-net模型后,原发肿瘤的整体DSC为74.00%[49]。此外,许多研究者基于U-net模型开发了一些改进模型,用于勾画NPC的目标体积。通过训练模型,最终模型获得了良好的DSC(0.827–0.84)[50–52]。
另一项研究构建了一个端到端的深度去卷积神经网络(DDNN),用于分割鼻咽部大体肿瘤体积和临床靶体积。DDNN和VGG-16模型的性能进行了比较,DDNN的DSC值为80.9%的大体肿瘤体积和82.6%的临床靶体积,而VGG-16的DSC值为72.3%和73.7%, respectively[53]。
MRI图像在软组织对比度方面比CT图像更好,这有助于更准确地分割肿瘤靶区。
已有许多研究致力于在MRI图像上构建各种算法进行NPC分割。例如,一项研究使用最近邻图模型和距离正则化水平集进化从MRI图像中确定NPC轮廓[54,55]。另一项研究利用CNN创建了一个自动NPC分割模型,基于增强的MRI,并获得了0.89的DSC[56]。另一项研究建立了一个基于VoxResNet的3D CNN架构,用于自动绘制鼻咽癌的原发大体肿瘤体积轮廓。
在这项研究中,包括1021例NPC,训练后的模型达到了0.79的DSC[57]。另一项研究开发了一个3D CNN,具有长程跳跃连接和多尺度特征金字塔,用于NPC分割。该模型已训练并获得了0.737的测试DSC[58]。
Ye等人成功开发了一个完全自动的NPC分割方法,使用密集连接嵌入U-net和双序列MRI图像,在七名NPC外部受试者中获得了平均0.87的DSC[59]。Luo等人提出了一种增强不变策略,并将其与DL模型结合。实验结果表明,增强不变策略优于广泛使用的nnU-net,能够对MRI进行高精度的原发大体肿瘤体积分割[60]。
NPC具有高度恶性且侵袭性,因此在复杂的MRI背景下难以区分肿瘤组织和正常组织的边界。
为了解决这一背景问题,研究者开发了一个从粗到细的深度神经网络。该模型首先根据精心设计的分割模块预测粗略的掩膜,然后使用边界渲染模块,利用不同特征映射层之间的语义信息细化粗略掩膜的边界。数据集包括596名患者的2000个MRI切片,该模型获得了0.703的DSC[61]。
CNN在对比增强MRI上的癌症分割显示出前景,但一些患者不适合使用对比剂。为了解决这个问题,Wong等人使用U-net在非增强的MRI上勾画原发NPC,并将其与对比增强的MRI进行了比较。U-net在脂肪抑制(FS)-T2W上与增强-T1W的性能相似(DSC = 0.71),表明CNN在描绘FS-T2W图像上的NPC时具有潜力[62]。
自动和精确地分割OAR可以导致更精确的放疗计划,并减少放射性副作用的风险。研究者创建了一个基于DL的风险器官检测和分割网络,CT图像上高风险器官分割的DSC值介于0.689至0.934之间[63]。Zhong等人提出了一种结合DL和Boosting算法的级联网络结构,用于分割涉及腮腺、甲状腺和视神经的OAR,相应的DSC值为0.92、0.92和0.89[64]。Peng等人设计了OrganNet,一个改进的全卷积神经网络,用于自动分割OAR,平均DSC为83.75%[65]。Zhao等人设计了一个基于3D U-net的AU-net模型,用于自动分割NPC的OAR,并获得了平均DSC值为0.86 ± 0.02[66]。
确定放疗剂量在放疗计划中也起着重要作用。研究者开发了一个基于剂量信息的有门限循环单元(GRU)的RNN模型,用于预测NPC的治疗计划。一种改进的方法被提出,以进一步提高剂量体积直方图(DVH)预测的精度和这种方法在小样本患者数据中的可行性[67]。结果显示,由基于GRU的RNN预测模型指导的再生实验计划(EPs)与临床计划(CPs)达成良好的一致性。EPs为许多OAR节省了更好的剂量,同时仍满足计划肿瘤体积(PTV)的可接受标准[68,69]。
Yue等人开发了一种基于距离信息和掩膜信息的DL方法,用于预测NPC放疗的剂量。该方法预测的剂量误差和DVH误差分别比基于掩膜的方法低7.51%和11.6%[70]。Sun等人开发了一个基于U-net的DL网络,用于根据患者的解剖结构信息预测剂量分布。这项研究共纳入了117例NPC病例,显示了使用体素策略的更好的器官保留和次优计划靶体积覆盖[71]。
Jiao等人开发了一个基于几何和剂量信息的广义回归神经网络,用于预测OAR的DVH。结果显示,在DVH预测中加入剂量信息后,R2值增加了约6.7%,平均绝对误差值降低了约46.7%[72]。同样,Chen等人设计了一个基于DL方法的CNN网络,用于直接预测OAR的DVH。预测的D2%和D50之间的差异可以控制在2.32和0.69 Gy以内[73]。
一些鼻咽癌患者在放疗后可能会出现并发症,这会影响生活质量甚至寿命。然而,早期诊断这些并发症是一个挑战。人工智能可以应用于NPC放疗后可能的并发症的早期预测。
例如,先前的一项研究使用了随机森林模型来构建一个放射学模型,用于早期检测辐射诱导的颞叶损伤(RTLI)。在这个模型中,RTLI可以提前动态预测,从而允许早期检测并采取预防措施限制其进展[74]。同样,Bin等人从MRI中提取放射学特征,并建立了一个机器学习(ML)模型来生成特征。使用一个结合临床因素的诺模图来预测接受T4/N0-3/M0 NPC放疗的患者在放疗后5年内RTLI的发生情况。验证队列的C-指数为0.82[75]。
Ren等人开发了一个基于ML算法的预测模型,该模型结合了剂量学特征。该模型在预测接受早期放疗的NPC患者可能出现的辐射诱导性甲状腺功能减退症方面优于传统的剂量体积因素,并在最优AUC值为0.7时显示出更好的预测性能,而基于剂量体积因素的预测模型在0.61时表现更好[76]。
为了预测辐射诱发的口干症,Chao等人开发了一个包含腮腺内不均匀剂量分布的聚类模型。该团队结合了聚类模型和机器学习技术,为预测头颈部癌症患者口干症提供了一个有前景的工具[77]。
综上所述,人工智能在鼻咽癌的诊断、治疗和预后预测中发挥着重要作用。通过提高图像质量、实现更准确的肿瘤靶区分割和剂量计算,AI技术有助于改善放疗计划的制定。
此外,AI在预测放疗并发症方面的应用,如辐射诱导的颞叶损伤和甲状腺功能减退症,显示了其在早期诊断和预防方面的潜力。随着技术的不断进步和临床实践的积累,人工智能在鼻咽癌诊疗中的应用将更加广泛和深入。
3、人工智能在鼻咽癌个性化精准治疗中的应用
个性化精准癌症治疗已成为鼻咽癌研究的重要议题。
对于局部晚期鼻咽癌患者,可以选择同步化疗(CCRT)或诱导化疗(IC)加CCRT作为治疗选项。然而,他们的选择仍然模糊不清。
研究者开发了一个基于深度学习(DL)的鼻咽癌治疗决策模型,该模型可以预测T3N1M0鼻咽癌患者在不同治疗方案下的预后,并根据此推荐最佳治疗方案。这有望成为促进鼻咽癌个性化治疗的潜在工具[78]。
区分鼻咽癌复发患者不同风险的能力,以及为个性化治疗量身定制治疗方案的重要性日益凸显。研究者设计的AI模型可以将复发患者分为不同的风险组,为个性化治疗提供了重要指导[79]。
靶向治疗也是治疗鼻咽癌患者的重要手段。研究者开发了一个使用支持向量机(SVM)的数学算法,用于预测具有先进定位的鼻咽癌的预后。该算法整合了代表肿瘤生成信号通路的多个组织分子生物标志物的表达水平和与EBV相关的血清学生物标志物。它可能指导未来针对相关信号通路的靶向治疗[80]。
此外,AI在临床管理中的应用也不容忽视。先前的一项研究基于MRI数据开发了一个自动机器学习评分系统,其预后性能优于美国癌症联合委员会(AJCC)[81]的TNM系统。使用新的评分系统可以帮助改善NPC患者的咨询和个性化管理,帮助他们实现更好的结果[82]。
随着大数据时代的到来,NPC治疗将变得更加个性化、精准(见表3)。
AI的发展不仅可以有效减轻临床医生的负担,还可以为患者提供更准确、更人性化的医疗服务。
3-3:AI与NPC预后预测
尽管在NPC治疗方面取得了巨大进展,但NPC患者的长期预后仍然不尽人意。
传统的TNM/AJCC分期系统未能提供预期的预后效果,也无法预测患者进展。相比之下,AI可以通过处理数据和分析重要特征来准确预测癌症生存时间和进展。研究人员经常使用MRI图像和临床数据来建立预测NPC预后的预测模型。
例如,Zhong等人建立了一个放射组学诺模图来预测无病生存期。在测试队列中,放射组学诺模图的C-index为0.788[83]。研究者使用SVM构建了放射组学机器学习模型来预测疾病进展,这些模型表现良好[84,85]。Li等人结合了放射组学和机器学习来预测放射治疗后NPC的复发,比较了中心化典型算法的结果,显示神经网络(ANN)达到了0.812的最佳预测精度[86]。Qiang等人基于3D DenseNet开发了一个预后模型,用于预测非转移性NPC患者的无病生存期。该研究共纳入了1636名NPC患者。该模型根据风险评分的截断值将患者分为低风险和高风险组。结果显示,模型能够正确区分这两组患者(危险比 = 0.62)[87]。
同样,Du等人开发了一个DCNN模型来评估非转移性NPC患者的复发风险。在3年疾病进展的验证集中,该模型的AUC为0.828[88]。此外,还有几位研究者构建了类似的深度学习模型,用于NPC的预后预测和风险分层,所有这些模型表现良好[78,89,90]。
对于NPC患者而言,生存预测至关重要。
Jing等人开发了一个端到端的多模态深度生存网络(MDSN),以精确预测NPC患者的肿瘤进展风险。该模型与四种传统流行的生存方法进行了比较,最终建立的MDSN表现最佳,C-index为0.651[91]。
Chen等人使用机器学习方法,基于肿瘤负担特征和所有临床因素,开发了一个生存模型。该研究共纳入了1643名患者。内部验证和外部验证集中的C-index分别为0.766和0.760[92]。
PET-CT在NPC复发和远处转移的敏感性、特异性和准确性方面具有特别优势。
Meng等人提出了一种基于治疗前PET-CT图像的模型,可用于预测生存和分割晚期NPC。他们采用了一种硬共享分割骨架,以提取与原发肿瘤相关的区域属性,并减少无关背景数据的影响。
此外,他们还采用了级联生存网络,利用分割骨架中获得的肿瘤数据进行预后信息的进一步利用[93]。Gu等人开发了一个端到端的基于多模态深度学习(DL)的放射组学模型,用于从预处理的PET-CT图像中提取深度特征,并预测5年无进展生存期。
该团队还纳入了TNM分期,以进一步提高预后能力。共有257名晚期NPC患者被纳入,并被分为内部和外部队列。内部和外部队列的AUC分别为0.842和0.823[94]。
病理图像也可以用于构建AI预后模型。
研究者整合了基于MRI的放射学特征、基于病理图像的深度卷积神经网络(DCNN)模型和NPC患者的临床特征,构建了一个多尺度诺模图,用于预测NPC患者的无病生存期。结果显示,内部和外部试验队列的C-index分别为0.828和0.834[95]。
在先前的研究中,软件QuPath(版本0.1.3. Queen’s University)被用于提取NPC患者的病理显微镜特征,并使用神经网络DeepSurv来分析病理显微镜特征(DSPMF)。
在研究中,DSPMF被证明是一个可靠的预后工具,可能指导NPC患者的治疗决策[96]。
其他研究者使用RNA数据构建了AI预测模型。
在NPC中,一些miRNAs具有预后能力。例如,Chen等人结合了来自各种平台的不同miRNA表达数据,并构建了一个使用6-miRNA标志的预测模型。
根据功能分析,这六个miRNA主要涉及致癌信号通路、病毒感染通路和B细胞表达[97]。Zhao等人应用机器学习技术对NPC肿瘤活检的RNA-Seq数据进行分析,以识别复发/转移与非复发/转移组之间的13个显著基因。
通过这些基因,研究人员识别了一个4-mRNA签名,该签名对NPC具有良好的预测价值,且对NPC具有正面的预后价值。此外,该4-mRNA签名与免疫反应以及细胞增殖相关[98]。Zhang等人使用深度网络根据MRI和基因表达预测NPC的预后,AUC为0.88[99]。
AI使基于多种因素预测结果成为可能,这对整个诊断和治疗过程非常有利(见表4)。在未来,AI技术将帮助医生做出合理和个性化的医疗决策,包括为NPC患者提供准确的诊断、个性化治疗和预后评估。
3-4:当前在鼻咽癌诊断和治疗中最先进的AI算法
AI模型需要大量的数据集进行训练和验证,图2中列出了来自不同数据集的一些示例图像。
AI可以帮助医生统计病理学、体检报告等数据。通过大数据和深度挖掘等技术,AI可以分析并挖掘患者的医疗数据,自动识别患者的临床变量和指标。大部分医疗数据来自医学图像,如CT图像、MRI图像和PET-CT图像。AI可以通过学习医学图像来帮助诊断和治疗疾病。
卷积神经网络(CNN)在图像识别和图像分割方面表现出色。在基于各种图像的NPC诊断[28]、治疗反应预测[33]和预后预测[93]的研究中,研究者使用改进的经典CNN模型获得了最佳性能,通常使用AUC和DSC作为性能指标。基于FCN的U-net模型在图像分割方面也表现出色,尤其在目标分割[59]和剂量预测[69]方面。
基于最佳表现算法的分布如图3所示。
许多研究改进了经典模型以创建新的算法模型。在AI算法中,DCNN和CNN表现非常好。然而,研究结果基于每个研究独立进行,由于使用了不同的数据集和/或评估指标,因此结果之间无法直接比较。
3-5:AI算法性能的影响因素
AI算法的性能受到多种因素的影响——数据集大小、类别平衡、验证策略和数据处理策略,这些因素直接影响训练和测试性能。总结见表5。
大多数引用的研究论文数据集包含少于1000个案例。此外,只有一项研究讨论了类别平衡。AI需要特殊的策略来管理有限和不平衡的数据,以减少对训练和测试过程的影响(例如,数据增强技术)。大多数研究使用验证集和交叉验证方法来验证模型。
验证集方法是最简单的方法——它将整个数据集分为训练集和测试集。这种方法仅使用数据的一部分进行模型训练,适用于数据量相对较大的情况。
交叉验证方法重复使用数据,然后将获得的样本数据切片和切块。我们将数据组合成多个不同的训练和测试集。这种策略常见于小数据集。交叉验证方法将重复进行,直到每个部分至少一次用作测试数据。然而,交叉验证不能保证ML模型的质量,因为潜在的偏见或不平衡的数据会导致偏差评估。一些论文未能描述任何验证策略。
健康数据包含许多缺失值。AI算法在数据预处理期间无法处理缺失值,这导致算法性能下降。根据表4,排除不完整数据的策略是最常见的。然而,这种策略会导致大量信息丢失,并且在缺失值超过整个数据集时性能不佳。一些研究缺乏数据处理策略和对缺失值案例的详细描述。
AI解决方案在私人/受限数据集上进行训练和测试。这些数据集要么包含敏感的患者信息,要么属于不愿或无法公开其数据的医疗机构。数据集的可获得性有助于提高研究的可重复性和透明度[100,101]。然而,由于所有研究论文都使用了私人数据,NPC中AI应用的数据集可用性仍然是一个问题。
四、当前挑战总结
尽管在NPC的临床研究中AI技术发展迅速,但AI的应用仍处于初级阶段[102]。为了将这些研究转化为具有临床价值的应用,需要解决一些挑战。
随着NPC生存期的延长,越来越多的患者遭受放疗后脑损伤、治疗失败和治疗后复发及转移的困扰。这些患者病情复杂,预后不佳,给治疗带来了困难。
为了解决上述问题,我们需要找到经济、高效且临床最优的NPC治疗方案。由于AI具有客观分析和处理大量数据的优势,因此AI应参与建立精确的治疗思路,包括早期筛查、精确分期、精确目标成像、复发转移性NPC的最佳治疗以及治疗方式的组合选择。
AI算法构建的预测模型需要大量高质量临床数据来提高其准确性、敏感性和特异性,因此需要标准化数据注释和多中心数据来源。
研究人员已开发了改进的算法来处理小样本数据,但准确性较低[103]。目前,NPC的AI算法大多局限于单个医疗机构的数据[13]。这可能导致模型过度拟合,并且模型不完全适用于更广泛的情况。因此,在广泛临床应用AI应用之前,需要进行外部验证。
此外,AI预测被称为“黑箱”,因为AI算法的选择过程和加权过程不明确。换句话说,当将AI应用于NPC时,可解释性是一个重要考虑因素。
目前,有两种主要解决方案来解决这个问题:可解释的模型和模型独立的解释方法[104]。这两种方法都增加了计算复杂性。因此,还有很多工作要做以提高模型的可解释性。
此外,NPC中AI应用的大多数研究都是回顾性的。然而,由于回顾性研究设计中可能存在的选择偏倚,这些研究中获得的鼓舞人心的结果需要通过进一步的前瞻性和多中心研究来确认。
此外,隐私保护和数据安全是AI面临的主要挑战。建立NPC的AI应用需要大量患者的临床数据,这要求隐私保护和数据安全。目前,尚无合适的解决方案可以减轻这一问题,同时满足数据驱动科学日益增长的需求[105]。建立一个安全可靠的NPC多中心数据共享平台可能是解决这一问题的方法。
当前AI工具的一个常见缺陷是它们无法处理多任务。尚未开发出能够检测人体多种异常的集成AI系统。疾病和治疗需要使用多种工具,其中协同作用复杂。利用AI解决方案带来许多好处,但部署却困难重重。对于医疗保健组织来说,需要通过教育员工了解AI系统和专业能力,并建立患者对AI的信任来弥补技能差距。
五、结论与展望
AI在NPC的各个临床方面显示出巨大的应用潜力,随着临床数据的爆炸性增长和机器学习(ML)和深度学习(DL)研究的进展。
AI在NPC的应用如下:
(1)通过DL理解癌症的分子层面;
(2)基于图像和病理标本支持NPC的诊断和预后;
(3)促进NPC的个性化、准确诊断和治疗。
随着AI技术的不断发展,AI将对NPC临床领域产生重大影响。我们相信,在不久的将来,AI将与医学的各个方面更加紧密地结合。我们可以依靠AI技术开发比鼻咽镜检查更微创的技术,其诊断准确性接近病理活检。我们可以基于临床数据建立AI模型,帮助健康人了解NPC的早期预警。
AI将与放疗紧密结合,开发更个性化的放疗计划,并更有效地进行全过程疗效评估。在未来,我们可以建立大样本量和跨种族人口的数据库,以支持AI技术预测预后,帮助研究人员找到最大的预后因素,并建立未来的前瞻性预后干预研究。