关键词:联邦学习 (Federated Learning, FL)、机器学习 (Machine Learning, ML)、肿瘤学 (Oncology)、数据隐私 (Data Privacy)、精准医疗 (Precision Medicine)、多模态 (Multi-modal)
肿瘤学正在经历快速的变革,这得益于机器学习(ML)的整合,ML能够丰富大规模数据集中的临床证据,超越了传统的分析方法。然而,到目前为止,ML模型大多是在数据孤岛中集中化的。虽然集中化的ML模型在癌症研究中取得了显著进展,但临床数据的指数级增长和多样化,例如影像学、健康记录和分子特征,现在带来了相当大的挑战。数据量的激增,加上国际合作和标准化数据集的趋势,凸显了局限于本地数据获取实践和人口统计学的单中心研究的局限性。多中心研究,从不同的地区获取数据,提供了一种更全面的ML建模方法。然而,集中化的模型难以有效利用这种日益复杂的数据格局,可能影响ML的泛化能力、性能、全球适用性和可信度。虽然将来自不同来源的数据聚合到集中的数据湖中可能提供了一种替代方案,但它容易受到隐私泄露、复杂的数据共享协议和数据传输法律限制的影响。
联邦学习(FL)作为这些局限性的潜在解决方案应运而生。使用FL,ML算法可以在本地数据集上同时训练,而无需数据离开其环境。这种去中心化的方法允许医院和研究机构控制自己的数据,解决隐私问题和监管限制,同时从集体洞察中受益。FL在肿瘤学中特别有前景,因为数据涉及敏感的患者信息,及时的协作分析可以对患者的结果产生重大影响。然而,FL的采用并非没有挑战。在不影响数据内容的情况下平衡有效的模型训练和可以增加计算开销并可能影响数据内容的患者隐私技术,确保多个中心的数据质量和一致性,以及保持稳健的模型性能和可信度,都是紧迫的问题。
1 概述
1.1 集中式ML的局限性
- 数据孤岛: 集中式模型难以有效利用多中心数据,导致模型泛化能力受限。
- 隐私问题: 集中式模型需要将数据集中存储,容易引发隐私泄露和安全问题。
- 数据异质性: 不同中心的数据收集方式和人口统计学特征不同,导致数据异质性,影响模型性能和可信度。
1.2 联邦学习的优势
- 数据分散: 联邦学习允许在本地数据集上同时训练ML模型,无需数据迁移,有效保护隐私。
- 模型共享: 不同中心的模型可以进行共享和整合,利用集体智慧提高模型性能和泛化能力。
- 协同分析: 联邦学习可以促进多中心协同分析,加速研究进展,改善患者预后。
1.3 联邦学习的挑战
- 模型训练与隐私保护的平衡: 需要开发有效的隐私保护技术,同时保证模型训练效果。
- 数据质量和一致性: 需要确保不同中心数据的质量和一致性,以保证模型性能和可信度。
- 模型性能和可信度: 需要开发评估方法,确保联邦学习模型的性能和可信度。
2 方法
2.1 文献回顾策略
2.1.1 文献检索策略
- 时间范围: 2020 年 1 月 1 日至 2023 年 9 月 1 日
- 数据库: PubMed, Scopus, Web of Science
- 关键词: 涵盖肿瘤学、联邦学习和机器学习的多个关键词和 MeSH 术语
2.1.2 筛选流程
初步筛选出5,766篇文献,经过逐步筛选,最终纳入25篇符合标准的期刊文章进行分析。
PRISMA流程图
阶段1 - 识别:在数据库搜索和其它来源中识别出的所有潜在相关的研究文献。
阶段2 - 筛选:基于标题和摘要的初步筛选,去除那些明显不相关的文献。
阶段3 - 排除:在初步筛选后,进一步通过阅读全文来排除那些不符合纳入标准的文献。
阶段4 - 纳入:最终纳入综述的文献数量。
2.2 评估标准
- 联邦学习方法的类型: 模型中心化和数据中心化。
- 聚合策略: 用于整合参与设备更新或模型参数的方法,例如联邦平均和共识模型集成。
- 设备类型: 跨设备和跨数据孤岛。
- 数据类型: 医学影像、电子健康记录等。
- 隐私方法: 例如差分隐私和加密。
- 评估指标: 用于评估联邦学习模型性能的指标,例如准确率、召回率和F1分数。
- 联邦学习范围: 包括模型泛化能力、预测精度、数据隐私、疾病理解、领域适应和训练时间减少等。
2.3 研究重点
- 临床应用: 包括疾病类型区分、肿瘤识别、治疗反应预测、严重程度评估、副作用预测、生存分析和肿瘤复发评估等。
- ML模型类型: 包括经典机器学习模型、卷积神经网络、预训练模型和生成对抗网络等。
- 数据多样性: 评估不同研究中的患者规模和数据规模。
2.4 评估联邦学习方法的严谨性
- 比较框架: 是否将联邦学习方法与集中式机器学习模型进行比较。
- 性能比较: 联邦学习方法是否优于或与集中式模型具有可比性。
3 结论
3.1 研究趋势
机器学习(ML)相关的出版物随时间的变化趋势
与FL(联邦学习)相关的出版物随时间的变化趋势
(a)条形/线条:代表每年针对特定临床应用发表的论文数量,不同颜色或样式可能代表不同的临床应用,如肿瘤识别、疾病类型区分、严重程度评估、治疗反应预测、生存分析等。
(b)条形/线条:代表每年针对特定FL范围发表的论文数量,不同颜色或样式可能代表不同的FL目标,如数据隐私、ML预测改进、疾病理解改进、模型泛化能力提升等。
- 增长趋势: 联邦学习在肿瘤学领域的应用呈上升趋势,从2020年的0篇增加到2023年的13篇。
- ML技术: 研究涵盖了多种机器学习技术,包括大型预训练模型、UNet、CNN、经典机器学习模型和生成对抗网络等。
- 临床应用: 研究主要集中在肿瘤识别和疾病类型区分,其次是严重程度评估、治疗反应预测、生存分析和肿瘤复发评估。
- 联邦学习范围: 研究主要集中在提高模型泛化能力和预测精度,其次是数据隐私和疾病理解。
3.2 联邦学习分析
- 数据类型: 大型预训练模型主要用于医学影像数据,UNet主要用于MRI、CT、PET-CT和X光数据,CNN用于分析多种数据类型,经典机器学习模型主要用于EHR和影像特征提取,生成对抗网络主要用于MRI和CT数据。
- 任务类型: 大多数研究关注分类任务,其次是分割和检测任务。
- 临床应用: 肿瘤识别和疾病类型区分是主要的应用领域,其次是严重程度评估、治疗反应预测、生存分析和肿瘤复发评估。
3.3 数据多样性
- 患者规模: 研究中的患者规模差异较大,大多数研究集中在100-1,500名患者,但也有研究涉及超过10,000名患者。
- 数据规模: 数据规模差异也较大,大多数研究集中在1-5,000个图像或样本,但也有研究涉及超过100万个图像或样本。
- 数据类型: 大多数研究使用公开数据集,但也有研究使用私有数据集或混合数据集。
3.4 联邦学习实施细节
- 联邦学习方法: 大多数研究没有明确说明所使用的联邦学习方法,其中横向联邦学习最为常见。
- 聚合策略: 大多数研究没有报告聚合策略,少数研究使用了联邦平均和共识模型集成。
- 设备类型: 大多数研究没有说明设备类型,少数研究提到了跨数据孤岛联邦学习。
- 隐私方法: 只有少数研究明确说明了所使用的隐私方法,例如差分隐私、安全聚合、安全多方计算和同态加密。
3.5 评估联邦学习范围的严谨性
- 模型泛化能力: 大多数研究证明了联邦学习可以增强模型泛化能力,例如通过整合来自不同中心的数据。
- 预测精度: 大多数研究证明了联邦学习可以改善模型预测精度,例如通过减少数据偏差和学习复杂模式。
- 数据隐私: 一些研究证明了联邦学习可以保护数据隐私,例如通过使用差分隐私和加密技术。
- 疾病理解: 一些研究证明了联邦学习可以改善疾病理解,例如通过分析来自不同中心的数据。