赛题名称:UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)
赛题链接:https://www.kaggle.com/competitions/UBC-OCEAN
赛题背景
卵巢癌是女性生殖系统最致命的癌症。目前,卵巢癌诊断依赖病理学家评估亚型。然而,这带来了几个挑战,包括观察者之间的分歧和诊断的可重复性。此外,医疗不发达的社区通常缺乏专科病理学家,即使是发达社区也面临缺乏妇科肿瘤专业知识的病理学家的短缺。
深度学习模型在分析组织病理学图像方面展现出了显著的能力。然而目前仍然存在挑战,例如需要大量的训练数据,理想情况下来自单一来源。技术、伦理和财务限制以及保密问题使培训成为一项挑战。
赛题任务
UBC卵巢癌亚型分类和异常检测(UBC-OCEAN)比赛的目的是对卵巢癌亚型进行分类,参赛者将在世界上最广泛的卵巢癌组织病理学图像数据集上训练模型,这些图像来自超过20个医疗中心。
参赛者的工作可以提高识别卵巢癌亚型的准确性,更好的分类将使临床医生能够制定个性化的治疗策略,而不受地理位置的限制。这种有针对性的方法有可能提高治疗效果,减少不良反应,并最终为患者带来更好的结果。
评价指标
提交内容使用balanced accuracy
进行评估。
提交文件
对测试集中的每个image_id
,参赛者必须为label
变量预测一个类。该文件应包含一个标题并采用以下格式:
image_id,label
2,CC
5,EC
6,HGSC
etc.
数据描述
参赛者在本次竞赛中的挑战是从活检样本的显微镜扫描中分类卵巢癌的类型。
本次竞赛使用隐藏测试。当提交的笔记本被评分时,将提供实际的测试数据(包括完整的样本提交)。由于数据集的大小,训练图像将不会被提供。
文件
[train/test]_images
包含相关图像的文件夹。有两类图像:全部切片图像(WSI)和组织微数组(TMA)。
测试集包含与训练集不同的来源医院的图像,最大的区域图像几乎为100,000 x 50,000像素。预计测试集中大约有2000张图像,大多数是TMA,总大小为550GB。
[train/test].csv
训练集的标签。
-
image_id
- 每张图像的唯一ID代码。 -
label
- 目标类。这些卵巢癌亚型之一:CC、EC
、HGSC
、LGSC
、MC
、Other
。 -
image_width
- 图像宽度,以像素为单位。 -
image_height
- 图像高度,以像素为单位。 -
is_tma
- 如果切片是组织微数组,则为True
。
[train/test]_thumbnails
包含全部切片图像的较小 .png 副本的文件夹。不提供TMA的缩略图。
sample_submission.csv 有效的样本提交。只能下载第一行。
时间安排
-
2023 年 10 月 6 日 - 开始日期
-
2023 年 12 月 27 日 - 报名截止日期
-
2023 年 12 月 27 日 - 合并截止日期
-
2024 年 1 月 3 日 - 提交截止日期
赛题奖金
-
第一名 - 12,000美元
-
第二名 - 10,000美元
-
第三名 - 10,000美元
-
第四名 - 10,000美元
-
第五名 - 8,000美元
需要组队的私聊
关注下方【学姐带你玩AI】🚀🚀🚀
回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)
码字不易,欢迎大家点赞评论收藏!