目录
- 一、DSC
- 二、IOU
- 三、VOE (Volume Overlap Error)
- 四、RVD (Relative Volume Difference)
- 五、Hausdorff95 (95th Percentile of Hausdorff Distance)
- 六、ASSD (Average Symmetric Surface Distance)
- 七、MSD (Mean Surface Distance)
- 八、NSD (Normalized Surface Dice)
- 九、评价指标对比
- 1. NSD 和 ASSD
- 2. Hausdorff95 和 ASD
- 3. ASSD、ASSD 和 NSD
- 4. NSD、Dice、ASSD 和 HD95
一、DSC
二、IOU
三、VOE (Volume Overlap Error)
衡量预测分割与真实分割之间的不重叠区域占总体积的比例。公式:
1 − ∣ A ∩ B A ∪ B ∣ 1-\left| \frac{A\cap B}{A\cup B} \right| 1− A∪BA∩B
四、RVD (Relative Volume Difference)
衡量预测分割与真实分割体积之间的相对差异。公式:
( V p r e d − V g t ) / V g t (V^{pred}-V^{gt})/V^{gt} (Vpred−Vgt)/Vgt
五、Hausdorff95 (95th Percentile of Hausdorff Distance)
-
定义:
Hausdorff95 是 Hausdorff 距离的 95% 分位数,衡量两个分割表面之间最大误差的一个近似值。
它关注的是两个表面之间最远点的距离,但通过取 95% 的分位数来去除偶发的极端噪声点对指标的影响。 -
计算过程:
- 从预测表面 ( S_{\text{pred}} ) 到真实表面 ( S_{\text{gt}} ) 的所有点计算最近点距离:
d ( p , S gt ) = min q ∈ S gt d ( p , q ) , ∀ p ∈ S pred d(p, S_{\text{gt}}) = \min_{q \in S_{\text{gt}}} d(p, q), \quad \forall p \in S_{\text{pred}} d(p,Sgt)=q∈Sgtmind(p,q),∀p∈Spred - 反向从 ( S_{\text{gt}} ) 到 ( S_{\text{pred}} ) 计算距离:
d ( q , S pred ) = min p ∈ S pred d ( q , p ) , ∀ q ∈ S gt d(q, S_{\text{pred}}) = \min_{p \in S_{\text{pred}}} d(q, p), \quad \forall q \in S_{\text{gt}} d(q,Spred)=p∈Spredmind(q,p),∀q∈Sgt - 合并所有距离,取其第 95 个百分位值:
Hausdorff95 = 95th percentile of { d ( p , S gt ) , d ( q , S pred ) } \text{Hausdorff95} = \text{95th percentile of } \{d(p, S_{\text{gt}}), d(q, S_{\text{pred}})\} Hausdorff95=95th percentile of {d(p,Sgt),d(q,Spred)}
- 从预测表面 ( S_{\text{pred}} ) 到真实表面 ( S_{\text{gt}} ) 的所有点计算最近点距离:
-
特点:
- 单位与输入图像的分辨率相同(如毫米)。
- 更注重最坏情况的误差,但通过分位数减少了对异常值的敏感性。
- 指标值越小,表明分割表面之间的最大误差更小。
六、ASSD (Average Symmetric Surface Distance)
-
定义:
ASSD 衡量的是预测分割和真实分割之间的平均对称距离,包括双向(对称)距离。具体来说,它计算预测分割和真实分割表面之间所有点的双向平均距离。它关注的是整体距离分布的平均值,而不是最大距离或异常距离。 -
计算方法:
- 计算从预测分割表面到真实分割表面的距离(pred → gt)。
- 计算从真实分割表面到预测分割表面的距离(gt → pred)。
- 取这两个距离的平均值。
-
计算公式:
A S S D = 1 ∣ S pred ∣ + ∣ S gt ∣ ( ∑ p ∈ S pred min q ∈ S gt d ( p , q ) + ∑ q ∈ S gt min p ∈ S pred d ( q , p ) ) ASSD = \frac{1}{|S_{\text{pred}}| + |S_{\text{gt}}|} \left( \sum_{p \in S_{\text{pred}}} \min_{q \in S_{\text{gt}}} d(p, q) + \sum_{q \in S_{\text{gt}}} \min_{p \in S_{\text{pred}}} d(q, p) \right) ASSD=∣Spred∣+∣Sgt∣1 p∈Spred∑q∈Sgtmind(p,q)+q∈Sgt∑p∈Spredmind(q,p) - d ( p , q ) d(p, q) d(p,q): 表示点 p p p 和 q q q 之间的欧几里得距离。
-
特点:
- ASSD 是一个浮点数,单位与输入数据的空间分辨率相同(如毫米)。
- 值越小,表示分割表面之间平均误差越小,即两个表面越接近;值越大,表示两个表面越远。
- 计算了所有点的平均对称距离。
- 对整个分割的全局误差有更均衡的反映,而不是仅关注边界情况。
- 对所有点的偏差同等看待。
- 对局部极端误差不敏感。
-
应用:衡量整体分割表面偏差的平均水平,反映分割结果的总体一致性。
七、MSD (Mean Surface Distance)
-
定义:计算预测分割和真实分割表面之间所有点的最大距离(极端情况)。
-
计算方法:
- 在所有点对的距离中,取最大值(pred → gt 和 gt → pred 中的最大值)。
-
特点:
- 对局部误差(如预测过远)非常敏感。
- 通常用于评估“最坏情况”。
-
应用:衡量分割表面间最大的偏差,通常用来检测最差匹配情况。
八、NSD (Normalized Surface Dice)
-
定义:
NSD 衡量的是预测分割和真实分割的表面重合度,具体来说,是两个表面之间距离在某一阈值 τ \tau τ(如 5mm)范围内的部分占总表面的比例。
如果一个预测点距离真实表面小于或等于阈值 τ \tau τ,则认为该点是正确预测。 -
计算公式:
N S D = ∣ S p r e d ∩ S g t , τ ∣ + ∣ S g t ∩ S p r e d , τ ∣ ∣ S p r e d ∣ + ∣ S g t ∣ NSD = \frac{|S_{pred}\cap S_{gt, \tau}| + |S_{gt}\cap S_{pred, \tau}|}{|S_{pred}| + |S_{gt}|} NSD=∣Spred∣+∣Sgt∣∣Spred∩Sgt,τ∣+∣Sgt∩Spred,τ∣- S p r e d S_{pred} Spred: 预测分割的表面点集。
- S g t S_{gt} Sgt: 真实分割的表面点集。
- S g t , τ S_{gt, \tau} Sgt,τ: 真实表面上距离预测表面点在阈值 τ \tau τ 以内的点集。
-
特点:
- 容差设置:NSD 需要一个设定的距离阈值 τ \tau τ, τ \tau τ 通常由用户指定(例如 1mm、5mm 等),因此它是一个对距离阈值敏感的指标。
- 局部精度:NSD 主要衡量在一定容差范围内表面点的匹配程度,因此它对小的误差和局部细节更敏感,即更注重局部误差对整体性能的影响。
- 表面关注:不像 Dice 系数那样关注整个体积,NSD 更专注于表面之间的匹配,通常用于需要较高局部精度的应用场景。
- NSD 的值在 [0, 1] 之间,1 表示完全重合,0 表示完全不重合。
-
应用:这种方法结合了表面距离和常见的 Dice 系数,专注于局部精度,尤其适用于医疗图像分割,通常用于检测分割结果的表面与真实表面在指定容差范围内的匹配程度。
-
总结:
NSD (Normalized Surface Dice) 是一个精细的评价指标,专门针对分割表面的精确度进行评估。在设定的容差范围内,它衡量预测表面和真实表面之间的匹配程度。它不同于传统的 Dice 系数,因为它更关注局部表面匹配而非整体体积重叠,适用于需要高精度局部表面匹配的任务,例如肿瘤边界或器官分割等应用。
九、评价指标对比
1. NSD 和 ASSD
- 主要区别
指标 | NSD | ASSD |
---|---|---|
意义 | 衡量表面点在某一距离阈值内的重合度 | 衡量两个表面之间的平均对称距离 |
是否依赖阈值 | 是(用户指定阈值 τ \tau τ) | 否(直接计算所有点间的平均距离) |
值域 | [0, 1](归一化值) | 非负浮点数,通常与数据单位一致 |
偏向 | 注重表面点的距离分布是否在合理范围内 | 注重表面整体的平均距离 |
应用场景 | 多用于医学分割质量评估,尤其是对表面接近程度要求较高的场景 | 用于衡量分割整体精度,特别是表面平滑或偏离的程度 |
- 总结
- NSD 是一个归一化指标,用于衡量预测分割与真实分割的表面匹配度,依赖用户定义的距离阈值。
- ASSD 是一个平均距离指标,直接量化两个分割表面之间的对称距离,不依赖阈值。
它们是互补的指标,可以同时使用来更全面地评估分割结果的质量。
2. Hausdorff95 和 ASD
- 主要区别
指标 | Hausdorff95 | ASD |
---|---|---|
意义 | 衡量表面之间最大误差的近似值(95% 分位数) | 衡量表面之间平均对称距离 |
重点 | 注重最坏情况(极端距离)但减少异常点影响 | 注重整体误差分布 |
计算方式 | 取两个表面点集的点到点距离的第 95% 分位数 | 取两个表面点集的点到点距离的平均值 |
值的单位 | 单位与输入图像分辨率一致 | 单位与输入图像分辨率一致 |
敏感性 | 对最坏情况下的误差较敏感 | 对全局误差均衡反映 |
-
总结
- Hausdorff95 更适合用于检查最坏情况下的分割误差,特别是在需要确保没有极大误差的应用中(例如,手术导航)。
- ASD 更适合衡量整体分割精度,对局部误差的容忍度更高。
在分割任务中,这两个指标通常是 互补 的,Hausdorff95 用于捕捉极端误差,ASD 用于反映整体表现。
3. ASSD、ASSD 和 NSD
- 区别总结
指标 | 描述 | 评估重点 | 是否对局部误差敏感 |
---|---|---|---|
ASSD | 预测和真实分割表面所有点的平均双向距离 | 全局一致性 | 否 |
MSD | 预测和真实分割表面所有点的最大距离 | 最差匹配情况 | 是 |
NSD | 在设定距离阈值内,预测和真实分割表面点的匹配程度 (归一化) | 容差范围内的匹配率 | 是 |
- 适用场景
- 如果需要一个对整体性能有综合评价的指标:使用 ASSD。
- 如果需要关注最差情况(如异常预测):使用 MSD。
- 如果需要一个容差敏感的指标(如医疗图像应用中重要部位的精准性):使用 NSD。
- 总结
ASSD、MSD 和 NSD 是互补的指标,各自适合不同的评估需求。它们不是相同的指标,但可以结合使用以全面分析分割结果的质量。
4. NSD、Dice、ASSD 和 HD95
指标 | 计算重点 | 使用场景 |
---|---|---|
NSD | 表面点的匹配度,基于设定的距离容差 | 需要精确评估分割表面精度的场景 |
Dice | 整体的重叠度,评估分割区域的重叠率 | 全局分割质量评估 |
ASSD | 平均表面距离(对表面偏差的综合评估) | 全局表面偏差评估 |
HD95 | 95%的表面点的最大距离(最坏情况评估) | 最差匹配评估 |