AI视频管理平台中使用目标检测模型中的NMS参数原理及设置原则

目标检测模型中的NMS参数原理及设置原则

在目标检测模型中，非极大值抑制（Non-Maximum Suppression，简称NMS）是一种常用的后处理技术，用于筛选和保留最佳的检测框。本文将详细介绍NMS的原理、参数设置原则以及实际应用中的一些优化策略。

NMS原理

NMS的核心思想是保留每个目标的最高置信度的边界框，同时去除其他与之高度重叠的边界框。这里的重叠通常用交并比（Intersection over Union，简称IoU）来量化。NMS的具体步骤如下：

排序：首先，根据每个边界框的置信度（通常是分类概率与定位准确度的综合指标）进行降序排列。置信度最高的边界框被认为是最有可能正确检测到目标的。
选择：从排序后的列表中选择置信度最高的边界框，标记为已选，并将其添加到最终的检测结果列表中。
计算IoU：对于剩余的每个边界框，计算它与已选边界框的IoU。
比较与剔除：如果某个边界框与已选框的IoU超过了预设的阈值（例如0.5或0.7），则认为这两个框表示的是同一个目标，于是根据置信度较低的原则，剔除这个低置信度的边界框。
重复步骤2-4：继续选择剩余边界框中置信度最高的，重复计算IoU和剔除过程，直到所有边界框都被检查过。
结束：最终，剩下的边界框集合即为经过NMS处理后的检测结果，每个目标对应一个最优的边界框。

代码示例：

import numpy as npdef intersection_over_union(boxA, boxB):# 计算两个边界框的交集的坐标xA = max(boxA[0], boxB[0])yA = max(boxA[1], boxB[1])xB = min(boxA[2], boxB[2])yB = min(boxA[3], boxB[3])# 计算交集的面积interArea = max(0, xB - xA) * max(0, yB - yA)# 计算两个边界框的面积boxAArea = (boxA[2] - boxA[0]) * (boxA[3] - boxA[1])boxBArea = (boxB[2] - boxB[0]) * (boxB[3] - boxB[1])# 计算交并比IoUiou = interArea / float(boxAArea + boxBArea - interArea)return ioudef non_max_suppression(boxes, scores, iou_threshold):# 初始化一个空列表来保存最终的边界框final_boxes = []# 将边界框和分数组合在一起boxes_with_scores = [(box, score) for box, score in zip(boxes, scores)]# 根据分数进行降序排序boxes_with_scores.sort(key=lambda x: x[1], reverse=True)# 遍历排序后的边界框while boxes_with_scores:# 选择分数最高的边界框current_box, current_score = boxes_with_scores.pop(0)# 将当前边界框添加到最终结果中final_boxes.append(current_box)# 过滤掉与当前边界框IoU超过阈值的其他边界框boxes_with_scores = [(box, score) for box, score in boxes_with_scores if intersection_over_union(current_box, box) <= iou_threshold]return final_boxes# 示例边界框和分数
boxes = np.array([[1, 1, 5, 5],[2, 2, 6, 6],[10, 10, 15, 15],[15, 15, 20, 20]
])scores = np.array([0.9, 0.8, 0.7, 0.6])# 应用NMS，设置IoU阈值为0.2
iou_threshold = 0.2
final_boxes = non_max_suppression(boxes, scores, iou_threshold)print("最终保留的边界框：")
for box in final_boxes:print(box)#[1 1 5 5]
#[10 10 15 15]
#[15 15 20 20]

NMS参数设置原则

NMS中最关键的参数是IoU阈值，它是决定边界框是否重叠过多的关键参数。常见的取值范围在0.3到0.7之间，具体值需根据应用场景调整。以下是一些设置原则：

应用场景：不同的应用场景对检测的准确性和召回率有不同的要求。例如，在安防监控中，可能更倾向于高召回率，因此可能会选择较低的IoU阈值。
目标密度：在目标密集的场景中，可能需要较高的IoU阈值来避免误删有效的检测结果。而在目标稀疏的场景中，可以选择较低的IoU阈值以去除更多的冗余框。
目标大小：对于不同大小的目标，可能需要不同的IoU阈值。一般来说，对于较大的目标，可以选择较高的IoU阈值，因为大目标的检测框更可能完全覆盖目标。
实验调优：在实际应用中，可以通过实验来调整IoU阈值，以达到最佳的检测性能。可以通过绘制PR曲线（Precision-Recall Curve），选择一个合适的IoU阈值，使得在保证高准确率的同时，召回率也尽可能高。