检测后处理与框融合

一、目标检测后处理流程

多模型预测 → 置信度过滤(OOF选阈值) → 框融合(NMS/WBF/Soft-NMS) → 最终结果

维度	说明
问题	同一目标被多个框检测，需要去重
流程	1.按置信度排序 2.取最高分框保留 3.计算其余框与该框IoU 4.删除IoU>阈值的框 5.重复直到无框
阈值	通常0.5~0.7，IoU>阈值则抑制
缺点	密集目标场景下误删相邻真实目标

维度	说明
问题	标准NMS对密集目标误删
改进	不直接删除IoU>阈值的框，而是降低其置信度
公式	score_new = score * (1 - IoU) 或 score * exp(-IoU^2/sigma)
效果	密集目标场景下比标准NMS更好
参数	sigma通常0.5
适用	小麦穗检测等密集目标场景

维度	说明
问题	NMS只保留高分框丢弃低分框，信息损失
核心思想	将多个模型预测的重叠框融合为一个框，而非丢弃
流程	1.按置信度排序 2.匹配重叠框 3.加权平均坐标和置信度 4.输出融合框
与NMS区别	NMS丢弃低分框，WBF融合所有框
效果	多模型融合时比NMS/Soft-NMS更好

方法	处理重叠框方式	信息利用	适用场景
NMS	丢弃低分框	低	单模型稀疏目标
Soft-NMS	降低低分框置信度	中	单模型密集目标
WBF	加权融合所有框	高	多模型融合

1. 用当前最优模型对测试集预测
2. 筛选高置信度(>0.9)预测结果
3. 将高置信度样本加入训练集
4. 重新训练模型
5. 重复2~4直到收敛

1. 切片预测结果拼回大图坐标空间
2. 重叠区域取平均或取最大值
3. 连通域分析去除碎片(面积<阈值)
4. 空洞填充(医学结构通常是连通的)
5. 形态学操作平滑边界
6. 输出最终分割掩码

1. 各模型独立预测 → 得到各自的框集合
2. 合并所有模型的框集合
3. 用WBF/NMS进行框融合
4. OOF选择最优置信度阈值
5. 过滤低置信度框
6. 输出最终结果

维度	方法
架构多样性	EfficientDet + YOLOv5 + Faster R-CNN
尺度多样性	不同输入尺寸(512/640/768)
折数多样性	不同折训练的模型
增强多样性	不同TTA变换的预测结果

维度	说明
核心问题	小目标在大图中占比极小，直接推理容易漏检
核心思想	将大图切片后逐片检测，再将切片检测结果合并回原图坐标
切片方式	滑动窗口切片，有重叠区域(如overlap=0.2~0.3)
合并策略	切片检测结果坐标偏移回原图 + NMS/WBF去重
与医学大图区别	医学大图是训练时切片，SAHI是推理时切片
效果	小目标检测mAP提升5~15个百分点
实现	sahi库，支持YOLOv5/EfficientDet/MMDetection等
竞赛建议	小麦穗检测、海星检测等小目标场景几乎必须使用

1. 加载训练好的检测模型
2. 将测试大图切片(如1024x1024, overlap=0.25)
3. 每个切片独立推理
4. 将切片检测结果坐标偏移回原图
5. 用WBF/NMS合并重叠区域的检测框
6. 输出最终检测结果