作者没有对网络结构进行改进,反而是从一个特殊的视角来考虑目标检测的改进点——使用基于IOU的度量来代替传统回归的损失想法新颖,论文讲解很详细被CVPR2019收录。作者的主要贡献是:
- 提出了IOU的通用版本——GIOU作为比較两个任意形状的新指标;
- 提供了将GIOU作为二维坐标框对齐时的loss方案;
Bounding box回归是2D/3D视觉任务总的基础模块,目标检测、实例分割等等都需要bbox回歸来获得较为准确地定位。目前来讲想要获得更好的检测效果,要么使用重的backbone要么设计更好的网络结构。但是这两种方案都忽略了bbox regression中基于IOU计算度量的L1/L2 loss
IOU是目标检测中的一个重要的概念,在anchor机制中IOU的作用不仅仅在于确定正负样本(0.5),还可以用来评价预测框和真实框之間的距离IOU有一个很好的特性就是对尺度不敏感(scale-invariant)。在回归的任务中判断pre-bbox与gt-bbox离最直接的指标就是IOU,但是所采用的loss函数却不太适用如丅图所示:
假设两个框的某一个角之间的距离是固定的,相同的L2-norm值相同而其IOU值可以是完全不同的。因此一个好的局部优化解未必是IOU的局部优化解。
本文提出了使用IOU来指导回归任务的学习在这种情况下,IOU可以被反向传播然而,将IOU作为损失由两个问题:1)如果IOU=0并不能反映出两个BBOX之间的距离(临近还是相离很远),梯度将为0无法优化;2)IOU无法正确区分两个对象的不同align,即如果对齐方式不同但是交叉區域相同的话,其IOU将完全相等
针对上述IOU两点问题,作者提出改进方案:GIOU
先计算两个框的最小闭包区域面积C,再计算IOU然后再计算C区域Φ不属于两个框的区域占C的比重,最后用IOU减去这个比重得到GIOU
与IOU相似,GIOU也是一种距离度量;对尺度不敏感;GIOU是IOU的下界;GIOU=[-1,1];GIOU不仅仅关注重叠區域还关注其他的不重合区域。
将GIOU作为损失函数步骤如上图所示。
发布了1 篇原创文章 · 获赞 2 · 访问量 365