Anchor-Based目标检测学习记录

Matcher 算法

对于简单的猫狗分类任务，我们会对每一张图片进行标注，然后模型会根据图片的真实类别进行学习和训练。在基于Anchor的目标检测任务中，模型也会对每一个Anchor进行预测分类，但我们没有对每一个Anchor进行标注，模型并不知道目前预测的Anchor的真实类别，因此这是无法学习的。但我们不可能手动对每一个Anchor进行标注，我们只是标注了一张图片中某些目标区域而已，而且这些被标注的目标区域并不会与Anchor完美匹配。

因此为了确定每一个Anchor的真实类别，需要引入Matcher算法。

我们会计算每一个目标的GT（Ground Truth）与每一个Anchor的IOU，如果IOU超过设定的阈值，那么就认为该Anchor的类别为该目标的类别，否则就认为是背景。

这样我们就可以根据标注图片获得每一个Anchor的类别了。

BoxCoder算法

由于Anchor的框往往不会完美匹配真实目标，也就是说Anchor的框是有可能不会完美框中真是目标的，有可能会只框住大部分，这样是没法获取到检测目标准确的位置信息的。因此为了获取目标的准确位置需要用模型再预测出Anchor与目标GT的位置偏移量。

也就是说现在的模型需要预测两个值，一个是Anchor的类别，另一个是Anchor与目标GT的位置偏移量。

与之前说的类似，我们也不可能为每一个Anchor标注出其与目标GT的位置偏移量，因此需要使用BoxCoder算法将Anchor的坐标与GT坐标之间的偏移量编码成模型可以预测的变量。

Anchor生成

Anchor一般有3种不同的面积，area1<area2<area3，每一种面积又有3种不同长宽比的Anchor，1:1、1:2、2:1。因此一般来说对于某一个锚点会生成9张Anchor。

一般来说，对于特征图上的每一个像素点都会生成一系列的Anchor。但这不意味每个像素点都会生成9种Anchor，对于不同的特征图只需要生成一种面积的特征图就行。一般来说，对于尺度大的特征图，会生成小面积的Anchor；尺度小的特征图，会生成大面积的Anchor。

LightningMaster

https://lightningleader.github.io/posts/23.html

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 LightningMaster !

深度学习目标检测学习笔记

open3d可视化点云

2023-06-09 LightningMaster

学习笔记三维点云

sklearn实现基于TF-IDF的KNN新闻标题文本分类

2023-03-23 LightningMaster

机器学习 NLP

Anchor-Based目标检测学习记录

Anchor-Based目标检测学习记录

推荐文章

Matcher 算法

BoxCoder算法

Anchor生成