一种权重自适应与任务解耦的旋转目标检测器

文档序号:35461247发布日期:2023-09-15 23:31阅读:20来源:国知局
一种权重自适应与任务解耦的旋转目标检测器

本发明涉及一种长尾目标检测方法,涉及一种目标检测中任务精化的方法,涉及了一种新的应用于遥感场景任务精化及长尾目标检测的方法,涉及军事领域的遥感目标检测问题,属于计算机视觉与智能信息处理领域。


背景技术:

1、长尾目标检测(long-tailed object detection)是指真实场景的数据往往存在着少数类别(头部类别)占据大多数样本数量,大多数类别(尾部类别)占据少数样本量的现象。遥感场景采集的图像大都分辨率比较大,而且目标尺度不一,小目标数量占据主要部分,为更好地方便对小目标的检测,通常都要对遥感图像进行裁剪后送入检测网络,检测后再对检测结果进行重新拼接得到检测后的遥感图像,遥感图像经过裁剪之后长尾效会进一步加剧,通常裁剪的gap越大长尾效应越严重,在经过gap为100的裁剪之后,小车类别数量有超过22万个实例标注,而自网球场类别(第7个类别,含有4822个实例标注)往后呈现出9个尾部类别,特别地,对于储油罐类别仅仅只有402个实例标注。针对长尾效应,现有的方法在解决长尾效应总体上可以分为两大类,基于重采样(re-sampling)和重赋值(re-weighting),重采样主要是针对头部类别进行欠采样、针对尾部类别进行过采样从而在一定层度上缓解长尾效应问题,重赋值是对于某些关注类别进行权重惩罚,默写不关注类别不进行惩罚,如现有的方法中认为在每次迭代计算概率时,认为较小的概率值没有必要保留,因此在计算bce损失时,对非one-hot类别或较小概率值所对应的各自类别进行置“0”操作从而缓解在每次迭代过程中头部类别对尾部类别的负梯度影响;还有一些方法是用现在比较流行的方法来缓解,如元学习(meta-learning)、迁移学习(transfer-learning)、自适应权重(auto-weighting)等。现有的重赋值方法大都是忽略完全去除非one-hot类别的影响,但是事实上,非one-hot类别尤其是头部非one-shot类别同样存在着与分类相关的信息。相比于传统的重赋值方法,本发明将非one-hot类别同样进行重赋值,具体赋值基于每个类别的实例数量比例,本发明能够缓解遥感场景的长尾目标检测。

2、任务精化(task-refinement)通常是指对特定任务采用特定优化方式,本专利针对任务精化主要做两方面,一方面是检测头解耦(decoupled head),另一方面采用eiou损失。检测头解耦是指将目标检测任务中的两个子任务分类和回归独立开,使分类任务和回归任务能够在各自通道上进行,通常一阶段检测器retinanet等使采用解耦方式,yolo系列的目标检测器处于速度上的考虑大都采用一个卷积头同时完成分类和回归任务,现有的研究证明将分类和回归任务独立开能够提升检测精度。针对遥感场景的目标检测,本发明将yolov5检测器进行解耦操作,使分类、回归任务在各自的通道上完成,能够提高检测精度。对于回归框的定位损失,常用的giou和diou大都存在问题,ciou优化了giou和diou的问题后,同样还存在着相对长宽比导致的对于长宽惩罚失效的问题,因此本专利在yolov5-obb检测器的基础上引入eiou损失,提高定位任务的可靠性。


技术实现思路

1、本发明提出了一种应用于遥感场景任务精化的长尾目标检测的方法,设计了一种编码权重及任务精化的网络结构,权重能根据不同数据集来自适应计算,采用huffman编码方式来编码得到每个类别对应的权值,用于后续计算交叉熵损失时进行权重重分配,对yolov5-obb检测头进行任务解耦操作,使分类和回归任务在各自的通道上进行,引入了eiou损失便于后续更好地进行回归框预测。

2、编码权重及任务精化的单阶段检测方法,包括以下步骤:

3、(1)利用训练集标注信息统计训练的每个类别的实例标注数量并计算其各自的概率σ(ci);

4、(2)将计算得到的每个类别概率依次通过huffman编码器进行编码,得到编码后的码长,码长作为权重;

5、(3)针对分类任务,在计算每个类的bce损失时,将预测值与概率做交叉熵损失所得到结果分别乘上huffman编码得到的权重;

6、(4)针对回归任务,采用eiou保证回归框回归的可靠性,同时解耦yolov5检测头,使分类、回归任务独立进行,提高定位精度。



技术特征:

1.一种权重自适应与任务解耦的旋转目标检测器,其特征在于包括以下步骤:

2.根据权利要求1所述的方法,步骤(1)中编码权重的步骤是:利用先验标签信息统计出每个类别的数量,同时计算每个类别的概率,然后将概率值进行huffman编码,得到编码码长,然后将码长作为惩罚权重,在预测值和one-hot做bce损失时将对应的每个类别计算结果分别乘上权重惩罚,一定程度上缓解长尾目标检中类别数量不平衡的问题;此外考虑到有些类别在数量上本来就很多,添加权重后反而会降低其表现,导致影响整体评估,因此可以只针对某些类别进行huffman编码得到权重,部分类别保持不变,添加编码权重后计算的bce损失定义为式(1)所示,添加编码权重后的梯度反向传播计算过程如式(2)所示:

3.根据权利要求1所述的方法,步骤(2)中本发明使用了解耦卷积头的操作,附图(1)所示的detect head部分即为解耦卷积头后的原理示意图,相对于传统的yolov5采用的一个单独卷积头来同时进行多种任务,考虑各个任务之间的互斥关系,将分类与回归任务进行了解耦操作,分别使用三个卷积头来同时对于角度回归,坐标回归及分类任务,附图(3)所示即为对yolov5进行任务精化的解耦卷积头模块,使回归任务和回归任务通过各自的支路解决,通过对回归,分类任务分别通过3*3卷积和1*1卷积来实现完成对分类回归任务的解耦操作;假定输入的特征图x的维度大小为w×h×256,x首先经过两个3×3卷积,然后经过一个1×1卷积进行通道降维成任务各自需要的通道,即降维成分类,角度回归,坐标回归和置信度三个通道,其中坐标回归和置信度又细分成两个各自的通进行各自的任务实现,具体地,在各自通道上经过3×3卷积之后得到新的特征图分别经过1×1卷积分别得到维度为w×h×nc,w×h×ang,w×h×4,w×h×1的特征图,其中的1*1卷积主要目是尽可能地减少参数量,然后将所得到的特征图在通道维度上进行拼接从而得到拼接后的特征图z。

4.根据权利要求1所述的方法,其特征在于步骤(3)中,传统的yolov5采用的是ciou损失,其公式如式(3),式(4)所示:


技术总结
本发明提出了一种权重自适应与任务解耦的旋转目标检测器。首先,利用标签信息统计每个类别的数量并计算各自的概率,再对各个类别的概率进行Huffman编码,得到编码权重,在计算预测值和one‑hot标签的BCE损失时,将每个类别的计算结果乘上各自类别的编码权重。其次,将yolov5‑obb检测器的检测头进行解耦操作,采用两个不同的1×1卷积对分类和回归任务进行各自预测,同时,还引入了EIOU损失来代替CIOU提高定位准确性,最终提高遥感场景下目标检测精度。本发明主要应用于遥感场景下的任务精化及长尾目标检测,在遥感目标检测,国防科技及军事等领域具有开阔的应用前景。

技术研发人员:何小海,曾王明,陈洪刚,熊书琪,吴晓红,王正勇
受保护的技术使用者:四川大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1