一种基于距离选择的强判别特征学习的行人重识别方法与流程

文档序号：19788017发布日期：2020-01-24 13:51阅读：来源：国知局

技术特征：

1.一种基于距离选择的强判别特征学习的行人重识别方法，所述方法包括：

步骤1)，选取图像，并缩放裁剪形成训练图片，在transform中采用随机水平翻转或者随机擦除等图像处理手段。每一个训练batch，随机挑选p个id的行人，每个行人随机挑选k张不同的图片，即一个batch含有p*k张图片。对于batch中的每一张图片，挑选出一个最难的正样本和一个最难的负样本组成一个三元组s,则最终三元组集合记为s；

步骤2)，设计基于预训练的残差网络架构，在不同层的维度上提取全局特征以及局部特征，在g-net与l-net的前三层网络完全共享，在第五层池化层之前和resnet50架构基本一致，修改最后的训练类别数目c。

步骤3)，将网络进行样本对的训练。在g-net中，在pool5层利用全局平均池化输出的特征图，特征用于计算三元组损失，同时结合中心损失，达到同类的聚合在同一球面的效果。接一个归一化层bn，将特征归一化至同一球面，能够平衡三元组损失与分类损失训练不一致的问题，同时利用1x1卷积进行降维处理，将2048维特征降到256维，最后接softmax层做分类损失。

步骤4)，在l-net中，在conv4层的最后一个下采样处，步长设置s＝1，即不降低特征图的大小，更利于网络学到更细节的特征。同时在pool5层中的特征图中进行切分成n块，最后对每块降维成256做n个局部分类损失lil，同时对融合n块局部特征的全局特征在未降维之前做全局分类损失gil，降维之后做全局三元组损失gtl，该分支对比与g-net分支结构相同，但是分类损失与三元组损失在全连接层的位置互换，我们对这两部分进行相同的对比实验，并在g-net中去掉中心损失，实验证明g-net中在测试阶段归一化后用softmax损失比l-net模块的全局分支效果要好。

步骤5)，在l-net中的ca模块中，通过pool5层之后的特征图被全局平均池化分块后，对n块特征归一化至[0,1]，便于选取距离模型矩阵m，得到每个batch中一对三元组中每张图片的n块局部特征，考虑检测算法捕获的行人图像存在的不对齐问题，通过计算局部特征之间的归一化距离来抽象选取最相似的局部做局部三元组损失ltl，来保证正负样例在局部区域的最佳匹配。

步骤6)，训练过程中，上述多损失同时优化行人重识别网络(l-net+g-net)，得到训练完的模型，确立相似性损失、分类损失的权重因子。

步骤7)，测试阶段中，用上述模型提取测试图片的特征(对比n+2个256维特征与选取g-net中2048维度的特征做检索各自的效果)，将特征图做欧氏距离，找到距离最近的一张图片，旨在给定一张查询图，能够高准确的检索出最相似的前k张相同id的图像。

2.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：步骤1)中在网络对选取的p*k张图像做resize处理，并使用随机擦除的手段防止过拟合以及使用插值的方法实现图片的缩放，从而保持图片不发生形变失真。

3.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：步骤2)中利用imagenet上预训练的网络模型，模型结构利用残差网络resnet50，修改网络模型的最后两层，调整成适合行人重识别所用数据集的训练类别数。并根据g-net与l-net选择修改pool5层的stride的大小。

4.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：步骤3)与4)中确定损失函数的权重因子，融合多种损失优化网络，同时注意为方便特征计算，改变维度特征，从2048维做成256维，降维之后更快更有效。在测试的时把l-net中的这八个256维的特征串连一个2048的特征，在对比实验中用这个2048维度的特征代表图片特征做检索。

5.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：步骤5)在l-net中的ca模块中，为解决局部区域空间语义不一致的问题，采用一种基于距离选择的强判别特征学习方法，分别计算一个batch中三元组分块的n块局部特征，并记录di与dj之间的距离构成矩阵m，其中i，j代表每张图像的局部区域，选出矩阵m中最相似的一个局部三元组，即距离最近表示对齐区域程度越高。

6.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：步骤6)中使用adam优化算法，并联合六个分类损失、全局与局部三元组损失以及g-net中的中心三元组损失cl共同训练网络。

7.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：步骤7)中的测试阶段，分别对比各个阶段的损失函数结合效果，并在实验中找到一种最优的损失权重来平衡各类损失所占比重，在选择用于测试阶段特征时，考虑在步骤4)中l-net结合后的2048维特征与g-net中2048维度的特征之间选择最优效果的作为检索特征。

8.根据权利要求1所述的基于距离选择的强判别特征学习的行人重识别方法，其特征在于：整个网络在训练以及测试过程中都是端到端实现的。

完整全部详细技术资料下载

当前第2页1 2 3