行人属性识别模型的训练方法、系统及相关设备与流程

文档序号:30959488发布日期:2022-07-30 12:07阅读:167来源:国知局
行人属性识别模型的训练方法、系统及相关设备与流程

1.本发明属于计算机视觉应用领域,尤其涉及一种行人属性识别模型的训练方法、系统及相关设备。


背景技术:

2.计算机视觉领域的任务有目标检测、属性识别、图像分类等,而行人属性识别是计算机视觉领域的一项重要任务,因为它在视频监控中扮演着重要的角色,目的是识别图片中行人的属性,比如年龄、性别、上衣穿搭、上衣颜色等。
3.早期的行人属性识别主要用的是手工设计的低层特征,如n.dalal等人提出的hog算法使用方向梯度直方图获取局部形状;d.g.lowe等人提出的sift尺度不变特征转换算法在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,从而获得局部特征。但是以上算法由于存在人为设计不可控、依赖于数据库、提取时间长、工作量大等缺点,使得这些算法在实际应用中的效果并不理想。
4.近年来,由于深度学习通过多层非线性变换可以提取更加丰富特征的优势,也出现了很多的基于深度学习的行人属性识别算法。p.sudowe等人提出了一种基于卷积网络的多分支分类分层算法(can),多分支分类分层仅考虑全局图像,并联合学习所有属性以进行预测,这就导致多分支分类分层算法缺乏对图像的细粒度识别的考虑;p.liu等人提出了一种定位引导网络(lgnet),将局部特征与全局特征融合,可以对不同属性对应的区域进行定位,但是这类算法获取到的局部特征和全局特征可能不够有效,不能作为行人属性识别的重要依据。
5.2017年,wang.x等人提出了non-local net,应用于计算机视觉领域的视频分类任务,因为其使用了注意力机制作为信息传递的结构,使得non-local net相对于之前的分类模型具有更高的性能,这促进了注意力机制广泛应用于计算机视觉领域。hu、j等人提出的se-net自适应的对各个通道进行权重的分配,提升了网络的性能,但是仅从通道方向的进行考虑;saini、r.等人再se-net的基础上再提出的ulsam(ultra-lightweight subspace attention,超轻量注意力机制)具备从每个特征子空间获得各自的注意图的能力,从而在提取特征时获得多尺度和多频率的特征表示,这对于细粒度图像分类更为理想,但是ulsam存在子特征图之间缺乏交互的不足,忽略了特征中多属性与多属性之间的关系。


技术实现要素:

6.本发明实施例提供一种行人属性识别模型的训练方法、系统及相关设备,旨在解决原本的ulsam注意力模块对图像的通道信息的提取能力不足、使得属性间的关联性不足的问题。
7.第一方面,本发明实施例提供一种行人属性识别模型的训练方法,所述方法包括:
8.获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集,所述频繁项集中的每一所述行人图像包含至少2种行人属性;
9.对所述频繁项集进行二值属性转换,得到训练数据集;
10.构建包含改进的ulsam注意力模块的预训练属性识别模型,并将所述训练数据集输入至所述预训练属性识别模型,得到关于所述行人属性的预训练属性识别准确率结果,其中,所述预训练属性识别模型还包含与所述行人属性的数量对应的全连接层,且每一所述全连接层分别对应一种所述行人属性;
11.根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的所述行人属性所对应的所述全连接层进行连接;
12.将完成了所述全连接层连接的所述预训练属性识别模型输出,得到行人属性识别模型。
13.更进一步地,所述获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集的步骤,具体为:
14.根据所述数据集设定所述apriori算法的预设支持度阈值和预设置信度阈值,根据所述预设支持度阈值和所述预设置信度阈值对所述数据集的所述行人属性进行过滤筛选,得到所述频繁项集,所述频繁项集中至少有部分所述行人属性具有所述强相关性。
15.更进一步地,对所述频繁项集进行二值属性转换,得到训练数据集的步骤,包括以下子步骤:
16.将所述频繁项集中的多值属性转换为二值属性;
17.保留所述频繁项集中原本的二值属性,并与所述多值属性转换的结果进行整合,得到所述训练数据集。
18.更进一步地,所述预训练属性识别模型基于resnet50模型,所述resnet50模型根据前后逻辑顺序包含输入层、第一残差层、第二残差层、第三残差层、第四残差层、全连接层、输出层,所述第一残差层、所述第二残差层、所述第三残差层、所述第四残差层所有残差层之间两两具有交互通道之间具有交互通道,其中,所述第一残差层包含3个残差模块,所述第二残差层包含4个残差模块,所述第三残差层包含6个残差模块,所述第四残差层包含3个残差模块,每一所述残差模块均由前后逻辑顺序的1*1卷积、3*3卷积、1*1卷积组成。
19.更进一步地,所述ulsam注意力模块包含空间注意力子模块和se-通道注意力子模块,其中,所述空间注意力子模块位于所述第一残差层的最后一个1*1卷积之后,所述se-通道注意力子模块位于所述全连接层的输出之后。
20.更进一步地,在所述预训练属性识别模型中,定义所述第一残差层的最后一个1*1卷积输出的一个特征图为f,f可划分为对应所述行人属性的数量的g个子特征图,则所述特征图f的所述子特征图可以表示为关系式(1):
21.[f1,
…fn

…fg
]
ꢀꢀꢀꢀꢀꢀ
(1)
[0022]
其中n和g均为正整数;
[0023]
定义所述空间注意力子模块以fn为输入进行处理后输出的空间注意力特征图为f’n
,则所述空间注意力特征图f’n
满足关系式(2):
[0024]
f’n
=sigmod(maxpool(fn))*fnꢀꢀꢀ
(2)
[0025]
定义所述预训练属性识别模型中resnet50的通道连接和卷积操作对所述空间注意力特征图f’n
进行处理后输出的第二特征图为f”n
,则所述第二特征图f”n
满足关系式(3):
[0026][0027]
定义所述se-通道注意力子模块以所述第二特征图f”n
为输入进行处理后,再经过所述输出层输出的修正特征图为out,则所述修正特征图out满足关系式(4):
[0028]
out=fc2(relu(fc1(maxpool(concat[f”1


f”n


f”g
]))))
ꢀꢀꢀ
(4)
[0029]
以上关系式(2)、(3)、(4)中,maxpool表示通道维度的最大池化操作,sigmod、relu表示激活函数,concat表示通道连接操作,conv表示卷积核大小为1*1的卷积操作,fc表示全连接层的全连接操作。
[0030]
更进一步地,根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的多种所述行人属性所对应的所述全连接层进行连接的步骤,包括以下子步骤:
[0031]
获取所述预训练属性识别准确率结果中每一所述行人属性对应的行人属性识别准确率;
[0032]
定义其中任意一所述行人属性为后件属性,与所述后件属性存在所述强相关性的其他的所述行人属性为前件属性,并判断所述前件属性所对应的所述行人属性识别准确率是否高于所述预设准确度阈值,其中:
[0033]
若所述前件属性所对应的所述行人属性识别准确率高于所述预设准确度阈值,则将所述前件属性所对应的所述全连接层与所述后件属性所对应的所述全连接层进行连接;
[0034]
若所述前件属性所对应的所述行人属性识别准确率小于或等于所述预设准确度阈值,则不进行任何处理。
[0035]
第二方面,本发明实施例还提供一种行人属性识别模型的训练系统,包括:
[0036]
属性关联模块,用于获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集,所述频繁项集中的每一所述行人图像包含至少2种行人属性;
[0037]
属性转化模块,用于对所述频繁项集进行二值属性转换,得到训练数据集;
[0038]
预训练模块,用于构建包含改进的ulsam注意力模块的预训练属性识别模型,并将所述训练数据集输入至所述预训练属性识别模型,得到关于所述行人属性的预训练属性识别准确率结果,其中,所述预训练属性识别模型还包含与所述行人属性的数量对应的全连接层,且每一所述全连接层分别对应一种所述行人属性;
[0039]
全连接关联模块,用于根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的所述行人属性所对应的所述全连接层进行连接;
[0040]
模型输出模块,用于将完成了所述全连接层连接的所述预训练属性识别模型输出,得到行人属性识别模型。
[0041]
第三方面,本发明实施例还提供一种计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例中任意一项所述的行人属性识别模型的训练方法中的步骤。
[0042]
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储
介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中任意一项所述的行人属性识别模型的训练方法中的步骤。
[0043]
本发明所达到的有益效果,由于采用了改进的ulsam注意力模块增加到具有通道交互操作的行人属性识别模型中、并通过apriori算法对行人属性进行筛选和关系挖掘以改变全连接层的结构和训练方法,使得识别模型的性能得到增强,并能够识别到更丰富的信息。
附图说明
[0044]
图1是本发明实施例提供的行人属性识别模型的训练方法的步骤流程框图;
[0045]
图2是本发明实施例提供的行人属性识别模型的训练方法中步骤s102的子流程框图;
[0046]
图3是本发明实施例中的预训练属性识别模型的多任务学习硬连接结构示意图;
[0047]
图4是本发明实施例所使用的resnet50模型结构示意图;
[0048]
图5是本发明实施例提供的注意力模块结构示意图;
[0049]
图6是本发明实施例提供的预训练属性识别模型的整体结构示意图;
[0050]
图7是本发明实施例提供的行人属性识别模型的训练方法中步骤s104的子流程框图;
[0051]
图8是本发明实施例提供的预训练属性识别模型的全连接结构示意图;
[0052]
图9是本发明提供的行人属性识别模型的训练系统200的结构示意图;
[0053]
图10是本发明实施例提供的计算机设备的结构示意图。
具体实施方式
[0054]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0055]
请参照图1,图1是本发明实施例提供的行人属性识别模型的训练方法的步骤流程框图,包括以下步骤:
[0056]
s101、获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集,所述频繁项集中的每一所述行人图像包含至少2种行人属性。
[0057]
具体的,所述数据集具有多张行人图像,所述行人图像中的行人均具备多种行人属性,例如着装类型、着装颜色、行人年龄、行人性别等,对于任一所述行人图像,都可以根据所述行人属性进行类别的区分。所述apriori算法是一种数据挖掘算法,用于计算并找出数据中频繁出现的数据集合,以便于进行集合间的关系分析,频繁出现的数据集合即所述频繁项集。
[0058]
对于所述apriori算法,其过程主要由连接和剪枝组成,连接的方法主要是迭代的类矩阵计算,剪枝则是将类矩阵计算的不必要的中间结果去掉,剪枝得到的结果即所述频繁项集,所述频繁项集包括标准支持度(support),置信度(confidence)、提升度(lift)的概念,其中:
[0059]
标准支持度指的是关联的数据集中出现的次数占总数据集的比重;
[0060]
置信度指的是数据的条件概率,例如,对于同一数据中的属性x和y,则y相对于x的所述置信度可以表示为:
[0061]
confidence(y-》x)=p(x|y)=p(xy)/p(y)
[0062]
提升度指的是含有y的条件下同时含有x的概率、与x总体发生的概率之比,该表述可以表示为:
[0063]
lift(y-》x)=p(x|y)=confidence(y-》x)/p(x)
[0064]
提升度大于1时,表示y与x之间具有有效的强相关性,提升度小于1时,表示y与x之间具有无效的强关联规则,提升度等于1时,表示x与y相互独立。
[0065]
在本发明实施例中,通过设定所述apriori算法的预设支持度阈值和预设置信度阈值,再经过所述apriori算法对所述数据集进行所述行人属性的过滤筛选,得到所述数据集对应的所述频繁项集。示例性的,本发明实施例使用公开的market1501数据集作为所述apriori算法进行筛选的所述数据集,所述market1501数据集中包含32668个行人图像,且包含多种所述行人属性,对于所述market1501数据集,所述预设支持度阈值和所述预设置信度阈值分别设置为0.2和0.9,根据上述的所述预设支持度阈值和所述预设置信度阈值利用所述apriori算法对所述market1501数据集进行筛选计算得到的所述频繁项集如表1所示。
[0066]
表1market1501数据集进行筛选计算得到的所述频繁项集
[0067][0068]
需要说明的是,根据数据集、所述预设支持度阈值、所述预设置信度阈值的不同,得到的结果也应相应的不同,表1的数据仅作示例性说明,并不用以限制本发明。
[0069]
s102、对所述频繁项集进行二值属性转换,得到训练数据集。
[0070]
具体的,请参照图2,图2是本发明实施例提供的行人属性识别模型的训练方法中步骤s102的子流程框图,具体包括以下子步骤:
[0071]
s1021、将所述频繁项集中的多值属性转换为二值属性。
[0072]
对于所述频繁项集中的任一所述行人属性,都可能是多值属性,所述多值属性指的是对于某一实体,有多组值对实体进行描述的属性,在本发明实施例中,以所述market1501数据集为例,其任一行人图像中所包含的所述行人属性由1个四值属性、9个二值属性、1个九值属性、1个二值属性组成,在本步骤中,将所述多值属性均转换为所述二值属性。
[0073]
s1022、保留所述频繁项集中原本的二值属性,并与所述多值属性转换的结果进行整合,得到所述训练数据集。
[0074]
将转换完的所述多值属性与原本的所述二值属性进行整合,示例性的,对所述market1501数据集进行多值转换后得到32个二值属性,其每一图像形状从64*128*3转换为224*224*3,从而统一用于输入预训练属性识别模型的数据大小。
[0075]
s103、构建包含改进的ulsam注意力模块的预训练属性识别模型,并将所述训练数据集输入至所述预训练属性识别模型,得到关于所述行人属性的预训练属性识别准确率结果,其中,所述预训练属性识别模型还包含与所述行人属性的数量对应的全连接层,且每一
所述全连接层分别对应一种所述行人属性。
[0076]
请同时参照图3、图4、图5、图6,图3是本发明实施例中的预训练属性识别模型的多任务学习硬连接结构示意图,图4是本发明实施例所使用的resnet50模型结构示意图,图5是本发明实施例提供的注意力模块结构示意图,图6是本发明实施例提供的预训练属性识别模型的整体结构示意图,在本发明实施例中,所述预训练属性识别模型使用多任务学习中的硬连接结构,多任务联合学习可以共享数据集,改善模型效果,多任务学习一般共享特征网络,但对每一个任务应用一个单独的网络,在用于行人属性识别时,多任务学习有利于在不同的子任务中寻找关联性。
[0077]
所述预训练属性识别模型基于resnet50模型,所述resnet50模型根据前后逻辑顺序包含输入层、第一残差层、第二残差层、第三残差层、第四残差层、全连接层、输出层,所有残差层之间具有交互通道,其中,所述第一残差层包含3个残差模块,所述第二残差层包含4个残差模块,所述第三残差层包含6个残差模块,所述第四残差层包含3个残差模块,每一所述残差模块均由前后逻辑顺序的1*1卷积、3*3卷积、1*1卷积组成。
[0078]
更进一步地,所述改进的ulsam注意力模块包含空间注意力子模块和se-通道注意力子模块,其中,所述空间注意力子模块位于所述第一残差层的最后一个1*1卷积之后,所述se-通道注意力子模块位于所述全连接层的输出之后。所述se-通道注意力子模块的结构与所述resnet50模型中的交互通道相关,这意味着所述se-通道注意力子模块与所有残差层的输出具有信息交互关系,从而提高了网络中信息的传递效率。
[0079]
更进一步地,在所述预训练属性识别模型中,定义所述第一残差层的最后一个1*1卷积输出的一个特征图为f,f可划分为对应所述行人属性的数量的g个子特征图,则所述特征图f的所述子特征图可以表示为关系式(1):
[0080]
[f1,
…fn

…fg
](1)
[0081]
其中n和g均为正整数;
[0082]
定义所述空间注意力子模块以fn为输入进行处理后输出的空间注意力特征图为f’n
,则所述空间注意力特征图f’n
满足关系式(2):
[0083]
f’n
=sigmod(maxpool(fn))*fnꢀꢀꢀ
(2)
[0084]
定义所述预训练属性识别模型中resnet50的通道连接和卷积操作对所述空间注意力特征图f’n
进行处理后输出的第二特征图为f”n
,则所述第二特征图f”n
满足关系式(3):
[0085][0086]
定义所述se-通道注意力子模块以所述第二特征图f”n
为输入进行处理后,再经过所述输出层输出的修正特征图为out,则所述修正特征图out满足关系式(4):
[0087]
out=fc2(relu(fc1(maxpool(concat[f”1


f”n


f”g
]))))
ꢀꢀꢀ
(4)
[0088]
以上关系式(2)、(3)、(4)中,maxpool表示通道维度的最大池化操作,sigmod、relu表示激活函数,concat表示通道连接操作,conv表示卷积核大小为1*1的卷积操作,fc表示全连接层的全连接操作。
[0089]
在本发明实施例中,将所述训练数据集输入所述预训练属性识别模型,所述预训练属性识别模型在将所述训练数据集中的所述行人属性进行特征提取和识别后,输出识别
到的所述修正特征图,对于所述修正特征图与原本的所述行人属性进行相互的比对,可以得到关于所述行人属性的预训练属性识别准确率结果,一般的,所述预训练属性识别准确率结果为计算出的数值。
[0090]
s104、根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的所述行人属性所对应的所述全连接层进行连接。
[0091]
请参照图7,图7是本发明实施例提供的行人属性识别模型的训练方法中步骤s104的子流程框图,包括以下子步骤:
[0092]
s1041、获取所述预训练属性识别准确率结果中每一所述行人属性对应的行人属性识别准确率。
[0093]
具体的,本发明实施例中的所述预训练属性识别准确率结果中包含任一所述行人属性的识别结果,能够根据所述特征修正图与原本的所述行人属性计算每一所述行人属性对应的行人属性识别准确率,具体为一个数值。
[0094]
s1042、定义其中任意一所述行人属性为后件属性,与所述后件属性存在所述强相关性的其他的所述行人属性为前件属性,并判断所述前件属性所对应的所述行人属性识别准确率是否高于所述预设准确度阈值。
[0095]
示例性的,如表1中的数据,在本发明实施例中以所述行人属性down、cloth、teenager为例,使用所述apriori算法计算所述频繁项集时,会相对于其中一种属性来计算另一属性对该属性的关联性,其中,以down、cloth为所述前件属性(antecedents),以teenager为所述后件属性(consequents),为了提高作为所述后件属性的teenager的识别准确率,需要对作为所述前件属性的down、cloth的识别准确率进行判断,在这里需要定义一预设阈值,即所述预设准确度阈值,将down、cloth的识别准确率与所述预设准确度阈值进行比较判断,其中:
[0096]
s1043a、若所述前件属性所对应的所述行人属性识别准确率高于所述预设准确度阈值,则将所述前件属性所对应的所述全连接层与所述后件属性所对应的所述全连接层进行连接。
[0097]
具体的,请参照图8,图8是本发明实施例提供的预训练属性识别模型的全连接结构示意图,对于down、cloth的识别准确率超过所述预设准确度阈值的情况时,将所述全连接层(full connect,fc)中与down、cloth对应的层次与teenager的层次进行连接,即:
[0098][0099]
同时,以表1中的数据为例,以upsleeve为所述后件属性的情况时,作为upsleeve的所述前件属性的teenager、down、cloth各自的识别准确率均超过所述预设准确度阈值的情况时,将所述全连接层中与teenager、down、cloth对应的层次与upsleeve的层次进行连接,即:
[0100][0101]
通过这样的方式,在具有强相关性的属性的影响下,高识别准确率所对应的所述行人属性也会提高作为其所述后件属性的识别准确率,从而提高整体属性识别模型的识别效果。
[0102]
s1043b、若所述前件属性所对应的所述行人属性识别准确率小于或等于所述预设准确度阈值,则不进行任何处理。
[0103]
该情况指的是,作为所述前件属性时的识别准确率小于或等于所述准确度阈值,即当前的识别准确度不足够以提高所述后件属性的准确度,此时则不将对应的所述全连接层的层次与所述后件属性的层次进行连接,需要说明的是,当所述前件属性具有多个时,并不是当其中一个所述前件属性对应的准确度低于阈值时就取消对多个所述前件属性的层次连接,而是仅取消不满足阈值的单个所述前件属性对应的层次连接。
[0104]
s105、将完成了所述全连接层连接的所述预训练属性识别模型输出,得到行人属性识别模型。
[0105]
示例性的,以本发明实施例中使用的所述market1501数据集、所述预设支持度阈值、所述预设置信度阈值、所述预设准确度阈值等参数训练、输出得到的所述行人属性识别模型使用的所述ulsam注意力模块与其他类型的注意力模块在accuary、recall、precision、f1-score指标下的对比数据如表2所示。
[0106]
表2ulsam注意力模块与其他类型的注意力模块对比数据
[0107]
模型accuaryrecallprecisionf1-scoreresnet0.88980.71740.81530.7632resnet+se0.89640.74540.81970.7808resnet+ulsam0.90380.77450.82600.7994resnet+hs-ulsam-b0.91110.79320.83870.8153
[0108]
其中,resnet+hs-ulsam-b表示本发明实施例中的所述行人属性识别模型。
[0109]
所述行人属性识别模型与使用其他类型的注意力模块的模型在accuary、recall、precision、f1-score指标下的消融实验对比数据如表3所示。
[0110]
表3行人属性识别模型与使用其他类型的注意力模块的模型消融实验数据对比
[0111]
模型accrecallprecisionf1-scoreresnet0.88980.71740.81530.7632resnet+协同0.89610.73280.82770.7773resnet+hs-ulsam-a0.90740.79870.82220.8103resnet+hs-ulsam-b0.91110.79320.83870.8153resnet+hs-ulsam-b+协同0.91300.79710.84290.8194
[0112]
其中,resnet+hs-ulsam-b+协同表示本发明实施例中的结合硬连接结构进行协同训练的所述行人属性识别模型。
[0113]
对于本发明实施例中所提到的所述行人属性teenager、upsleeve,所述行人属性识别模型与使用其他类型的注意力模块的模型在行人属性上的识别准确率的对比数据如表4所示。
[0114]
表4行人属性的识别准确率的对比数据
[0115]
模型teenagerupsleeveresnet0.82660.9182resnet+协同0.83580.9240
resnet+hs-ulsam-b0.85770.9280resnet+hs-ulsam-b+协同0.86640.9343
[0116]
以上数据表明,本发明实施例提供的所述行人属性识别模型在accuary、recall、precision、f1-score指标下均高于传统结构的注意力机制的神经网络模型,并且,对于行人属性的识别准确率也有提高。
[0117]
本发明所达到的有益效果,由于采用了改进的ulsam注意力模块增加到具有通道交互操作的行人属性识别模型中、并通过apriori算法对行人属性进行筛选和关系挖掘以改变全连接层的结构和训练方法,使得识别模型的性能得到增强,并能够识别到更丰富的信息。
[0118]
本发明实施例还提供一种行人属性识别模型的训练系统,请参照图9,图9是本发明提供的行人属性识别模型的训练系统200的结构示意图,包括:
[0119]
属性关联模块201,用于获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集,所述频繁项集中的每一所述行人图像包含至少2种行人属性;
[0120]
属性转化模块202,用于对所述频繁项集进行二值属性转换,得到训练数据集;
[0121]
预训练模块203,用于构建包含改进的ulsam注意力模块的预训练属性识别模型,并将所述训练数据集输入至所述预训练属性识别模型,得到关于所述行人属性的预训练属性识别准确率结果,其中,所述预训练属性识别模型还包含与所述行人属性的数量对应的全连接层,且每一所述全连接层分别对应一种所述行人属性;
[0122]
全连接关联模块204,用于根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的所述行人属性所对应的所述全连接层进行连接;
[0123]
模型输出模块205,用于将完成了所述全连接层连接的所述预训练属性识别模型输出,得到行人属性识别模型。
[0124]
所述行人属性识别模型的训练系统200能够实现如上述实施例中的行人属性识别模型的训练方法中的步骤,且能实现同样的技术效果,参上述实施例中的描述,此处不再赘述。
[0125]
本发明实施例还提供一种计算机设备,请参照图10,图10是本发明实施例提供的计算机设备的结构示意图,所述计算机设备300包括:存储器302、处理器301及存储在所述存储器302上并可在所述处理器301上运行的计算机程序。
[0126]
所述处理器301调用所述存储器302存储的计算机程序,执行本发明实施例提供的园区管理方法中的步骤,请结合图1,具体包括:
[0127]
s101、获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集,所述频繁项集中的每一所述行人图像包含至少2种行人属性。
[0128]
更进一步地,所述获取包含多张行人图像的数据集,并利用apriori算法对所述数据集进行过滤,得到频繁项集的步骤,具体为:
[0129]
根据所述数据集设定所述apriori算法的预设支持度阈值和预设置信度阈值,根据所述预设支持度阈值和所述预设置信度阈值对所述数据集的所述行人属性进行过滤筛选,得到所述频繁项集,所述频繁项集中至少有部分所述行人属性具有所述强相关性。
[0130]
s102、对所述频繁项集进行二值属性转换,得到训练数据集。
[0131]
更进一步地,对所述频繁项集进行二值属性转换,得到训练数据集的步骤,包括以下子步骤:
[0132]
将所述频繁项集中的多值属性转换为二值属性;
[0133]
保留所述频繁项集中原本的二值属性,并与所述多值属性转换的结果进行整合,得到所述训练数据集。
[0134]
s103、构建包含改进的ulsam注意力模块的预训练属性识别模型,并将所述训练数据集输入至所述预训练属性识别模型,得到关于所述行人属性的预训练属性识别准确率结果,其中,所述预训练属性识别模型还包含与所述行人属性的数量对应的全连接层,且每一所述全连接层分别对应一种所述行人属性。
[0135]
更进一步地,所述预训练属性识别模型基于resnet50模型,所述resnet50模型根据前后逻辑顺序包含输入层、第一残差层、第二残差层、第三残差层、第四残差层、全连接层、输出层,所述第一残差层、所述第二残差层、所述第三残差层、所述第四残差层之间两两具有交互通道,其中,所述第一残差层包含3个残差模块,所述第二残差层包含4个残差模块,所述第三残差层包含6个残差模块,所述第四残差层包含3个残差模块,每一所述残差模块均由前后逻辑顺序的1*1卷积、3*3卷积、1*1卷积组成。
[0136]
更进一步地,所述改进的ulsam注意力模块包含空间注意力子模块和se-通道注意力子模块,其中,所述空间注意力子模块位于所述第一残差层的最后一个1*1卷积之后,所述se-通道注意力子模块位于所述全连接层的输出之后。
[0137]
更进一步地,在所述预训练属性识别模型中,定义所述第一残差层的最后一个1*1卷积输出的一个特征图为f,f可划分为对应所述行人属性的数量的g个子特征图,则所述特征图f的所述子特征图可以表示为关系式(1):
[0138]
[f1,
…fn

…fg
]
ꢀꢀꢀꢀꢀ
(1)
[0139]
其中n和g均为正整数;
[0140]
定义所述空间注意力子模块以fn为输入进行处理后输出的空间注意力特征图f’n
,则所述空间注意力特征图f’n
满足关系式(2):
[0141]
f’n
=sigmod(maxpool(fn))*fnꢀꢀꢀ
(2)
[0142]
定义所述预训练属性识别模型中resnet50的通道连接和卷积操作对所述空间注意力特征图f’n
进行处理后输出的第二特征图为f”n
,则所述第二特征图f”n
满足关系式(3):
[0143][0144]
定义所述se-通道注意力子模块以所述第二特征图f”n
为输入进行处理后,再经过所述输出层输出的修正特征图为out,则所述修正特征图out满足关系式(4):
[0145]
out=fc2(relu(fc1(maxpool(concat[f”1


f”n


f”g
]))))
ꢀꢀꢀ
(4)
[0146]
以上关系式中,maxpool表示通道维度的最大池化操作,sigmod、relu表示激活函数,concat表示通道连接操作,conv表示卷积核大小为1*1的卷积操作,fc表示全连接层的全连接操作。
[0147]
s104、根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的多种所述行人属性所对
应的所述全连接层进行连接。
[0148]
更进一步地,根据所述预训练属性识别准确率结果,按照预设关联规则对存在强相关性的多种所述行人属性进行准确率判断,并将满足预设准确率阈值的多种所述行人属性所对应的所述全连接层进行连接的步骤,包括以下子步骤:
[0149]
获取所述预训练属性识别准确率结果中每一所述行人属性对应的行人属性识别准确率;
[0150]
定义其中任意一所述行人属性为后件属性,与所述后件属性存在所述强相关性的其他的所述行人属性为前件属性,并判断所述前件属性所对应的所述行人属性识别准确率是否高于所述预设准确度阈值,其中:
[0151]
若所述前件属性所对应的所述行人属性识别准确率高于所述预设准确度阈值,则将所述前件属性所对应的所述全连接层与所述后件属性所对应的所述全连接层进行连接;
[0152]
若所述前件属性所对应的所述行人属性识别准确率小于或等于所述预设准确度阈值,则不进行任何处理。
[0153]
s105、将完成了所述全连接层连接的所述预训练属性识别模型输出,得到行人属性识别模型。
[0154]
本发明实施例提供的计算机设备300能够实现如上述实施例中的行人属性识别模型的训练方法中的步骤,且能实现同样的技术效果,参上述实施例中的描述,此处不再赘述。
[0155]
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现本发明实施例提供的行人属性识别模型的训练方法中的各个过程及步骤,且能实现相同的技术效果,为避免重复,这里不再赘述。
[0156]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存取存储器(random access memory,简称ram)等。
[0157]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0158]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0159]
上面结合附图对本发明的实施例进行了描述,所揭露的仅为本发明较佳实施例而已,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而
不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式用等同变化,均属于本发明的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1