特征提取模型训练及特征提取方法、装置与流程

文档序号:33701994发布日期:2023-03-31 20:01阅读:74来源:国知局
特征提取模型训练及特征提取方法、装置与流程
特征提取模型训练及特征提取方法、装置
5技术领域
1.本发明实施例涉及特征工程领域,尤其涉及一种模型训练及特征提取方法、装置。


背景技术:

2.0随着计算机技术的发展以及各种成像设备的普及,互联网上累计了海
3.量的图像数据。给定查询图像,如何高效而精确地从这些大规模的图像集合中检索出内容相似的图像,成为了许多应用中的迫切需求。例如,如何高效而精确地从视频流中检索出包含指定地标、街景、服饰,或者商品的图像帧,是推广应用(例如旅游推广、商品推广等)中的迫切需求。
4.5对此,现有技术中提出了图像检索算法。图像检索算法通过提取图像
5.特征,基于图像特征进行分析并标引,建立图像的索引数据库,用于图像检索。
6.然而,目前的图像检索算法在提取图像特征时,通常将特征提取与特征聚合分开进行,导致算法复杂度较高且特征提取效率较低。
7.

技术实现要素:

8.鉴于此,为解决上述的技术问题,本发明实施例提供一种特征提取模型训练及特征提取方法、装置
9.第一方面,本发明实施例提供一种特征提取模型训练方法,包括:5获取训练图片集;
10.将所述训练图片集输入至初始模型,以由所述初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给所述初始模型中的特征增强层,以由所述特征增强层基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征并输出给所述初始模型中的全局特征提取层,以由所述全局特征提取层基于所述若干个增强局部特征进行特征聚合得到全局特征并输出给所述初始模型中的分类器,以由所述分类器根据所述全局特征得到所述训练图片的预测分类参数;
11.根据所述训练图片的标签参数和所述预测分类参数,对所述初始模型的模型参数进行调整,得到训练好的分类模型;
12.基于所述分类模型中的所述局部特征提取层、所述特征增强层以及所述全局特征提取层构建特征提取模型,所述特征提取模型用于提取待识别图片的全局特征。
13.在一可能的实施方式中,所述基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征,包括:
14.利用自注意力机制对所述若干个局部特征进行计算,得到视觉标记序列;
15.利用所述视觉标记序列对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
16.在一可能的实施方式中,所述利用自注意力机制对所述若干个局部特征进行计
算,得到视觉标记序列,包括:
17.利用通道自注意力机制对所述若干个局部特征进行重编码;
18.利用空间自注意力机制对若干个重编码后的局部特征进行分组,将每一所述分组确定为一个视觉标记,得到所述视觉标记序列。
19.在一可能的实施方式中,所述利用所述视觉标记序列对所述若干个局部特征进行特征增强,得到若干个增强局部特征,包括:
20.利用自注意力机制对所述视觉标记序列中的每个视觉标记分别进行特征增强,得到增强视觉标记序列;
21.利用所述增强视觉标记序列,并基于交叉注意力机制对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
22.在一可能的实施方式中,根据权利要求1所述的方法,其特征在于,所述基于所述若干个增强局部特征进行特征聚合得到全局特征,包括:
23.对所述若干个增强局部特征以及所述若干个局部特征进行特征聚合,得到全局特征。
24.第二方面,本发明实施例提供一种特征提取方法,包括:
25.将待识别图片输入至按照如第一方面中任一项方法训练出的特征提取模型,得到所述待识别图片的全局特征。
26.在一可能的实施方式中,所述将待识别图片输入至按照如权利要求1至5任一方法训练出的特征提取模型,得到所述待识别图片的全局特征,包括:
27.将待识别图片输入至按照如权利要求1至5任一方法训练出的特征提取模型,以由所述特征提取模型中的局部特征提取层从所述待识别图片中提取出若干个局部特征并输出给所述特征提取模型中的特征增强层,以由所述特征增强层基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征并输出给所述初始模型中的全局特征提取层,以由所述全局特征提取层基于所述若干个增强局部特征进行特征聚合得到全局特征。
28.在一可能的实施方式中,所述基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征,包括:
29.利用自注意力机制对所述若干个局部特征进行计算,得到视觉标记序列;
30.利用所述视觉标记序列对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
31.在一可能的实施方式中,所述利用自注意力机制对所述若干个局部特征进行计算,得到视觉标记序列,包括:
32.利用通道自注意力机制对所述若干个局部特征进行重编码;
33.利用空间自注意力机制对若干个重编码后的局部特征进行分组,将每一所述分组确定为一个视觉标记,得到所述视觉标记序列。
34.在一可能的实施方式中,所述利用所述视觉标记序列对所述若干个局部特征进行特征增强,得到若干个增强局部特征,包括:
35.利用自注意力机制对所述视觉标记序列中的每个视觉标记分别进行特征增强,得到增强视觉标记序列;
36.利用所述增强视觉标记序列,并基于交叉注意力机制对所述若干个局部特征进行特征增强,得到若干个增强局部特征。。
37.在一可能的实施方式中,所述基于所述若干个增强局部特征进行特征聚合得到全局特征,包括:
38.对所述若干个增强局部特征以及所述若干个局部特征进行特征聚合,得到全局特征。
39.第三方面,本发明实施例提供一种特征提取模型训练装置,包括:
40.获取模块,用于获取训练图片集;
41.模型训练模块,用于将所述训练图片集输入至初始模型,以由所述初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给所述初始模型中的特征增强层,以由所述特征增强层基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征并输出给所述初始模型中的全局特征提取层,以由所述全局特征提取层基于所述若干个增强局部特征进行特征聚合得到全局特征并输出给所述初始模型中的分类器,以由所述分类器根据所述全局特征得到所述训练图片的预测分类参数;根据所述训练图片的标签参数和所述预测分类参数,对所述初始模型的模型参数进行调整,得到训练好的分类模型;
42.特征提取模型构建模块,用于基于所述分类模型中的所述局部特征提取层、所述特征增强层以及所述全局特征提取层构建特征提取模型,所述特征提取模型用于提取待识别图片的全局特征。
43.第四方面,本发明实施例提供一种特征提取装置,包括:
44.提取模块,用于将待识别图片输入至按照如权利要求1至5任一方法训练出的特征提取模型,得到所述待识别图片的全局特征。
45.第五方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的模型训练程序,以实现第一方面中任一项所述的特征提取模型训练方法,或者用于执行所述存储器中存储的特征提取程序,以实现第二方面中任一项所述的特征提取方法。
46.第六方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的特征提取模型训练方法或者第二方面中任一项所述的特征提取方法。
47.本发明实施例提供的技术方案,通过获取训练图片集,将训练图片集输入至初始模型,以由初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给初始模型中的特征增强层,以由特征增强层基于注意力机制对若干个局部特征进行特征增强得到若干个增强局部特征并输出给初始模型中的全局特征提取层,以由全局特征提取层基于若干个增强局部特征进行特征聚合得到全局特征并输出给初始模型中的分类器,以由分类器根据全局特征得到训练图片的预测分类参数,根据训练图片的标签参数和预测分类参数,对初始模型的模型参数进行调整,得到训练好的分类模型,基于分类模型中的局部特征提取层和全局特征提取层构建一个用于提取待识别图片全局特征的特征提取模型,实现了构建出一个能够用于提取待识别图片全局特征的特征提取模型,进而在应用中,通过将待识别图片输入至该特征提取模型,即可得到全局特征。由此可见,这实现了一种端到端的全
局特征提取方案,这有助于局部特征与全局特征的有效对齐,并且特征提取与特征聚合联合实现,从而提高了特征提取效率,以及相较于现有技术中将特征提取与特征聚合分开进行的算法而言,降低了算法复杂度;与此同时,通过利用注意力机制对局部特征进行特征增强,能够抑制局部特征中的无关背景干扰、削弱背景噪声以及局部遮挡对特征的影响,进一步提高特征的表征能力以及表征的丰富性。
附图说明
48.图1为本发明实施例提供的一种特征提取模型训练方法的实施例流程图;
49.图2为初始模型的结构示意图;
50.图3为本发明实施例提供的一种特征提取方法的实施例流程图;
51.图4为本发明实施例提供的一种对若干个局部特征进行特征聚合得到全局特征的流程示意图;
52.图5为本发明实施例提供的一种模型训练装置的实施例框图;
53.图6为本发明实施例提供的一种特征提取装置的实施例框图;
54.图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
55.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
56.下面结合附图以具体实施例对本发明提供的特征提取模型训练方法和特征提取方法做进一步的解释说明,实施例并不构成对本发明实施例的限定。
57.参见图1,为本发明实施例提供的一种特征提取模型训练方法的实施例流程图。如图1所示,包括以下步骤:
58.步骤101、获取训练图片集。
59.上述训练图片集中包括若干张训练图片,每张训练图片具有相应的标签参数,用于表征该训练图片中所包含对象的分类信息。
60.上述对象可以是地标、街景、服饰,或者商品等,这可以依据具体的应用场景而定。例如,在地标检索场景中,上述训练图片中可包括地标;又例如,在服饰检索场景中,上述训练图片中可包括服饰。
61.可以理解的是,不论何种应用场景,上述训练图片集中的若干张训练图片所包含的对象不完全相同。例如,在地标检索场景中,上述训练图片集中的一部分训练图片包含天安门,另一部分训练图片包含人民英雄纪念碑,还一部分训练图片包含人民大会堂。
62.在一实施例中,本发明实施例的执行主体可以从开源的图片数据库中获取若干张训练图片,然后由用户对每张训练图片设置相应的标签参数,得到训练图片集。
63.在另一实施例中,本发明实施例的执行主体可以从一个或多个视频流中抽取若干个视频帧作为训练图片,然后由用户对每张训练图片设置相应的标签参数,得到训练图片集。
64.步骤102、将训练图片集输入至初始模型,以由初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给初始模型中的特征增强层,以由特征增强层基于注意力机制对若干个局部特征进行特征增强得到若干个增强局部特征并输出给初始模型中的全局特征提取层,以由全局特征提取层基于若干个增强局部特征进行特征聚合得到全局特征并输出给初始模型中的分类器,以由分类器根据全局特征得到训练图片的预测分类参数。
65.步骤103、根据训练图片的标签参数和预测分类参数,对初始模型的模型参数进行调整,得到训练好的分类模型。
66.步骤104、基于分类模型中的局部特征提取层、特征增强层以及全局特征提取层构建特征提取模型,特征提取模型用于提取待识别图片的全局特征。
67.以下结合图2所示例的初始模型的结构示意图对上述步骤102至步骤104进行统一说明:
68.在一实施例中,初始模型以卷积神经网络,例如resnest101为骨干网络。进一步的,如图2所示,沿着模型输入到输出的方向,初始模型顺次包括局部特征提取层、特征增强层、全局特征提取层,以及分类器。当然,除该四部分以外,初始模型还可以包括其他部分,在此不做具体限定。
69.其中,局部特征提取层用于从输入图片中提取出若干个局部特征,并将该若干个局部特征输出给全局特征提取层。局部特征是图像特征的局部表达,能够反应出图像上具有的局部特殊性。
70.局部特征提取层对于输入图片局部特征的提取通常使用局部图像描述子来进行。其中,斑点与角点是两类局部图像描述子,斑点的检测方法主要包括高斯拉普拉斯算子检测的方法、利用像素点hessian矩阵及其行列值的方法、尺度不变特征转换方法等;角点的检测方法主要包括harris角点检测方法(一种基于图像灰度的一阶导数矩阵检测方法)、fast特征检测方法等。
71.至于局部特征提取层是如何从输入图片中提取出若干个局部特征的,本领域技术人员可以参见现有技术中的相关描述,这里不再赘述。
72.现有的卷积神经网络在处理图片时,不考虑图片中不同区域的重要性,而是统一地处理所有的图像块,并且卷积被限制在一个小的区域上进行操作,丧失了图片空间上的交互,比如图中的包含关系、位置关系等。对此,本发明实施例提出:在骨干网络的基础上增加注意力机制,具体的,特征增强层用于基于注意力机制对局部特征进行特征增强,能够抑制局部特征中的无关背景干扰、削弱背景噪声以及局部遮挡对特征的影响,进一步提高特征的表征能力以及表征的丰富性。
73.至于特征增强层是如何基于注意力机制对若干个局部特征进行特征增强的,本领域技术人员可以参见下述实施例中的相关描述,这里先不详述。
74.全局特征提取层用于基于输入的若干个增强局部特征进行特征聚合得到全局特征,并将全局特征输出给分类器。全局特征是指图像的整体属性。由于全局特征是基于特征增强后的增强局部特征进行特征聚合得到的,因此,全局特征也能够抑制无关背景干扰、削弱背景噪声以及局部遮挡对特征的影响,进一步提高特征的表征能力。
75.分类器用于根据输入的全局特征进行分类识别,得到输入图片的预测分类参数。
76.基于此,在本发明实施例中,将训练图片集输入至初始模型,以由初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给初始模型中的特征增强层,以由特征增强层基于注意力机制对若干个局部特征进行特征增强得到若干个增强局部特征并输出给初始模型中的全局特征提取层,以由全局特征提取层基于若干个增强局部特征进行特征聚合得到全局特征并输出给初始模型中的分类器,以由分类器根据全局特征得到训练图片的预测分类参数。
77.进一步的,根据训练图片的标签参数和预测分类参数,对初始模型的模型参数进行调整,得到训练好的分类模型。具体的,根据训练图片的标签参数和预测分类参数确定损失函数,进一步根据损失函数确定当前的初始模型是否收敛,若是,则停止训练,将当前的初始模型确定为训练好的分类模型;若否,则根据损失函数对当前的初始模型的模型参数进行调整,然后返回执行将训练图片输入至当前的初始模型的步骤,直至确定当前的初始模型收敛。
78.由上述描述可见,训练好的分类模型中的局部特征提取层、特征增强层以及全局特征提取层可联合使用,实现从待识别图片中提取出全局特征,分类器可根据全局特征对待识别图片中的对象进行分类识别。因此,本发明实施例中,基于分类模型中的局部特征提取层、特征增强层以及全局特征提取层来构建用于提取待识别图片全局特征的特征提取模型。
79.进一步的,在应用中,则可以将待识别图片输入至按照上述方法训练出的特征提取模型,得到待识别图片的全局特征。
80.本发明实施例提供的技术方案,通过获取训练图片集,将训练图片集输入至初始模型,以由初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给初始模型中的特征增强层,以由特征增强层基于注意力机制对若干个局部特征进行特征增强得到若干个增强局部特征并输出给初始模型中的全局特征提取层,以由全局特征提取层基于若干个增强局部特征进行特征聚合得到全局特征并输出给初始模型中的分类器,以由分类器根据全局特征得到训练图片的预测分类参数,根据训练图片的标签参数和预测分类参数,对初始模型的模型参数进行调整,得到训练好的分类模型,基于分类模型中的局部特征提取层和全局特征提取层构建一个用于提取待识别图片全局特征的特征提取模型,实现了构建出一个能够用于提取待识别图片全局特征的特征提取模型,进而在应用中,通过将待识别图片输入至该特征提取模型,即可得到全局特征。由此可见,这实现了一种端到端的全局特征提取方案,这有助于局部特征与全局特征的有效对齐,并且特征提取与特征聚合联合实现,从而提高了特征提取效率,以及相较于现有技术中将特征提取与特征聚合分开进行的算法而言,降低了算法复杂度;与此同时,通过利用注意力机制对局部特征进行特征增强,能够抑制局部特征中的无关背景干扰、削弱背景噪声以及局部遮挡对特征的影响,进一步提高特征的表征能力以及表征的丰富性。
81.参见图3,为本发明实施例提供的一种特征提取方法的实施例流程图。如图3所示,包括以下步骤:
82.步骤301、将待识别图片输入至特征提取模型。
83.步骤302、特征提取模型中的局部特征提取层从待识别图片中提取出若干个局部特征并输出给特征提取模型中的特征增强层。
84.步骤303、特征增强层基于注意力机制对若干个局部特征进行特征增强得到若干个增强局部特征并输出给特征提取模型中的全局特征提取层。
85.在一实施例中,特征增强层可通过图4所示流程实现基于注意力机制对若干个局部特征进行特征增强,得到增强局部特征。如图4所示,包括以下步骤:
86.步骤401、利用自注意力机制对若干个局部特征进行计算,得到视觉标记序列。
87.在本步骤401中,全局特征提取层首先利用通道自注意力机制对若干个局部特征进行重编码。其中,通道自注意力机制通过设定算法为每个特征通道分配权重,然后将该权重应用于局部特征中的每个特征通道,以此对局部特征进行重编码。通过该种处理,能够确定出重点关注的局部特征,提高局部特征的表征能力。
88.之后,全局特征提取层利用空间自注意力机制对若干个重编码后的局部特征进行分组,将每一分组确定为一个视觉标记,得到视觉标记序列。其中,空间自注意力机制能够对各种形变数据在空间中进行转换并自动捕获重要区域特征,进而根据重要区域特征对若干个重编码后的局部特征进行关联,也即分组,从而得到多组能够表征图像的视觉标记。如此处理能够提高特征表征的丰富性。
89.步骤402、利用视觉标记序列对若干个局部特征进行特征增强,得到若干个增强局部特征。
90.在一实施例中,利用视觉标记序列对若干个局部特征进行特征增强,得到若干个增强局部特征的具体实现可以包括:首先利用自注意力机制对视觉标记序列中的每个视觉标记分别进行特征增强,得到增强视觉标记序列,然后利用增强视觉标记序列,并基于交叉注意力机制对若干个局部特征进行特征增强,得到若干个增强局部特征。
91.上述实施例中,利用增强视觉标记序列,并基于交叉注意力机制对若干个局部特征进行特征增强,主要目的是在原始局部特征的基础上补充不同的视觉标记,然后从补充有视觉标记的局部特征中进一步筛选出需要重点关注的局部特征,增强局部特征的表征能力。
92.步骤304、全局特征提取层基于若干个增强局部特征进行特征聚合,得到全局特征。
93.在一实施例中,全局特征提取层可以对若干个增强局部特征进行特征聚合,得到全局特征。
94.在另一实施例中,可以对若干个增强局部特征以及若干个局部特征进行特征聚合,得到全局特征。该种处理相较于仅对若干个增强局部特征进行特征聚合,得到全局特征而言,能够进一步提高最终得到的全局特征的表征能力。
95.可选的,上述特征聚合采用的算法可以是vlad(vector of locally aggregated descriptors,局部聚合向量)算法、asmk算法、delg算法等,在此不做具体限定。
96.图3所示流程,通过利用注意力机制对若干个局部特征进行特征增强,进而基于特征增强得到的增强局部特征得到全局特征,能够抑制无关背景干扰、削弱背景噪声以及局部遮挡对特征的影响,进一步提高特征的表征能力。
97.此外,注意力机制应用灵活,可以随意插入不同的骨干网络中,因此,应用注意力机制来进行特征提取能够提高算法整体性能,便于后续联合优化。
98.参见图5,为本发明实施例提供的一种特征提取模型训练装置的实施例框图。如图
5所示,该装置包括:
99.获取模块51,用于获取训练图片集;
100.模型训练模块52,用于以由所述初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给所述初始模型中的特征增强层,以由所述特征增强层基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征并输出给所述初始模型中的全局特征提取层,以由所述全局特征提取层基于所述若干个增强局部特征进行特征聚合得到全局特征并输出给所述初始模型中的分类器,以由所述分类器根据所述全局特征得到所述训练图片的预测分类参数;根据所述训练图片的标签参数和所述预测分类参数,对所述初始模型的模型参数进行调整,得到训练好的分类模型;
101.特征提取模型构建模块53,用于基于所述分类模型中的所述局部特征提取层、所述特征增强层以及所述全局特征提取层构建特征提取模型,所述特征提取模型用于提取待识别图片的全局特征。
102.在一可能的实施方式中,所述模型训练模块52包括:
103.特征增强单元,用于基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征,具体包括:
104.利用自注意力机制对所述若干个局部特征进行计算,得到视觉标记序列;利用所述视觉标记序列对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
105.在一可能的实施方式中,所述特征增强单元包括:
106.重编码子单元,用于利用通道自注意力机制对所述若干个局部特征进行重编码;
107.分组子单元,用于利用空间自注意力机制对若干个重编码后的局部特征进行分组,将每一所述分组确定为一个视觉标记,得到所述视觉标记序列。
108.在一可能的实施方式中,所述特征增强单元,包括:
109.第一增强子单元,用于利用自注意力机制对所述视觉标记序列中的每个视觉标记分别进行特征增强,得到增强视觉标记序列;
110.第二增强子单元,用于利用所述增强视觉标记序列,并基于交叉注意力机制对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
111.在一可能的实施方式中,所述特征聚合单元,具体用于:
112.基于所述若干个增强局部特征进行特征聚合得到全局特征,包括:
113.对所述若干个增强局部特征以及所述若干个局部特征进行特征聚合,得到全局特征。
114.参见图6,为本发明实施例提供的一种特征提取装置的实施例框图。如图6所示,该装置包括:
115.提取模块61,用于将待识别图片输入至按照如上述特征提取模型训练方法训练出的特征提取模型,得到所述待识别图片的全局特征。
116.在一可能的实施方式中,所述提取模块61具体用于:
117.将待识别图片输入至按照如上述特征提取模型训练方法训练出的特征提取模型,以由所述特征提取模型中的局部特征提取层从所述待识别图片中提取出若干个局部特征并输出给所述特征提取模型中的特征增强层,以由所述特征增强层基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征并输出给所述初始模型中的全局
特征提取层,以由所述全局特征提取层基于所述若干个增强局部特征进行特征聚合得到全局特征。
118.在一可能的实施方式中,所述提取模块61包括:
119.特征增强单元,用于基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征,具体包括:
120.利用自注意力机制对所述若干个局部特征进行计算,得到视觉标记序列;利用所述视觉标记序列对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
121.在一可能的实施方式中,所述特征增强单元包括:
122.重编码子单元,用于利用通道自注意力机制对所述若干个局部特征进行重编码;
123.分组子单元,用于利用空间自注意力机制对若干个重编码后的局部特征进行分组,将每一所述分组确定为一个视觉标记,得到所述视觉标记序列。
124.在一可能的实施方式中,所述特征增强单元,包括:
125.第一增强子单元,用于利用自注意力机制对所述视觉标记序列中的每个视觉标记分别进行特征增强,得到增强视觉标记序列;
126.第二增强子单元,用于利用所述增强视觉标记序列,并基于交叉注意力机制对所述若干个局部特征进行特征增强,得到若干个增强局部特征。
127.在一可能的实施方式中,所述特征聚合单元,具体用于:
128.对所述若干个增强局部特征以及所述若干个局部特征进行特征聚合,得到全局特征。
129.图7为本发明实施例提供的一种电子设备的结构示意图,图7所示的电子设备700包括:至少一个处理器701、存储器702、至少一个网络接口704和其他用户接口703。电子设备700中的各个组件通过总线系统705耦合在一起。可理解,总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统705。
130.其中,用户接口703可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball))、触感板或者触摸屏等。
131.可以理解,本发明实施例中的存储器702可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledatarate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的存储器702旨在包括但不限于这些和任意其它适合类型的存储器。
132.在一些实施方式中,存储器702存储了如下的元素,可执行单元或者数据结构,或
者他们的子集,或者他们的扩展集:操作系统7021和应用程序7022。
133.其中,操作系统7021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序7022,包含各种应用程序,例如媒体播放器(mediaplayer)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序7022中。
134.在本发明实施例中,通过调用存储器702存储的程序或指令,具体的,可以是应用程序7022中存储的程序或指令,处理器701用于执行各方法实施例所提供的特征提取模型训练方法步骤,例如包括:
135.获取训练图片集;
136.将所述训练图片集输入至初始模型,以由所述初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给所述初始模型中的全局特征提取层,以由所述全局特征提取层对所述若干个局部特征进行特征聚合得到全局特征并输出给所述初始模型中的分类器,以由所述分类器根据所述全局特征得到所述训练图片的预测分类参数;
137.根据所述训练图片的标签参数和所述预测分类参数,对所述初始模型的模型参数进行调整,得到训练好的分类模型;
138.基于所述分类模型中的所述局部特征提取层和所述全局特征提取层构建特征提取模型,所述特征提取模型用于提取待识别图片的全局特征。
139.或者用于执行各方法实施例所提供的特征提取方法步骤,例如包括:
140.将待识别图片输入至按照如上述任一特征提取模型训练方法训练出的特征提取模型,得到所述待识别图片的全局特征。
141.上述本发明实施例揭示的方法可以应用于处理器701中,或者由处理器701实现。处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成上述方法的步骤。
142.可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
143.对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
144.本实施例提供的电子设备可以是如图7中所示的电子设备,可执行如上述实施例中特征提取模型训练方法或特征提取方法的所有步骤,进而实现如上述实施例中特征提取模型训练方法或特征提取方法的技术效果,具体请参照上述实施例中的相关描述,为简洁描述,在此不作赘述。
145.本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
146.当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的特征提取模型训练方法或特征提取方法。
147.所述处理器用于执行存储器中存储的模型训练程序,以实现以下在电子设备侧执行的特征提取模型训练方法的步骤:
148.获取训练图片集;
149.将所述训练图片集输入至初始模型,以由所述初始模型中的局部特征提取层从训练图片中提取出若干个局部特征并输出给所述初始模型中的特征增强层,以由所述特征增强层基于注意力机制对所述若干个局部特征进行特征增强得到若干个增强局部特征并输出给所述初始模型中的全局特征提取层,以由所述全局特征提取层基于所述若干个增强局部特征进行特征聚合得到全局特征并输出给所述初始模型中的分类器,以由所述分类器根据所述全局特征得到所述训练图片的预测分类参数;
150.根据所述训练图片的标签参数和所述预测分类参数,对所述初始模型的模型参数进行调整,得到训练好的分类模型;
151.基于所述分类模型中的所述局部特征提取层、所述特征增强层以及所述全局特征提取层构建特征提取模型,所述特征提取模型用于提取待识别图片的全局特征。
152.或者实现以下在电子设备侧执行的特征提取方法的步骤:
153.将待识别图片输入至按照如上述任一特征提取模型训练方法训练出的特征提取模型,得到所述待识别图片的全局特征。
154.专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
155.结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
156.以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步
详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1