一种哈希参数确定方法、装置、设备及存储介质与流程

文档序号:17587530发布日期:2019-05-03 21:27阅读:126来源:国知局
一种哈希参数确定方法、装置、设备及存储介质与流程

本申请涉及图像处理技术领域,尤其涉及一种哈希参数确定方法、装置、设备及存储介质。



背景技术:

目前的图像检索方法大多为哈希检索方法,即基于哈希算法的图像检索方法,哈希检索方法是将图像的高维内容经过哈希编码,聚类成不同类别的图像序列,并在这些图像序列中挑出适量图像,生成一个低维的图像序列进行检索。哈希检索方法降低了图像检索系统对计算机内存空间的要求,提高了检索速度,能更好的适应海量图像检索的要求。

在采用哈希检索方法进行检索时,需要事先确定出两个哈希参数,即编码个数和查询个数。现有技术中,哈希参数的确定方法为:利用线性检索得到标准的检索召回率,哈希检索按照这个标准的召回率手动调节编码个数和查询个数的值,使得哈希检索的召回率能够最接近线性检索的召回率,以确定最终的编码个数和查询个数。然而,基于标准的召回率手动调节哈希参数的值犹如大海捞针,花费人力且效率低下。



技术实现要素:

有鉴于此,本申请提供了一种哈希参数确定方法、装置、设备及存储介质,用以自动确定出哈希参数,以节省人力成本,提高哈希参数的确定效率,其技术方案如下:

一种哈希参数确定方法,包括:

获取指定场景对应的识别模型的相关数据;

获取所述识别模型的相关数据的特征;

根据所述识别模型的相关数据的特征,以及预先建立的哈希参数预测模型,预测对所述指定场景下的图像进行哈希检索时所使用的哈希参数值。

其中,所述识别模型的相关数据为所述识别模型在训练过程中的相关数据;

所述识别模型的相关数据包括:所述识别模型的模型数据,以及,测试场景数据和/或检索数据库数量数据。

可选的,所述识别模型包括:检测模块、标定模块和识别模块;

所述识别模型的模型数据的特征包括:所述检测模块、所述标定模块和所述识别模块分别对应的特征;

获取所述识别模型的模型数据的特征,包括:

将测试图像集和/或检索数据库中的各幅图像分别输入所述模型数据对应的识别模型中的检测模块,获得所述检测模块输出的检测特征,作为所述检测模块对应的特征;

将所述检测特征输入所述标定模块,获得所述标定模块输出的标定特征,作为所述标定模块对应的特征;

将所述标定特征输入所述识别模块,获得所述识别模块输出的识别特征,作为所述识别模块对应的特征。

其中,预先建立所述哈希参数预测模型的过程包括:

获取第一训练样本集;

从所述第一训练样本集中的训练样本获取样本特征;

将所述样本特征输入预先搭建的哈希参数预测模型进行训练,所述哈希参数预测模型输出所述训练样本对应的哈希参数预测值;

对所述预先搭建的哈希参数预测模型进行训练的目标为:基于所述第一训练样本集中各个训练样本对应的哈希参数误差获得的模型第一评估值小于第一评估阈值,其中,所述各个训练样本对应的哈希参数误差通过各个训练样本对应的哈希参数预测值与对应的哈希参数目标值确定。

可选的,所述预先建立所述哈希参数预测模型的过程,还包括:

获取验证样本集,所述验证样本集中的验证样本与所述第一训练样本集中的训练样本不同;

根据从所述验证样本集中的各个验证样本获取的样本特征,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值;

通过所述各个验证样本对应的哈希参数预测值和各个验证样本对应的哈希参数目标值,确定各个验证样本对应的哈希参数误差;

通过所述各个验证样本对应的哈希参数误差,获得模型第二评估值;

若所述模型第二评估值小于所述第一评估阈值,则结束训练,否则,继续基于所述第一训练样本集对所述哈希参数预测模型进行训练,直至训练得到的哈希参数预测模型对应的模型第二评估值小于所述第一评估阈值。

可选的,所述预先建立所述哈希参数预测模型的过程,还包括:

利用所述验证样本集,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定样本筛选参考值;

基于所述样本筛选参考值,从所述训练样本集中筛选出干净样本,并利用筛选出的干净样本构造第二训练样本集;

利用所述第二训练样本集,对基于所述第一训练样本集训练得到的哈希参数预测模型进一步进行训练。

可选的,所述利用所述验证样本集,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定样本筛选参考值,包括:

基于所述各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差,和/或,哈希检索召回率误差,和/或,检索时间比,其中,一样本对应的哈希参数误差为该样本对应的哈希参数预测值与该样本对应的哈希参数目标值的误差,任一样本对应的哈希检索召回率误差为基于该样本对应的哈希参数预测值确定的哈希检索召回率与该样本对应的目标召回率的误差,任一样本对应的检索时间比为得到该样本对应的哈希检索召回率所花费的时间与该样本对应的目标时间的比值;

从各个验证样本对应的哈希参数误差中获取哈希参数最大误差,和/或,从各个验证样本对应的哈希检索召回率误差中获取哈希检索召回率最大误差,和/或,从各个验证样本对应的检索时间比中获取最大检索时间比;

将所述哈希参数最大误差、所述哈希检索召回率最大误差、所述最大检索时间比中的任意一个或者任意两个的和或者三个的和,确定为所述样本筛选参考值。

可选的,所述样本筛选参考值为所述哈希参数最大误差、所述哈希检索召回率最大误差、所述最大检索时间比之和;

基于所述样本筛选参考值,从所述第一训练样本集中筛选出干净数据,包括:

对于所述第一训练样本集中的任一训练样本:

通过从该训练样本获取的特征,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定该训练样本对应的哈希参数预测值;

基于该训练样本对应的哈希参数预测值,确定该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比;

若该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比之和小于所述样本筛选参考值,则确定该训练样本为干净样本;

以获得所述第一训练样本集中的干净样本。

可选的,所述利用筛选出的干净样本构造第二训练样本集,包括:

将所述筛选出的干净样本组成所述第二训练样本集;

或者,

对所述第一训练样本集中的脏样本进行聚类,获得多类脏样本;

基于所述筛选出的干净样本的数量,以及预设的干净样本与脏样本的比例,确定脏样本的数量;

基于所述脏样本的数量,分别从各类脏样本中获取脏样本,将获取的脏样本和所述筛选出的干净样本组成所述第二训练样本集。

可选的,所述利用所述第二训练样本集,对基于所述第一训练样本集训练得到的哈希参数预测模型进一步进行训练,包括:

从所述第二训练样本集中的训练样本获取样本特征;

将从所述第二训练样本集中的训练样本获取的样本特征,输入基于所述第一训练样本集训练得到的哈希参数预测模型进行训练;

利用所述第二训练样本集对基于所述第一训练样本集训练得到的哈希参数预测模型进行训练的目标为:基于第一训练评估值、第二训练评估值、第三训练评估值中的任意一个或多个获得的模型第三评估值小于第二评估阈值;

其中,所述第一训练评估值为所述第二训练样本集中各个训练样本对应的哈希参数误差中的最大误差与最小误差的差值,所述第二训练评估值为所述第二训练样本集中各个训练样本对应的哈希检索召回率误差中的最大误差与最小误差的差值,所述第三训练评估值为所述第二训练样本集中各个训练样本对应的检索时间比中的最大检索时间比与最小检索时间比的差值。

可选的,所述预先建立所述哈希参数预测模型的过程,还包括:

通过从各个验证样本获取的特征,以及基于所述第二训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值;

基于所述各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差、和/或哈希检索召回率误差、和/或检索时间比;

确定各个验证样本对应的哈希参数误差中的最大误差与最小误差的差值作为第一验证评估值,和/或,确定各个验证样本对应的哈希检索召回率误差中的最大误差与最小误差的差值作为第二验证评估值,和/或,确定各个验证样本对应的检索时间比中的最大检索时间比与最小检索时间比的差值作为第三验证评估值;

基于所述第一验证评估值和/或第二验证评估值和/或第三验证评估值,确定模型第四评估值;

若所述模型第四评估值小于所述第二评估阈值,则结束训练,否则继续基于所述第二训练样本集训练所述哈希参数预测模型,直至训练得到的哈希参数预测模型对应的模型第四评估值小于所述第二评估阈值。

一种哈希参数确定装置,包括:数据获取模块、特征获取模块和哈希参数预测模块;

所述数据获取模块,用于获取指定场景对应的识别模型的相关数据;

所述特征获取模块,用于获取所述识别模型的相关数据的特征;

所述哈希参数预测模块,用于根据所述识别模型的相关数据的特征,以及预先建立的哈希参数预测模型,预测对所述指定场景下的图像进行哈希检索时所使用的哈希参数值。

其中,所述识别模型的相关数据为所述识别模型在训练过程中的相关数据;

所述识别模型的相关数据包括:所述识别模型的模型数据,以及,测试场景数据和/或检索数据库数量数据。

可选的,所述识别模型包括:检测模块、标定模块和识别模块;

所述识别模型的模型数据的特征包括:所述检测模块、所述标定模块和所述识别模块分别对应的特征;

所述特征获取模块,具体用于将测试图像集和/或检索数据库中的各幅图像分别输入所述模型数据对应的识别模型中的检测模块,获得所述检测模块输出的检测特征,作为所述检测模块对应的特征;将所述检测特征输入所述标定模块,获得所述标定模块输出的标定特征,作为所述标定模块对应的特征;将所述标定特征输入所述识别模块,获得所述识别模块输出的识别特征,作为所述识别模块对应的特征。

可选的,所述哈希参数确定装置还包括:模型构建模块;

所述模型构建包括:第一训练模块;

所述第一训练模块,用于获取第一训练样本集;从所述第一训练样本集中的训练样本获取样本特征;将所述样本特征输入预先搭建的哈希参数预测模型进行训练,所述哈希参数预测模型输出所述训练样本对应的哈希参数预测值;

所述第一训练模块对所述预先搭建的哈希参数预测模型进行训练的目标为:基于所述第一训练样本集中各个训练样本对应的哈希参数误差获得的模型第一评估值小于第一评估阈值,其中,所述各个训练样本对应的哈希参数误差通过各个训练样本对应的哈希参数预测值与对应的哈希参数目标值确定。

可选的,所述模型构建模块还包括:第一验证模块;

所述第一验证模块,用于获取验证样本集,所述验证样本集中的验证样本与所述第一训练样本集中的训练样本不同;根据从所述验证样本集中的各个验证样本获取的样本特征,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值;通过所述各个验证样本对应的哈希参数预测值和各个验证样本对应的哈希参数目标值,确定各个验证样本对应的哈希参数误差;通过所述各个验证样本对应的哈希参数误差,获得模型第二评估值;若所述模型第二评估值小于所述第一评估阈值,则使所述第一训练模块结束训练,否则,继续使所述第一训练模块基于所述第一训练样本集对所述哈希参数预测模型进行训练,直至训练得到的哈希参数预测模型对应的模型第二评估值小于所述第一评估阈值。

可选的,所述模型构建模块还包括:样本筛选参考值确定模块、样本筛选模块、训练样本集构造模块和第二训练模块;

所述样本筛选参考值确定模块,用于利用所述验证样本集,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定样本筛选参考值;

所述样本筛选模块,用于基于所述样本筛选参考值,从所述训练样本集中筛选出干净样本;

所述训练样本集构造模块,用于利用筛选出的干净样本构造第二训练样本集;

所述第二训练模块,用于利用所述第二训练样本集,对基于所述第一训练样本集训练得到的哈希参数预测模型进一步进行训练。

可选的,所述样本筛选参考值确定模块包括:参数确定子模块、最大参数获取子模块和样本筛选参考值确定子模块;

所述参数确定子模块,用于基于所述各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差,和/或,哈希检索召回率误差,和/或,检索时间比,其中,一样本对应的哈希参数误差为该样本对应的哈希参数预测值与该样本对应的哈希参数目标值的误差,任一样本对应的哈希检索召回率误差为基于该样本对应的哈希参数预测值确定的哈希检索召回率与该样本对应的目标召回率的误差,任一样本对应的检索时间比为得到该样本对应的哈希检索召回率所花费的时间与该样本对应的目标时间的比值;

所述最大参数获取子模块,用于从各个验证样本对应的哈希参数误差中获取哈希参数最大误差,和/或,从各个验证样本对应的哈希检索召回率误差中获取哈希检索召回率最大误差,和/或,从各个验证样本对应的检索时间比中获取最大检索时间比;

所述样本筛选参考值确定子模块,用于将所述哈希参数最大误差、所述哈希检索召回率最大误差、所述最大检索时间比中的任意一个或者任意两个的和或者三个的和,确定为所述样本筛选参考值。

可选的,所述样本筛选参考值为所述哈希参数最大误差、所述哈希检索召回率最大误差、所述最大检索时间比之和;

所述样本筛选模块,具体用于对于所述第一训练样本集中的任一训练样本,通过从该训练样本获取的特征,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定该训练样本对应的哈希参数预测值;基于该训练样本对应的哈希参数预测值,确定该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比;若该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比之和小于所述样本筛选参考值,则确定该训练样本为干净样本;以获得所述第一训练样本集中的干净样本。

可选的,所述训练样本集构造模块,具体用于将所述筛选出的干净样本组成所述第二训练样本集;或者,对所述第一训练样本集中的脏样本进行聚类,获得多类脏样本,基于所述筛选出的干净样本的数量,以及预设的干净样本与脏样本的比例,确定脏样本的数量,基于所述脏样本的数量,分别从各类脏样本中获取脏样本,将获取的脏样本和所述筛选出的干净样本组成所述第二训练样本集。

可选的,所述第二训练模块,具体用于从所述第二训练样本集中的训练样本获取样本特征;将从所述第二训练样本集中的训练样本获取的样本特征,输入基于所述第一训练样本集训练得到的哈希参数预测模型进行训练;

所述第二训练模块利用所述第二训练样本集对基于所述第一训练样本集训练得到的哈希参数预测模型进行训练的目标为:基于第一训练评估值、第二训练评估值、第三训练评估值中的任意一个或多个获得的模型第三评估值小于第二评估阈值;

其中,所述第一训练评估值为所述第二训练样本集中各个训练样本对应的哈希参数误差中的最大误差与最小误差的差值,所述第二训练评估值为所述第二训练样本集中各个训练样本对应的哈希检索召回率误差中的最大误差与最小误差的差值,所述第三训练评估值为所述第二训练样本集中各个训练样本对应的检索时间比中的最大检索时间比与最小检索时间比的差值。

可选的,所述模型构建模块还包括:第二验证模块;

所述第二验证模块,具体用于通过从各个验证样本获取的特征,以及基于所述第二训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值;基于所述各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差、和/或哈希检索召回率误差、和/或检索时间比;确定各个验证样本对应的哈希参数误差中的最大误差与最小误差的差值作为第一验证评估值,和/或,确定各个验证样本对应的哈希检索召回率误差中的最大误差与最小误差的差值作为第二验证评估值,和/或,确定各个验证样本对应的检索时间比中的最大检索时间比与最小检索时间比的差值作为第三验证评估值;基于所述第一验证评估值和/或第二验证评估值和/或第三验证评估值,确定模型第四评估值;若所述模型第四评估值小于所述第二评估阈值,则结束训练,否则继续基于所述第二训练样本集训练所述哈希参数预测模型,直至训练得到的哈希参数预测模型对应的模型第四评估值小于所述第二评估阈值。

一种哈希参数确定设备,包括:存储器和处理器;

所述存储器,用于存储程序;

所述处理器,用于执行所述程序,实现所述哈希参数确定方法的各个步骤。

一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述哈希参数确定方法的各个步骤。

经由上述的技术方案可知,本申请提供的哈希参数确定方法、装置、设备及存储介质,首先获取指定场景对应的识别模型的相关数据,然后获取识别模型的相关数据的特征,最后,根据识别模型的相关数据的特征以及预先建立的哈希参数预测模型,预测对指定场景下的图像进行哈希检索时所使用的哈希参数值。由此可见,本申请提供的哈希参数确定方法,能够利用指定场景对应的识别模型的相关数据和预先建立的哈希参数预测模型自动确定出对指定场景下的图像进行哈希检索时所使用的哈希参数值,从而避免了手动调节哈希参数的过程,节省了人力,降低了人工成本,提升了哈希参数值的确定效率,且该哈希参数确定方法易用性较强。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的哈希参数确定方法的流程示意图;

图2为本申请实施例提供的将多个特征拼接后输入预先建立的哈希参数预测模型以预测哈希参数的示意图;

图3为本申请实施例提供的利用验证样本集对基于第一训练样本集训练得到的参数预测模型进行验证的流程示意图;

图4为本申请实施例提供的利用验证样本集,以及基于第一训练样本集训练得到的参数预测模型,确定样本筛选参考值的流程示意图;

图5为本申请实施例提供的利用验证样本集对基于第二训练样本集训练得到的参数预测模型进行验证的流程示意图;

图6为本申请实施例提供的哈希参数确定装置的结构示意图;

图7为本申请实施例提供的哈希参数确定设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

现有哈希检索方法为:步骤一,对检索图像和检索数据库中各个图像分别提取特征,得到各个图像对应的特征向量;步骤二,对各个图像对应的特征向量进行哈希编码,可理解为一个聚类过程,聚成不同类别的图像,并对每种类别图像进行编码,哈希编码个数为a,该个数是可调的;步骤三,对哈希编码的每一类图像,从中抽取b个图像,即在每一类图像中的查询个数为b,并按照汉明距离或者其它距离公式计算检索图像与查询图像的相似度;步骤四,对相似度进行排序,与检索图像相似度最大的图像即为需要寻找的目标图像。

由上述过程可以发现,哈希检索是基于哈希参数即编码个数a和查询个数b进行的,因此,在进行哈希检索前,需要先确定出哈希参数。发明人在实现本发明创造的过程中发现:现有的哈希检索参数的确定方法一般是利用线性检索得到标准的检索召回率,线性检索的过程是用检索图像与检索数据库中的图像进行一一对比,过程比较耗时,但得到的检索召回率比较准确,在获得标准的检索召回率后,哈希检索按照这个标准的检索召回率手动调节编码个数a和查询个数b的值,找到哈希检索的召回率与标准的检索召回率无限接近的点,来确定最终的哈希参数的值。然而,手动调节哈希参数的值犹如大海捞针,花费人力且效率低下。

鉴于现有技术中确定哈希参数的方式花费人力且效率低下,本案发明人进行了深入研究,最终提出了一种可自动确定哈希参数的方法,接下来通过下述实施例对本申请提供的哈希参数确定方法进行介绍。

请参阅图1,示出了本申请实施例提供的哈希参数确定方法的流程示意图,可以包括:

步骤s101:获取指定场景对应的识别模型的相关数据。

其中,指定场景可以为人脸场景,相应的,识别模型可以为人脸识别模型,本实施例并不限定指定场景为人脸场景,还可以为其它场景,比如车辆场景,相应的,识别模型可以为车辆识别模型。

其中,识别模型的相关数据可以为识别模型在训练过程中的相关数据。

具体的,识别模型的相关数据可以包括识别模型的模型数据,还可以包括测试场景数据和/或检索数据库数量数据。其中,检索数据库数量指的是检索数据库中图像的数量。

鉴于模型数据的不同、测试场景的不同、检索数据库中图像数量的不同,均会影响哈希参数的值,为了能够使哈希参数的值更准确,本实施例中识别模型的相关数据优选为同时包括识别模型的模型数据、测试场景数据和检索数据库数量数据。

步骤s102:获取识别模型的相关数据的特征。

在一种可能的实现方式中,识别模型包括检测模块、标定模块和识别模块。比如,人脸场景下的人脸模型包括检测模块、标定模块和识别模块,其中,检测模块用于检测出人脸图像中的人脸区域,并将人脸区域用矩形框标记出来将其记为人脸框,该模块的输出为人脸框的坐标点位置坐标及人脸框的长和宽,标定模块用于在人脸框的基础上,进一步定位出五官的位置,即眼睛、鼻子、嘴巴等所在的像素位置坐标,识别模块用于进行比对判定人脸相似度。

识别模型的相关数据的特征包括检测模块、标定模块和识别模块分别对应的特征。具体的,获取检测模块、标定模块和识别模块分别对应的特征的过程可以包括:将测试图像集和/或检索数据库中的各幅图像分别输入模型数据(即识别模型的相关数据)对应的识别模型中的检测模块,获得检测模块输出的检测特征,作为检测模块对应的特征;将检测特征输入标定模块,获得标定模块输出的标定特征,作为标定模块对应的特征;将标定特征输入识别模块,获得识别模块输出的识别特征,作为识别模块对应的特征。

在本实施例中,获取测试场景数据的特征的过程可以包括:对测试场景数据进行编码,并将编码结果作为测试场景数据的特征,即测试场景特征。

示例性的,人脸测试场景通常包括四种,分别为天网、网吧、人证、驾驶证考试,天网大类里面包含街道、小区、园区等,摄像头一般布置在较高的地方,可监控整条街道,得到街道内行人的一些图片,网吧场景是指在网吧内,通过各电脑摄像头拍摄得到的用户上网图像,人证大类包含各种刷脸考试场景,图像一般为较为配合的刷脸图像,驾驶证考试,是指在车内不同位置布控一些摄像头,得到的考试场景的图像。对于上述四种测试场景,可按0001、0010、0100、1000进行编码,假设天网这一测试场景的编码为0001,则天网这一测试场景的特征即为0001。

对于检索数据库数量数据而言,可将检索数据库数量(检索数据库中图像的数量)作为检索数据库数量数据的特征即检索数据库数量特征。

步骤s103:根据识别模型的相关数据的特征,以及预先建立的哈希参数预测模型,预测对指定场景下的图像进行哈希检索时所使用的哈希参数值。

具体的,将识别模型的相关数据的特征输入预先建立的哈希参数预测模型,获得哈希参数预测模型预测的哈希参数值。在本实施例中,哈希参数预测模型以从训练样本获取的特征作为训练特征,以训练样本对应的哈希参数目标值为标签训练得到。

需要说明的是,假设识别模型的相关数据的特征包括多种特征,比如包括上述的检测特征、标定特征、识别特征、测试场景特征和检索数据库数量特征,则将检测特征、标定特征、识别特征、测试场景特征和检索数据库数量特征进行拼接,将拼接后的特征输入预先建立的哈希参数预测模型,请参阅图2,示出了基于拼接后的特征,通过哈希参数预测模型预测哈希参数的示意图。

本申请实施例提供的哈希参数确定方法,首先获取指定场景对应的识别模型的相关数据,然后获取识别模型的相关数据的特征,最后,根据识别模型的相关数据的特征以及预先建立的哈希参数预测模型,预测对指定场景下的图像进行哈希检索时所使用的哈希参数值。由此可见,本实施例提供的哈希参数确定方法,能够利用指定场景对应的识别模型的相关数据和预先建立的哈希参数预测模型自动确定出对指定场景下的图像进行哈希检索时所使用的哈希参数值,避免了手动调节哈希参数的过程,节省了人力,降低了人工成本,提升了哈希参数值的确定效率,且该哈希参数确定方法易用性较强。

在本申请的另一实施例中,对预先建立哈希参数预测模型的过程进行介绍。

预先建立哈希参数预测模型的过程可以包括:获取第一训练样本集,并从第一训练样本集中的训练样本获取样本特征;将样本特征输入预先搭建的哈希参数预测模型进行训练,哈希参数预测模型输出训练样本对应的哈希参数预测值。

其中,第一训练样本集中包括多个不同的训练样本,一个训练样本包括识别模型的模型数据(检测模型数据、标定模型数据和识别模型数据),还可以包括测试场景数据和/或检索数据库数量数据,优选为包括上述三种数据,假设一个训练样本包括上述三种数据,则两个样本不同指的是两个样本中的至少一种数据不同,需要说明的是,识别模型的模型数据不同可以为检测模型数据、标定模型数据、识别模型数据中的至少一数据不同。

在本实施例中,对预先搭建的哈希参数预测模型进行训练的目标为:基于第一训练样本集中各个训练样本对应的哈希参数误差获得的模型第一评估值小于第一评估阈值。其中,任一训练样本对应的哈希参数误差为该训练样本对应的哈希参数预测值与该训练样本对应的哈希参数目标值的误差,具体的,任一训练样本对应的哈希参数误差可通过下式确定:

其中,第一训练样本集中包括m个样本,a′m,b′m为第一训练样本集中第m个训练样本对应的哈希参数预测值,am,bm为第m个训练样本对应的哈希参数目标值,dism为第m个训练样本对应的哈希参数误差。

基于第一训练样本集中各个训练样本对应的哈希参数误差,获得模型第一评估值的过程可以包括:获取第一训练样本集中各个训练样本对应的哈希参数误差中的最大误差和/或最小误差,和/或最大误差与最小误差的差值,和/或各个训练样本对应的哈希参数误差的平均误差,可将最大误差、最小误差、平均误差、最大误差与最小误差的差值中的任意一个或任意两个或任意三个或四个作为模型第一评估值。需要说明的是,在设定第一评估阈值时,可为最大误差、最小误差、平均误差、最大误差与最小误差的差值分别设置不同的第一评估阈值。需要说明的是,最大误差、最小误差、平均误差、最大误差与最小误差的差值越小,表明哈希参数预测值越接近哈希参数目标值。

优选地,预先建立哈希参数预测模型的过程还可以包括:获取验证样本集,用验证样本集验证基于第一训练样本集训练得到的哈希参数预测模型的优劣。其中,验证样本集中的样本与训练样本集中的样本不同。

请参阅图3,示出了用验证样本集对基于第一训练样本集训练得到的哈希参数预测模型进行验证的流程示意图,可以包括:

步骤s301:根据从验证样本集中的各个验证样本获取的样本特征,以及基于第一训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值。

具体的,对于验证样本集中的任一验证样本,将该验证样本输入基于第一训练样本集训练得到的哈希参数预测模型,获得该验证样本对应的哈希参数预测值,以得到各个验证样本对应的哈希参数预测值。

步骤s302:通过各个验证样本对应的哈希参数预测值和各个验证样本对应的哈希参数目标值,确定各个验证样本对应的哈希参数误差。

具体的,对于任一验证样本,计算该验证样本对应的哈希参数预测值与该验证样本对应的哈希参数目标值的差值,计算得到的差值作为该验证样本对应的哈希参数误差,以得到各个验证样本对应的哈希参数误差。

步骤s303:基于各个验证样本对应的哈希参数误差,获得模型第二评估值。

需要说明的是,基于各个验证样本对应的哈希参数误差,获得模型第二评估值的具体实现过程与基于第一训练样本集中各个训练样本对应的哈希参数误差,获得模型第一评估值的过程类似,本实施例在此不作赘述。但需要说明是,若以各个训练样本对应的哈希参数误差中的最大误差作为模型第一评估值,则同样以各个验证样本对应的哈希参数误差中的最大误差作为模型第二评估值,其它情况类似。

步骤s304:若模型第二评估值小于第一评估阈值,则确定基于第一训练样本集训练得到的哈希参数预测模型满足要求。

需要说明的是,若模型第二评估值小于第一评估阈值,则结束训练,若模型第二评估值大于或等于第一评估阈值,则继续基于第一训练样本集对哈希参数预测模型进行训练,直至训练得到的哈希参数预测模型对应的模型第二评估值小于第一评估阈值。

考虑到上述的第一训练样本集中可能会存在一些脏数据,而脏数据会影响训练得到的哈希参数预测模型的预测精度,为了提高哈希参数预测模型的预测精度,优选的,预先建立哈希参数预测模型的过程还可以包括:利用验证样本集,以及基于第一训练样本集训练得到的哈希参数预测模型,确定样本筛选参考值;基于样本筛选参考值,从第一训练样本集中筛选出干净样本,并利用筛选出的干净样本构造第二训练样本集;利用第二训练样本集,对基于第一训练样本集训练得到的哈希参数预测模型进一步进行训练。

请参阅图4,示出了利用验证样本集,以及基于第一训练样本集训练得到的哈希参数预测模型,确定样本筛选参考值的流程示意图,可以包括:

步骤s401:基于验证样本集中各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差,和/或,哈希检索召回率误差,和/或,检索时间比。

需要说明的是,各个验证样本对应的哈希参数误差为各个验证样本对应的哈希参数预测值与对应的哈希参数目标值的误差,具体的,各个验证样本对应的哈希参数误差可通过下式确定:

其中,验证样本集中包括n个验证样本,a′n_verify,b′n_verify为第n个验证样本对应的哈希参数预测值,an_verify,bn_verify为第n个验证样本对应的哈希参数目标值,disn_verify为第n个验证样本对应的哈希参数误差。

各个验证样本对应的哈希检索召回率误差为基于各个验证样本对应的哈希参数预测值进行哈希检索的召回率(即哈希检索召回率)与对应的目标召回率的误差,需要说明的是,任一样本对应的目标召回率可以为该样本对应的线性检索召回率,具体的,各个验证样本对应的哈希检索召回率误差可通过下式确定:

其中,为验证样本集中第n个验证样本对应的哈希检索召回率,为第n个验证样本对应的线性检索召回率,errn_verify为第n个验证样本对应的哈希检索召回率误差。

各个验证样本对应的检索时间比为得到该样本对应的哈希检索召回率所花费的时间与该样本对应的目标时间的比值,其中,一样本对应的目标时间可以为获得该样本对应的线性检索召回率所花费的时间,具体的,各个验证样本对应的检索时间比可通过下式确定:

其中,为得到第n个验证样本对应的哈希检索召回率所花费的时间,为得到第n个验证样本对应的线性检索召回率所花费的时间,dis_tn_verify为的比值,即为第n个验证样本对应的检索时间比。

需要说明的是,一样本对应的哈希参数误差越小,表明该样本越干净,一样本对应的哈希检索召回率误差越小,表示该样本越精确,一样本对应的检索时间比越小,表示该样本相对线性检索在哈希检索上花费的时间越少。

步骤s402:从各个验证样本对应的哈希参数误差中获取哈希参数最大误差,和/或,从各个验证样本对应的哈希检索召回率误差中获取哈希检索召回率最大误差,和/或,从各个验证样本对应的检索时间比中获取最大检索时间比。

从上述计算得到的dis1~disn_verify中获取哈希参数最大误差dismax_verify,从err1~errn_verify中获取哈希检索召回率最大误差errmax_verify,从dis_t1~dis_tn_verify中获取最大检索时间比dis_tmax_verify。

步骤s403:将哈希参数最大误差、哈希检索召回率最大误差、最大检索时间比中的任意一个或者任意两个的和或者三个的和,确定为样本筛选参考值。

在本实施例中,可将dismax_verify、errmax_verify和dis_tmax_verify中的任意一个作为样本筛选参考值,比如,将dismax_verify作为样本筛选参考值,则从第一训练样本集中筛选干净样本的过程为:确定训练样本集中各个训练样本对应的哈希参数误差,将哈希参数误差小于dismax_verify的训练样本确定为干净样本。将errmax_verify、dis_tmax_verify作为样本筛选参考值从第一训练样本集中筛选干净样本的过程类似,本实施例在此不作赘述。

本实施例还可将dismax_verify、errmax_verify和dis_tmax_verify中任意两个的和作为样本筛选参考值,比如,将dismax_verify与errmax_verify的和作为样本筛选参考值,则从第一训练样本集中筛选干净样本的过程为:确定训练样本集中各个训练样本对应的哈希参数误差和哈希检索召回率误差,将哈希参数误差与哈希检索召回率误差的和小于dismax_verify与errmax_verify的和的训练样本确定为干净样本。样本筛选参考值还可以为dismax_verify与dis_tmax_verify的和,或者,errmax_verify与dis_tmax_verify的和,将dismax_verify与dis_tmax_verify的和作为样本筛选参考值,以及将errmax_verify与dis_tmax_verify的和作为样本筛选参考值从第一训练样本集中筛选干净样本的过程与将dismax_verify与errmax_verify的和作为样本筛选参考值进行筛选的过程类似,本实施例在此不作赘述。

需要说明的是,为了能够准确筛选出干净数据,本实施例优选为将哈希参数最大误差dismax_verify、哈希检索召回率最大误差errmax_verify、最大检索时间比dis_tmax_verify之和作为样本筛选参考值。此时,基于样本筛选参考值,从第一训练样本集中筛选出干净数据的过程可以包括:确定第一训练样本集中各个训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比,将哈希参数误差、哈希检索召回率误差和检索时间比之和小于样本筛选参考值,即满足下式的训练样本确定为干净样本:

(disi_train+erri_train+dis_ti_train)<(dismax_verify+errmax_verify+dis_tmax_verify)(5)

其中,确定第一训练样本集中各个训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比的过程可以包括:对于第一训练样本集中的任一训练样本,通过从该训练样本中获取的特征,以及,基于第一训练样本集训练得到的哈希参数预测模型,确定该训练样本对应的哈希参数预测值;基于该训练样本对应的哈希参数预测值,确定该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比。

与上述验证样本类似,训练样本对应的哈希参数误差为该训练样本对应的哈希参数预测值与该训练样本对应的哈希参数目标值的误差,该训练样本对应的哈希检索召回率误差为基于该训练样本对应的哈希参数预测值获得的哈希检索召回率与该训练样本对应的目标召回率(比如,线性检索召回率)的误差,该训练样本对应的检索时间比为得到该训练样本对应的哈希检索召回率所花费的时间与该训练样本对应的目标时间(比如,得到线性检索召回率所花费的时间)的比值。

在从第一训练样本集中筛选出干净样本后,便可利用筛选出的干净样本构造第二训练样本集。利用筛选出的干净样本构造第二训练样本集的实现方式有多种,在一种可能的实现方式中,可将筛选出的干净样本组成第二训练样本集。考虑到样本的单一性可能会出现过拟合现象,基于此,在另一种可能的实现方式,可对第一训练样本集中的脏样本(第一训练样本集中除筛选出的干净样本外的样本即为脏样本)进行聚类,获得多类脏样本,基于筛选出的干净样本的数量,以及预设的干净样本与脏样本的比例,确定脏样本的数量,基于脏样本的数量分别从各类脏样本中获取脏样本,将获取的脏样本和筛选出的干净样本组成第二训练样本集。其中,干净样本与脏样本的比例可基于实际应用情况或经验设定,比如,可设定为9:1,对第一训练样本集中的脏样本进行聚类的方法可以但不限为k聚类(k-means)等。

在获得第二训练样本集后,利用第二训练样本集对基于训练样本集训练得到的哈希参数预测模型进一步进行训练,训练过程包括:从第二训练样本集中的训练样本获取样本特征;将从第二训练样本集中的训练样本获取的样本特征,输入基于第一训练样本集训练得到的哈希参数预测模型进一步进行训练。

在本实施例中,利用第二训练样本集对基于训练样本集训练得到的哈希参数预测模型进行训练的目标为:基于第一训练评估值、第二训练评估值、第三训练评估值中的任意一个或多个获得的模型第三评估值小于第二评估阈值ε(如0.001)。

其中,第一训练评估值为第二训练样本集中各个训练样本对应的哈希参数误差中的最大误差dismax_train与最小误差dismin_train的差值,第二训练评估值为第二训练样本集中各个训练数据对应的哈希检索召回率误差中的最大误差errmax_train与最小误差errmin_train的差值,第三训练评估值为第二训练样本集中各个训练数据对应的检索时间比中的最大时间比dis_tmax_train与最小时间比的差值dis_tmin_train。

若模型第三评估值小于第二评估阈值ε(如0.001),则结束训练,若模型第三评估值大于或等于第二评估阈值,则继续基于第二训练样本集对哈希参数预测模型进行训练,直至训练得到的哈希参数预测模型对应的模型第三评估值小于第二评估阈值。

为了使训练得到的哈希参数预测模型能够预测出准确高效的哈希参数,模型第三评估值优选为基于第一训练评估值、第二训练评估值、第三训练评估值确定,在一种可能的实现方式中,可将第一训练评估值、第二训练评估值、第三训练评估值的均值作为模型第三评估值,即:

需要说明的是,第一评估值反映的是哈希参数预测模型在第二训练集上的哈希参数误差,第二评估值反映的是参数预测模型在第二训练集上的哈希检索召回率误差,第三评估值反映的参数预测模型在第二训练集上的检索时间比,本实施例在基于第二训练样本集进行对哈希参数预测模型进行训练时,优选为同时根据基于哈希参数误差、哈希检索召回率误差和检索时间比这三个因素来训练,加入检索时间比这一因素会使得训练得到的哈希参数在检索时会更高效,加入哈希检索召回率误差这一因素,能够进一步保证训练得到的哈希参数在检索时更准确,即,同时基于上述三个因素训练,可以获得既准确又高效的哈希参数。

优选地,在获得基于第二训练样本集训练得到的哈希参数预测模型后,可用验证样本集对其进行验证,请参阅图5,示出了用验证样本集对基于第二训练样本集训练得到的哈希参数预测模型进行验证的流程示意图,可以包括:

步骤s501:通过从各个验证样本中提取的特征,以及基于第二训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值。

步骤s502:基于各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差、和/或哈希检索召回率误差、和/或检索时间比。

步骤s503:确定各个验证样本对应的哈希参数误差中的最大误差dismax_verify与最小误差dismin_verify的差值作为第一验证评估值、和/或,确定各个验证样本对应的哈希检索召回率误差中的最大误差errmax_verify与最小误差errmin_verify的差值作为第二验证评估值,和/或,确定各个验证样本对应的检索时间比中的最大检索时间比dis_tmax_verify与最小检索时间比dis_tmin_verify的差值作为第三验证评估值。

步骤s504:基于第一验证评估值、和/或第二验证评估值、和/或第三验证评估值,获得模型第四评估值。

具体的,若上述模型第三评估值基于第一训练评估值、第二训练评估值和第三训练评估值获得,则此处的模型第四评估值也基于第一验证评估值、第二验证评估值和第三验证评估值获得,比如,模型第三评估值为三个训练评估值的均值,那么模型第四评估值也为三个验证评估值的均值。

步骤s505:若模型第四评估值小于第二评估阈值,则确定基于第二训练集训练得到的哈希参数预测模型满足要求。

若模型第四评估值小于第二评估阈值ε,即满足下式(7),则结束训练,若模型第四评估值大于或等于第二评估阈值ε,继续基于第二训练样本集训练哈希参数预测模型,直至训练得到的哈希参数预测模型对应的模型第四评估值小于第二评估阈值ε。

可选的,当基于第二训练集训练得到的哈希参数预测模型满足要求时,可进一步从第二训练数据集中筛选干净数据,利用从第二训练数据集中筛选出的干净数据构造第三训练数据集,用第三训练数据集对基于第二训练数据集训练得到的哈希参数预测模型进行训练,以此类推,直至满足设定的训练终止条件。其中,筛选干净数据以构造新的训练样本集,以及用新的训练样本集训练哈希参数预测模型的过程可参见上述实施例,本实施例在此不作赘述。

本申请提供的哈希参数确定方法,能够利用指定场景对应的识别模型的相关数据和预先建立的哈希参数预测模型自动确定出对指定场景下的图像进行哈希检索时所使用的哈希参数值,从而避免了手动调节哈希参数的过程,节省了人力,降低了人工成本,提升了哈希参数值的确定效率,且该哈希参数确定方法易用性较强。

本申请实施例还提供了一种哈希参数确定装置,下面对本申请实施例提供的哈希参数确定装置进行描述,下文描述的哈希参数确定装置与上文描述的哈希参数确定方法可相互对应参照。

请参阅图6,示出了本申请实施例提供的一种哈希参数确定装置的结构示意图,如图6所示,该装置可以包括:数据获取模块601、特征获取模块602和哈希参数预测模块603。

数据获取模块601,用于获取指定场景对应的识别模型的相关数据。识别模型的相关数据为所述识别模型在训练过程中的相关数据。

其中,识别模型的相关数据至少包括:识别模型的模型数据。

优选的,识别模型的相关数据还可以包括:测试场景数据和/或检索数据库数量数据。

特征获取模块602,用于获取所述识别模型的相关数据的特征;

哈希参数预测模块603,用于根据识别模型的相关数据的特征,以及预先建立的哈希参数预测模型,预测对所述指定场景下的图像进行哈希检索时所使用的哈希参数值。

本申请实施例提供的哈希参数确定装置,能够利用指定场景对应的识别模型的相关数据和预先建立的哈希参数预测模型自动确定出对指定场景下的图像进行哈希检索时所使用的哈希参数值,避免了手动调节哈希参数的过程,节省了人力,降低了人工成本,提升了哈希参数值的确定效率,且该哈希参数确定方法易用性较强。

在一种可能的实现方式中,上述实施例中的识别模型可以包括:检测模块、标定模块和识别模块。识别模型的模型数据的特征包括:所述检测模块、所述标定模块和所述识别模块分别对应的特征。

特征获取模块602,具体用于将测试图像集和/或检索数据库中的各幅图像分别输入所述模型数据对应的识别模型中的检测模块,获得所述检测模块输出的检测特征,作为所述检测模块对应的特征;将所述检测特征输入所述标定模块,获得所述标定模块输出的标定特征,作为所述标定模块对应的特征;将所述标定特征输入所述识别模块,获得所述识别模块输出的识别特征,作为所述识别模块对应的特征。

上述实施例提供的哈希参数确定装置还可以包括:模型构建模块。所述模型构建模块包括:第一训练模块。

所述第一训练模块,用于获取第一训练样本集;从所述第一训练样本集中的训练样本获取样本特征;将所述样本特征输入预先搭建的哈希参数预测模型进行训练,所述哈希参数预测模型输出所述训练样本对应的哈希参数预测值。

其中,所述第一训练模块对所述预先搭建的哈希参数预测模型进行训练的目标为:基于所述第一训练样本集中各个训练样本对应的哈希参数误差获得的模型第一评估值小于第一评估阈值,其中,所述各个训练样本对应的哈希参数误差通过各个训练样本对应的哈希参数预测值与对应的哈希参数目标值确定。

可选的,模型构建模块还可以包括:第一验证模块。

所述第一验证模块,用于获取验证样本集,所述验证样本集中的验证样本与所述第一训练样本集中的训练样本不同;根据从所述验证样本集中的各个验证样本获取的样本特征,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值;通过所述各个验证样本对应的哈希参数预测值和各个验证样本对应的哈希参数目标值,确定各个验证样本对应的哈希参数误差;通过所述各个验证样本对应的哈希参数误差,获得模型第二评估值;若所述模型第二评估值小于所述第一评估阈值,则使所述第一训练模块结束训练,否则,继续使所述第一训练模块基于所述第一训练样本集对所述哈希参数预测模型进行训练,直至训练得到的哈希参数预测模型对应的模型第二评估值小于所述第一评估阈值。

可选的,模型构建模块还可以包括:样本筛选参考值确定模块、样本筛选模块、训练样本集构造模块和第二训练模块。

所述样本筛选参考值确定模块,用于利用所述验证样本集,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定样本筛选参考值;

所述样本筛选模块,用于基于所述样本筛选参考值,从所述训练样本集中筛选出干净样本。

所述训练样本集构造模块,用于利用筛选出的干净样本构造第二训练样本集。

所述第二训练模块,用于利用所述第二训练样本集,对基于所述第一训练样本集训练得到的哈希参数预测模型进一步进行训练。

在一种可能的实现方式中,样本筛选参考值确定模块包括:参数确定子模块、最大参数获取子模块和样本筛选参考值确定子模块。

所述参数确定子模块,用于基于所述各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差,和/或,哈希检索召回率误差,和/或,检索时间比,其中,一样本对应的哈希参数误差为该样本对应的哈希参数预测值与该样本对应的哈希参数目标值的误差,任一样本对应的哈希检索召回率误差为基于该样本对应的哈希参数预测值确定的哈希检索召回率与该样本对应的目标召回率的误差,任一样本对应的检索时间比为得到该样本对应的哈希检索召回率所花费的时间与该样本对应的目标时间的比值。

所述最大参数获取子模块,用于从各个验证样本对应的哈希参数误差中获取哈希参数最大误差,和/或,从各个验证样本对应的哈希检索召回率误差中获取哈希检索召回率最大误差,和/或,从各个验证样本对应的检索时间比中获取最大检索时间比。

所述样本筛选参考值确定子模块,用于将所述哈希参数最大误差、所述哈希检索召回率最大误差、所述最大检索时间比中的任意一个或者任意两个的和或者三个的和,确定为所述样本筛选参考值。

优选的,所述样本筛选参考值为所述哈希参数最大误差、所述哈希检索召回率最大误差、所述最大检索时间比之和。

所述样本筛选模块,具体用于对于所述第一训练样本集中的任一训练样本,通过从该训练样本获取的特征,以及基于所述第一训练样本集训练得到的哈希参数预测模型,确定该训练样本对应的哈希参数预测值;基于该训练样本对应的哈希参数预测值,确定该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比;若该训练样本对应的哈希参数误差、哈希检索召回率误差和检索时间比之和小于所述样本筛选参考值,则确定该训练样本为干净样本;以获得所述第一训练样本集中的干净样本。

在一种可能的实现方式中,所述训练样本集构造模块,具体用于将所述筛选出的干净样本组成所述第二训练样本集;或者,对所述第一训练样本集中的脏样本进行聚类,获得多类脏样本,基于所述筛选出的干净样本的数量,以及预设的干净样本与脏样本的比例,确定脏样本的数量,基于所述脏样本的数量,分别从各类脏样本中获取脏样本,将获取的脏样本和所述筛选出的干净样本组成所述第二训练样本集。

所述第二训练模块,具体用于从所述第二训练样本集中的训练样本获取样本特征;将从所述第二训练样本集中的训练样本获取的样本特征,输入基于所述第一训练样本集训练得到的哈希参数预测模型进行训练。

其中,所述第二训练模块利用所述第二训练样本集对基于所述第一训练样本集训练得到的哈希参数预测模型进行训练的目标为:基于第一训练评估值、第二训练评估值、第三训练评估值中的任意一个或多个获得的模型第三评估值小于第二评估阈值。所述第一训练评估值为所述第二训练样本集中各个训练样本对应的哈希参数误差中的最大误差与最小误差的差值,所述第二训练评估值为所述第二训练样本集中各个训练样本对应的哈希检索召回率误差中的最大误差与最小误差的差值,所述第三训练评估值为所述第二训练样本集中各个训练样本对应的检索时间比中的最大检索时间比与最小检索时间比的差值。

可选的,模型构建模块还可以包括:第二验证模块。

所述第二验证模块,具体用于通过从各个验证样本获取的特征,以及基于所述第二训练样本集训练得到的哈希参数预测模型,确定各个验证样本对应的哈希参数预测值;基于所述各个验证样本对应的哈希参数预测值,确定各个验证样本对应的哈希参数误差、和/或哈希检索召回率误差、和/或检索时间比;确定各个验证样本对应的哈希参数误差中的最大误差与最小误差的差值作为第一验证评估值,和/或,确定各个验证样本对应的哈希检索召回率误差中的最大误差与最小误差的差值作为第二验证评估值,和/或,确定各个验证样本对应的检索时间比中的最大检索时间比与最小检索时间比的差值作为第三验证评估值;基于所述第一验证评估值和/或第二验证评估值和/或第三验证评估值,确定模型第四评估值;若所述模型第四评估值小于所述第二评估阈值,则结束训练,否则继续基于所述第二训练样本集训练所述哈希参数预测模型,直至训练得到的哈希参数预测模型对应的模型第四评估值小于所述第二评估阈值。

本申请实施例还提供了一种哈希参数确定设备,请参阅图7,示出了该哈希参数确定设备的结构示意图,该设备可以包括:至少一个处理器701,至少一个通信接口702,至少一个存储器703和至少一个通信总线704;

在本申请实施例中,处理器701、通信接口702、存储器703、通信总线704的数量为至少一个,且处理器701、通信接口702、存储器703通过通信总线704完成相互间的通信;

处理器701可能是一个中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;

存储器703可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;

其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:

获取指定场景对应的识别模型的相关数据;

获取所述识别模型的相关数据的特征;

根据所述识别模型的相关数据的特征,以及预先建立的哈希参数预测模型,预测对所述指定场景下的图像进行哈希检索时所使用的哈希参数值。

可选的,所述程序的细化功能和扩展功能可参照上文描述。

本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:

获取指定场景对应的识别模型的相关数据;

获取所述识别模型的相关数据的特征;

根据所述识别模型的相关数据的特征,以及预先建立的哈希参数预测模型,预测对所述指定场景下的图像进行哈希检索时所使用的哈希参数值。

可选的,所述程序的细化功能和扩展功能可参照上文描述。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1