本发明涉及数据库检索,具体涉及一种检索系统,特别是涉及一种通过动态阈值保持在布控库中性能稳定的检索系统。本发明还涉及一种通过动态阈值保持在布控库中性能稳定的检索方法。
背景技术:
检索系统是用于在检索数据库中检索所需要的内容,通常是输入和所要检索内容相关的特征,之后再在检索数据库中进行比对,将比对相似的数据都列出来,并得到检索结果。
随着人工智能(artificialintelligence,ai)的发展,检索也变得很重要。例如可以形成人脸识别的布控库,这种人脸识别的布控库对应的检索数据库中会存储大量的人脸特征,通过布控在不同区域位置的摄像头可以获取所需要检索的人脸特征,将检索请求输入到检索系统之后就能进行人脸识别并输出对应的检索结果。
现有技术中,当使用一个请求检索一个布控库时,会通过相似度比对的方式对所有的检索结果做排序,再使用阈值进行后过滤。高于阈值的结果会作为检索的正例输出。
现有方法中,检索所采用的阈值通常固定不变,而布控库本身的结构特征却会改变,这样造成检索的性能不稳定。原因为:布控库的结构结构包括数据分布和数据规模,其中不同的数据分布下例如数据来源不同的条件下以及不同的数据规模下,阈值代表的语义是不稳定的。意味着相同的阈值在不同数据分布下不具备泛化性,如果使用相同阈值,会造成检索的性能不稳定。
技术实现要素:
本发明所要解决的技术问题是提供一种通过动态阈值保持在布控库中性能稳定的检索系统,能提高检索的稳定性。为此,本发明还提供通过动态阈值保持在布控库中性能稳定的检索方法。
为解决上述技术问题,本发明提供的通过动态阈值保持在布控库中性能稳定的检索系统包括:检索数据库,动态阈值测试模块,检索模块。
所述动态阈值测试模块用于对所述检索数据库进行测试并形成所述检索数据库的动态阈值。
所述检索模块根据检索请求对所述检索数据库进行检索,检索过程中根据所述动态阈值形成检索结果。
进一步的改进是,所述检索数据库包括多个,各所述检索数据库的结构特征包括数据分布和数据规模。
所述检索数据库的动态阈值根据所述检索数据库的结构特征变化而适应性的动态变化。
进一步的改进是,所述检索数据库的数据分布包括由不同来源的数据形成的分布。
进一步的改进是,所述检索数据库的数据分布和数据规模的结构特征具有动态变化的特征。
所述动态阈值测试模块通过检测所述检索数据库的结构特征来得到所述动态阈值。
进一步的改进是,所述检索模块在接收到所述检索请求之后,首先通过相似度比对的方法检测出所有初步检索结果并对所述初步检索结果进行排序,之后再采用所述动态阈值对所述初步检索结果进行过滤得到所述检索结果,所述过滤是将检索值高于所述动态阈值的所述初步检索结果作为所述检索结果。
进一步的改进是,所述检索数据库为用于人脸识别的布控库,所述检索数据库中储存有多个人脸信息,所述检索模块在接收所述检索请求的同时接收被检索人脸信息。
进一步的改进是,所述被检索人脸信息通过布控的摄像头输入。
进一步的改进是,所述动态阈值测试模块采用如下步骤形成所述动态阈值:
查询所述检索数据库的结构特征信息。
基于所述结构特征信息对所述检索数据库进行检索测试,检索测试中采用一系列的测试阈值,不同的测试阈值得到对应的误报率,形成测试阈值和误报率一一对应的关系。
基于所述结构特征计算进行检索时所需求的准确率并基于所述准确率计算对应的所需要的误报率。
将所需要的误报率对应的所述测试阈值作为所述动态阈值。
为解决上述技术问题,本发明提供的通过动态阈值保持在布控库中性能稳定的检索方法包括如下步骤:
步骤一、提供动态阈值测试模块,利用所述动态阈值测试模块对检索数据库进行测试并形成所述检索数据库的动态阈值表。
步骤二、检索模块根据检索请求对所述检索数据库进行检索,检索过程中根据所述动态阈值形成检索结果。
进一步的改进是,所述检索数据库包括多个,各所述检索数据库的结构特征包括数据分布和数据规模。
所述检索数据库的动态阈值根据所述检索数据库的结构特征变化而适应性的动态变化。
进一步的改进是,所述检索数据库的数据分布包括由不同来源的数据形成的分布。
进一步的改进是,所述检索数据库的数据分布和数据规模的结构特征具有动态变化的特征。
所述动态阈值测试模块通过检测所述检索数据库的结构特征来得到所述动态阈值。
进一步的改进是,所述检索模块在接收到所述检索请求之后,首先通过相似度比对的方法检测出所有初步检索结果并对所述初步检索结果进行排序,之后再采用所述动态阈值对所述初步检索结果进行过滤得到所述检索结果,所述过滤是将检索值高于所述动态阈值的所述初步检索结果作为所述检索结果。
进一步的改进是,所述检索数据库为用于人脸识别的布控库,所述检索数据库中储存有多个人脸信息,所述检索模块在接收所述检索请求的同时接收被检索人脸信息。
进一步的改进是,所述被检索人脸信息通过布控的摄像头输入。
进一步的改进是,所述动态阈值测试模块采用如下步骤形成所述动态阈值:
查询所述检索数据库的结构特征信息。
基于所述结构特征信息对所述检索数据库进行检索测试,检索测试中采用一系列的测试阈值,不同的测试阈值得到对应的误报率,形成测试阈值和误报率一一对应的关系。
基于所述结构特征计算进行检索时所需求的准确率并基于所述准确率计算对应的所需要的误报率。
将所需要的误报率对应的所述测试阈值作为所述动态阈值。
本发明在检索系统中设置了动态阈值测试模块,通过动态阈值测试模块能检测检索数据库的动态阈值,在检索过程中采用动态阈值来形成检索结果并输出,所以,本发明能实现阈值动态的跟随检索数据库的结构特征变化,当检索数据库的结构特征变化时如数据分布和数据规模等产生变化时,本发明依然能实现准确的输出,从而能提高检索的稳定性。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明:
图1是本发明实施例检索系统的结构图;
图2是本发明实施例检索系统中动态阈值测试模块计算动态阈值的流程图。
具体实施方式
如图1所示,是本发明实施例检索系统的结构图;本发明实施例一种通过动态阈值保持在布控库中性能稳定的检索系统包括:检索数据库1,动态阈值测试模块2,检索模块3。
所述动态阈值测试模块2用于对所述检索数据库1进行测试并形成所述检索数据库1的动态阈值。
所述检索模块3根据检索请求对所述检索数据库1进行检索,检索过程中根据所述动态阈值形成检索结果。
所述检索数据库1包括多个,各所述检索数据库1的结构特征包括数据分布和数据规模。所述检索数据库1的数据分布包括由不同来源的数据形成的分布,例如来自于不同省份的数据。所述检索数据库1能作为用于人脸识别的布控库,所述检索数据库1中储存有多个人脸信息,所述检索模块3在接收所述检索请求的同时接收被检索人脸信息。所述被检索人脸信息通过布控的摄像头输入,所述被检索人脸信息也能通过手动输入。其中,手动输入可以输入文本信息;通过布控的摄像头输入是输入图形信息,图形信息需要先通过识别模块进行特征提取并转化为文本信息。
所述检索数据库1的数据分布和数据规模的结构特征具有动态变化的特征,例如:数据分布对应的数据来源会不断扩充,从而使数据分布越来越广;数据规模也会不断扩充,从而使数据规模越来越大;反之亦然。
所述检索数据库1的动态阈值根据所述检索数据库1的结构特征变化而适应性的动态变化。
所述动态阈值测试模块2通过检测所述检索数据库1的结构特征来得到所述动态阈值。
所述检索模块3在接收到所述检索请求之后,首先通过相似度比对的方法检测出所有初步检索结果并对所述初步检索结果进行排序,之后再采用所述动态阈值对所述初步检索结果进行过滤得到所述检索结果,所述过滤是将检索值高于所述动态阈值的所述初步检索结果作为所述检索结果。
如图2所示,是本发明实施例检索系统中动态阈值测试模块计算动态阈值的流程图。所述动态阈值测试模块2采用如下步骤形成所述动态阈值:
查询所述检索数据库1的结构特征信息。
基于所述结构特征信息对所述检索数据库1进行检索测试,检索测试中采用一系列的测试阈值,不同的测试阈值得到对应的误报率,形成测试阈值和误报率一一对应的关系。
基于所述结构特征计算进行检索时所需求的准确率并基于所述准确率计算对应的所需要的误报率。
将所需要的误报率对应的所述测试阈值作为所述动态阈值。
在其他实施例中也能为:预先提供具有一系列的结构特征对应的所述检索数据库,之后按照上面的流程分别测试各所述结构特征对应的所述动态阈值,从而形成动态阈值表;之后,在实际检索过程中,所述动态阈值测试模块2仅需对所述检索数据库的结构特征信息进行检测,根据检测得到的所述结构特征在所述动态阈值表中选择对应的所述动态阈值即可。
本发明实施例在检索系统中设置了动态阈值测试模块2,通过动态阈值测试模块2能检测检索数据库1的动态阈值,在检索过程中采用动态阈值来形成检索结果并输出,所以,本发明实施例能实现阈值动态的跟随检索数据库1的结构特征变化,当检索数据库1的结构特征变化时如数据分布和数据规模等产生变化时,本发明实施例依然能实现准确的输出,从而能提高检索的稳定性。
本发明实施例检索方法包括如下步骤:
步骤一、提供动态阈值测试模块2,利用所述动态阈值测试模块2对检索数据库1进行测试并形成所述检索数据库1的动态阈值表。
所述检索数据库1包括多个,各所述检索数据库1的结构特征包括数据分布和数据规模。所述检索数据库1的数据分布包括由不同来源的数据形成的分布,例如来自于不同省份的数据。所述检索数据库1能作为用于人脸识别的布控库,所述检索数据库1中储存有多个人脸信息,所述检索模块3在接收所述检索请求的同时接收被检索人脸信息。所述被检索人脸信息通过布控的摄像头输入,所述被检索人脸信息也能通过手动输入。其中,手动输入可以输入文本信息;通过布控的摄像头输入是输入图形信息,图形信息需要先通过识别模块进行特征提取并转化为文本信息。
所述检索数据库1的数据分布和数据规模的结构特征具有动态变化的特征,例如:数据分布对应的数据来源会不断扩充,从而使数据分布越来越广;数据规模也会不断扩充,从而使数据规模越来越大;反之亦然。
所述检索数据库1的动态阈值根据所述检索数据库1的结构特征变化而适应性的动态变化。
所述动态阈值测试模块2通过检测所述检索数据库1的结构特征来得到所述动态阈值。
如图2所示,是本发明实施例检索系统中动态阈值测试模块计算动态阈值的流程图。所述动态阈值测试模块2采用如下步骤形成所述动态阈值:
查询所述检索数据库1的结构特征信息。
基于所述结构特征信息对所述检索数据库1进行检索测试,检索测试中采用一系列的测试阈值,不同的测试阈值得到对应的误报率,形成测试阈值和误报率一一对应的关系。
基于所述结构特征计算进行检索时所需求的准确率并基于所述准确率计算对应的所需要的误报率。
将所需要的误报率对应的所述测试阈值作为所述动态阈值。
在其他实施例中也能为:预先提供具有一系列的结构特征对应的所述检索数据库,之后按照上面的流程分别测试各所述结构特征对应的所述动态阈值,从而形成动态阈值表;之后,在实际检索过程中,所述动态阈值测试模块2仅需对所述检索数据库的结构特征信息进行检测,根据检测得到的所述结构特征在所述动态阈值表中选择对应的所述动态阈值即可。
步骤二、检索模块3根据检索请求对所述检索数据库1进行检索,检索过程中根据所述动态阈值形成检索结果。
较佳选择为,所述检索模块3在接收到所述检索请求之后,首先通过相似度比对的方法检测出所有初步检索结果并对所述初步检索结果进行排序,之后再采用所述动态阈值对所述初步检索结果进行过滤得到所述检索结果,所述过滤是将检索值高于所述动态阈值的所述初步检索结果作为所述检索结果。
以上通过具体实施例对本发明进行了详细的说明,但这些并非构成对本发明的限制。在不脱离本发明原理的情况下,本领域的技术人员还可做出许多变形和改进,这些也应视为本发明的保护范围。