一种数据处理方法及装置与流程

文档序号:21783312发布日期:2020-08-07 20:17阅读:170来源:国知局
一种数据处理方法及装置与流程

本申请涉及人工智能技术领域,尤其涉及一种数据处理方法及装置。



背景技术:

目前,安防设备主要提供监控记录和检索查找功能,现有技术中,在检索查找数据时,一般通过两种方式进行检索查找,第一种是按照时间和通路查找数据,第二种是按照结构化检索查找数据或通过数据来查找另一个数据,但现有技术中的这两种方式,当数据量较多时,由于计算复杂度较大,在检索查找的过程中效率相对较低,并且,由于未将数据进行分类,因此,检索查找获得的数据重复性较高。



技术实现要素:

本申请实施例提供一种数据处理方法及装置,提高数据归档效率,并降低计算复杂度和数据重复性。

本申请实施例提供的具体技术方案如下:

一种数据处理方法,包括:

获取待处理数据的数据特征;

分别将所述数据特征与各档案数据类的中心数据特征进行对比,确定所述数据特征与各中心数据特征之间的特征相似度,其中,所述中心数据特征表征对应档案数据类中包含的各数据的中心点的数据特征,所述中心点表征对应档案数据类中分别与档案数据类中其它数据的数据特征对比,特征相似度的平均值最高的数据;

若确定存在特征相似度不小于预设特征相似度阈值,则将所述待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征相似度均小于预设特征相似度阈值,则新建档案数据类,并将所述待处理数据归档到新建的档案数据类中。

可选的,所述各档案数据类和所述新建的档案数据类分别关联一个档案编号,并所述各档案数据类和所述新建的档案数据类中包含的各数据分别对应一个数据编号。

可选的,进一步包括:

针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则分别将所述任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定出与其它数据特征相似度最高的数据特征,并根据确定出的数据特征,更新所述任意一个档案数据类的中心数据特征;

若在更新所述任意一个档案数据类的中心数据特征时,确定有新数据归档,则在更新所述任意一个档案数据类的中心数据特征之后,将所述新数据归档到所述任意一个档案数据类中。

可选的,进一步包括:

若确定接收到操作指令,则根据所述操作指令执行相应的操作。

可选的,若所述操作指令为删除指令,则根据所述操作指令执行相应的操作,具体包括:

根据所述删除指令中的档案编号,查找到与所述档案编号关联的档案数据类,并删除所述档案数据类,其中,所述删除指令中至少包括档案编号;或,

根据所述删除指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述删除指令中的数据编号,查找到与所述数据编号关联的数据,并将所述数据删除,其中,所述删除指令中至少包括档案编号和数据编号。

可选的,若所述操作指令为修改指令,则根据所述操作指令执行相应的操作,具体包括:

根据所述修改指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述修改指令执行相应的修改操作,其中,所述修改指令中至少包括档案编号;或,

根据所述修改指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述修改指令中的数据编号,查找到与所述数据编号关联的数据,并根据所述修改指令执行相应的修改操作,其中,所述修改指令中至少包括档案编号和数据编号。

可选的,若所述操作指令为查找指令,则根据所述操作指令执行相应的操作,具体包括:

根据所述查找指令中的档案编号,查找到与所述档案编号关联的档案数据类,其中,所述查找指令中至少包括档案编号;或,

根据所述查找指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述查找指令中的数据编号,查找到与所述数据编号关联的数据,其中,所述查找指令中至少包括档案编号和数据编号。

可选的,若所述档案数据类对应有多个中心数据特征,则分别将所述数据特征与各档案数据类的中心数据特征进行对比,确定所述数据特征与各中心数据特征之间的特征相似度,具体包括:

分别将所述数据特征与各档案数据类的各中心数据特征进行比对,确定所述数据特征与各档案数据类的各中心数据特征之间的特征相似度,其中,所述多个中心数据特征为针对对应档案数据类中包含的各数据的不同区域块分别进行特征提取,并分别基于各数据的不同区域的数据特征确定出多个中心点后,基于确定的多个中心点确定的;或,所述多个中心数据特征为针对对应档案数据类中包含的各数据进行特征提取后,分别对各数据的数据特征进行聚类后获得的。

可选的,所述待处理数据为图像。

一种数据处理装置,包括:

获取模块,用于获取待处理数据的数据特征;

比对模块,用于分别将所述数据特征与各档案数据类的中心数据特征进行对比,确定所述数据特征与各中心数据特征之间的特征相似度,其中,所述中心数据特征表征对应档案数据类中包含的各数据的中心点的数据特征,所述中心点表征对应档案数据类中分别与档案数据类中其它数据的数据特征对比,特征相似度的平均值最高的数据;

第一处理模块,用于若确定存在特征相似度不小于预设特征相似度阈值,则将所述待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征相似度均小于预设特征相似度阈值,则新建档案数据类,并将所述待处理数据归档到新建的档案数据类中。

可选的,所述各档案数据类和所述新建的档案数据类分别关联一个档案编号,并所述各档案数据类和所述新建的档案数据类中包含的各数据分别对应一个数据编号。

可选的,进一步包括:

更新模块,用于针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则分别将所述任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定出与其它数据特征相似度最高的数据特征,并根据确定出的数据特征,更新所述任意一个档案数据类的中心数据特征;

第二处理模块,用于若在更新所述任意一个档案数据类的中心数据特征时,确定有新数据归档,则在更新所述任意一个档案数据类的中心数据特征之后,将所述新数据归档到所述任意一个档案数据类中。

可选的,进一步包括:

第三处理模块,用于若确定接收到操作指令,则根据所述操作指令执行相应的操作。

可选的,若所述操作指令为删除指令,则根据所述操作指令执行相应的操作时,第三处理模块具体用于:

根据所述删除指令中的档案编号,查找到与所述档案编号关联的档案数据类,并删除所述档案数据类,其中,所述删除指令中至少包括档案编号;或,

根据所述删除指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述删除指令中的数据编号,查找到与所述数据编号关联的数据,并将所述数据删除,其中,所述删除指令中至少包括档案编号和数据编号。

可选的,若所述操作指令为修改指令,则根据所述操作指令执行相应的操作时,第三处理模块具体用于:

根据所述修改指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述修改指令执行相应的修改操作,其中,所述修改指令中至少包括档案编号;或,

根据所述修改指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述修改指令中的数据编号,查找到与所述数据编号关联的数据,并根据所述修改指令执行相应的修改操作,其中,所述修改指令中至少包括档案编号和数据编号。

可选的,若所述操作指令为查找指令,则根据所述操作指令执行相应的操作时,第三处理模块具体用于:

根据所述查找指令中的档案编号,查找到与所述档案编号关联的档案数据类,其中,所述查找指令中至少包括档案编号;或,

根据所述查找指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述查找指令中的数据编号,查找到与所述数据编号关联的数据,其中,所述查找指令中至少包括档案编号和数据编号。

可选的,若所述档案数据类对应有多个中心数据特征,则比对模块具体用于:

分别将所述数据特征与各档案数据类的各中心数据特征进行比对,确定所述数据特征与各档案数据类的各中心数据特征之间的特征相似度,其中,所述多个中心数据特征为针对对应档案数据类中包含的各数据的不同区域块分别进行特征提取,并分别基于各数据的不同区域的数据特征确定出多个中心点后,基于确定的多个中心点确定的;或,所述多个中心数据特征为针对对应档案数据类中包含的各数据进行特征提取后,分别对各数据的数据特征进行聚类后获得的。

可选的,所述待处理数据为图像。

一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述数据处理方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理方法的步骤。

本申请实施例中,获得待处理数据的数据特征,分别将数据特征与各档案数据类的中心数据特征进行对比,确定数据特征与各中心数据特征之间的特征相似度,中心数据特征表征对应档案数据类中包含的各数据的中心点的数据特征,若确定存在特征相似度不小于预设相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征相似度均小于预设相似度阈值,则新建档案数据类,并将待处理数据归档到新建的档案数据类中,这样,通过将待处理数据的数据特征与各档案的中心数据特征进行比对,确定特征相似度,并根据特征相似度将待处理数据进行聚类归档,不仅提高了待处理数据的归档效率,还降低了计算复杂度和数据重复性。

附图说明

图1为本申请实施例中一种数据处理方法的流程图;

图2为本申请实施例中另一种数据处理方法的流程图;

图3为本申请实施例中数据处理装置的结构示意图;

图4为本申请实施例中电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,安防设备主要提高监控记录和检索查找功能,现有技术中,在检索查找数据时,一般通过两种方式进行查找,第一种方式是按照时间和通路查找数据,第二种方式是按照结构化检索数据或通过一个数据查找另一个数据,例如,当数据为图像时,还可以通过以图搜图的方式查找图像,但是现有技术中的这两种方式,当数据量较大时,则查找图像的效率较低,并且由于未将数据进行分类,因此,检索出来的数据重复性较高。

本申请实施例中,获取待处理数据的数据特征,分别将数据特征与各档案数据类的中心数据特征进行比对,确定数据特征与各中心数据特征之间的特征相似度,将数据特征与存储的档案数据类的中心数据特征进行比对,确定数据特征与中心数据特征之间的特征相似度,若确定存在特征相似度不小于预设特征相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征相似度均小于预设特征相似度阈值,则新建档案数据类,并将待处理数据归档到新建的档案数据类中,通过比对待处理数据的数据特征和档案数据类的数据特征,进而将待处理数据聚类到对应的档案数据类中,对数据进行聚类归档,这样,在检索数据时,能够提高数据检索效率,并降低计算量和数据重复性。

基于上述实施例,参阅图1所示,为本申请实施例中一种数据处理方法的流程图,主要应用于服务器,具体包括:

步骤100:获取待处理数据的数据特征。

本申请实施例中,待处理数据可以为图像,也可以为语音,本申请实施例中对此并不进行限制。

若待处理数据为图像,则执行步骤100时,具体包括:

s1:通过摄像头获得图像。

本申请实施例中,假设待处理数据为图像时,则可以通过摄像头直接抓拍图像,或者还可以通过其它发送方式获得图像,本申请实施例中对此并不进行限制。

s2:将图像进行特征提取,获得图像的数据特征。

本申请实施例中,将图像进行特征提取,获得图像的数据特征,例如,若待处理数据为图像时,则对图像进行特征提取后,获得待处理图像中人脸数据特征,例如,可以按照不同部分对图像进行特征提取,例如,对“眼睛”、“鼻子”等部分对图像进行特征提取,获得图像的整体的数据特征,又例如,可以直接对待处理图形进行人脸识别,提取出人脸数据特征,本申请实施例中对数据特征的类型和数量并不进行限制。

步骤110:分别将数据特征与各档案数据类的中心数据特征进行对比,确定数据特征与各中心数据特征之间的特征相似度。

其中,中心数据特征表征对应档案数据类中包含的各数据的中心点的数据特征,中心点表征对应档案数据类中分别与档案数据类中其它数据的数据特征对比,特征相似度的平均值最高的数据。

本申请实施例中,档案数据类中的各数据分别与档案数据类中其它数据的数据特征比对,获得多个特征相似度,然后将特征相似度取平均值,获得每个数据的特征相似度的平均值,并从各数据中选择特征相似度平均值最高的数据作为该档案数据类的中心点,例如,当待处理数据为图像时,则用户a的档案数据类中的中心数据特征为表征用户a的人脸中心数据特征。

本申请实施例中,通过分别将数据特征与各档案数据类的中心数据特征进行对比,确定数据特征与各中心数据特征之间的特征相似度,并且,在确定特征相似度时,对中心数据特征的数量并不进行限制,中心数据特征可以为一个,也可以为多个,具体执行步骤110时可以分为以下两种不同的情况:

第一种情况:中心数据特征为一个。

本申请实施例中,当中心数据特征为一个时,则将待处理数据进行特征提取,获取到待处理数据的数据特征后,则分别将提取到的数据特征与各档案数据类的中心数据特征进行比对,以待处理数据为图像,数据特征为人脸数据特征为例,例如,当获得图像之后,对图像进行特征提取,获得人脸数据特征,然后与档案编号为a的档案数据类的人脸中心数据特征进行比对,确定人脸数据特征与档案编号为a的档案数据类的人脸中心数据特征之间的特征相似度,与档案编号为b的档案数据类的人脸中心数据特征进行比对,确定人脸数据特征与档案编号为b的档案数据类的人脸中心数据特征之间的特征相似度,并与档案编号为c的档案数据类的人脸中心数据特征进行比对,确定人脸数据特征与档案编号为c的档案数据类的人脸中心数据特征之间的特征相似度,本申请实施例中对此并不进行限制。

第二种情况:中心数据特征为多个。

则具体包括:分别将数据特征与各档案数据类的各中心数据特征进行比对,确定数据特征与各档案数据类的各中心数据特征之间的特征相似度。

其中,若档案数据类对应有多个中心数据特征,则对于多个中心数据特征的确定,本申请实施例中提供了两种可能的实施方式:1)多个中心数据特征为针对对应档案数据类中包含的各数据的不同区域块分别进行特征提取,并分别基于各数据的不同区域的数据特征确定出多个中心点后,基于确定的多个中心点确定的。例如,当待处理数据为图像时,对应的不同区域块可以分为“眼睛”、“嘴巴”、“鼻子”等,并不进行限制,则分别对档案数据类的各图像的不同区域块分别进行特征提取,并分别基于各数据的不同区域块的数据特征确定出多个中心点,即基于“眼睛”数据特征进行比对确定的中心点,基于“嘴巴”数据特征进行比对确定的中心点等,然后,分别基于确定的中心点“眼睛”和“嘴巴”确定对应的中心数据特征。

在这种实施方式中,当获得待处理数据的各数据特征之后,分别将各数据特征与各档案数据类的各中心数据特征进行比对,确定数据特征与各档案数据类的各中心数据特征之间的特征相似度,例如,假设档案数据类a的中心数据特征为“眼睛”和“鼻子”,档案数据类b的中心数据特征为“眼睛”和“嘴巴”,则对待处理数据进行特征提取,获得数据特征“眼睛”、“鼻子”和“嘴巴”,然后分别将待处理数据的数据特征“眼睛”和档案数据类a的中心数据特征“眼睛”进行比对,将待处理数据的数据特征“鼻子”和档案数据类a的中心数据特征“鼻子”进行比对,将待处理数据的数据特征“眼睛”和档案数据类b的中心数据特征“眼睛”进行比对,将待处理数据的数据特征“嘴巴”和档案数据类b的中心数据特征“嘴巴”进行比对。

2)多个中心数据特征为针对对应档案数据类中包含的各数据进行特征提取后,分别对各数据的数据特征进行聚类后获得的。例如,档案编号为a的档案数据类中包括图像1、图像2、图像3、图像4,则分别对图像1、图像2和图像3、图像4进行特征提取,获得图像1的数据特征a1,图像2的数据特征a2和图像3的数据特征a3,图像4的数据特征a4,然后分别对数据特征a1、数据特征a2、数据特征a3、数据特征a4进行聚类,例如,数据特征a2和数据特征a1、数据特征a3的特征相似度的平均值最高,但与数据特征a4特征相似度较低,则可以聚为两类,进而获得档案编号为a的档案数据类的两个中心数据特征,分别为数据特征a2和数据特征a4。

本申请实施例中,虽然档案数据类中包含的各数据均为对应的用户的数据,但是,由于档案数据类中的各数据可能相差较大,因此,可以将中心数据特征设置为多个,例如,可以将档案数据类的中心数据特征设置为2-6个,中心数据特征的数量可以根据实际需要进行设置,这样,为每个档案数据类设置多个中心数据特征,能够提高数据聚类归档的准确性,并且,随着中心数据特征的数量的递增,将数据聚类归档的结果也就越准确,本申请实施例中对中心数据特征的数量并不进行限制。

例如,假设档案编号为a的档案数据类中,设置有2个中心数据特征,分别为中心数据特征a1和中心数据特征a2,档案编号为b的档案数据类中,设置有3个中心数据特征,分别为中心数据特征b1、中心数据特征b2和中心数据特征b3,则在获取到待处理数据的数据特征之后,将数据特征与档案编号为a的档案数据类中的各中心数据特征进行比对,即,将数据特征与中心数据特征a1进行比对,确定出数据特征与中心数据特征a1之间的特征相似度,将数据特征与中心数据特征a2进行比对,确定出数据特征与中心数据特征a2之间的特征相似度,并将数据特征与档案编号为b的档案数据类中的各中心数据特征进行比对,即将数据特征与中心数据特征b1进行比对,确定出数据特征与中心数据特征b1之间的特征相似度,将数据特征与中心数据特征b2进行比对,确定出数据特征与中心数据特征b2之间的特征相似度,将数据特征与中心数据特征b3进行比对,确定出数据特征与中心数据特征b3之间的特征相似度。

其中,各档案数据类的中心数据特征的数量可以相同,也可以不同,可根据实际需求进行设置。

步骤120:若确定存在特征相似度不小于预设特征相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征相似度均小于预设特征相似度阈值,则新建档案数据类,并将待处理数据归档到新建的档案数据类中。

则基于上述档案数据类中对应的中心数据特征的个数,相应地执行步骤120时,具体可以分为以下两种不同实施方式:

第一种实施方式:当档案数据类对应有一个中心数据特征时,本申请实施例中,当中心数据特征为一个时,则当确定出待处理数据的数据特征与各档案数据类的中心数据特征之间的特征相似度之后,进而判断待处理数据的各数据特征的特征相似度是否不小于预设特征相似度阈值,具体执行步骤120可以分为以下两种不同的情况。

第一种情况:特征相似度不小于预设特征相似度阈值。

具体包括:若确定存在特征相似度不小于预设特征相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中。

本申请实施例中,若确定存在数据特征的特征相似度不小于预设特征相似度阈值,则将待处理数据归档到其数据特征与各档案数据类的中心数据特征之间的最高特征相似度对应的档案数据类中,以数据特征为图像的人脸数据特征、特征相似度阈值为80%为例,例如,通过摄像头采集到用户x的图像,并将用户x的图像进行特征提取,获得用户x的人脸数据特征,假设人脸数据特征与档案编号为a档案数据类的人脸中心数据特征的第一特征相似度为90%,人脸数据特征与档案编号为b档案数据类的人脸中心数据特征的第二特征相似度为85%,人脸数据特征与档案编号为c档案数据类的人脸中心数据特征的第三特征相似度为“60%”,由此可知,第一特征相似度大于第二特征相似度,第二特征相似度大于第三特征相似度,并确定第一特征相似度和第二特征相似度大于预设特征相似度阈值,第三特征相似度小于预设特征相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中,即,将待处理数据聚类归档到档案编号为a的档案数据类中。

进一步地,当待处理数据聚类归档到对应的档案数据类后,则为该待处理数据关联一个数据编号,这样,在检索查找数据的过程中,能够通过档案数据类对应的档案编号和数据对应的数据编号准确定位数据的位置。

本申请实施例中,各档案数据类和新建的档案数据类分别关联一个档案编号,并各档案数据类和新建的档案数据类中包含的各数据分别对应一个数据编号,每个档案数据类中包含对应用户的数据,例如,当数据为图像时,则档案编号为a的档案数据类中为用户a的图像,档案编号为b的档案数据类中为用户b的图像。

例如,将档案数据类关联一个档案编号为a,档案编号为a的档案数据类中包含的第一个数据的数据编号为1、第二个数据的数据编号为2、第三个数据的数据编号为3,这样,在接收到操作指令时,能够及时根据档案编号或数据编号查找到对应的档案数据类或档案数据类中的数据,可以提高查找的准确性。

第二种情况:特征相似度均小于预设特征相似度阈值。

具体包括:

s1:若确定特征相似度均小于特征相似度阈值,则新建档案数据类。

本申请实施例中,若确定特征相似度均小于特征相似度阈值,也就是说,根据将待处理数据的数据特征与各档案数据类的中心数据特征进行比对,确定数据特征与各档案数据类的中心数据特征之间的特征相似度,若确定出的数据特征与各档案数据类的中心数据特征之间的特征相似度均小于预设特征相似度阈值,则新建档案数据类,以待处理数据为图像、预设特征相似度阈值为70%为例,例如,假设确定出的数据特征与档案编号为a档案数据类的中心数据特征的第一特征相似度为30%,该数据特征与档案编号为b档案数据类的中心数据特征的第二特征相似度为20%,该数据特征与档案编号为c档案数据类的中心数据特征的第三特征相似度为“25%”,此时,由于第一特征相似度、第二特征相似度和第三特征相似度均小于预设特征相似度阈值,则新建档案数据类。

s2:将待处理数据归档到新建的档案数据类中。

当新建档案数据类后,将待处理数据归档到新建的档案数据类中并保存,然后为新建的档案数据类关联一个档案编号,并为保存到该档案数据中的待处理数据关联一个数据编号,例如,为新建的档案数据类关联一个档案编号为c,为保存到档案编号为c的档案数据类的待处理数据关联一个数据编号为1,本申请实施例中对此并不进行限制。

第二种实施方式:当档案数据类对应有多个中心数据特征时,本申请实施例中,当中心数据特征为多个时,则当确定出待处理数据的数据特征与各档案数据类的各中心数据特征之间的特征相似度之后,进而判断待处理数据的数据特征与档案数据类的各中心数据特征之间的特征相似度是否不小于预设特征相似度阈值,具体执行步骤120包括以下两种不同的情况。

第一种情况:特征相似度不小于预设特征相似度阈值。

本申请实施例中,当确定出待处理数据的数据特征与各档案数据类的各中心数据特征之间的特征相似度之后,若确定存在特征相似度不小于预设特征相似度阈值,则将待处理数据进行归档,具体可以包括以下两种不同的方式。

第一种方式:将待处理数据归档到最高特征相似度对应的档案数据类中。

本申请实施例中,若确定存在特征相似度不小于预设特征相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中,以待处理数据为图像为例,例如,对图像进行特征提取,获得图像的数据特征为人脸数据特征x,假设档案编号为a的档案数据类的人脸中心数据特征分别为a1、a2,档案编号为b的档案数据类的人脸中心数据特征分别为b1、b2,则将人脸数据特征x与人脸中心数据特征a1进行比对,确定出人脸数据特征x与人脸中心数据特征a1之间的特征相似度为xa1,为90%,将人脸数据特征x与人脸中心数据特征a2进行比对,确定出人脸数据特征x与人脸中心数据特征a2之间的特征相似度为xa2,为70%,将人脸数据特征x与人脸中心数据特征b1进行比对,确定出人脸数据特征x与人脸中心数据特征b1之间的特征相似度为xb1,为80%,将人脸数据特征x与人脸中心数据特征b2进行比对,确定出人脸数据特征x与人脸中心数据特征b2之间的特征相似度为xb2,为60%,若此时特征相似度阈值为75%,则可以确定特征相似度xa1和特征相似度xb1大于特征相似度阈值,然后将图像归档到最高特征相似度对应的档案数据类中,即,将图像归档到档案编号为a的档案数据类中。

第二种方式:将待处理数据归档到最高平均特征相似度对应的档案数据类中。

本申请实施例中,若确定存在特征相似度不小于预设特征相似度阈值,则分别计算各档案数据类对应的不小于预设特征相似度阈值的各特性相似度的加权平均值,并将待处理数据归档到最高平均特征相似度对应的档案数据类中。

以待处理数据为图像,特征相似度阈值为80%为例,例如,对图像进行特征提取,获得图像的数据特征为人脸数据特征x,假设档案编号为a的档案数据类的人脸中心数据特征分别为a1、a2,档案编号为b的档案数据类的人脸中心数据特征分别为b1、b2,确定出人脸数据特征x与人脸中心数据特征a1之间的特征相似度为xa1,为90%,确定出人脸数据特征x与人脸中心数据特征a2之间的特征相似度为xa2,为70%,由于则人脸数据特征x的预设特征相似度阈值为80%,因此,人脸数据特征x与档案编号为a的档案数据类中的各人脸中心数据特征之间的平均特征相似度为90%,然后,确定出人脸数据特征x与人脸中心数据特征b1之间的特征相似度为xb1,为80%,确定出人脸数据特征x与人脸中心数据特征b2之间的特征相似度为xb2,为85%,由于人脸数据特征x与档案编号为b的档案数据类的各人脸中心数据特征的特征相似度均不小于预设相似度阈值,则对特征相似度取加权平均,获得平均特征相似度为82.5%,然后将图像归档到最高平均特征相似度对应的档案数据类中,即,将图像归档到档案编号为a的档案数据类中。

第三种方式:本申请实施例中,还提供了一种可能的实施方式,具体包括:

确定出待处理数据的数据特征与各档案数据类的各中心数据特征之间的特征相似度后,分别计算各档案数据类对应的各特性相似度的加权平均值,获得各档案数据类对应的平均特征相似度,并若确定存在平均特征相似度不小于预设特征相似度阈值,则将待处理数据归档到最高平均特征相似度对应的档案数据类中。

下面以待处理数据为图像,特征相似度阈值为80%为例,对本申请实施例中的可能的实施方式进行详细阐述,例如,对图像进行特征提取,获得图像的数据特征为人脸数据特征x,假设档案编号为a的档案数据类的人脸中心数据特征分别为a1、a2,档案编号为b的档案数据类的人脸中心数据特征分别为b1、b2,确定出人脸数据特征x与人脸中心数据特征a1之间的特征相似度为xa1,为80%,确定出人脸数据特征x与人脸中心数据特征a2之间的特征相似度为xa2,为90%,则人脸数据特征x与档案编号为a的档案数据类中的各人脸中心数据特征之间的平均特征相似度为85%,然后,确定出人脸数据特征x与人脸中心数据特征b1之间的特征相似度为xb1,为70%,确定出人脸数据特征x与人脸中心数据特征b2之间的特征相似度为xb2,为80%,则人脸数据特征x与档案编号为b的档案数据类中的各人脸中心数据特征之间的平均特征相似度为75%,若此时特征相似度阈值为80%,则将图像归档到档案编号为a的档案数据类中。

第二种情况:特征相似度均小于预设特征相似度阈值。

具体包括:若确定特征相似度均小于特征相似度阈值,则新建档案数据类,并将待处理数据归档到新建的档案数据类中。

进一步地,本申请实施例中,针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则任意一个档案数据类能够自动更新中心数据特征,具体包括:

s1:针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则分别将任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定出与其它数据特征相似度最高的数据特征,并根据确定出的数据特征,更新任意一个档案数据类的中心数据特征。

本申请实施例中,针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则分别将任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定出与其它数据特征相似度最高的数据特征,并根据确定出的数据特征,更新任意一个档案数据类的中心数据特征,实现各档案数据类的中心数据特征迭代调整,也就是说,各档案数据类的中心数据特征为选择获得的,而不是计算获得的,以数据特征为人脸数据特征,中心数据特征为人脸中心数据特征为例,例如,假设人脸中心数据特征为一个时,将数据编号为1的图像对应的人脸数据特征与数据编号为2的图像对应的人脸数据特征进行比对,确定出数据编号为1的图像对应的人脸数据特征与数据编号为2的图像对应的人脸数据特征之间的第一特征相似度为70%,将数据编号为1的图像对应的人脸数据特征与数据编号为3的图像对应的人脸数据特征进行比对,确定出数据编号为1的图像对应的人脸数据特征与数据编号为3的图像对应的人脸数据特征之间的第二特征相似度为80%,将数据编号为2的图像对应的人脸数据特征与数据编号为3的图像对应的人脸数据特征进行比对,确定出数据编号为2的图像对应的人脸数据特征与数据编号为3的图像对应的人脸数据特征之间的第三特征相似度为75%,则此时数据编号为1的图像对应的人脸数据特征的平均特征相似度为为75%,数据编号为2的图像对应的人脸数据特征的平均特征相似度为为72.5%,数据编号为3的图像对应的人脸数据特征的平均特征相似度为为77.5%,由于数据编号为3的图像的特征相似度的平均值最高,则将数据编号为3的图像对应的人脸数据特征作为该档案数据类的人脸中心数据特征,本申请实施例中对此并不进行限制。

进一步地,当获得档案数据类的中心数据特征之后,自动重新对档案数据类中的各数据进行特征提取,获得档案数据类中的各数据的数据特征,并根据确定出的各数据的数据特征对该档案数据类的中心数据特征进行不断更新,确保确定出的中心数据特征为能够表征当前档案数据类最佳的数据特征。

由于在获取数据时,可能由于获取数据时的场景不同,因此会导致获取到的数据之间的偏差较大,在这种情况下,如果数据与各档案数据类的中心数据特征之间的特征相似度均小于预设特征相似度阈值,而新建档案数据类的话,可能会导致原本应当归档的数据,被重新新建了一个档案数据类,这样,就会降低数据聚类归档的准确性,因此,可以通过设置多个中心数据特征,来提高数据聚类归档的准确性。

若中心数据特征为多个时,则可以分别将任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定各数据之间的特征相似度,并获得各类数据的平均特征相似度,选择特征相似度最高的几个数据特征作为该档案数据类的中心数据特征。

例如,将数据编号为1的图像对应的数据特征与数据编号为2的图像对应的数据特征进行比对,确定出数据编号为1的图像对应的数据特征与数据编号为2的图像对应的数据特征之间的第一特征相似度,将数据编号为1的图像对应的数据特征与数据编号为3的图像对应的数据特征进行比对,确定出数据编号为1的图像对应的数据特征与数据编号为3的图像对应的数据特征之间的第二特征相似度,将数据编号为2的图像对应的数据特征与数据编号为3的图像对应的数据特征进行比对,确定出数据编号为2的图像对应的数据特征与数据编号为3的图像对应的数据特征之间的第三特征相似度,然后选取特征相似度的平均值最高的数据和特征相似度的平均值第二高的数据作为该档案数据类的中心点。

进一步地,还可以根据场景的不同对档案数据类中的数据进行分类,并计算每一类中数据之间的特征相似度,取特征相似度的平均值最高的数据作为该类的中心数据特征,并将每一类的中心数据特征集合,作为该档案数据类的多个中心数据特征。

其中,可以利用低负载时间来更新档案数据类的中心数据特征,预设时长可以根据实际需要进行设置,例如,可将时长设置为5秒,本申请实施例中对此并不进行限制。

s2:若在更新任意一个档案数据类的中心数据特征时,确定有新数据归档,则在更新任意一个档案数据类的中心数据特征之后,将新数据归档到任意一个档案数据类中。

本申请实施例中,若在更新任意一个档案数据类的中心数据特征时,确定有新数据归档,也就是说,在更新任意一个档案数据类的中心数据特征时接收到新的数据,并且已确定了新的数据所属的档案数据类,则在更新完本次任意一个档案数据类的中心数据特征之后,暂停更新该档案数据类的中心数据特征,然后将新数据归档到任意一个该档案数据类中,当新数据归档后,则继续计时,若确定超过预设时长未有新数据归档,则继续执行更新任意一个档案数据类的中心数据特征的步骤。

当档案数据类聚类归档或新建完成后,用户可根据实际需求和不同类型的操作指令,向服务器发送指令,具体包括:

若确定接收到操作指令,则根据操作指令执行相应的操作。

下面以操作指令为删除指令、修改指令和删除指令,对本申请实施例中的根据操作指令执行相应的操作进行详细阐述,本申请实施例中的操作类型仅为示例,对此并不进行限定。

第一种类型:操作指令为删除指令。

若确定删除档案数据类,则根据操作指令执行相应的操作,具体包括:

根据删除指令中的档案编号,查找到与档案编号关联的档案数据类,并删除档案数据类。

其中,删除指令中至少包括档案编号。

本申请实施例中,根据删除指令中的档案编号,查找到与档案编号关联的档案数据类,然后将该档案数据类删除,这样,档案数据类中的所有数据都被删除,例如,假设确定删除档案编号为b的档案数据类,则删除指令中包括答案编号b,然后根据该档案编号b确定与该档案编号对应的档案数据类,并删除该档案数据类。

若确定删除档案数据类中的数据,则根据操作指令执行相应的操作,具体包括:

根据删除指令中的档案编号,查找到与档案编号关联的档案数据类,并根据删除指令中的数据编号,查找到与数据编号关联的数据,并将数据删除。

其中,删除指令中至少包括档案编号和数据编号。

本申请实施例中,当接收到删除指令后,确定删除档案数据类的数据,则根据删除指令中的档案编号,查找到与档案编号关联的档案数据类,并根据删除指令的数据编号,查找到与数据编号关联的数据,并将该数据删除,例如,假设删除指令中的档案编号为b,数据编号为c,则当接收到删除指令后,根据删除指令中的档案编号b,查找到与档案编号b关联的档案数据类,并根据删除指令中的数据编号4,查找到与数据编号4关联的数据,并将该数据删除,本申请实施例中对档案编号与数据编号的个数并不进行限制。

这样,通过本申请实施例中的方法,分别为各档案数据类关联一个档案编号,并分别为档案数据类中的各数据关联一个数据编号,能够准确定位到档案数据类和数据,在删除档案数据类或档案数据类中的数据时,能够提高准确性。

第二种类型:操作指令为修改指令。

若确定修改档案数据类,则根据操作指令执行相应的操作,具体包括:

根据修改指令中的档案编号,查找到与档案编号关联的档案数据类,并根据修改指令执行相应的修改操作。

其中,修改指令中至少包括档案编号。

本申请实施例中,当确定修改档案数据类时,可以根据修改指令对档案数据类的档案编号、名称等进行修改,本申请实施例中对此并不进行限制。

若确定修改档案数据类中的数据,则根据操作指令执行相应的操作,具体包括:

根据修改指令中的档案编号,查找到与档案编号关联的档案数据类,并根据修改指令中的数据编号,查找到与数据编号关联的数据,并根据修改指令执行相应的修改操作。

其中,修改指令中至少包括档案编号和数据编号。

本申请实施例中,当确定修改档案数据类中的数据时,则首先根据修改指令中的档案编号,并根据档案编号与档案数据类的关联关系,查找到对应的档案数据类,进而根据修改指令中的数据编号和数据编号与数据的关联关系,查找到对应的数据,并将数据进行修改,例如,可以修改数据的数据编号或将数据替换为新的数据,本申请实施例中对此并不进行限制。

第三种类型:操作指令为查找指令。

本申请实施例中,当操作指令为查找指令时,查找指令可以具体分为以下三种不同的种类。

第一种:查找指令中至少包括档案编号。

则根据操作指令执行相应的操作,具体包括:

根据查找指令中的档案编号,查找到与档案编号关联的档案数据类。

其中,查找指令中至少包括档案编号。

本申请实施例中,将待处理数据进行聚类归档后,则可以根据档案数据类对应的档案编号,准确定位需要检索的档案数据类,这样,通过将待处理数据归档,然后再进行检索,检索获得的数据是按照聚类后的档案数据类的方式呈现的,例如,对抓拍到的图像进行聚类归档,在检索图像时,通过输入档案数据类的数据编号,进而检索获得的档案数据类的各个数据,能够避免同一个人的数据多次出现,实现抓拍及检索结果去重显示并快速返回。

第二种:查找指令中至少包括档案编号和数据编号。

则根据操作指令执行相应的操作,具体包括:

根据查找指令中的档案编号,查找到与档案编号关联的档案数据类,并根据查找指令中的数据编号,查找到与数据编号关联的数据。

其中,查找指令中至少包括档案编号和数据编号。

本申请实施例中,在查找档案数据类中的数据时,先根据查找指令中的档案编号和档案编号与档案数据类的关联关系,查找到对应的档案数据类,然后根据查找指令中的数据编号和数据编号与数据的关联关系,查找到对应的数据,这样,通过将数据聚类归档后再进行检索查找,能够对检索结果去重并快速返回,并且,能够通过结构化检索或者事件检索去重,以数据为图像为例,能够基于查询档案数据类或者档案数据类中的数据的方式检索历史图片、视频或档案信息并快速去重。

第三种:查找指令中至少包括数据编号。

则根据操作指令执行相应的操作,具体包括:

查找到与数据编号关联的档案数据类,并根据档案数据编号查找到与数据编号关联的数据。

其中,查找指令中至少包括数据编号。

本申请实施例中,在查找档案数据类中的数据时,先根据查找指令中的数据编号与档案数据类的关联关系,查找到对应的档案数据类,然后根据数据编号与数据的关联关系,查找与数据编号关联的对应的数据。

例如,还可以给定一个数据特征和特征相似度阈值搜索历史匹配的数据集合,通过给定的数据特征到对应的档案数据类查找特征相似度阈值匹配的档案编号,这些档案编号对应的数据的集合在通过给定时间段过滤后就是需要的数据。

其中,过滤的方式可以为根据时间对数据进行过滤,这样,能够过滤掉在档案数据类中保存时间较长的数据,保留近期数据,当数据为图像时,还可以根据图像的清晰度对图像进行过滤,这样,能够过滤掉在档案数据类中清晰度不高的图像,仅保留清晰度较高的图像,能够进一步提高待处理数据归档的准确性。

进一步地,以数据为图像为例,由于将数据进行聚类获得档案数据类,因此在检索查找的过程中,人员的图像信息是按人头统计的,而非按次数统计,可用于出入人流趋势分析。

本申请实施例中,获得待处理数据的数据特征,分别将数据特征与各档案数据类的中心数据特征进行比对,确定数据特征与各中心数据特征之间的特征相似度,若确定存在特征相似度不小于预设特征相似度阈值,则将待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征显示度均小于特征相似度阈值,则新建档案数据类,并将待处理数据归档到新建的档案数据类中,并且,针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则分别将任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定出与其它数据特征相似度最高的数据特征,并根据确定出的数据特征,更新任意一个档案数据类的中心数据特征,这样,通过将待处理数据的数据特征与各档案数据类的中心数据特征进行比对,进而将待处理数据归档,能够提升数据聚类归档效率,在检索查找数据时,能够基于档案编号和数据编号实现去重显示,并降低计算量。

基于上述实施例,下面以数据为图像为例,对本申请实施例中图像归档方法进行详细阐述,参阅图2所示,为本申请实施例中另一种数据处理方法的流程图,具体包括:

步骤200:开始。

步骤210:获得待处理图像的图像特征。

步骤220:分别将图像特征与各档案数据类的中心图像特征进行对比,确定图像特征与各中心图像特征之间的特征相似度。

其中,中心图像特征表征对应档案数据类中包含的各图像的中心点的图像特征,中心点表征对应档案数据类中分别与档案数据类中其它数据的数据特征对比,特征相似度的平均值最高的数据。

步骤230:判断是否存在特征相似度不小于预设特征相似度阈值,若是,则执行步骤240,若否,则执行步骤250。

步骤240:将待处理图像归档到最高特征相似度对应的档案数据类中。

步骤250:新建档案数据类,并将待处理图像归档到新建的档案数据类中。

其中,各档案数据类和新建的档案数据类分别关联一个档案编号,并各档案数据类和新建的档案数据类中包含的各图像分别对应一个图像编号。

步骤260:结束。

本申请实施例中,获得待处理图像的图像特征,分别将图像特征与各档案数据类的中心图像特征进行比对,确定图像特征与各中心图像特征之间的特征相似度,中心图像特征表征对应档案数据类汇总包含的各图像的中心点的图像特征,若确定存在特征相似度不小于预设特征相似度阈值,则将待处理图像归档到最高特征相似度对应的档案数据类中,若特征相似度均小于特征相似度阈值,则新建档案数据类,并将待处理图像归档到新建的档案数据类中,这样,通过比对特征相似度,将待处理图像进行归档,能够实现图像去重显示,降低计算量。

基于同一发明构思,本申请实施例中提供了数据处理装置,该数据处理装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施例,参阅图3所示,为本申请实施例中数据处理装置的结构示意图,具体包括:

获取模块300,用于获取待处理数据的数据特征;

比对模块310,用于分别将所述数据特征与各档案数据类的中心数据特征进行对比,确定所述数据特征与各中心数据特征之间的特征相似度,其中,所述中心数据特征表征对应档案数据类中包含的各数据的中心点的数据特征,所述中心点表征对应档案数据类中分别与档案数据类中其它数据的数据特征对比,特征相似度的平均值最高的数据;

第一处理模块320,用于若确定存在特征相似度不小于预设特征相似度阈值,则将所述待处理数据归档到最高特征相似度对应的档案数据类中,若确定特征相似度均小于预设特征相似度阈值,则新建档案数据类,并将所述待处理数据归档到新建的档案数据类中。

可选的,所述各档案数据类和所述新建的档案数据类分别关联一个档案编号,并所述各档案数据类和所述新建的档案数据类中包含的各数据分别对应一个数据编号。

可选的,进一步包括:

更新模块330,用于针对任意一个档案数据类,若确定超过预设时长均未有新数据归档,则分别将所述任意一个档案数据类中包含的各数据的数据特征两两进行比对,确定出与其它数据特征相似度最高的数据特征,并根据确定出的数据特征,更新所述任意一个档案数据类的中心数据特征;

第二处理模块340,用于若在更新所述任意一个档案数据类的中心数据特征时,确定有新数据归档,则在更新所述任意一个档案数据类的中心数据特征之后,将所述新数据归档到所述任意一个档案数据类中。

可选的,进一步包括:

第三处理模块350,用于若确定接收到操作指令,则根据所述操作指令执行相应的操作。

可选的,若所述操作指令为删除指令,则根据所述操作指令执行相应的操作时,第三处理模块350具体用于:

根据所述删除指令中的档案编号,查找到与所述档案编号关联的档案数据类,并删除所述档案数据类,其中,所述删除指令中至少包括档案编号;或,

根据所述删除指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述删除指令中的数据编号,查找到与所述数据编号关联的数据,并将所述数据删除,其中,所述删除指令中至少包括档案编号和数据编号。

可选的,若所述操作指令为修改指令,则根据所述操作指令执行相应的操作时,第三处理模块350具体用于:

根据所述修改指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述修改指令执行相应的修改操作,其中,所述修改指令中至少包括档案编号;或,

根据所述修改指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述修改指令中的数据编号,查找到与所述数据编号关联的数据,并根据所述修改指令执行相应的修改操作,其中,所述修改指令中至少包括档案编号和数据编号。

可选的,若所述操作指令为查找指令,则根据所述操作指令执行相应的操作时,第三处理模块350具体用于:

根据所述查找指令中的档案编号,查找到与所述档案编号关联的档案数据类,其中,所述查找指令中至少包括档案编号;或,

根据所述查找指令中的档案编号,查找到与所述档案编号关联的档案数据类,并根据所述查找指令中的数据编号,查找到与所述数据编号关联的数据,其中,所述查找指令中至少包括档案编号和数据编号。

可选的,若所述档案数据类对应有多个中心数据特征,则比对模块310具体用于:

分别将所述数据特征与各档案数据类的各中心数据特征进行比对,确定所述数据特征与各档案数据类的各中心数据特征之间的特征相似度,其中,所述多个中心数据特征为针对对应档案数据类中包含的各数据的不同区域块分别进行特征提取,并分别基于各数据的不同区域的数据特征确定出多个中心点后,基于确定的多个中心点确定的;或,所述多个中心数据特征为针对对应档案数据类中包含的各数据进行特征提取后,分别对各数据的数据特征进行聚类后获得的。

可选的,所述待处理数据为图像。

基于上述实施例,参阅图4所示为本申请实施例中电子设备的结构示意图。

本申请实施例提供了一种电子设备,该电子设备可以包括处理器410(centerprocessingunit,cpu)、存储器420、输入设备430和输出设备440等,输入设备430可以包括键盘、鼠标、触摸屏等,输出设备440可以包括显示设备,如液晶显示器(liquidcrystaldisplay,lcd)、阴极射线管(cathoderaytube,crt)等。

存储器420可以包括只读存储器(rom)和随机存取存储器(ram),并向处理器410提供存储器420中存储的程序指令和数据。在本申请实施例中,存储器420可以用于存储本申请实施例中任一种数据处理方法的程序。

处理器410通过调用存储器420存储的程序指令,处理器410用于按照获得的程序指令执行本申请实施例中任一种数据处理方法。

基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的数据处理方法。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1