一种数据聚类方法、装置、计算机设备及存储介质与流程

文档序号：30750428发布日期：2022-07-13 08:49阅读：72来源：国知局

1.本技术涉及计算机技术领域，尤其涉及一种数据聚类方法、装置、计算机设备及存储介质。

背景技术：

2.随着科技的不断发展，越来越多的设备可以针对数据进行聚类处理。例如，针对人脸图像，将相同或相似的人脸图像汇聚为一类。
3.在车辆行驶监测场景下，可能由于车辆行驶速度、天气或车窗颜色等原因，造成获得的车辆行驶图像中不包含人脸所在图像区域，或人脸所在图像区域的清晰度较低等情况。因此，在针对车辆行驶图像中人脸所在图像区域，对车辆行驶图像进行数据聚类时，仅能够针对包含人脸所在图像区域的车辆行驶图像进行聚类处理，无法针对同一人脸获得完整的行车轨迹，造成车辆行驶监测困难度较高的问题，同时，对清晰度较低的车辆行驶图像进行数据聚类，还容易出现一个聚类结果中包含不同人脸对应的车辆行驶图像的情况。
4.可见，相关技术下，数据聚类的准确性较低。

技术实现要素：

5.本技术实施例提供了一种数据聚类方法、装置、计算机设备及存储介质，用以数据聚类的准确性较低的问题。
6.第一方面，提供一种数据聚类方法，包括：
7.获取各个第一聚类结果，其中，所述各个第一聚类结果是基于在预设时间段内产生的各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域，对所述各个目标车辆行驶数据进行初始聚类处理获得的，每个第一聚类结果包含至少一个目标车辆行驶数据；
8.基于预设的关联关系挖掘策略，对所述各个目标车辆行驶数据，以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，其中，所述各个参考车辆行驶数据各自包含的车牌数据，与所述各个目标车辆行驶数据各自包含的车牌数据匹配；
9.基于所述多个关联关系和所述各个第一聚类结果，对所述目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
10.可选的，在基于预设的关联关系挖掘策略，对所述各个目标车辆行驶数据，以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系之前，还包括：
11.获取所述各个目标车辆行驶数据各自包含的车辆行驶图像中，包含人脸的车辆图像区域对应的车牌数据；
12.针对所述各个目标车辆行驶数据各自包含的车牌数据，分别在所述预设时间段内产生的各个实时车辆行驶数据中，选取包含的车辆行驶图像中车辆图像区域对应的车牌数
据，与相应目标车辆行驶数据包含的车牌数据相同的实时车辆行驶数据，作为参考车辆行驶数据。
13.可选的，所述目标车辆行驶数据和所述参考车辆行驶数据分别还包括数据产生时刻和数据产生地址；
14.所述基于预设的关联关系挖掘策略，对所述各个目标车辆行驶数据，以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，包括：
15.将所述各个目标车辆行驶数据和所述各个参考车辆行驶数据，分别作为综合车辆行驶数据，并基于包含的车牌数据和数据产生时刻所属时间区间，对各个综合车辆行驶数据进行分组处理，针对每个车牌数据，获得多个车辆行驶数据序列，其中，每个车辆行驶数据序列包含的各综合车辆行驶数据按照数据产生时刻排列；
16.针对每个车牌数据对应的多个车辆行驶数据序列，执行以下操作：
17.采用所述关联关系挖掘策略，基于每个车辆行驶数据序列包含的综合车辆行驶数据的数据产生地址，分别对相应的多个车辆行驶数据序列进行挖掘处理，确定至少一个频繁项，以及每个频繁项包含的综合车辆行驶数据的数据产生地址，在相应的多个车辆行驶数据组中出现的频数，其中，
18.所述频繁项包含至少一个综合车辆行驶数据；
19.将获得的至少一个频繁项和相应的频数，作为相应车牌数据对应的关联关系。
20.可选的，基于所述多个关联关系和所述各个第一聚类结果，对所述各个目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果，包括：
21.基于所述各个目标车辆行驶数据各自的车牌数据，对所述各个第一聚类结果进行重新整合处理，获得多个第二聚类结果，其中，每个第二聚类结果中的各目标车辆行驶数据的车牌数据相同，且车辆行驶图像中位于车辆内部的人脸匹配；
22.基于所述多个关联关系和所述各个第二聚类结果，对所述各个目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
23.可选的，基于所述多个关联关系和所述各个第二聚类结果，对所述各个目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果，包括：
24.针对所述各个第二聚类结果，分别从第二聚类结果包含的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为相应第二聚类结果对应的质心车辆行驶数据；
25.基于所述多个关联关系，确定每两个质心车辆行驶数据之间的目标相似度；
26.针对目标相似度大于预设相似度条件的每两个质心车辆行驶数据各自对应的第二聚类结果进行合并处理，获得至少一个目标聚类结果。
27.可选的，所述目标车辆行驶数据还包括驾驶标识，所述驾驶标识用于表征所述目标车辆行驶数据包含的车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域与车辆图像区域之间的相对位置关系，所述驾驶标识包括主驾驶标识和副驾驶标识；
28.所述针对所述各个第二聚类结果，分别从第二聚类结果包含的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为相应第二聚类结果对应的质心车辆行驶数据，包括：
29.针对所述各个第二聚类结果，分别执行以下操作：
30.从第二聚类结果包含的各目标车辆行驶数据中，分别确定包含的驾驶标识为主驾驶标识的目标车辆行驶数据，以及包含的驾驶标识为副驾驶标识的目标车辆行驶数据；
31.从包含主驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为主质心车辆行驶数据；
32.从包含副驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为副质心车辆行驶数据；
33.基于获得的主质心车辆行驶数据和副质心车辆行驶数据，获得所述第二聚类结果对应的质心车辆行驶数据。
34.可选的，每个关联关系对应一个车牌数据，每个关联关系包括至少一个频繁项，每个频繁项包含至少一个目标车辆行驶数据或参考车辆行驶数据，所述频繁项具有频数，所述频数表征所述频繁项对应的数据产生地址，在相同车牌数据和数据产生时刻属于相同时间区间的目标车辆行驶数据和参考车辆行驶数据中的出现次数；
35.所述基于所述多个关联关系，确定每两个质心车辆行驶数据之间的目标相似度，包括：
36.针对每两个执行车辆行驶数据，执行以下操作：
37.基于两个质心车辆行驶数据各自包含的目标车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域之间的相似度，确定两个质心车辆行驶数据之间的初始相似度；
38.基于所述两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间，以及所述两个质心车辆行驶数据各自所在频繁项的频数，确定所述两个质心车辆行驶数据对应的拉伸系数；
39.基于所述拉伸系数，对所述初始相似度进行拉伸处理，获得所述两个质心车辆行驶数据之间的目标相似度。
40.可选的，所述频繁项包括频繁一项和频繁二项，所述频繁一项包含的目标车辆行驶数据和参考车辆行驶数据具有相同的数据产生地址，所述频繁二项包含的目标车辆行驶数据和参考车辆行驶数据统计有不同的两个数据产生地址；
41.所述基于所述两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间，以及所述两个质心车辆行驶数据各自所在频繁项的频数，确定所述两个质心车辆行驶数据对应的拉伸系数，包括：
42.若所述两个质心车辆行驶数据各自数据产生时刻属于相同的时间区间，且所述两个质心车辆行驶数据属于相同的频繁二项，则以所述两个质心车辆行驶数据同在的频繁二项的频数，与每个质心车辆行驶数据所在频繁二项的频数和之比，作为所述两个质心车辆行驶数据对应的拉伸系数；
43.若所述两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且所述两个质心车辆行驶数据属于相同的频繁一项，则以所述两个质心车辆行驶数据同在的频繁一项的频数，与每个质心车辆行驶数据所在频繁二项包含的目标车辆行驶数据和参考车辆行驶数据分别所在的频繁一项的频数和之间的比值，作为所述两个质心车辆行驶数据对应的拉伸系数；
44.若所述两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且所述两个
质心车辆行驶数据不属于相同的频繁一项或相同的频繁二项，则将预设的指定数值作为所述两个质心车辆行驶数据对应的拉伸系数。
45.第二方面，提供一种数据聚集的装置，包括：
46.获取模块：用于获取各个第一聚类结果，其中，所述各个第一聚类结果是基于在预设时间段内产生的各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域，对所述各个目标车辆行驶数据进行初始聚类处理获得的，每个第一聚类结果包含至少一个目标车辆行驶数据；
47.处理模块：用于基于预设的关联关系挖掘策略，对所述各个目标车辆行驶数据，以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，其中，所述各个参考车辆行驶数据各自包含的车牌数据，与所述各个目标车辆行驶数据各自包含的车牌数据匹配；
48.所述处理模块还用于：基于所述多个关联关系和所述各个第一聚类结果，对所述目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
49.可选的，所述处理模块还用于：
50.在基于预设的关联关系挖掘策略，对所述各个目标车辆行驶数据，以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系之前，获取所述各个目标车辆行驶数据各自包含的车辆行驶图像中，包含人脸的车辆图像区域对应的车牌数据；
51.针对所述各个目标车辆行驶数据各自包含的车牌数据，分别在所述预设时间段内产生的各个实时车辆行驶数据中，选取包含的车辆行驶图像中车辆图像区域对应的车牌数据，与相应目标车辆行驶数据包含的车牌数据相同的实时车辆行驶数据，作为参考车辆行驶数据。
52.可选的，所述目标车辆行驶数据和所述参考车辆行驶数据分别还包括数据产生时刻和数据产生地址；所述处理模块具体用于：
53.所述基于预设的关联关系挖掘策略，对所述各个目标车辆行驶数据，以及在所述预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，包括：
54.将所述各个目标车辆行驶数据和所述各个参考车辆行驶数据，分别作为综合车辆行驶数据，并基于包含的车牌数据和数据产生时刻所属时间区间，对各个综合车辆行驶数据进行分组处理，针对每个车牌数据，获得多个车辆行驶数据序列，其中，每个车辆行驶数据序列包含的各综合车辆行驶数据按照数据产生时刻排列；
55.针对每个车牌数据对应的多个车辆行驶数据序列，执行以下操作：
56.采用所述关联关系挖掘策略，基于每个车辆行驶数据序列包含的综合车辆行驶数据的数据产生地址，分别对相应的多个车辆行驶数据序列进行挖掘处理，确定至少一个频繁项，以及每个频繁项包含的综合车辆行驶数据的数据产生地址，在相应的多个车辆行驶数据组中出现的频数，其中，
57.所述频繁项包含至少一个综合车辆行驶数据；
58.将获得的至少一个频繁项和相应的频数，作为相应车牌数据对应的关联关系。
59.可选的，所述处理模块具体用于：
60.基于所述各个目标车辆行驶数据各自的车牌数据，对所述各个第一聚类结果进行重新整合处理，获得多个第二聚类结果，其中，每个第二聚类结果中的各目标车辆行驶数据的车牌数据相同，且车辆行驶图像中位于车辆内部的人脸匹配；
61.基于所述多个关联关系和所述各个第二聚类结果，对所述各个目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
62.可选的，所述处理模块具体用于：
63.针对所述各个第二聚类结果，分别从第二聚类结果包含的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为相应第二聚类结果对应的质心车辆行驶数据；
64.基于所述多个关联关系，确定每两个质心车辆行驶数据之间的目标相似度；
65.针对目标相似度大于预设相似度条件的每两个质心车辆行驶数据各自对应的第二聚类结果进行合并处理，获得至少一个目标聚类结果。
66.可选的，所述目标车辆行驶数据还包括驾驶标识，所述驾驶标识用于表征所述目标车辆行驶数据包含的车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域与车辆图像区域之间的相对位置关系，所述驾驶标识包括主驾驶标识和副驾驶标识；所述处理模块具体用于：
67.针对所述各个第二聚类结果，分别执行以下操作：
68.从第二聚类结果包含的各目标车辆行驶数据中，分别确定包含的驾驶标识为主驾驶标识的目标车辆行驶数据，以及包含的驾驶标识为副驾驶标识的目标车辆行驶数据；
69.从包含主驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为主质心车辆行驶数据；
70.从包含副驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为副质心车辆行驶数据；
71.基于获得的主质心车辆行驶数据和副质心车辆行驶数据，获得所述第二聚类结果对应的质心车辆行驶数据。
72.可选的，每个关联关系对应一个车牌数据，每个关联关系包括至少一个频繁项，每个频繁项包含至少一个目标车辆行驶数据或参考车辆行驶数据，所述频繁项具有频数，所述频数表征所述频繁项对应的数据产生地址，在相同车牌数据和数据产生时刻属于相同时间区间的目标车辆行驶数据和参考车辆行驶数据中的出现次数；所述处理模块具体用于：
73.针对每两个执行车辆行驶数据，执行以下操作：
74.基于两个质心车辆行驶数据各自包含的目标车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域之间的相似度，确定两个质心车辆行驶数据之间的初始相似度；
75.基于所述两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间，以及所述两个质心车辆行驶数据各自所在频繁项的频数，确定所述两个质心车辆行驶数据对应的拉伸系数；
76.基于所述拉伸系数，对所述初始相似度进行拉伸处理，获得所述两个质心车辆行驶数据之间的目标相似度。
77.可选的，所述频繁项包括频繁一项和频繁二项，所述频繁一项包含的目标车辆行驶数据和参考车辆行驶数据具有相同的数据产生地址，所述频繁二项包含的目标车辆行驶
数据和参考车辆行驶数据统计有不同的两个数据产生地址；所述处理模块具体用于：
78.若所述两个质心车辆行驶数据各自数据产生时刻属于相同的时间区间，且所述两个质心车辆行驶数据属于相同的频繁二项，则以所述两个质心车辆行驶数据同在的频繁二项的频数，与每个质心车辆行驶数据所在频繁二项的频数和之比，作为所述两个质心车辆行驶数据对应的拉伸系数；
79.若所述两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且所述两个质心车辆行驶数据属于相同的频繁一项，则以所述两个质心车辆行驶数据同在的频繁一项的频数，与每个质心车辆行驶数据所在频繁二项包含的目标车辆行驶数据和参考车辆行驶数据分别所在的频繁一项的频数和之间的比值，作为所述两个质心车辆行驶数据对应的拉伸系数；
80.若所述两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且所述两个质心车辆行驶数据不属于相同的频繁一项或相同的频繁二项，则将预设的指定数值作为所述两个质心车辆行驶数据对应的拉伸系数。
81.第三方面，提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如第一方面所述的方法。
82.第四方面，提供一种计算机设备，包括：
83.存储器，用于存储程序指令；
84.处理器，用于调用所述存储器中存储的程序指令，按照获得的程序指令执行如第一方面所述的方法。
85.第五方面，提供一种计算机可读存储介质，所述存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如第一方面所述的方法。
86.本技术实施例中，在针对各个目标车辆行驶数据，获得各个第一聚类结果之后，可以基于关联关系挖掘测试，对各个目标车辆行驶数据，以及与各个目标车辆行驶数据相关的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，从而，可以基于获得的多个关联关系和各个第一聚类结果，再次对目标车辆行驶数据进行聚类处理，获得至少一个目标聚类结果。通过与各个目标车辆行驶数据相关的参考车辆行驶数据一起作为对目标车辆行驶数据进行聚类处理的依据，避免仅依据各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域进行聚类处理时，人脸图像区域的清晰度较低造成的聚类结果错误的情况等，提高了数据聚类的准确性。
附图说明
87.图1为本技术实施例提供的数据聚类方法的一种应用场景；
88.图2为本技术实施例提供的数据聚类方法的一种流程示意图；
89.图3为本技术实施例提供的数据聚类方法的一种原理示意图一；
90.图4为本技术实施例提供的数据聚类方法的一种原理示意图二；
91.图5为本技术实施例提供的数据聚类装置的一种结构示意图一；
92.图6为本技术实施例提供的数据聚类装置的一种结构示意图二。
具体实施方式
93.为了使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述。
94.下面对本技术实施例中的部分用语进行解释说明，以便于本领域技术人员理解。
95.(1)关联关系挖掘策略：
96.关联关系挖掘策略主要用于发现大量数据中项集之间有趣的关联或者相互联系。关联关系挖掘策略的一个典型例子就是购物篮分析，该过程通过发现顾客放入其购物篮中不同商品之间的联系，分析出顾客的购买习惯，通过了解哪些商品频繁地被顾客同时买入，能够帮助零售商制定合理的营销策略。常用的方法主要包括：apriori与fp-growth算法，prefixspan算法等。常见的参数主要有：置信度、支持度、提升度等。
97.应当说明的是，本技术实施例中，涉及到的用户数据，当本技术以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
98.下面对本技术实施例提供的数据聚类方法的应用领域进行简单介绍。
99.随着科技的不断发展，越来越多的设备可以针对数据进行聚类处理。例如，针对人脸图像，将相同或相似的人脸图像汇聚为一类。
100.在车辆行驶监测场景下，可能由于车辆行驶速度、天气或车窗颜色等原因，造成获得的车辆行驶图像中不包含人脸所在图像区域，或人脸所在图像区域的清晰度较低等情况。因此，在针对车辆行驶图像中人脸所在图像区域，对车辆行驶图像进行数据聚类时，仅能够针对包含人脸所在图像区域的车辆行驶图像进行聚类处理，无法针对同一人脸获得完整的行车轨迹，造成车辆行驶监测困难度较高的问题，同时，对清晰度较低的车辆行驶图像进行数据聚类，还容易出现一个聚类结果中包含不同人脸对应的车辆行驶图像的情况。
101.可见，相关技术下，数据聚类的准确性较低。
102.为了解决数据聚类的准确性较低的问题，本技术提出一种数据聚类方法。该方法中，在获取各个第一聚类结果之后，可以基于预设的关联关系挖掘策略，对各个目标车辆行驶数据，以及在预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系。在获得多个关联关系之后，可以基于多个关联关系和各个第一聚类结果，对目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
103.其中，各个第一聚类结果是基于在预设时间段内产生的各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域，对各个目标车辆行驶数据进行初始聚类处理获得的，每个第一聚类结果包含至少一个目标车辆行驶数据，各个参考车辆行驶数据各自包含的车牌数据，与各个目标车辆行驶数据各自包含的车牌数据匹配。
104.本技术实施例中，在针对各个目标车辆行驶数据，获得各个第一聚类结果之后，可以基于关联关系挖掘测试，对各个目标车辆行驶数据，以及与各个目标车辆行驶数据相关的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，从而，可以基于获得的多个关联关系和各个第一聚类结果，再次对目标车辆行驶数据进行聚类处理，获得至少一个目标聚类结果。通过与各个目标车辆行驶数据相
关的参考车辆行驶数据一起作为对目标车辆行驶数据进行聚类处理的依据，避免仅依据各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域进行聚类处理时，人脸图像区域的清晰度较低造成的聚类结果错误的情况等，提高了数据聚类的准确性。
105.下面对本技术提供的数据聚类方法的应用场景进行说明。
106.请参考图1，为本技术提供的数据聚类方法的一种应用场景示意图。该应用场景中包括客户端101和服务端102。客户端101和服务端102之间可以通信。通信方式可以是采用有线通信技术进行通信，例如通过连接网线或串口线进行通信；也可以是采用无线通信技术进行通信，例如，通过蓝牙或无线保真(wireless fidelity，wifi)等技术进行通信，具体不做限制。
107.客户端101泛指可以提供各个目标车辆行驶数据和各个参考车辆行驶数据的设备，例如，终端设备、终端设备可以访问的第三方应用程序或终端设备可以访问的网页等。终端设备包括但不限于手机、电脑、智能交通设备、智能电器等。服务端102泛指可以对各个目标车辆行驶数据进行聚类处理的设备，例如，终端设备或服务器等。服务器包括但不限于云服务器、本地服务器或关联的第三方服务器等。客户端101和服务端102均可以采用云计算，以减少本地计算资源的占用；同样也可以采用云存储，以减少本地存储资源的占用。
108.作为一种实施例，客户端101和服务端102可以是同一个设备，具体不做限制。本技术实施例中，以客户端101和服务端102分别为不同的设备为例进行介绍。
109.下面基于图1，对本技术实施例提供的数据聚类方法进行具体介绍。请参考图2，为本技术实施例提供的数据聚类方法的一种流程示意图。
110.s201，获取各个第一聚类结果。
111.服务器可以分别基于各个客户端接收各个目标车辆行驶数据，例如，接收各个道路安装的监测设备发送的目标车辆行驶数据；服务器可以读取内存中存储的各个目标车辆行驶数据等，具体不做限制。
112.目标车辆行驶数据可以包括车辆在行驶过程中被拍摄的车辆行驶图像，车辆行驶图像中，包含车辆的区域为车辆图像区域，位于车辆内部的人脸所在的区域为人脸图像区域；目标车辆行驶数据还可以包括车辆被拍摄的时间，即车辆行驶图像的生成时间；目标车辆行驶数据还可以包括车辆被拍摄的地点，可以是物理地点，也可以是拍摄设备的网络地址等；目标车辆行驶数据还可以包括车辆的车牌数据，车牌数据可以包括车牌号码、车牌颜色等，也可以是这牌所在图像区域等；目标车辆行驶数据还可以包括车辆的类型、品牌、颜色等；目标车辆行驶数据还可以包括人脸属性数据，人脸属性数据主要包括但不限于，人脸图像区域的宽度和高度，以及人脸图像区域的清晰度等，可以用于过滤是否满足作为目标车辆行驶数据的依据等，目标车辆行驶数据包含的数据具体不做限制。
113.目标车辆行驶数据中的车辆行驶图像可以是剔除了行人图像区域后获得的图像，即剔除了不位于车辆内部的人脸所在的图像区域等，具体不做限制。
114.服务器可以针对每个预设时间段内获得的各个目标车辆行驶数据，基于各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域，对各个目标车辆行驶数据进行初始聚类处理，获得各个第一聚类结果，每个第一聚类结果包含至少一个目标车辆行驶数据。一个第一聚类结果中包含的至少一个目标车辆行驶数据
中，每两个目标车辆行驶数据各自包含的车辆行驶图像中的人脸图像区域之间的相似度满足人脸相似度条件。服务器还可以直接接收其他设备发送的各个第一聚类结果，由其他设备完成初始聚类处理等，具体不做限制。
115.由于车辆行驶图像为抓拍图像，图像的清晰度较低，并且由于各个拍摄设备的拍摄角度可能不同，因此，通过初试聚类处理获得的各个第一聚类结果中，可能会将包含同一个人脸的车辆行驶图像对应的目标车辆行驶数据，聚类到不同的第一聚类结果中，使得第一聚类结果的准确性较低。因此，服务器可以继续执行s202和s203，获得更加准确地目标聚类结果。
116.s202，基于预设的关联关系挖掘策略，对各个目标车辆行驶数据，以及在预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系。
117.在获得各个第一聚类结果之后，服务器可以获取在预设时间段内产生的各个参考车辆行驶数据，预设时间段与产生各个目标车辆行驶数据的预设时间段为相同的时间段。服务器可以将各个目标车辆行驶数据以外的各个参考车辆行驶数据，作为对各个目标车辆行驶数据进行聚类处理的参考依据，从多个角度考虑，对各个目标车辆行驶数据进行聚类处理，来提高数据聚类的准确性。参考车辆行驶数据可以包括车辆行驶图像的被拍摄时间，被拍摄地点，车牌数据，车辆颜色，车辆类型等，参考车辆行驶数据包含的内容可以与目标车辆行驶数据包含的内容除了人脸图像区域以外相同，参考车辆行驶数据可以不包含人脸图像区域，也可以包含清晰度非常低的人脸图像区域，使得参考车辆行驶数据无法作为目标车辆行驶数据进行聚类处理。
118.作为一种实施例，服务器获得的各个参考车辆行驶数据各自包含的车牌数据，可以是与各个目标车辆行驶数据各自包含的车牌数据匹配的数据。匹配可以是车牌数据对应相同，也可以是车牌数据之间的相似度大于车牌相似度阈值等，具体不做限制。通过获取包含的车牌数据匹配的各个参考车辆行驶数据，保证各个参考车辆行驶数据与各个目标车辆行驶数据相关，从而可以基于各个参考车辆行驶数据，提高目标车辆行驶数据聚类的准确性。
119.服务器可以获取各个目标车辆行驶数据各自包含的车辆行驶图像中，包含人脸的车辆图像区域对应的车牌数据。针对各个目标车辆行驶数据各自包含的车牌数据，分别在预设时间段内产生的各个实时车辆行驶数据中，选取包含的车辆行驶图像中车辆图像区域对应的车牌数据，与相应目标车辆行驶数据包含的车牌数据相同的实时车辆行驶数据，作为参考车辆行驶数据。实时车辆行驶数据可以是服务器可以获取到的所有车辆行驶数据，从中选取车牌数据符合要求的，作为参考车辆行驶数据。
120.例如，服务器获取了最近30天内的各个目标车辆行驶数据进行了初始聚类之后，可以基于各个目标车辆行驶数据包含的车牌数据，服务器可以获取到的所有车辆行驶数据，即各个实时车辆行驶数据中，选取最近30天内产生的，且包含相同车牌数据的参考车辆行驶数据。
121.作为一种实施例，为例避免重复选取相同的参考车辆行驶数据，可以在获得各个目标车辆行驶数据包含的车牌数据之后，对车牌数据进行去重处理，去掉重复的车牌数据，避免重复遍历过程。
122.在获得各个参考车辆行驶数据之后，服务器可以基于预设的关联关系挖掘策略，对各个目标车辆行驶数据和各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系。关联关系例如可以表征同一行车轨迹的关系，还可以表征同一起始地和同一目的地的关系等，具体不做限制。
123.作为一种实施例，目标车辆行驶数据和参考车辆行驶数据分别还包括数据产生时刻和数据产生地址，数据产生时刻可以是生成目标车辆行驶数据或参考车辆行驶数据的时间，可以将拍摄车辆行驶图像的时间，作为目标车辆行驶数据或参考车辆行驶数据的数据产生时刻等；数据产生地址可以是生成目标车辆行驶数据或参考车辆行驶数据的物理地址，如街道、路口等，也可以是拍摄车辆行驶图像的拍摄设备的mac地址或ip地址等，具体不做限制。
124.服务器可以将各个目标车辆行驶数据和各个参考车辆行驶数据，分别作为综合车辆行驶数据，并基于包含的车牌数据和数据产生时刻所属时间区间，对各个综合车辆行驶数据进行分组处理，针对每个车牌数据，获得多个车辆行驶数据序列，每个车辆行驶数据序列包含的各综合车辆行驶数据按照数据产生时刻排列。
125.例如，各个目标车辆行驶数据和各个参考车辆行驶数据是服务器获得的最近30天内的数据，那么数据产生时刻所属时间区间可以是以天为单位的区间，如，最近30天为10月1日至10月30日，数据产生时刻为10月1日，那么数据产生时刻所属时间区间可以记为第一天等。
126.车牌数据可以是在获得车辆行驶图像时，针对包含人脸的车辆图像区域进行目标识别获得的，也可以是在获得车辆行驶图像时，针对包含人脸的车辆图像区域中的车牌所在区域进行图像分割获得的等，具体不做限制。
127.服务器可以将包含的车牌数据相同，数据产生时刻属于相同时间区间的综合车辆行驶数据划分为一组，在一组综合车辆行驶数据中，按照数据产生时刻从过去到现在的顺序进行排列，获得一个车辆行驶数据序列。从而，每个车牌数据可以对应多个车辆行驶数据序列，下面以一个车牌数据对应的多个车辆行驶数据序列为例进行介绍，其他车牌数据对应的多个车辆行驶数据序列在此不再赘述。
128.采用关联关系挖掘策略，基于每个车辆行驶数据序列包含的综合车辆行驶数据的数据产生地址，分别对相应的多个车辆行驶数据序列进行挖掘处理，确定至少一个频繁项，以及每个频繁项包含的综合车辆行驶数据的数据产生地址，在相应的多个车辆行驶数据组中出现的频数，其中，频繁项包含至少一个综合车辆行驶数据。服务器可以将获得的至少一个频繁项和相应的频数，作为相应车牌数据对应的关联关系。
129.例如，请参考图3，针对同一个车牌数据对应的多个车辆行驶数据序列包括第一车辆行驶数据序列包括车辆行驶数据a组、车辆行驶数据b组和车辆行驶数据c组，其中，车辆行驶数据a组中包含的各车辆行驶数据至少具有相同的车牌数据，相同的数据产生地址和属于相同的时间区间，车辆行驶数据a组表示其包含的各个车辆行驶数据的数据产生地址为a，同理车辆行驶数据b组、车辆行驶数据c组、车辆行驶数据d组、车辆行驶数据e组和车辆行驶数据f组中，分别各自包含的各车辆行驶数据至少具有相同的车牌数据，相同的数据产生地址和属于相同的时间区间，其各自包含的各个车辆行驶数据的数据产生地址，分别为b、c、d、e和f。
130.第二车辆行驶数据序列包括车辆行驶数据a组、车辆行驶数据c组、车辆行驶数据b组、车辆行驶数据a组和车辆行驶数据b组；第三车辆行驶数据序列包括车辆行驶数据a组、车辆行驶数据b组和车辆行驶数据e组；第四车辆行驶数据序列包括车辆行驶数据f组。
131.那么，请参考图4，可以获得多个频繁项，包括一个频繁一项为车辆行驶数据a组，一个频繁二项为车辆行驶数据a组和车辆行驶数据c组，一个频繁二项为车辆行驶数据a组和车辆行驶数据b组，一个频繁一项车辆行驶数据b组，一个频繁一项车辆行驶数据c组。频繁一项为车辆行驶数据a组的频数为3，频繁二项为车辆行驶数据a组和车辆行驶数据c组的频数为2，频繁二项为车辆行驶数据a组和车辆行驶数据b组的频数为3，频繁一项车辆行驶数据b组的频数为3，频繁一项车辆行驶数据c组的频数为2。
132.作为一种实施例，车辆行驶数据a组、车辆行驶数据b组、车辆行驶数据c组、车辆行驶数据d组、车辆行驶数据e组和车辆行驶数据f组中，如果存在目标车辆行驶数据，那么可以通过人脸标识进行表示。
133.作为一种实施例，服务器可以通过设置最小支持度，针对每条行车轨迹获得相应的频繁项，例如设置最小支持度大于等于2等。
134.作为一种实施例，服务器还可以基于包含的车牌数据、数据产生时刻所属时间区间和驾驶标识，对各个综合车辆行驶数据进行分组处理。驾驶标识用于表征目标车辆行驶数据包含的车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域与车辆图像区域之间的相对位置关系，驾驶标识包括主驾驶标识和副驾驶标识。对于不包含人脸的参考车辆行驶数据，可以添加为主驾驶标识，也可以基于同一车牌数据对应的相邻数据生成时间的目标车辆行驶数据包含的驾驶标识确定等，具体不做限制。服务器再针对每个车牌数据，获得多个车辆行驶数据序列，每个车辆行驶数据序列包含的各综合车辆行驶数据按照数据产生时刻排列。
135.例如，综合车辆行驶数据a为，车牌数据a，主驾驶标识，10月1日，数据产生地址1；综合车辆行驶数据b为，车牌数据a，主驾驶标识，10月1日，数据产生地址2；综合车辆行驶数据c为，车牌数据a，主驾驶标识，10月2日，数据产生地址1；综合车辆行驶数据d为，车牌数据a，副驾驶标识，10月1日，数据产生地址1。
136.服务器将车牌数据相同，数据产生时间属于同一天，驾驶标识相同的综合车辆行驶数据划分为一组，那么得到综合车辆行驶数据a和综合车辆行驶数据b为一组，综合车辆行驶数据c为一组，综合车辆行驶数据d为一组。每组中的综合车辆行驶数据按照数据产生时间排序，可以针对车牌数据a，得到一个车辆行驶数据序列，依次包括综合车辆行驶数据a和综合车辆行驶数据b，一个车辆行驶数据序列，包括综合车辆行驶数据c，一个车辆行驶数据序列，包括综合车辆行驶数据d。
137.s203，基于多个关联关系和各个第一聚类结果，对目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
138.在获得多个关联关系和各个第一聚类结果之后，服务器可以基于多个关联关系和各个第一聚类结果，对目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
139.作为一种实施例，由于车辆行驶图像中包含的人脸图像区域的清晰度通常较低，在初始聚类处理时，仅能够将非常相似的人脸图像区域对应的目标车辆行驶数据聚为一类，然而，在一些情况下，例如正脸和侧脸之间的并不是非常相似的，但确实是属于同一人，
如果将正脸和侧脸分别对应的目标车辆行驶数据聚为两个不同的类，会造成聚类结果不准确的问题。同时，对于同一人脸来说，可能出现在不同的车辆中，因此，基于人脸进行聚类的聚类结果，可能包含多个车辆数据各自对应的目标车辆行驶数据，聚类结果准确性低，不利于后续行车轨迹的分析等任务。
140.因此，在获得各个第一聚类结果之后，服务器可以基于各个目标车辆行驶数据各自的车牌数据，对各个第一聚类结果进行重新整合处理，获得多个第二聚类结果，那么每个第二聚类结果中的各目标车辆行驶数据的车牌数据相同，且车辆行驶图像中位于车辆内部的人脸匹配。服务器再基于多个关联关系和各个第二聚类结果，对各个目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
141.对各个第一聚类结果进行重新整合处理，可以是将多个第一聚类结果合并为一个第二聚类结果；也可以是将多个第一聚类结果中的部分目标车辆行驶数据合并；也可以是将一个第一聚类结果拆分为两个第二聚类结果等，具体不做限制。
142.车辆行驶图像中位于车辆内部的人脸匹配，可以是人脸图像区域之间的相似度大于一预设阈值则为匹配，也可以是人脸图像区域之间的相似度按照从大到小排序，其中排在指定序号之前的则为匹配等，具体不做限制。
143.作为一种实施例，在获得各个第二聚类结果之后，可以获得每个第二聚类结果的聚类中心，由于聚类中心是与相应第二聚类结果包含的各目标车辆行驶数据之间的相似度满足一预设相似度条件的数据，聚类中心可能是其中的一个目标车辆行驶数据，也可能不是目标车辆行驶数据。服务器可以针对各个第二聚类结果，服务器可以分别从第二聚类结果包含的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为相应第二聚类结果对应的质心车辆行驶数据。从而将每个第二聚类结果的聚类中心调整为一个目标车辆行驶数据。服务器可以再基于多个关联关系，确定每两个质心车辆行驶数据之间的目标相似度。针对目标相似度大于预设相似度条件的每两个质心车辆行驶数据各自对应的第二聚类结果进行合并处理，获得至少一个目标聚类结果。
144.作为一种实施例，目标车辆行驶数据如果包括驾驶标识，那么可以针对各个第二聚类结果，分别确定一个主驾驶标识对应的主质心车辆行驶数据，一个副驾驶标识对应的副执行车辆行驶数据。以一个第二聚类结果为例进行介绍，其他第二聚类结果类似，在此不再赘述。
145.服务器可以从第二聚类结果包含的各目标车辆行驶数据中，分别确定包含的驾驶标识为主驾驶标识的目标车辆行驶数据，以及包含的驾驶标识为副驾驶标识的目标车辆行驶数据。从包含主驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为主质心车辆行驶数据。从包含副驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为副质心车辆行驶数据。最后，服务器可以基于获得的主质心车辆行驶数据和副质心车辆行驶数据，获得第二聚类结果对应的质心车辆行驶数据。服务器在针对质心车辆行驶数据进行计算时，可以分别基于其包含的主质心车辆行驶数据和副质心车辆行驶数据进行计算，也可以仅基于其包含的主质心车辆行驶数据进行计算等，具体不做限制。
146.作为一种实施例，每个关联关系对应一个车牌数据，每个关联关系包括至少一个
频繁项，每个频繁项包含至少一个目标车辆行驶数据或参考车辆行驶数据，频繁项具有频数，频数表征频繁项对应的数据产生地址，在相同车牌数据和数据产生时刻属于相同时间区间的目标车辆行驶数据和参考车辆行驶数据中的出现次数，那么服务器在基于多个关联关系，确定每两个质心车辆行驶数据之间的目标相似度时，可以基于频繁项和相应的频数进行计算，下面以其中两个质心车辆行驶数据为例进行介绍，其他质心车辆行驶数据的计算过程类似，在此不再赘述。
147.服务器可以基于两个质心车辆行驶数据各自包含的目标车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域之间的相似度，确定两个质心车辆行驶数据之间的初始相似度。基于两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间，以及两个质心车辆行驶数据各自所在频繁项的频数，确定两个质心车辆行驶数据对应的拉伸系数。基于拉伸系数，对初始相似度进行拉伸处理，获得两个质心车辆行驶数据之间的目标相似度。
148.作为一种实施例，频繁项可以包括频繁一项和频繁二项，频繁一项包含的目标车辆行驶数据和参考车辆行驶数据具有相同的数据产生地址，频繁二项包含的目标车辆行驶数据和参考车辆行驶数据统计有不同的两个数据产生地址，那么服务器在确定两个质心车辆行驶数据各自数据产生时刻属于相同的时间区间，且两个质心车辆行驶数据属于相同的频繁二项时，可以以两个质心车辆行驶数据同在的频繁二项的频数，与每个质心车辆行驶数据所在频繁二项的频数和之比，作为两个质心车辆行驶数据对应的拉伸系数。
149.服务器在确定两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且两个质心车辆行驶数据属于相同的频繁一项时，可以以两个质心车辆行驶数据同在的频繁一项的频数，与每个质心车辆行驶数据所在频繁二项包含的目标车辆行驶数据和参考车辆行驶数据分别所在的频繁一项的频数和之间的比值，作为两个质心车辆行驶数据对应的拉伸系数。
150.服务器在确定两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且两个质心车辆行驶数据不属于相同的频繁一项或相同的频繁二项时，可以将预设的指定数值作为两个质心车辆行驶数据对应的拉伸系数。
151.例如，两个质心车辆行驶数据之间的初始相似度为s
original
，预先设定一个拉伸幅度s
bias
，通过拉伸系数c
adj
，可以动态调整拉伸幅度s
bias
，从而服务器可以基于拉伸系数c
adj
与拉伸幅度s
bias
的乘积，与初始相似度为s
original
之和，确定两个质心车辆行驶数据之间的目标相似度s
adj
，请参考公式(1)。
152.s
adj
＝s
original
+c
adj
×sbias
ꢀꢀꢀꢀꢀꢀꢀ
(1)
153.例如，请继续参考图3和图4，以频繁二项为车辆行驶数据a组和车辆行驶数据c组为例，车辆行驶数据a组和车辆行驶数据c组各自的数据产生时间属于同一天，且处于同一个频繁二项中，那么可以确定包含车辆行驶数据a组的频繁二项对应的频数，以及包含车辆行驶数据c组的频繁二项对应的频数，将各频数之和记为n
a|c
，并确定同时包含车辆行驶数据a组和车辆行驶数据c组的频繁二项的频数记为n
a&c
，那么服务器可以将作为两个质心车辆行驶数据对应的拉伸系数。
154.以两个车辆行驶数据序列中的车辆行驶数据a组为例，两个车辆行驶数据序列中
的车辆行驶数据a组各自的数据产生时间属于不同的时间区间，两个车辆行驶数据序列中的车辆行驶数据a组分别属于频繁一项，那么可以确定包含车辆行驶数据a组的频繁二项，分别为车辆行驶数据a组和车辆行驶数据c组，以及车辆行驶数据a组和车辆行驶数据b组。两个频繁二项对应三个频繁一项分别包含车辆行驶数据a组、车辆行驶数据b组和车辆行驶数据c组。服务器可以确定频繁一项为车辆行驶数据a组的频数，频繁一项为车辆行驶数据b组的频数和频繁一项为车辆行驶数据c组的频数之和，记为其中ni中i取值不同，ni表征不同的频繁一项的频数，i的取值为[1,m]，在对应三个频繁一项时，i的取值为[1,3]。服务器将频繁一项为车辆行驶数据a组的频数记为n
one
，基于确定两个质心车辆行驶数据对应的拉伸系数。
[0155]
对于除了上述两个情况以外的情况，服务器可以将预设的指定数值0，作为所述两个质心车辆行驶数据对应的拉伸系数。
[0156]
作为一种实施例，在区分主驾驶标识和副驾驶标识时，针对副驾驶标识对应的拉伸系数，可以设置为小于针对主驾驶标识对应的拉伸系数，也可以针对副驾驶标识对应的拉伸幅度，可以设置为小于针对主驾驶标识对应的拉伸幅度，例如针对副驾驶标识对应的拉伸幅度为0.1～0.15，针对主驾驶标识对应的拉伸幅度为0.5～0.1等。
[0157]
基于同一发明构思，本技术实施例提供一种数据聚类装置，能够实现前述的数据聚类方法对应的功能。请参考图5，该装置包括获取模块501和处理模块502，其中：
[0158]
获取模块501：用于获取各个第一聚类结果，其中，各个第一聚类结果是基于在预设时间段内产生的各个目标车辆行驶数据各自包含的车辆行驶图像中，位于车辆内部的人脸所在的人脸图像区域，对各个目标车辆行驶数据进行初始聚类处理获得的，每个第一聚类结果包含至少一个目标车辆行驶数据；
[0159]
处理模块502：用于基于预设的关联关系挖掘策略，对各个目标车辆行驶数据，以及在预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，其中，各个参考车辆行驶数据各自包含的车牌数据，与各个目标车辆行驶数据各自包含的车牌数据匹配；
[0160]
处理模块502还用于：基于多个关联关系和各个第一聚类结果，对目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
[0161]
在一种可能的实施例中，处理模块502还用于：
[0162]
在基于预设的关联关系挖掘策略，对各个目标车辆行驶数据，以及在预设时间段内产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系之前，获取各个目标车辆行驶数据各自包含的车辆行驶图像中，包含人脸的车辆图像区域对应的车牌数据；
[0163]
针对各个目标车辆行驶数据各自包含的车牌数据，分别在预设时间段内产生的各个实时车辆行驶数据中，选取包含的车辆行驶图像中车辆图像区域对应的车牌数据，与相应目标车辆行驶数据包含的车牌数据相同的实时车辆行驶数据，作为参考车辆行驶数据。
[0164]
在一种可能的实施例中，目标车辆行驶数据和参考车辆行驶数据分别还包括数据产生时刻和数据产生地址；处理模块502具体用于：
[0165]
基于预设的关联关系挖掘策略，对各个目标车辆行驶数据，以及在预设时间段内
产生的各个参考车辆行驶数据进行挖掘处理，获得目标车辆行驶数据与参考车辆行驶数据之间的多个关联关系，包括：
[0166]
将各个目标车辆行驶数据和各个参考车辆行驶数据，分别作为综合车辆行驶数据，并基于包含的车牌数据和数据产生时刻所属时间区间，对各个综合车辆行驶数据进行分组处理，针对每个车牌数据，获得多个车辆行驶数据序列，其中，每个车辆行驶数据序列包含的各综合车辆行驶数据按照数据产生时刻排列；
[0167]
针对每个车牌数据对应的多个车辆行驶数据序列，执行以下操作：
[0168]
采用关联关系挖掘策略，基于每个车辆行驶数据序列包含的综合车辆行驶数据的数据产生地址，分别对相应的多个车辆行驶数据序列进行挖掘处理，确定至少一个频繁项，以及每个频繁项包含的综合车辆行驶数据的数据产生地址，在相应的多个车辆行驶数据组中出现的频数，其中，频繁项包含至少一个综合车辆行驶数据；
[0169]
将获得的至少一个频繁项和相应的频数，作为相应车牌数据对应的关联关系。
[0170]
在一种可能的实施例中，处理模块502具体用于：
[0171]
基于各个目标车辆行驶数据各自的车牌数据，对各个第一聚类结果进行重新整合处理，获得多个第二聚类结果，其中，每个第二聚类结果中的各目标车辆行驶数据的车牌数据相同，且车辆行驶图像中位于车辆内部的人脸匹配；
[0172]
基于多个关联关系和各个第二聚类结果，对各个目标车辆行驶数据进行目标聚类处理，获得至少一个目标聚类结果。
[0173]
在一种可能的实施例中，处理模块502具体用于：
[0174]
针对各个第二聚类结果，分别从第二聚类结果包含的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为相应第二聚类结果对应的质心车辆行驶数据；
[0175]
基于多个关联关系，确定每两个质心车辆行驶数据之间的目标相似度；
[0176]
针对目标相似度大于预设相似度条件的每两个质心车辆行驶数据各自对应的第二聚类结果进行合并处理，获得至少一个目标聚类结果。
[0177]
在一种可能的实施例中，目标车辆行驶数据还包括驾驶标识，驾驶标识用于表征目标车辆行驶数据包含的车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域与车辆图像区域之间的相对位置关系，驾驶标识包括主驾驶标识和副驾驶标识；处理模块502具体用于：
[0178]
针对各个第二聚类结果，分别执行以下操作：
[0179]
从第二聚类结果包含的各目标车辆行驶数据中，分别确定包含的驾驶标识为主驾驶标识的目标车辆行驶数据，以及包含的驾驶标识为副驾驶标识的目标车辆行驶数据；
[0180]
从包含主驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为主质心车辆行驶数据；
[0181]
从包含副驾驶标识的目标车辆行驶数据中，选取与相应第二聚类结果的聚类质心之间的相似度最大的目标车辆行驶数据，作为副质心车辆行驶数据；
[0182]
基于获得的主质心车辆行驶数据和副质心车辆行驶数据，获得第二聚类结果对应的质心车辆行驶数据。
[0183]
在一种可能的实施例中，每个关联关系对应一个车牌数据，每个关联关系包括至
少一个频繁项，每个频繁项包含至少一个目标车辆行驶数据或参考车辆行驶数据，频繁项具有频数，频数表征频繁项对应的数据产生地址，在相同车牌数据和数据产生时刻属于相同时间区间的目标车辆行驶数据和参考车辆行驶数据中的出现次数；处理模块502具体用于：
[0184]
针对每两个执行车辆行驶数据，执行以下操作：
[0185]
基于两个质心车辆行驶数据各自包含的目标车辆行驶图像中，包含位于车辆内部的人脸的人脸图像区域之间的相似度，确定两个质心车辆行驶数据之间的初始相似度；
[0186]
基于两个质心车辆行驶数据各自包含的数据生成时刻是否属于相同的时间区间，以及两个质心车辆行驶数据各自所在频繁项的频数，确定两个质心车辆行驶数据对应的拉伸系数；
[0187]
基于拉伸系数，对初始相似度进行拉伸处理，获得两个质心车辆行驶数据之间的目标相似度。
[0188]
在一种可能的实施例中，频繁项包括频繁一项和频繁二项，频繁一项包含的目标车辆行驶数据和参考车辆行驶数据具有相同的数据产生地址，频繁二项包含的目标车辆行驶数据和参考车辆行驶数据统计有不同的两个数据产生地址；处理模块502具体用于：
[0189]
若两个质心车辆行驶数据各自数据产生时刻属于相同的时间区间，且两个质心车辆行驶数据属于相同的频繁二项，则以两个质心车辆行驶数据同在的频繁二项的频数，与每个质心车辆行驶数据所在频繁二项的频数和之比，作为两个质心车辆行驶数据对应的拉伸系数；
[0190]
若两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且两个质心车辆行驶数据属于相同的频繁一项，则以两个质心车辆行驶数据同在的频繁一项的频数，与每个质心车辆行驶数据所在频繁二项包含的目标车辆行驶数据和参考车辆行驶数据分别所在的频繁一项的频数和之间的比值，作为两个质心车辆行驶数据对应的拉伸系数；
[0191]
若两个质心车辆行驶数据各自生成时间不属于相同的时间区间，且两个质心车辆行驶数据不属于相同的频繁一项或相同的频繁二项，则将预设的指定数值作为两个质心车辆行驶数据对应的拉伸系数。
[0192]
请参照图6，上述数据聚类装置可以运行在计算机设备600上，数据存储程序的当前版本和历史版本以及数据存储程序对应的应用软件可以安装在计算机设备600上，该计算机设备600包括处理器680以及存储器620。在一些实施例中，该计算机设备600可以包括显示单元640，显示单元640包括显示面板641，用于显示由用户交互操作界面等。
[0193]
在一种可能的实施例中，可以采用液晶显示器(liquid crystal display，lcd)或有机发光二极管oled(organic light-emitting diode)等形式来配置显示面板641。
[0194]
处理器680用于读取计算机程序，然后执行计算机程序定义的方法，例如处理器680读取数据存储程序或文件等，从而在该计算机设备600上运行数据存储程序，在显示单元640上显示对应的界面。处理器680可以包括一个或多个通用处理器，还可包括一个或多个dsp(digital signal processor，数字信号处理器)，用于执行相关操作，以实现本技术实施例所提供的技术方案。
[0195]
存储器620一般包括内存和外存，内存可以为随机存储器(ram)，只读存储器(rom)，以及高速缓存(cache)等。外存可以为硬盘、光盘、usb盘、软盘或磁带机等。存储器
620用于存储计算机程序和其他数据，该计算机程序包括各客户端对应的应用程序等，其他数据可包括操作系统或应用程序被运行后产生的数据，该数据包括系统数据(例如操作系统的配置参数)和用户数据。本技术实施例中程序指令存储在存储器620中，处理器680执行存储器620中的程序指令，实现前文图论述的任意的一种方法。
[0196]
上述显示单元640用于接收输入的数字信息、字符信息或接触式触摸操作/非接触式手势，以及产生与计算机设备600的用户设置以及功能控制有关的信号输入等。具体地，本技术实施例中，该显示单元640可以包括显示面板641。显示面板641例如触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在显示面板641上或在显示面板641的操作)，并根据预先设定的程式驱动相应的连接装置。
[0197]
在一种可能的实施例中，显示面板641可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测玩家的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器680，并能接收处理器680发来的命令并加以执行。
[0198]
其中，显示面板641可以采用电阻式、电容式、红外线以及表面声波等多种类型实现。除了显示单元640，在一些实施例中，计算机设备600还可以包括输入单元630，输入单元630可以包括图像输入设备631和其他输入设备632，其中其他输入设备可以但不限于包括物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0199]
除以上之外，计算机设备600还可以包括用于给其他模块供电的电源690、音频电路660、近场通信模块670和rf电路610。计算机设备600还可以包括一个或多个传感器650，例如加速度传感器、光传感器、压力传感器等。音频电路660具体包括扬声器661和麦克风662等，例如计算机设备600可以通过麦克风662采集用户的声音，进行相应的操作等。
[0200]
作为一种实施例，处理器680的数量可以是一个或多个，处理器680和存储器620可以是耦合设置，也可以是相对独立设置。
[0201]
作为一种实施例，图6中的处理器680可以用于实现如图5中的获取模块501和处理模块502的功能。
[0202]
作为一种实施例，图6中的处理器680可以用于实现前文论述的服务器或终端设备对应的功能。
[0203]
本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0204]
或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，例如，通过计算机程序产品体现，该计算机程序产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0205]
显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：江中毅刘备张宏陈立力周明伟
技术所有人：浙江大华技术股份有限公司
我是此专利的发明人

上一篇：一种水泥窑协同处置有机废弃物的系统及处理方法与流程
上一篇：安全帽存放柜的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。