本公开涉及计算机,尤其涉及人工智能、大数据、数据检索等。
背景技术:
1、随着cnn(convolutional neural network,卷积神经网络))的广泛应用,使得应用在cnn特征上的基础检索技术ann(approximate nearest neighbor,近似最近邻检索)也得到了较快发展。针对大规模数据集,可以利用hnsw(hierarchical navigable smallworld)。但是hn sw算法的计算量较大。
技术实现思路
1、本公开提供了一种数据存储方法、数据检索方法和识别相似视频的方法、装置、设备、存储介质以及程序产品。
2、根据本公开的一方面,提供了一种数据存储方法,包括:对多个数据进行聚类,得到至少一个第一聚类中心;根据所述至少一个第一聚类中心,对所述多个数据进行聚类,得到至少一个第二聚类中心;根据所述至少一个第一聚类中心和所述至少一个第二聚类中心,将所述多个数据划分为至少一个数据组;根据所述至少一个数据组,生成图结构;以及将所述图结构存储至数据库。
3、根据本公开的另一方面,提供了一种数据检索方法,包括:确定至少一个第一聚类中心与待检索数据匹配的目标第一聚类中心;确定至少一个第二聚类中心与所述待检索数据匹配的目标第二聚类中心;根据所述目标第一聚类中心和所述目标第二聚类中心,确定多个数据组中的目标数据组;以及在数据库的图结构中,以与所述目标数据组对应的节点作为起点,检索与所述待检索数据匹配的数据,得到检索结果,其中,所述图结构包括多个节点,所述多个节点与多个原始数据一一对应,所述多个原始数据是根据本公开实施例所述的方法存储至所述数据库的。
4、根据本公开的另一方面,提供了一种识别相似视频的方法,包括:确定至少一个第一聚类中心与待识别视频信息匹配的目标第一聚类中心;确定至少一个第二聚类中心与所述待识别视频信息匹配的目标第二聚类中心;根据所述目标第一聚类中心和所述目标第二聚类中心,确定多个数据组中的目标数据组;以及在数据库的图结构中,以与所述目标数据组对应的节点作为起点,检索与所述待识别视频信息匹配的视频信息,得到识别结果,其中,所述图结构包括多个节点,所述多个节点与多个原始视频信息一一对应,所述多个原始视频信息是根据本公开实施例所述的方法存储至所述数据库的。
5、根据本公开的另一方面,提供了一种数据存储装置,包括:第二聚类模块,用于根据所述至少一个第一聚类中心,对所述多个数据进行聚类,得到至少一个第二聚类中心;划分模块,用于根据所述至少一个第一聚类中心和所述至少一个第二聚类中心,将所述多个数据划分为至少一个数据组;图生成模块,用于根据所述至少一个数据组,生成图结构;以及存储模块,用于将所述图结构存储至数据库存储模块。
6、根据本公开的另一方面,提供了一种数据检索装置,包括:第一聚类中心确定模块,用于确定至少一个第一聚类中心与待检索数据匹配的目标第一聚类中心;第二聚类中心确定模块,用于确定至少一个第二聚类中心与所述待检索数据匹配的目标第二聚类中心;第一目标数据组确定模块,用于根据所述目标第一聚类中心和所述目标第二聚类中心,确定多个数据组中的目标数据组;以及第一检索模块,用于在数据库的图结构中,以与所述目标数据组对应的节点作为起点,检索与所述待检索数据匹配的数据,得到检索结果,其中,所述图结构包括多个节点,所述多个节点与多个原始数据一一对应,所述多个原始数据是根据本公开实施例所述的方法存储至所述数据库的。
7、本公开的另一个方面提供了一种识别相似视频的装置,包括:第三聚类中心确定模块,用于确定至少一个第一聚类中心与待识别视频信息匹配的目标第一聚类中心;第四聚类中心确定模块,用于确定至少一个第二聚类中心与所述待识别视频信息匹配的目标第二聚类中心;第二目标数据组确定模块,用于根据所述目标第一聚类中心和所述目标第二聚类中心,确定多个数据组中的目标数据组;以及第二检索模块,用于在数据库的图结构中,以与所述目标数据组对应的节点作为起点,检索与所述待识别视频信息匹配的视频信息,得到识别结果,其中,所述图结构包括多个节点,所述多个节点与多个原始视频信息一一对应,所述多个原始视频信息是根据本公开实施例所述的方法存储至所述数据库的。
8、本公开的另一个方面提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所示的方法。
9、根据本公开实施例的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例所示的方法。
10、根据本公开实施例的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现本公开实施例所示方法的步骤。
11、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种数据存储方法,包括:
2.根据权利要求1所述的方法,其中,所述根据所述至少一个第一聚类中心,对所述多个数据进行聚类,得到至少一个第二聚类中心,包括:
3.根据权利要求1所述的方法,其中,所述根据所述至少一个数据组,生成图结构,包括:
4.根据权利要求3所述的方法,其中,所述边包括邻接边和相邻边;所述根据所述节点与数据组的对应关系,生成所述节点之间的边,包括:
5.根据权利要求1所述的方法,其中,所述对多个数据进行聚类,得到至少一个第一聚类中心,包括:
6.根据权利要求1所述的方法,其中,所述根据所述至少一个第一聚类中心和所述至少一个第二聚类中心,将所述多个数据划分为至少一个数据组,包括:
7.根据权利要求1所述的方法,还包括:
8.一种数据检索方法,包括:
9.根据权利要求8所述的方法,其中,所述确定至少一个第一聚类中心与待检索数据匹配的目标第一聚类中心,包括:
10.根据权利要求9所述的方法,其中,所述确定至少一个第二聚类中心与所述待检索数据匹配的目标第二聚类中心,包括:
11.根据权利要求8所述的方法,其中,所述在数据库的图结构中,以与所述目标数据组对应的节点作为起点,检索与所述待检索数据匹配的数据,得到检索结果,包括:
12.根据权利要求11所述的方法,其中,所述确定所述邻居节点中是否存在与所述待检索数据匹配的目标节点,包括:
13.一种识别相似视频的方法,包括:
14.根据权利要求13所述的方法,其中,所述确定至少一个第一聚类中心与待识别视频信息匹配的目标第一聚类中心,包括:
15.根据权利要求14所述的方法,其中,所述确定至少一个第二聚类中心与所述待识别视频信息匹配的目标第二聚类中心,包括:
16.根据权利要求13所述的方法,其中,所述在数据库的图结构中,以与所述目标数据组对应的节点作为起点,检索与所述待识别视频信息匹配的目标视频信息,得到识别结果,包括:
17.根据权利要求16所述的方法,其中,所述确定所述邻居节点中是否存在与所述待识别视频信息匹配的目标节点,包括:
18.一种数据存储装置,包括:
19.根据权利要求18所述的装置,其中,所述第二聚类模块包括:
20.根据权利要求18所述的装置,其中,所述图生成模块包括:
21.根据权利要求20所述的装置,其中,所述边包括邻接边和相邻边;所述边生成子模块包括:
22.根据权利要求18所述的装置,其中,所述第一聚类模块包括:
23.根据权利要求18所述的装置,其中,所述划分模块包括:
24.根据权利要求18所述的装置,还包括:
25.一种数据检索装置,包括:
26.根据权利要求25所述的装置,其中,所述第一聚类中心确定模块包括:
27.根据权利要求26所述的装置,其中,所述第二聚类中心确定模块包括:
28.根据权利要求25所述的装置,其中,所述第一检索模块包括:
29.根据权利要求28所述的装置,其中,所述第一目标节点确定子模块包括:
30.一种识别相似视频的装置,包括:
31.根据权利要求30所述的装置,其中,所述第三聚类中心确定模块包括:
32.根据权利要求31所述的装置,其中,所述第四聚类中心确定模块包括:
33.根据权利要求30所述的装置,其中,所述在第二检索模块包括:
34.根据权利要求33所述的方法,其中,所述第二目标节点确定子模块包括:
35.一种电子设备,包括:
36.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-17中任一项所述的方法。
37.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-17中任一项所述方法的步骤。