数据存储方法、数据检索方法和识别相似视频的方法与流程

文档序号：34568532发布日期：2023-06-28 11:33阅读：16来源：国知局

本公开涉及计算机，尤其涉及人工智能、大数据、数据检索等。

背景技术：

1、随着cnn(convolutional neural network，卷积神经网络))的广泛应用，使得应用在cnn特征上的基础检索技术ann(approximate nearest neighbor，近似最近邻检索)也得到了较快发展。针对大规模数据集，可以利用hnsw(hierarchical navigable smallworld)。但是hn sw算法的计算量较大。

技术实现思路

1、本公开提供了一种数据存储方法、数据检索方法和识别相似视频的方法、装置、设备、存储介质以及程序产品。

2、根据本公开的一方面，提供了一种数据存储方法，包括：对多个数据进行聚类，得到至少一个第一聚类中心；根据所述至少一个第一聚类中心，对所述多个数据进行聚类，得到至少一个第二聚类中心；根据所述至少一个第一聚类中心和所述至少一个第二聚类中心，将所述多个数据划分为至少一个数据组；根据所述至少一个数据组，生成图结构；以及将所述图结构存储至数据库。

3、根据本公开的另一方面，提供了一种数据检索方法，包括：确定至少一个第一聚类中心与待检索数据匹配的目标第一聚类中心；确定至少一个第二聚类中心与所述待检索数据匹配的目标第二聚类中心；根据所述目标第一聚类中心和所述目标第二聚类中心，确定多个数据组中的目标数据组；以及在数据库的图结构中，以与所述目标数据组对应的节点作为起点，检索与所述待检索数据匹配的数据，得到检索结果，其中，所述图结构包括多个节点，所述多个节点与多个原始数据一一对应，所述多个原始数据是根据本公开实施例所述的方法存储至所述数据库的。

4、根据本公开的另一方面，提供了一种识别相似视频的方法，包括：确定至少一个第一聚类中心与待识别视频信息匹配的目标第一聚类中心；确定至少一个第二聚类中心与所述待识别视频信息匹配的目标第二聚类中心；根据所述目标第一聚类中心和所述目标第二聚类中心，确定多个数据组中的目标数据组；以及在数据库的图结构中，以与所述目标数据组对应的节点作为起点，检索与所述待识别视频信息匹配的视频信息，得到识别结果，其中，所述图结构包括多个节点，所述多个节点与多个原始视频信息一一对应，所述多个原始视频信息是根据本公开实施例所述的方法存储至所述数据库的。

5、根据本公开的另一方面，提供了一种数据存储装置，包括：第二聚类模块，用于根据所述至少一个第一聚类中心，对所述多个数据进行聚类，得到至少一个第二聚类中心；划分模块，用于根据所述至少一个第一聚类中心和所述至少一个第二聚类中心，将所述多个数据划分为至少一个数据组；图生成模块，用于根据所述至少一个数据组，生成图结构；以及存储模块，用于将所述图结构存储至数据库存储模块。

6、根据本公开的另一方面，提供了一种数据检索装置，包括：第一聚类中心确定模块，用于确定至少一个第一聚类中心与待检索数据匹配的目标第一聚类中心；第二聚类中心确定模块，用于确定至少一个第二聚类中心与所述待检索数据匹配的目标第二聚类中心；第一目标数据组确定模块，用于根据所述目标第一聚类中心和所述目标第二聚类中心，确定多个数据组中的目标数据组；以及第一检索模块，用于在数据库的图结构中，以与所述目标数据组对应的节点作为起点，检索与所述待检索数据匹配的数据，得到检索结果，其中，所述图结构包括多个节点，所述多个节点与多个原始数据一一对应，所述多个原始数据是根据本公开实施例所述的方法存储至所述数据库的。

7、本公开的另一个方面提供了一种识别相似视频的装置，包括：第三聚类中心确定模块，用于确定至少一个第一聚类中心与待识别视频信息匹配的目标第一聚类中心；第四聚类中心确定模块，用于确定至少一个第二聚类中心与所述待识别视频信息匹配的目标第二聚类中心；第二目标数据组确定模块，用于根据所述目标第一聚类中心和所述目标第二聚类中心，确定多个数据组中的目标数据组；以及第二检索模块，用于在数据库的图结构中，以与所述目标数据组对应的节点作为起点，检索与所述待识别视频信息匹配的视频信息，得到识别结果，其中，所述图结构包括多个节点，所述多个节点与多个原始视频信息一一对应，所述多个原始视频信息是根据本公开实施例所述的方法存储至所述数据库的。

8、本公开的另一个方面提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开实施例所示的方法。

9、根据本公开实施例的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本公开实施例所示的方法。

10、根据本公开实施例的另一方面，提供了一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现本公开实施例所示方法的步骤。

11、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种数据存储方法，包括：

2.根据权利要求1所述的方法，其中，所述根据所述至少一个第一聚类中心，对所述多个数据进行聚类，得到至少一个第二聚类中心，包括：

3.根据权利要求1所述的方法，其中，所述根据所述至少一个数据组，生成图结构，包括：

4.根据权利要求3所述的方法，其中，所述边包括邻接边和相邻边；所述根据所述节点与数据组的对应关系，生成所述节点之间的边，包括：

5.根据权利要求1所述的方法，其中，所述对多个数据进行聚类，得到至少一个第一聚类中心，包括：

6.根据权利要求1所述的方法，其中，所述根据所述至少一个第一聚类中心和所述至少一个第二聚类中心，将所述多个数据划分为至少一个数据组，包括：

7.根据权利要求1所述的方法，还包括：

8.一种数据检索方法，包括：

9.根据权利要求8所述的方法，其中，所述确定至少一个第一聚类中心与待检索数据匹配的目标第一聚类中心，包括：

10.根据权利要求9所述的方法，其中，所述确定至少一个第二聚类中心与所述待检索数据匹配的目标第二聚类中心，包括：

11.根据权利要求8所述的方法，其中，所述在数据库的图结构中，以与所述目标数据组对应的节点作为起点，检索与所述待检索数据匹配的数据，得到检索结果，包括：

12.根据权利要求11所述的方法，其中，所述确定所述邻居节点中是否存在与所述待检索数据匹配的目标节点，包括：

13.一种识别相似视频的方法，包括：

14.根据权利要求13所述的方法，其中，所述确定至少一个第一聚类中心与待识别视频信息匹配的目标第一聚类中心，包括：

15.根据权利要求14所述的方法，其中，所述确定至少一个第二聚类中心与所述待识别视频信息匹配的目标第二聚类中心，包括：

16.根据权利要求13所述的方法，其中，所述在数据库的图结构中，以与所述目标数据组对应的节点作为起点，检索与所述待识别视频信息匹配的目标视频信息，得到识别结果，包括：

17.根据权利要求16所述的方法，其中，所述确定所述邻居节点中是否存在与所述待识别视频信息匹配的目标节点，包括：

18.一种数据存储装置，包括：

19.根据权利要求18所述的装置，其中，所述第二聚类模块包括：

20.根据权利要求18所述的装置，其中，所述图生成模块包括：

21.根据权利要求20所述的装置，其中，所述边包括邻接边和相邻边；所述边生成子模块包括：

22.根据权利要求18所述的装置，其中，所述第一聚类模块包括：

23.根据权利要求18所述的装置，其中，所述划分模块包括：

24.根据权利要求18所述的装置，还包括：

25.一种数据检索装置，包括：

26.根据权利要求25所述的装置，其中，所述第一聚类中心确定模块包括：

27.根据权利要求26所述的装置，其中，所述第二聚类中心确定模块包括：

28.根据权利要求25所述的装置，其中，所述第一检索模块包括：

29.根据权利要求28所述的装置，其中，所述第一目标节点确定子模块包括：

30.一种识别相似视频的装置，包括：

31.根据权利要求30所述的装置，其中，所述第三聚类中心确定模块包括：

32.根据权利要求31所述的装置，其中，所述第四聚类中心确定模块包括：

33.根据权利要求30所述的装置，其中，所述在第二检索模块包括：

34.根据权利要求33所述的方法，其中，所述第二目标节点确定子模块包括：

35.一种电子设备，包括：

36.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-17中任一项所述的方法。

37.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1-17中任一项所述方法的步骤。

技术总结
本公开提供了一种数据存储方法、数据检索方法和识别相似视频的方法，涉及计算机技术领域，尤其涉及人工智能、大数据、数据检索等技术领域。具体实现方案为：对多个数据进行聚类，得到至少一个第一聚类中心；根据至少一个第一聚类中心，对多个数据进行聚类，得到至少一个第二聚类中心；根据至少一个第一聚类中心和至少一个第二聚类中心，将多个数据划分为至少一个数据组；根据至少一个数据组，生成图结构；以及将图结构存储至数据库。

技术研发人员：尹洁,黄贲
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尹洁黄贲
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：气体注入管及ONO炉管淀积装置的制作方法
上一篇：一种基于快速三角特征直方图的点云粗配准方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。