对象识别方法、装置、电子设备及存储介质与流程

文档序号:34365592发布日期:2023-06-04 20:42阅读:20来源:国知局
对象识别方法、装置、电子设备及存储介质与流程

本公开涉及互联网,尤其涉及一种对象识别方法、装置、电子设备及存储介质。


背景技术:

1、随着移动通讯技术的成熟化发展,移动智能终端的普及为视频多元化的播放场景奠定基础,短视频类的应用程序得到了快速的发展,因此对短视频数据的处理也越发重要,尤其是对对象数据进行识别处理。为了对同一对象的行为数据进行对比分析,需要识别多个对象账号是否属于同一对象。

2、相关技术中,在进行对象识别时,一般是通过人工打标方式来识别,但是这种方式识别效率非常低,而且无法在短时间内覆盖所有对象。


技术实现思路

1、本公开提供一种对象识别方法、装置、电子设备及存储介质,以至少解决相关技术中识别效率低、覆盖率低的问题。本公开的技术方案如下:

2、根据本公开实施例的第一方面,提供一种对象识别方法,包括:

3、获取第一目标系统的第一对象群数据集合,并获取第二目标系统的第二对象群数据集合,所述第一对象群数据集合包括多个与第一对象账号对应的第一对象数据,所述第二对象群数据集合包括多个与第二对象账号对应的第二对象数据;

4、按照预设对象关联特征,对所述第一对象数据和第二对象数据进行匹配,确定相匹配的第一对象账号和第二对象账号,将相匹配的第一对象账号和第二对象账号确定为匹配对,并将所述匹配对加入匹配对候选集;

5、根据所述第一对象数据和第二对象数据中除所述预设对象关联特征外的其他属性数据,确定所述匹配对候选集中为同一对象的目标匹配对。

6、可选的,在按照预设对象关联特征,对所述第一对象数据和第二对象数据进行匹配之前,还包括:

7、分别对所述第一对象数据和第二对象数据进行预处理,使得所述第一对象数据和所述第二对象数据的数据格式一致。

8、可选的,按照预设对象关联特征,对所述第一对象数据和第二对象数据进行匹配,确定相匹配的第一对象账号和第二对象账号,包括下述至少一种:

9、确定所述第一对象数据和第二对象数据中对象名称的相似度,将对象名称的相似度大于第一相似度阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号;

10、确定所述第一对象数据和第二对象数据中对象描述信息的相似度,将对象描述信息的相似度大于第二相似度阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号;

11、确定第一对象账号对应的第一对象数据和第二对象账号对应的第二对象数据中相同作品的数量,并确定第一对象账号的第一对象作品总数和第二对象账号的第二对象作品总数,将所述相同作品的数量占第一对象作品总数和第二对象作品总数的比例均大于第一比例阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号;

12、确定第一对象账号对应的第一对象数据和第二对象账号对应的第二对象数据中共同关注者的数量,并确定第一对象账号的第一总关注者数量和第二对象账号的第二总关注者数量,将所述共同关注者的数量占第一总关注者数量和第二总关注者数量的比例均大于第二比例阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号。

13、可选的,根据所述第一对象数据和第二对象数据中除所述预设对象关联特征外的其他属性数据,确定所述匹配对候选集中为同一对象的目标匹配对,包括:

14、根据所述第一对象数据和第二对象数据中除所述预设对象关联特征外的其他属性数据,确定所述匹配对候选集中的匹配对为同一对象的匹配得分;

15、根据所述匹配得分,确定所述匹配对候选集中为同一对象的目标匹配对。

16、可选的,根据所述第一对象数据和第二对象数据中除所述预设对象关联特征外的其他属性数据,确定所述匹配对候选集中的匹配对为同一对象的匹配得分,包括:

17、确定所述第一对象数据和第二对象数据中每个其他属性数据的相似度;

18、根据所述每个其他属性数据的相似度,确定所述匹配对候选集中的匹配对为同一对象的匹配得分。

19、可选的,根据所述每个其他属性数据的相似度,确定所述匹配对候选集中的匹配对为同一对象的匹配得分,包括:

20、将所述每个其他属性数据的相似度作为权重,对每个其他属性数据的预设得分进行加权求和,得到所述匹配对候选集中的匹配对为同一对象的匹配得分;或者

21、将所述每个其他属性数据的相似度输入二分类模型,得到所述匹配对候选集中的匹配对为同一对象的匹配得分。

22、可选的,根据所述匹配得分,确定所述匹配对候选集中为同一对象的目标匹配对,包括:

23、从所述匹配对候选集中确定所述匹配得分大于或等于得分阈值的匹配对;

24、对所述匹配得分大于或等于得分阈值的匹配对进行去重,得到所述匹配对候选集中为同一对象的目标匹配对。

25、根据本公开实施例的第二方面,提供一种对象识别装置,包括:

26、数据获取模块,被配置为执行获取第一目标系统的第一对象群数据集合,并获取第二目标系统的第二对象群数据集合,所述第一对象群数据集合包括多个与第一对象账号对应的第一对象数据,所述第二对象群数据集合包括多个与第二对象账号对应的第二对象数据;

27、数据匹配模块,被配置为执行按照预设对象关联特征,对所述第一对象数据和第二对象数据进行匹配,确定相匹配的第一对象账号和第二对象账号,将相匹配的第一对象账号和第二对象账号确定为匹配对,并将所述匹配对加入匹配对候选集;

28、识别结果确定模块,被配置为执行根据所述第一对象数据和第二对象数据中除所述预设对象关联特征外的其他属性数据,确定所述匹配对候选集中为同一对象的目标匹配对。

29、可选的,所述装置还包括:

30、预处理模块,被配置为执行分别对所述第一对象数据和第二对象数据进行预处理,使得所述第一对象数据和所述第二对象数据的数据格式一致。

31、可选的,所述数据匹配模块包括下述至少一种:

32、名称匹配单元,被配置为执行确定所述第一对象数据和第二对象数据中对象名称的相似度,将对象名称的相似度大于第一相似度阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号;

33、描述信息匹配单元,被配置为执行确定所述第一对象数据和第二对象数据中对象描述信息的相似度,将对象描述信息的相似度大于第二相似度阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号;

34、作品匹配单元,被配置为执行确定第一对象账号对应的第一对象数据和第二对象账号对应的第二对象数据中相同作品的数量,并确定第一对象账号的第一对象作品总数和第二对象账号的第二对象作品总数,将所述相同作品的数量占第一对象作品总数和第二对象作品总数的比例均大于第一比例阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号;

35、关注者匹配单元,被配置为执行确定第一对象账号对应的第一对象数据和第二对象账号对应的第二对象数据中共同关注者的数量,并确定第一对象账号的第一总关注者数量和第二对象账号的第二总关注者数量,将所述共同关注者的数量占第一总关注者数量和第二总关注者数量的比例均大于第二比例阈值的第一对象账号和第二对象账号确定为相匹配的第一对象账号和第二对象账号。

36、可选的,所述识别结果确定模块包括:

37、匹配得分确定单元,被配置为执行根据所述第一对象数据和第二对象数据中除所述预设对象关联特征外的其他属性数据,确定所述匹配对候选集中的匹配对为同一对象的匹配得分;

38、识别结果确定单元,被配置为执行根据所述匹配得分,确定所述匹配对候选集中为同一对象的目标匹配对。

39、可选的,所述匹配得分确定单元包括:

40、属性相似度确定子单元,被配置为执行确定所述第一对象数据和第二对象数据中每个其他属性数据的相似度;

41、匹配得分确定子单元,被配置为执行根据所述每个其他属性数据的相似度,确定所述匹配对候选集中的匹配对为同一对象的匹配得分。

42、可选的,所述匹配得分确定子单元被配置为执行:

43、将所述每个其他属性数据的相似度作为权重,对每个其他属性数据的预设得分进行加权求和,得到所述匹配对候选集中的匹配对为同一对象的匹配得分;或者

44、将所述每个其他属性数据的相似度输入二分类模型,得到所述匹配对候选集中的匹配对为同一对象的匹配得分。

45、可选的,所述识别结果确定单元包括:

46、匹配对筛选子单元,被配置为执行从所述匹配对候选集中确定所述匹配得分大于或等于得分阈值的匹配对;

47、匹配对去重子单元,被配置为执行对所述匹配得分大于或等于得分阈值的匹配对进行去重,得到所述匹配对候选集中为同一对象的目标匹配对。

48、根据本公开实施例的第三方面,提供一种电子设备,包括:

49、处理器;

50、用于存储所述处理器可执行指令的存储器;

51、其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的对象识别方法。

52、根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的对象识别方法。

53、根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现如第一方面所述的对象识别方法。

54、本公开的实施例提供的技术方案至少带来以下有益效果:

55、本公开实施例通过在获取到第一目标系统的第一对象群数据集合和第二目标系统的第二对象群数据集合后,按照预设对象关联特征对第一对象群数据集合中的第一对象数据和第二对象群数据集合中的第二对象数据进行匹配,将相匹配的第一对象账号和第二对象账号确定为匹配对,并将匹配对加入匹配对候选集,根据第一对象数据和第二对象数据中除预设对象关联特征外的其他属性数据确定匹配对候选集中为同一对象的目标匹配对,实现了基于第一目标系统的第一对象数据和第二目标系统的第二对象数据来识别两个目标系统的同一对象,相对于人工打标方式,可以对两个目标系统中所有数据进行处理,提高了数据覆盖率,而且提高了识别效率。

56、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1