数据处理方法、搜索方法、装置及设备与流程

文档序号:33963149发布日期:2023-04-26 17:27阅读:22来源:国知局
数据处理方法、搜索方法、装置及设备与流程

本说明书实施例涉及互联网,尤其涉及一种数据处理方法、搜索方法、装置及设备。


背景技术:

1、在搜索、推荐等业务场景中,通常需要基于确定的关键词从数据库中筛选出与该关键词相关的目标对象,并显示给用户。以网上搜索平台为例,当用户输入搜索词后,需尽可能从数据库中筛选出与该搜索词相关的商品或店铺,并返回给用户。目前,有些技术将知识图谱应用到搜索或推荐场景中,由于知识图谱可以反应业务场景中的各知识点或概念之间的关联关系,因而,结合知识图谱来筛选与关键词相关的目标对象,可以提升筛选的目标对象的准确性。但是,针对不同的业务场景或不同的业务领域,其知识图谱由不同的工作人员构建,因而,构建的知识图谱没有统一的标准,比较分散和凌乱,并且,针对不同的使用场景,对知识图谱的需求也不同,目前的知识图谱还无法很好地应用到各种使用场景中。


技术实现思路

1、为克服相关技术中存在的问题,本说明书实施例提供了一种数据处理方法、搜索方法、装置及设备。

2、根据本说明书实施例的第一方面,提供一种数据处理方法,所述方法包括:

3、获取一个或多个知识图谱;

4、对所述一个或多个知识图谱中的知识进行分类,将所述知识划分到预先设置的多个类别中;

5、基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表,其中,每个数据表中存储的数据的数据结构基于该数据表对应的使用场景标签设置,不同的数据表中存储的数据用于从不同维度描述知识的特性。

6、在一些实施例中,所述多个数据表用于商品搜索场景或商品推荐场景,所述预先设置的多个类别包括以下一种或多种:类目、实体、属性、场景标签、商品、店铺、指定店铺的主营品。

7、在一些实施例中,所述多个数据表用于商品搜索场景或商品推荐场景,所述使用场景标签包括以下一种或多种:用户搜索意图识别、基于关键词召回与所述关键词相关的对象、对象与关键词相关性的确定、对召回的对象进行排序处理、智能推荐。

8、在一些实施例中,所述在基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表后,所述方法还包括:

9、针对每个数据表,对该数据表中存储的各条数据进行质量检测;

10、针对任一条数据,若该条数据不满足预设的质量条件,则删除该条数据。

11、在一些实施例中,所述对该数据表中存储的各条数据进行质量检测包括以下一项或多项:

12、检测各条数据描述的不同知识之间的关联关系的准确性;

13、检测各条数据描述的知识分类结果的准确性;

14、检测数据表中存储的数据对指定类型的知识的覆盖率。

15、在一些实施例中,所述数据表中存储的各条数据用于描述两个知识的相关性;所述对该数据表中存储的各条数据进行质量检测,包括:

16、将每条数据输入至预先训练的质量检测模型,基于质量检测模型输出质量检测结果;

17、其中,所述质量检测模型基于以下方式训练得到:

18、重复以下步骤,直至满足预设条件:

19、针对原始知识图谱中的任一节点,获取该节点的相邻节点,与该节点构成正样本对,以及获取与该节点不存在连接边的节点,与该节点构成负样本对;

20、利用构建的正样本对和负样本对对预设的初始模型进行训练;

21、将所述数据表中的各条数据输入到训练后的初始模型中,基于训练后的初始模型的预测结果,将所述各条数据中的知识更新到所述原始知识图谱中,得到更新后的知识图谱,并执行从更新后的知识图谱获取正样本对和负样本对的步骤。

22、根据本说明书实施例的第二方面,提供一种搜索方法,所述方法包括:

23、获取关键词;

24、从预先构建的多个数据表中确定和当前的使用场景匹配的目标数据表,基于所述目标数据表确定和所述关键词相关联的目标对象,以将所述目标对象展示给用户;其中,所述多个数据表根据上述第一方面提及的数据处理方法构建。

25、在一些实施例中,所述关键词由用户输入或所述关键词基于用户的历史行为数据确定。

26、在一些实施例中,所述使用场景包括以下一种或多种:用户搜索意图识别、基于关键词召回与所述关键词相关的对象、对象与关键词相关性的确定、对召回的对象进行排序处理。

27、根据本说明书实施例的第三方面,提供一种数据处理装置,所述装置包括:

28、获取模块,用于获取一个或多个知识图谱;

29、分类模块,用于对所述一个或多个知识图谱中的知识进行分类,将所述知识划分到预先设置的多个类别中;

30、数据表构建模块,用于基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表,其中,每个数据表中存储的数据的数据结构基于该数据表对应的使用场景标签设置,不同的数据表中存储的数据用于从不同维度描述知识的特性。

31、根据本说明书实施例的第四方面,提供一种数据处理装置,所述装置包括:

32、获取模块,用于获取关键词;

33、搜索模块,用于从预先构建的多个数据表中确定和当前的使用场景匹配的目标数据表,基于所述目标数据表确定和所述关键词相关联的目标对象,以将所述目标对象展示给用户;其中,所述多个数据表根据上述第一方面提及的数据处理方法构建。

34、根据本说明书实施例的第五方面,提供一种电子设备,所述电子设备包括:

35、存储器,用于存储可执行的计算机指令;

36、处理器,用于执行所述计算机指令时实现上述第一方面和/或第二方面提及的方法。

37、根据本说明书实施例的第四方面,提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现上述第一方面和/或第二方面提及的方法。

38、本说明书实施例的有益效果:在获取到一个或者多个预先构建的知识图谱后,可以根据不同使用场景对知识的需求,对这些知识图谱中的知识进行加工处理,得到适用于不同使用场景的多个数据表,后续针对不同的使用场景,可以利用该使用场景对应的数据表进行相关业务的处理。由于对知识图谱进行加工处理的过程中可以按照统一的分类标准对知识进行分类,从而可以避免知识分散、凌乱的问题。同时,不同数据表中存储的数据的数据结构是基于不同使用场景对知识的需求设置的,因而,在将这些数据表应用到不同的使用场景时,既可以提升处理效率,也可以得到更加准确的处理结果。

39、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。



技术特征:

1.一种数据处理方法,所述方法包括:

2.根据权利要求1所述的方法,所述多个数据表用于商品搜索场景或商品推荐场景,所述预先设置的多个类别包括以下一种或多种:类目、实体、属性、场景标签、商品、店铺、指定店铺的主营品。

3.根据权利要求1所述的方法,所述在基于各知识所属的类别以及各知识之间的关联关系构建得到多个数据表后,所述方法还包括:

4.根据权利要求3所述的方法,所述对该数据表中存储的各条数据进行质量检测包括以下一项或多项:

5.根据权利要求3所述的方法,所述数据表中存储的各条数据用于描述两个知识的相关性;所述对该数据表中存储的各条数据进行质量检测,包括:

6.一种搜索方法,所述方法包括:

7.一种数据处理装置,所述装置包括:

8.一种搜索装置,所述装置包括:

9.一种电子设备,所述设备包括:

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时可实现如权利要求1至6任一项所述的方法。


技术总结
本说明书实施例提供了一种数据处理方法、搜索方法、装置及设备。在获取到一个或者多个预先构建的知识图谱后,可以根据不同使用场景对知识的需求,对这些知识图谱中的知识进行加工处理,得到适用于不同使用场景的多个数据表,后续针对不同的使用场景,可以利用该使用场景对应的数据表进行相关业务的处理。由于对知识图谱进行加工处理的过程中可以按照统一的分类标准对知识进行分类,从而可以避免知识分散、凌乱的问题。同时,不同数据表中存储的数据的数据结构是基于不同使用场景对知识的需求设置的,因而,在将这些数据表应用到不同的使用场景时,既可以提升处理效率,也可以得到更加准确的处理结果。

技术研发人员:苑爱泉,曹国栋,潘伟,张鹏,郭轶博,刘传宝
受保护的技术使用者:拉扎斯网络科技(上海)有限公司
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1