搜索词处理方法、装置、设备、存储介质和程序产品与流程

文档序号:35931735发布日期:2023-11-05 07:58阅读:33来源:国知局
搜索词处理方法、装置、设备、存储介质和程序产品与流程

本技术涉及计算机,特别是涉及一种搜索词处理方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、随着计算机技术与互联网技术的发展,借助各类平台进行信息搜索成为人们日常工作、生活不可缺少信息收集渠道。例如,人们可以利用通用搜索系统搜索日常信息、在电商平台搜索商品信息、在视频平台搜索热门视频,等等。

2、为了提升搜索效率与用户的搜索体验,搜索系统通常会基于用户输入的搜索文本推荐出一些搜索词,这些搜索词可能与用户的搜索意图相关,从而能够对用户起到搜索提示作用,方便用户快速找到想要的信息。

3、然而,相关方式中,搜索系统的推荐搜索词,被用户点击后,仍存在搜索结果页中无法找到用户需要的信息的情况,用户的搜索体验较差。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种搜索词处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,所确定的推荐搜索词提高了用户在相应搜索结果页中点击并找到所需要的信息的几率,从而提升用户的搜索体验。

2、第一方面,本技术提供了一种搜索词处理方法。所述方法包括:

3、获取在搜索界面中输入的搜索文本;

4、获取所述搜索文本对应的多个候选搜索词;

5、查询各所述候选搜索词的质量得分;搜索词的质量得分,与搜索词的搜索结果页点击率、搜索结果页丰富度均呈正相关;

6、根据所述质量得分,从所述多个候选搜索词中筛选出低质量搜索词;

7、查询与所述低质量搜索词存在语义相关关系的高质量搜索词;

8、将所述多个候选搜索词中的低质量搜索词替换为相应的高质量搜索词,得到所述搜索文本对应的多个推荐搜索词;

9、在所述搜索界面中呈现所述多个推荐搜索词。

10、第二方面,本技术还提供了一种搜索词处理装置。所述装置包括:

11、候选搜索词确定模块,用于获取在搜索界面中输入的搜索文本;获取所述搜索文本对应的多个候选搜索词;

12、查询模块,用于查询各所述候选搜索词的质量得分;搜索词的质量得分,与搜索词的搜索结果页点击率、搜索结果页丰富度均呈正相关;

13、低质量搜索词筛选模块,用于根据所述质量得分,从所述多个候选搜索词中筛选出低质量搜索词;

14、所述查询模块,还用于查询与所述低质量搜索词存在语义相关关系的高质量搜索词;

15、搜索词替换模块,用于将所述多个候选搜索词中的低质量搜索词替换为相应的高质量搜索词,得到所述搜索文本对应的多个推荐搜索词,在所述搜索界面中呈现所述多个推荐搜索词。

16、在一个实施例中,所述搜索词处理装置还包括:

17、质量得分确定模块,用于确定搜索词库中每个搜索词的搜索结果页点击率与搜索结果页丰富度;根据所述搜索结果页点击率与所述搜索结果页丰富度,确定各所述搜索词的质量得分。

18、在一个实施例中,所述质量得分确定模块还包括:

19、搜索结果页点击率统计单元,用于统计所述搜索词的搜索次数与所述搜索词的搜索结果页的点击次数;根据所述点击次数与所述搜索次数的比例,确定所述搜索词的搜索结果页点击率。

20、在一个实施例中,所述质量得分确定模块还包括:

21、搜索结果页丰富度统计单元,用于统计所述搜索词的搜索结果页中各类型内容的数量;根据所述各类型内容的数量,确定所述搜索词的搜索结果页丰富度。

22、在一个实施例中,所述搜索结果页丰富度统计单元还用于获取各类型内容的权重;根据各类型内容的权重,将所述搜索词的搜索结果页的首页中各类型内容的数量进行加权求和,得到加权得分;根据所述加权得分,确定所述搜索词的搜索结果页丰富度。

23、在一个实施例中,低质量搜索词筛选模块,还用于根据所述质量得分,从所述多个候选搜索词中筛选出相应质量得分低于第一阈值的候选搜索词,作为低质量搜索词。

24、在一个实施例中,所述搜索词处理装置还包括:

25、聚类模块,用于提取搜索词库中每个搜索词的语义向量表示;根据所述语义向量表示,对所述搜索词库中的搜索词进行聚类,得到多个聚类簇;其中,每个聚类簇具有簇中心,聚类簇中搜索词的语义向量表示与所在聚类簇的簇中心的相似度,大于与其它聚类簇的簇中心的相似度;同一聚类簇中的搜索词之间存在语义相关关系;将每个聚类簇的簇标识与所述聚类簇包括的搜索词对应存储。

26、在一个实施例中,所述查询模块,还用于查询所述低质量搜索词所在目标聚类簇对应的簇标识;确定所述簇标识所对应目标聚类簇中的搜索词;查询所述目标聚类簇中搜索词各自的质量得分;将所述目标聚类簇中相应质量得分最高的搜索词,作为与所述低质量搜索词存在语义相关关系的高质量搜索词。

27、在一个实施例中,所述聚类模块,还用于以所述搜索词库中的首个搜索词的语义向量表示为首个簇中心;遍历所述搜索词库中的搜索词,计算遍历到的搜索词的语义向量表示与各簇中心之间的相似度;若各所述相似度中的最大相似度大于或等于第二阈值,则将遍历到的搜索词加入对应所述最大相似度的簇中心所在的聚类簇;若各所述相似度中的最大相似度小于第二阈值,则将遍历到的搜索词的语义向量表示作为新增的簇中心,直至遍历完所述搜索词库中的搜索词时,得到多个聚类簇。

28、在一个实施例中,所述聚类模块,还用于通过预设的语义向量表示模型,对所述搜索词库中每个搜索词分别进行语义向量提取,得到搜索词库中每个搜索词的语义向量表示。

29、在一个实施例中,所述候选搜索词确定模块,还用于确定搜索词库中以所述搜索文本为前缀的多个搜索词;计算以所述搜索文本为前缀的各搜索词与所述搜索文本间的语义相似度;获取以所述搜索文本为前缀的各搜索词的热度;根据所述语义相似度和所述热度,从所述多个搜索词中筛选出多个候选搜索词。

30、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

31、获取在搜索界面中输入的搜索文本;

32、获取所述搜索文本对应的多个候选搜索词;

33、查询各所述候选搜索词的质量得分;搜索词的质量得分,与搜索词的搜索结果页点击率、搜索结果页丰富度均呈正相关;

34、根据所述质量得分,从所述多个候选搜索词中筛选出低质量搜索词;

35、查询与所述低质量搜索词存在语义相关关系的高质量搜索词;

36、将所述多个候选搜索词中的低质量搜索词替换为相应的高质量搜索词,得到所述搜索文本对应的多个推荐搜索词;

37、在所述搜索界面中呈现所述多个推荐搜索词。

38、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

39、获取在搜索界面中输入的搜索文本;

40、获取所述搜索文本对应的多个候选搜索词;

41、查询各所述候选搜索词的质量得分;搜索词的质量得分,与搜索词的搜索结果页点击率、搜索结果页丰富度均呈正相关;

42、根据所述质量得分,从所述多个候选搜索词中筛选出低质量搜索词;

43、查询与所述低质量搜索词存在语义相关关系的高质量搜索词;

44、将所述多个候选搜索词中的低质量搜索词替换为相应的高质量搜索词,得到所述搜索文本对应的多个推荐搜索词;

45、在所述搜索界面中呈现所述多个推荐搜索词。

46、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

47、获取在搜索界面中输入的搜索文本;

48、获取所述搜索文本对应的多个候选搜索词;

49、查询各所述候选搜索词的质量得分;搜索词的质量得分,与搜索词的搜索结果页点击率、搜索结果页丰富度均呈正相关;

50、根据所述质量得分,从所述多个候选搜索词中筛选出低质量搜索词;

51、查询与所述低质量搜索词存在语义相关关系的高质量搜索词;

52、将所述多个候选搜索词中的低质量搜索词替换为相应的高质量搜索词,得到所述搜索文本对应的多个推荐搜索词;

53、在所述搜索界面中呈现所述多个推荐搜索词。

54、上述搜索词处理方法、装置、计算机设备、存储介质和计算机程序产品,在获取在搜索界面中输入的搜索文本并获取搜索文本对应的多个候选搜索词之后,对于每个候选搜索词,查询相应的质量得分,根据质量得分从多个候选搜索词中筛选出低质量搜索词,由于搜索词的质量得分与搜索词的搜索结果页点击率、搜索结果页丰富度均呈正相关,就可以将低质量搜索词替换为更高质量的搜索词,能够避免用户点击到低质量搜索词后进入转化效果较差的搜索结果页而无法找到所需的信息,提升了用户的搜索体验,也提升了搜索系统的相关指标,如搜索结果页点击率等。而且,替换时所采用的高质量搜索词是与低质量搜索词存在语义相关关系的搜索词,可以避免发生语义偏移而将候选搜索词替换成与用户搜索意图不相关的搜索词,进一步提升了用户的搜索体验。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1