一种相关搜索方法和装置的制造方法

文档序号:8395942阅读:298来源:国知局
一种相关搜索方法和装置的制造方法
【技术领域】
[0001] 本发明涉及搜索引擎技术领域,特别是涉及一种相关搜索方法和装置。
【背景技术】
[0002] 随着互联网发展,信息的快速膨胀,人们对搜索引擎的依赖越来越大。但是在有些 情况下,用户输入的搜索词不能准确地描述搜索意图,从而导致得到的搜索结果无法满足 用户需求。为了提高用户搜索的体验度,相关搜索技术应运而生,相关搜索技术可以检索所 述搜索词对应的相关搜索词,并提供给用户,以便于用户的二次检索。
[0003] 传统的相关搜索方法具有相关搜索词多样性较差的缺点,或者具有对于长尾搜索 词的搜索效果不佳的缺点,或者导致相关搜索覆盖率较低。

【发明内容】

[0004] 本发明实施例所要解决的技术问题是提供一种相关搜索方法和装置,能够有效提 高相关搜索结果的多样性以及覆盖率。
[0005]为了解决上述问题,本发明公开了一种相关搜索方法,包括:
[0006]依据用户输入的搜索词查询索引表,以得到与所述搜索词对应的相关列表;其中, 所述索引表中存储有搜索词与相关列表之间的映射关系,所述相关列表中记录有基于多种 相关搜索词挖掘方法得到的相关搜索词与对应的分质量参数、以及基于日志统计得到的所 述相关搜索词的相关特征之间的映射关系;
[0007]依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的分质量参数和 相关特征,确定所述相关搜索词的总质量参数;
[0008] 对总质量参数最高的若干个相关搜索词进行展现。
[0009] 优选地,通过如下步骤生成所述相关列表:
[0010] 采用多种相关搜索词挖掘方法挖掘得到搜索词对应的相关搜索词及所述相关搜 索词在各种相关搜索词挖掘方法中对应的分质量参数;
[0011] 对基于多种相关搜索词挖掘方法得到的相关搜索词及所述相关搜索词在各种相 关搜索词挖掘方法中对应的分质量参数进行第一融合处理,得到所述相关搜索词及所述相 关搜索词在多种相关搜索词挖掘方法中对应的分质量参数;
[0012] 通过分析日志得到所述相关搜索词对应的相关特征;
[0013] 对所述相关搜索词及所述相关搜索词在多种相关搜索词挖掘方法中对应的分质 量参数、及所述相关搜索词对应的相关特征进行第二融合处理,得到所述相关搜索词与分 质量参数和相关特征之间的映射关系,并将所述映射关系记录至相关列表。
[0014] 优选地,所述相关搜索词的相关特征包括所述相关搜索词的点击率,所述相关搜 索词对应的分质量参数包括:所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量 参数,则所述依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的分质量参数 和相关特征,确定所述相关搜索词的总质量参数的步骤,包括:
[0015] 依据所述相关搜索词的点击率与点击权重的乘积确定点击参数;
[0016] 对所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量参数进行第一加 权处理,得到相应的挖掘方法参数;
[0017] 对所述点击参数和所述挖掘方法参数进行第二加权处理,得到所述相关搜索词的 总质量参数。
[0018] 优选地,所述相关搜索词的点击率为基于日志统计得到相关搜索词的被点击次数 与被展现次数的比值。
[0019] 优选地,所述方法还包括:
[0020] 依据用户的点击记录在所述多种相关搜索词挖掘方法中的分布信息对所述第一 加权处理进行调整。
[0021] 优选地,所述相关搜索词挖掘方法包括基于会话的方法和/或基于点击相关的方 法。
[0022] 优选地,在所述相关搜索词挖掘方法为基于会话的方法时,所述分质量参数为所 述搜索词到所述相关搜索词的转移概率;
[0023] 在所述相关搜索词挖掘方法为基于点击相关的方法时,所述分质量参数为所述搜 索词与所述相关搜索词之间的相关度。
[0024] 优选地,所述方法还包括:
[0025] 依据所述相关搜索词、相关搜索词对应的分质量参数以及相关特征更新所述索引 表。
[0026] 依据本发明的另一个方面,提供了一种相关搜索装置,包括:
[0027] 查询模块,用于依据用户输入的搜索词查询索引表,以得到与所述搜索词对应的 相关列表;其中,所述索引表中存储有搜索词与相关列表之间的映射关系,所述相关列表中 记录有基于多种相关搜索词挖掘方法得到的相关搜索词与对应的分质量参数、以及基于日 志统计得到的所述相关搜索词的相关特征之间的映射关系;
[0028] 确定模块,用于依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的 分质量参数和相关特征,确定所述相关搜索词的总质量参数;及
[0029] 展现模块,用于对总质量参数最高的若干个相关搜索词进行展现。
[0030] 优选地,所述装置还包括:用于生成所述相关列表的生成模块;
[0031] 其中,所述生成模块包括:
[0032] 挖掘子模块,用于采用多种相关搜索词挖掘方法挖掘得到搜索词对应的相关搜索 词及所述相关搜索词在各种相关搜索词挖掘方法中对应的分质量参数;
[0033] 第一融合子模块,用于对基于多种相关搜索词挖掘方法得到的相关搜索词及所述 相关搜索词在各种相关搜索词挖掘方法中对应的分质量参数进行第一融合处理,得到所述 相关搜索词及所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量参数;
[0034] 特征提取子模块,用于通过分析日志得到所述相关搜索词对应的相关特征;及
[0035] 第二融合子模块,用于对所述相关搜索词及所述相关搜索词在多种相关搜索词挖 掘方法中对应的分质量参数、及所述相关搜索词对应的相关特征进行第二融合处理,得到 所述相关搜索词与分质量参数和相关特征之间的映射关系,并将所述映射关系记录至相关 列表。
[0036] 优选地,所述相关搜索词的相关特征包括所述相关搜索词的点击率,所述相关搜 索词对应的分质量参数包括:所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量 参数,则所述确定模块包括:
[0037]点击参数确定子模块,用于依据所述相关搜索词的点击率与点击权重的乘积确定 点击参数;
[0038] 挖掘方法参数确定子模块,用于对所述相关搜索词在多种相关搜索词挖掘方法中 对应的分质量参数进行第一加权处理,得到相应的挖掘方法参数;
[0039] 总质量参数确定子模块,用于对所述点击参数和所述挖掘方法参数进行第二加权 处理,得到所述相关搜索词的总质量参数。
[0040] 优选地,所述装置还包括:
[0041] 加权调整模块,用于依据用户的点击记录在所述多种相关搜索词挖掘方法中的分 布信息对所述第一加权处理进行调整。
[0042] 优选地,所述装置还包括:
[0043] 更新模块,用于依据所述相关搜索词、相关搜索词对应的分质量参数以及相关特 征更新所述索引表。
[0044] 与现有技术相比,本发明实施例包括以下优点:
[0045] 本发明实施例的相关搜索方法融合多种相关搜索词挖掘方法提取相关搜索词,并 依据搜索日志得到相关搜索词的相关特征,在相关搜索词对应挖掘方法的分质量参数与相 关特征的共同作用下,确定相关搜索词的总质量参数,将总质量参数最高的若干个相关搜 索词进行展现。由于相关搜索词为基于多种相关搜索词挖掘方法得到,因此可以提高相关 搜索词的多样性和覆盖率;此外,由于分质量参数可以体现各种挖掘方法对相关搜索结果 的影响,以及相关特征可以体现用户的搜索行为对相关搜索结果的影响,因此,通过分质量 参数和相关特征确定的总质量参数可以综合反映各种挖掘方法以及用户搜索习惯等各方 面因素对搜索结果的影响,从而提高相关搜索词的多样性及准确性,可以进一步提高搜索 结果的覆盖率和准确率。
【附图说明】
[0046] 图1示出了本发明的一种相关搜索方法实施例的步骤流程图;
[0047] 图2示出了本发明的一种确定所述相关搜索词的总质量参数的步骤流程图;
[0048] 图3示出了本发明的一种生成所述相关列表的步骤流程图;
[0049] 图4示出了本发明的
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1