一种相关搜索方法和装置的制造方法_2

文档序号:8395942阅读:来源:国知局
一种相关搜索系统的框架图;
[0050] 图5示出了本发明的一种挖掘融合系统的工作流程示意图;
[0051] 图6示出了本发明的一种相关搜索系统的工作流程示意图;及
[0052] 图7示出了本发明的一种相关搜索装置的结构框图。
【具体实施方式】
[0053] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。
[0054] 实施例一
[0055] 参照图1,示出了本发明的一种相关搜索方法实施例的步骤流程图,具体可以包 括:
[0056] 步骤101、依据用户输入的搜索词查询索引表,以得到与所述搜索词对应的相关列 表;其中,所述索引表中存储有搜索词与相关列表之间的映射关系,所述相关列表中记录有 基于多种相关搜索词挖掘方法得到的相关搜索词与对应的分质量参数、以及基于日志统计 得到的所述相关搜索词的相关特征之间的映射关系;
[0057] 具体地,索引表可以采用如下数据结构:key=用户搜索词,value=相关列表;其 中,key为索引表的关键词,其对应用户输入的搜索词,value为用户搜索词对应的相关搜 索词构成的列表结构。本发明实施例优选采用内存对索引表进行存储和管理,当然,在具体 应用中也可以采用数据库仓库存储和管理索引表,本发明实施例对于存储和管理索引表的 方法不做具体限制。参见表1,示出了本发明的一种索引表的具体示例。
[0058]表1
[0059]
【主权项】
1. 一种相关捜索方法,其特征在于,所述方法包括: 依据用户输入的捜索词查询索引表,W得到与所述捜索词对应的相关列表;其中,所述 索引表中存储有捜索词与相关列表之间的映射关系,所述相关列表中记录有基于多种相关 捜索词挖掘方法得到的相关捜索词与对应的分质量参数、W及基于日志统计得到的所述相 关捜索词的相关特征之间的映射关系; 依据所述相关列表中记录的相关捜索词及所述相关捜索词对应的分质量参数和相关 特征,确定所述相关捜索词的总质量参数; 对总质量参数最高的若干个相关捜索词进行展现。
2. 如权利要求1所述的方法,其特征在于,通过如下步骤生成所述相关列表: 采用多种相关捜索词挖掘方法挖掘得到捜索词对应的相关捜索词及所述相关捜索词 在各种相关捜索词挖掘方法中对应的分质量参数; 对基于多种相关捜索词挖掘方法得到的相关捜索词及所述相关捜索词在各种相关捜 索词挖掘方法中对应的分质量参数进行第一融合处理,得到所述相关捜索词及所述相关捜 索词在多种相关捜索词挖掘方法中对应的分质量参数; 通过分析日志得到所述相关捜索词对应的相关特征; 对所述相关捜索词及所述相关捜索词在多种相关捜索词挖掘方法中对应的分质量参 数、及所述相关捜索词对应的相关特征进行第二融合处理,得到所述相关捜索词与分质量 参数和相关特征之间的映射关系,并将所述映射关系记录至相关列表。
3. 如权利要求1所述的方法,其特征在于,所述相关捜索词的相关特征包括所述相关 捜索词的点击率,所述相关捜索词对应的分质量参数包括:所述相关捜索词在多种相关捜 索词挖掘方法中对应的分质量参数,则所述依据所述相关列表中记录的相关捜索词及所述 相关捜索词对应的分质量参数和相关特征,确定所述相关捜索词的总质量参数的步骤,包 括: 依据所述相关捜索词的点击率与点击权重的乘积确定点击参数; 对所述相关捜索词在多种相关捜索词挖掘方法中对应的分质量参数进行第一加权处 理,得到相应的挖掘方法参数; 对所述点击参数和所述挖掘方法参数进行第二加权处理,得到所述相关捜索词的总质 量参数。
4. 如权利要求3所述的方法,其特征在于,所述相关捜索词的点击率为基于日志统计 得到相关捜索词的被点击次数与被展现次数的比值。
5. 如权利要求3所述的方法,其特征在于,所述方法还包括: 依据用户的点击记录在所述多种相关捜索词挖掘方法中的分布信息对所述第一加权 处理进行调整。
6. 如权利要求1所述的方法,其特征在于,所述相关捜索词挖掘方法包括基于会话的 方法和/或基于点击相关的方法。
7. 如权利要求6所述的方法,其特征在于,在所述相关捜索词挖掘方法为基于会话的 方法时,所述分质量参数为所述捜索词到所述相关捜索词的转移概率; 在所述相关捜索词挖掘方法为基于点击相关的方法时,所述分质量参数为所述捜索词 与所述相关捜索词之间的相关度。
8. 如权利要求1所述的方法,其特征在于,所述方法还包括: 依据所述相关捜索词、相关捜索词对应的分质量参数W及相关特征更新所述索引表。
9. 一种相关捜索装置,其特征在于,所述装置包括: 查询模块,用于依据用户输入的捜索词查询索引表,W得到与所述捜索词对应的相关 列表;其中,所述索引表中存储有捜索词与相关列表之间的映射关系,所述相关列表中记录 有基于多种相关捜索词挖掘方法得到的相关捜索词与对应的分质量参数、W及基于日志统 计得到的所述相关捜索词的相关特征之间的映射关系; 确定模块,用于依据所述相关列表中记录的相关捜索词及所述相关捜索词对应的分质 量参数和相关特征,确定所述相关捜索词的总质量参数;及 展现模块,用于对总质量参数最高的若干个相关捜索词进行展现。
10. 如权利要求9所述的装置,其特征在于,所述装置还包括;用于生成所述相关列表 的生成模块; 其中,所述生成模块包括: 挖掘子模块,用于采用多种相关捜索词挖掘方法挖掘得到捜索词对应的相关捜索词及 所述相关捜索词在各种相关捜索词挖掘方法中对应的分质量参数; 第一融合子模块,用于对基于多种相关捜索词挖掘方法得到的相关捜索词及所述相关 捜索词在各种相关捜索词挖掘方法中对应的分质量参数进行第一融合处理,得到所述相关 捜索词及所述相关捜索词在多种相关捜索词挖掘方法中对应的分质量参数; 特征提取子模块,用于通过分析日志得到所述相关捜索词对应的相关特征;及 第二融合子模块,用于对所述相关捜索词及所述相关捜索词在多种相关捜索词挖掘 方法中对应的分质量参数、及所述相关捜索词对应的相关特征进行第二融合处理,得到所 述相关捜索词与分质量参数和相关特征之间的映射关系,并将所述映射关系记录至相关列 表。
11. 如权利要求9所述的装置,其特征在于,所述相关捜索词的相关特征包括所述相关 捜索词的点击率,所述相关捜索词对应的分质量参数包括:所述相关捜索词在多种相关捜 索词挖掘方法中对应的分质量参数,则所述确定模块包括: 点击参数确定子模块,用于依据所述相关捜索词的点击率与点击权重的乘积确定点击 参数; 挖掘方法参数确定子模块,用于对所述相关捜索词在多种相关捜索词挖掘方法中对应 的分质量参数进行第一加权处理,得到相应的挖掘方法参数; 总质量参数确定子模块,用于对所述点击参数和所述挖掘方法参数进行第二加权处 理,得到所述相关捜索词的总质量参数。
12. 如权利要求9所述的装置,其特征在于,所述装置还包括: 加权调整模块,用于依据用户的点击记录在所述多种相关捜索词挖掘方法中的分布信 息对所述第一加权处理进行调整。
13. 如权利要求9所述的装置,其特征在于,所述装置还包括: 更新模块,用于依据所述相关捜索词、相关捜索词对应的分质量参数W及相关特征更 新所述索引表。
【专利摘要】本发明实施例提供了一种相关搜索方法和装置,其中的方法具体包括:依据用户输入的搜索词查询索引表,以得到与所述搜索词对应的相关列表;其中,所述索引表中存储有搜索词与相关列表之间的映射关系,所述相关列表中记录有基于多种相关搜索词挖掘方法得到的相关搜索词与对应的分质量参数、以及基于日志统计得到的所述相关搜索词的相关特征之间的映射关系;依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的分质量参数和相关特征,确定所述相关搜索词的总质量参数;对总质量参数最高的若干个相关搜索词进行展现。本发明实施例能够有效提高相关搜索结果的多样性以及覆盖率。
【IPC分类】G06F17-30
【公开号】CN104715022
【申请号】CN201510092270
【发明人】胡军, 陈英傑, 李伟
【申请人】北京奇艺世纪科技有限公司
【公开日】2015年6月17日
【申请日】2015年2月28日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1