一种扩展词对的筛选方法及装置的制造方法_5

文档序号:9687445阅读:来源:国知局
:第一查询词的查询词单元中,至少有一个查询词单元 与第二查询词的查询词单元相同。8. 如权利要求2所述的方法,其特征在于,根据确定出的查询词对包含的各查询词在 特定时间段内分别被不同用户用作搜索依据的次数,从确定出的查询词对中,选取符合扩 展词对必要条件的查询词对作为扩展词对,包括: 根据所述次数,确定出的查询词对分别包含的各查询词之间的提升度,从确定出的查 询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。9.如权利要求1所述的方法,其特征在于,从确定出的查询词对中,选取符合扩展词对 必要条件的查询词对作为扩展词对,包括: 根据确定出的查询词对分别包含的各查询词的查询词单元的重合度,从确定出的查询 词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。10. 如权利要求9所述的方法,其特征在于,根据确定出的查询词对分别包含的各查询 词的查询词单元的重合度,从确定出的查询词对中,选取符合扩展词对必要条件的查询词 对作为扩展词对,包括: 根据所述重合度,以及确定出的查询词对分别包含的各查询词之间的提升度,从确定 出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。11. 如权利要求1所述的方法,其特征在于,从确定出的查询词对中,选取符合扩展词 对必要条件的查询词对作为扩展词对,包括: 根据确定出的查询词对分别包含的各查询词之间的提升度,从确定出的查询词对中, 选取符合扩展词对必要条件的查询词对作为扩展词对。12. 如权利要求1所述的方法,其特征在于,所述方法还包括: 将所述至少两个查询词对中的、包含的各查询词在特定时间段内的共现次数不小于第 一次数阈值的查询词对,确定为扩展词对。13.如权利要求1所述的方法,其特征在于,所述至少两个查询词对中,至少包括在特 定时间段内被第一用户用作搜索依据的第一查询词对,以及在特定时间段内被第二用户用 作搜索依据的第二查询词对。14.如权利要求13所述的方法,其特征在于,从所述至少两个查询词对中,确定包含的 各查询词在特定时间段内的共现次数小于第一次数阈值的查询词对,包括 : 针对所述至少两个查询词对中的、在特定时间段内仅被单个用户用作搜索依据的各查 询词对分别执行:确定该查询词对在特定时间段内被单个用户用作搜索依据的次数;并 针对所述至少两个查询词对中的、在特定时间段内被至少两个用户用作搜索依据的各 查询词对分别执行:确定该查询词对在特定时间段内分别被各个用户用作搜索依据的次数 总和; 根据针对所述至少两个查询词对中的、在特定时间段内仅被单个用户用作搜索依据的 各查询词对所确定出的次数,以及确定出的各次数总和,确定所述共现次数小于第一次数 阈值的查询词对。15. -种扩展词对的筛选装置,其特征在于,包括: 获得单元,用于获得至少两个查询词对;其中,每个查询词对包含至少一个作为竞价词 的查询词; 第一确定单元,用于从获得单元获得的所述至少两个查询词对中,确定包含的各查询 词在特定时间段内的共现次数小于第一次数阈值的查询词对; 选取单元,用于从第一确定单元确定出的查询词对中,选取符合设置的扩展词对必要 条件的查询词对作为扩展词对。16. 如权利要求15所述的装置,其特征在于: 所述选取单元,用于根据确定出的查询词对包含的各查询词在特定时间段内分别被不 同用户用作搜索依据的次数,从确定出的查询词对中,选取符合扩展词对必要条件的查询 词对作为扩展词对。17. 如权利要求16所述的装置,其特征在于,所述扩展词对必要条件包括: 包含的各查询词在特定时间段内被不同用户分别用作搜索依据的次数均大于第二次 数阈值。18. 如权利要求16所述的装置,其特征在于: 所述选取单元,用于根据确定出的查询词对包含的各查询词在特定时间段内分别被不 同用户用作搜索依据的次数,以及确定出的查询词对分别包含的各查询词的查询词单元的 重合度,从确定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。19. 如权利要求18所述的装置,其特征在于,所述扩展词对必要条件包括: 包含的各查询词在特定时间段内被不同用户分别用作搜索依据的次数均大于第二次 数阈值;且 满足查询词单元重合条件; 其中,单个查询词对包含第一查询词和第二查询词; 所述查询词单元重合条件包括:第一查询词的查询词单元中,至少有一个查询词单元 与第二查询词的查询词单元相同。20. 如权利要求18所述的装置,其特征在于: 所述选取单元,用于根据确定出的查询词对包含的各查询词在特定时间段内分别被不 同用户用作搜索依据的次数、所述重合度,以及确定出的查询词对分别包含的各查询词之 间的提升度,从确定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词 对。21. 如权利要求20所述的装置,其特征在于,所述扩展词对必要条件包括: 包含的各查询词在特定时间段内被不同用户分别用作搜索依据的次数均大于第二次 数阈值;且 满足查询词单元重合条件;且 包含的查询词之间的提升度的值大于提升度阈值; 其中,单个查询词对包含第一查询词和第二查询词; 所述查询词单元重合条件包括:第一查询词的查询词单元中,至少有一个查询词单元 与第二查询词的查询词单元相同。22. 如权利要求16所述的装置,其特征在于: 所述选取单元,用于根据所述次数,确定出的查询词对分别包含的各查询词之间的提 升度,从确定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。23. 如权利要求15所述的装置,其特征在于: 所述选取单元,用于根据确定出的查询词对分别包含的各查询词的查询词单元的重合 度,从确定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。24. 如权利要求23所述的装置,其特征在于: 所述选取单元,用于根据所述重合度,以及确定出的查询词对分别包含的各查询词之 间的提升度,从确定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词 对。25. 如权利要求15所述的装置,其特征在于: 所述选取单元,用于根据确定出的查询词对分别包含的各查询词之间的提升度,从确 定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。26. 如权利要求15所述的装置,其特征在于,所述装置还包括: 第二确定单元,用于将所述至少两个查询词对中的、包含的各查询词在特定时间段内 的共现次数不小于第一次数阈值的查询词对,确定为扩展词对。27. 如权利要求15所述的装置,其特征在于,所述至少两个查询词对中,至少包括在特 定时间段内被第一用户用作搜索依据的第一查询词对,以及在特定时间段内被第二用户用 作搜索依据的第二查询词对。28. 如权利要求27所述的装置,其特征在于,第一确定单元用于: 针对所述至少两个查询词对中的、在特定时间段内仅被单个用户用作搜索依据的各查 询词对分别执行:确定该查询词对在特定时间段内被单个用户用作搜索依据的次数;并 针对所述至少两个查询词对中的、在特定时间段内被至少两个用户用作搜索依据的各 查询词对分别执行:确定该查询词对在特定时间段内分别被各个用户用作搜索依据的次数 总和; 根据针对所述至少两个查询词对中的、在特定时间段内仅被单个用户用作搜索依据的 各查询词对所确定出的次数,以及确定出的各次数总和,确定所述共现次数小于第一次数 阈值的查询词对。
【专利摘要】本申请公开了一种扩展词对的筛选方法,用以解决在用户行为不够丰富的场景下,按照现有的扩展词对确定方式能够确定出的扩展词对的数量较小的问题。方法包括:获得至少两个查询词对;从所述至少两个查询词对中,确定包含的各查询词在特定时间段内的共现次数小于第一次数阈值的查询词对;从确定出的查询词对中,选取符合设置的扩展词对必要条件的查询词对作为扩展词对。本申请还公开一种扩展词对的筛选装置。
【IPC分类】G06F17/30
【公开号】CN105446984
【申请号】CN201410306347
【发明人】何炜, 李波, 林锋
【申请人】阿里巴巴集团控股有限公司
【公开日】2016年3月30日
【申请日】2014年6月30日
【公告号】US20150379129, WO2016003930A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1