一种搜索建议提供方法及装置的制造方法_5

文档序号:9217222阅读:来源:国知局
供第二搜索词对应的搜索建议之后,使得当前用户能够通过单击、双击、悬停等方式选择输入的第一搜索词。
[0184]关键词匹配单元802用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议。
[0185]第一建议提供单元803用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。
[0186]用户行为获取单元804用于获取日志记录中与所述离线列表中任一关键词相关的历史用户行为。
[0187]文档获取单元805用于获取所述历史用户行为所产生的文档。
[0188]分词单元806用于对所述文档进行分词,得到至少一个候选建议。
[0189]筛选单元807用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
[0190]本实施例中的关键词匹配单元802、第一建议提供单元803、用户行为获取单元804、文档获取单元805、分词单元806和筛选单元807与实施例三的相关内容类似,因此描述较简单,相关之处请具体参见实施例三。
[0191]需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0192]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0193]以上对本申请所提供的一种提供搜索建议的方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
【主权项】
1.一种搜索建议提供方法,其特征在于,所述方法包括: 获取当前用户输入的第一搜索词; 将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议; 在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供; 其中,所述离线列表中任一关键词对应的搜索建议的获取方式具体为: 获取日志记录中与该关键词相关的历史用户行为; 获取所述历史用户行为所产生的文档; 对所述文档进行分词,得到至少一个候选建议; 根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。2.根据权利要求1所述的方法,其特征在于,所述获取当前用户输入的第一搜索词之前还包括: 获取当前用户输入的第二搜索词; 向当前用户提供与所述第二搜索词对应的搜索建议; 所述获取当前用户输入的第一搜索词具体为: 获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。3.根据权利要求1所述的方法,其特征在于,所述候选建议的重要度特征基于预设时间点之前的相关数据获取得到。4.根据权利要求3所述的方法,其特征在于,所述候选建议的重要度特征还基于所述预设时间点之后的相关数据,每隔预设周期进行修正。5.根据权利要求3或4所述的方法,其特征在于,所述相关数据包括以下参数中的至少一项: 所述候选建议的T F— I D F值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。6.根据权利要求1所述的方法,其特征在于,所述获取日志记录中与该关键词相关的历史用户行为,包括: 获取日志记录中历史用户使用的搜索词; 对所述历史用户使用的搜索词进行聚类; 确定该关键词所对应的聚类; 根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。7.根据权利要求1所述的方法,其特征在于,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。8.根据权利要求1所述的方法,其特征在于,所述对所述文档进行分词具体为:对所述文档的标题和/或属性内容进行分词。9.一种搜索建议提供装置,其特征在于,所述装置包括: 第一搜索词获取单元,用于获取当前用户输入的第一搜索词; 关键词匹配单元,用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议; 第一建议提供单元,用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供; 用户行为获取单元,用于获取日志记录中与所述离线列表中任一关键词相关的历史用户行为; 文档获取单元,用于获取所述历史用户行为所产生的文档; 分词单元,用于对所述文档进行分词,得到至少一个候选建议; 筛选单元,用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。10.根据权利要求9所述的装置,其特征在于,所述装置还包括:第二搜索词获取单元和第二建议提供单元; 所述第二搜索词获取单元用于获取当前用户输入的第二搜索词; 所述第二建议提供单元用于向当前用户提供与所述第二搜索词对应的搜索建议;所述第一搜索词获取单元用于获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。11.根据权利要求9所述的装置,其特征在于,所述候选建议的重要度特征由所述筛选单元基于预设时间点之前的相关数据获取得到。12.根据权利要求11所述的装置,其特征在于,所述候选建议的重要度特征还由所述筛选单元基于所述预设时间点之后的相关数据,每隔预设周期进行修正。13.根据权利要求11或12所述的装置,其特征在于,所述相关数据包括以下参数中的至少一项: 所述候选建议的T F— I D F值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。14.根据权利要求9所述的装置,其特征在于,所述用户行为获取单元包括: 搜索词获取子单元,用于获取日志记录中历史用户使用的搜索词; 聚类子单元,用于对所述历史用户使用的搜索词进行聚类; 聚类确定子单元,用于确定该关键词所对应的聚类; 用户行为确定子单元,用于根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。15.根据权利要求9所述的装置,其特征在于,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。16.根据权利要求9所述的装置,其特征在于,所述分词单元用于对所述文档进行分词具体为: 所述分词单元用于对所述文档的标题和/或属性内容进行分词。
【专利摘要】本申请提供了一种搜索建议提供方法及装置,所述方法包括:获取当前用户输入的第一搜索词;将第一搜索词与离线列表相匹配,以从离线列表中选取至少一个关键词;在离线列表中获取与选取的关键词对应的搜索建议,作为第一搜索词的搜索建议向当前用户提供;其中,离线列表中任一关键词对应的搜索建议的获取方式具体为:获取日志记录中与该关键词相关的历史用户行为;获取历史用户行为所产生的文档;对文档进行分词,得到至少一个候选建议;根据候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。显然本申请中的搜索建议可供选择的范围更大,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。
【IPC分类】G06F17/30
【公开号】CN104933081
【申请号】CN201410108614
【发明人】孙常龙
【申请人】阿里巴巴集团控股有限公司
【公开日】2015年9月23日
【申请日】2014年3月21日
【公告号】US20150269163, WO2015143239A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1