一种搜索建议提供方法及装置的制造方法_4

文档序号:9217222阅读:来源:国知局
的搜索建议可以由搜索服务器获取得到,如图5所示,下面以关键词“雾霾口罩”为例,介绍其对应的搜索建议的具体获取方式:
[0142]步骤S 501:获取日志记录中与关键词“雾霾口罩”相关的历史用户行为。
[0143]在该步骤中,可以获取日志记录中记录的所有用户的对包含“雾霾口罩”的链接的点击、收藏、复制、购买等历史用户行为。当然,也可以不是获取所有用户的历史用户行为,例如获取与输入第一搜索词“雾霾口罩”的当前用户具有相同属性的用户(例如同城用户、或者同一性别的用户等等)的历史用户行为。
[0144]步骤S 502:获取与关键词“雾霾口罩”相关的历史用户行为所产生的文档。
[0145]例如当用户收藏了一个包含“雾霾口罩”的链接后,该链接中的所有文字、图片、语音信息等形成一个文档。
[0146]步骤S 503:对所述文档进行分词,得到至少一个候选建议。
[0147]步骤S 504:根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
[0148]其中候选建议的重要度特征,可以是根据当天之前的相关数据得到,并且根据当天的相关数据每隔预设时间进行修正,例如最终计算出的重要度特征可以为根据当天的相关数据计算出的重要度特征与根据当天之前的相关数据计算出的重要度特征之和。
[0149]其中,相关数据可以为以下参数之和:候选建议的T F — I D F值、候选建议与第一搜索词共同被搜索的次数和/或频率、候选建议与历史用户行为相关的次数和/或频率、候选建议的词语属性值、以及候选建议的标注属性值。其中,可以对每个参数设置不同的权重。
[0150]若经过步骤S 503的分词以及步骤S 504的重要度筛选后,得到“雾霾口罩”对应的搜索建议:“防二手烟”、“防病菌”、“流感”等。此时如图6所示,当前用户选择了第一搜索词“雾霾口罩”后,通过右边栏的方式向当前用户提供“雾霾口罩”对应的搜索建议以供当前用户选择。此时当前用户可以进一步选择搜索建议,从而实现完成搜索词的输入。例如,若当前用户此时选择“防二手烟”,则当前用户最终输入的搜索词为“雾霾口罩防二手烟”,搜索服务器基于该搜索词进行搜索并给出相应的搜索结果。
[0151]实施例三
[0152]与本申请上述搜索建议提供方法的第一实施例相对应,参见图7,本申请还提供了搜索建议提供装置的第一实施例,在本实施例中,该装置包括:第一搜索词获取单元701、关键词匹配单元702、第一建议提供单元703、用户行为获取单元704、文档获取单元705、分词单元706和筛选单元707。
[0153]第一搜索词获取单元701,用于获取当前用户输入的第一搜索词。其中,第一搜索词包括一个或多个搜索词。
[0154]关键词匹配单元702,用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词。其中关键词匹配单元702可以是将离线列表中与第一搜索词匹配度最高的一个或多个关键词作为选取的关键词,或者也可以是设置一个匹配度阈值,将离线列表中与第一搜索词的匹配度大于匹配度阈值的一个或多个关键词作为选取的关键词。
[0155]离线列表中包括有至少一个关键词,这些关键词可以是历史用户搜索的高频词,所述离线列表中的每个关键词分别对应至少一个搜索建议。其中离线列表可以预存在搜索建议提供装置中。搜索建议提供装置则可以设置在用户终端,或者搜索服务器中。
[0156]第一建议提供单元703,用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。其中第一建议提供单元703具体可以通过自动下拉栏、自动侧边框等方式向当前用户提供搜索建议。
[0157]用户行为获取单元704用于获取日志记录中与离线列表中任一关键词相关的历史用户行为。
[0158]为了加大统计的数据基数,历史用户行为具体可以为搜索服务器的日志记录中所记录的所有用户、或者与输入第一搜索词的当前用户具有相同属性的用户的历史用户行为。与该关键词相关的用户行为则具体可以包括:对包含该关键词的链接的点击、收藏、复制、或者购买等行为。
[0159]其中,为了增大搜索建议可供选择的范围,用户行为获取单元704可以包括搜索词获取子单元7041、聚类子单元7042、聚类确定子单元7043和用户行为确定子单元7044。
[0160]搜索词获取子单元7041,用于获取日志记录中历史用户使用的搜索词。离线列表中的关键词可以选自历史用户使用过的搜索词。
[0161]聚类子单元7042,用于对所述历史用户使用的搜索词进行聚类。对搜索词的聚类可以基于现有技术中的P L SA语义聚类模型进行。
[0162]聚类确定子单元7043,用于确定该关键词所对应的聚类。本实施可以通过聚类子单元7042对历史用户使用的搜索词的聚类,以得到该关键词的同义词或相似词。
[0163]用户行为确定子单元7044,用于根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
[0164]文档获取单元705用于获取所述历史用户行为所产生的文档。
[0165]分词单元706用于对所述文档进行分词,得到至少一个候选建议。
[0166]其中分词单元706可以是对所述文档的标题和/或属性内容进行分词。属性内容用于表示文档的属性。例如,若文档具体为一篇文章,属性内容可以为文章摘要、文章总结等等,若文档具体为商品信息时,属性内容可以为商品介绍等等。
[0167]在分词单元706对文档,或者文档的标题和/或属性内容进行分词时,可以基于现有的分词工具、还可以基于词典、或者基于分词模型等统计方法,例如基于n g r am模型进行分词。
[0168]筛选单元707用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
[0169]在筛选单元707根据重要度特征进行筛选时,可以是选择重要度特征最高的一个或多个候选建议,也可以是设置一个特征阈值,选择大于特征阈值的一个或多个候选建议。
[0170]由于离线列表是在用户输入搜索词之前就已经制作好的,因此可以设置一个预设时间点,在筛选单元707获取候选建议的重要度特征时,具体可以是基于预设时间点之前的相关数据。例如,候选建议的重要度特征可以由筛选单元707基于当天之前的相关数据获取得到。为了使得重要度特征能够具有实时性,本申请实施例中的候选建议的重要度特征还可以由筛选单元707基于所述预设时间点之后的相关数据,每隔预设周期进行修正
[0171]其中,重要度特征用于表示候选建议的重要性,而获取重要度特征时基于的相关数据可以包括以下参数中的至少一项:
[0172]候选建议的T F — I D F值、候选建议与第一搜索词共同被搜索的次数和/或频率、候选建议与所述历史用户行为相关的次数和/或频率、候选建议的词语属性值、以及候选建议的标注属性值。
[0173]其中,在计算重要度特征时,还可以对上述每个参数设置不同的权重。
[0174]在本申请实施例中,离线列表中的任一关键词对应的搜索建议具体可以为经过同义词和/或停用词过滤的搜索建议。
[0175]
[0176]实施例四
[0177]与本申请上述搜索建议提供方法的第二实施例相对应,参见图8,本申请还提供了搜索建议提供装置的第二实施例,与搜索建议提供装置第一实施例不同的是,在本实施例中,第一搜索词具体为当前用户选择的搜索建议。
[0178]在本实施例中,该装置包括:第一搜索词获取单元801、关键词匹配单元802、第一建议提供单元803、用户行为获取单元804、文档获取单元805、分词单元806、筛选单元807、第二搜索词获取单元808和第二建议提供单元809。
[0179]第二搜索词获取单元808用于获取当前用户输入的第二搜索词。需要说明的是,第二搜索词可以是当前用户直接输入的搜索词,当然也可以是根据当前用户直接输入的搜索词生成的搜索建议。
[0180]第二建议提供单元809用于向当前用户提供与所述第二搜索词对应的搜索建议。
[0181]这里向当前用户提供与第二搜索词对应的搜索建议的具体方式不受限定,例如当前用户输入第二搜索词“雾霾”之后,可以通过关键词匹配单元802以及第一建议提供单元803,实现向当前用户提供第二搜索词对应的搜索建议。当然,这里也可以采用现有技术的任一种提供搜索建议的方式,例如基于当前用户的搜索历史向当前用户提供对应的搜索建议等等,对此本申请实施例不再详述。
[0182]第一搜索词获取单元801用于获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的第一搜索词。
[0183]向当前用户提
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1