1.一种搜索关键词的类名选取方法,其特征在于,包括:
对目标网站的搜索关键词进行聚类,得到多类搜索关键词,其中,所述搜索关键词为对所述目标网站进行站内搜索时所采用的关键词,所述目标网站通过栏目划分站内页面;
查询所述搜索关键词在所述目标网站进行站内搜索时所着陆的着陆页面,确定所述搜索关键词对应的着陆页面所在栏目的栏目名称;
对于所述多类搜索关键词中每一类搜索关键词,从所述每一类搜索关键词所包含的搜索关键词对应的着陆页面所在栏目的栏目名称中选择一个栏目名称,作为该类搜索关键词的类名。
2.根据权利要求1所述的方法,其特征在于,从所述每一类搜索关键词所包含的搜索关键词对应的着陆页面所在栏目的栏目名称中选择一个栏目名称,作为该类搜索关键词的类名包括:
统计所述每一类搜索关键词中搜索关键词对应的着陆页面所在栏目的栏目名称的出现次数;以及
对于所述每一类搜索关键词,选择统计后出现次数最多的栏目名称作为该类搜索关键词的类名。
3.根据权利要求1所述的方法,其特征在于,在对目标网站的搜索关键词进行聚类,得到多类搜索关键词之前,所述方法还包括:
获取所述目标网站的历史访问数据;
对所述历史访问数据进行解析,得到所述目标网站的搜索关键词及其对应的着陆页面。
4.根据权利要求3所述的方法,其特征在于,在对所述历史访问数据进行解析,得到所述目标网站的搜索关键词及其对应的着陆页面之后,所述方法还包括:
建立所述搜索关键词与所述着陆页面的对应关系;
其中,查询所述搜索关键词在进行所述目标网站的站内搜索时所着陆的着陆页面包括:以所述搜索关键词为索引,利用所述对应关系查询所述搜索关键词对应的着陆页面。
5.根据权利要求1所述的方法,其特征在于,对目标网站的搜索关键词进行聚类,得到多类搜索关键词包括:
用K-means聚类算法对所述目标网站的搜索关键词进行聚类,得到所述多类搜索关键词。
6.一种搜索关键词的类名选取装置,其特征在于,包括:
聚类单元,用于对目标网站的搜索关键词进行聚类,得到多类搜索关键词,其中,所述搜索关键词为对所述目标网站进行站内搜索时所采用的关键词,所述目标网站通过栏目划分站内页面;
查询单元,用于查询所述搜索关键词在所述目标网站进行站内搜索时所着陆的着陆页面,确定所述搜索关键词对应的着陆页面所在栏目的栏目名称;
选择单元,用于对于所述多类搜索关键词中每一类搜索关键词,从所述每一类搜索关键词所包含的搜索关键词对应的着陆页面所在栏目的栏目名称中选择一个栏目名称,作为该类搜索关键词的类名。
7.根据权利要求6所述的装置,其特征在于,所述选择单元包括:
统计模块,用于统计所述每一类搜索关键词中搜索关键词对应的着陆页面所在栏目的栏目名称的出现次数;以及
选择模块,用于对于所述每一类搜索关键词,选择统计后出现次数最多的栏目名称作为该类搜索关键词的类名。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取单元,用于在对目标网站的搜索关键词进行聚类,得到多类搜索关键词之前,获取所述目标网站的历史访问数据;
解析单元,用于对所述历史访问数据进行解析,得到所述目标网站的搜索关键词及其对应的着陆页面。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
建立单元,用于在对所述历史访问数据进行解析,得到所述目标网站的搜索关键词及其对应的着陆页面之后,建立所述搜索关键词与所述着陆页面的对应关系;
其中,所述查询单元具体用于以所述搜索关键词为索引,利用所述对应关系 查询所述搜索关键词对应的着陆页面。
10.根据权利要求6所述的装置,其特征在于,所述聚类单元具体用于用K-means聚类算法对所述目标网站的搜索关键词进行聚类,得到所述多类搜索关键词。