关键词推送的方法及装置与流程

文档序号:12824807阅读:330来源:国知局
关键词推送的方法及装置与流程

本发明涉及互联网技术领域,尤其涉及一种关键词推送的方法及装置。



背景技术:

随着互联网技术的发展,网络提供给人们的信息量越来越大。各种网站中包含的信息量也是来越大,为了提高获取信息的效率,通常网站会推出一些辅助的手段,比如在用户通过搜索功能获取信息时推出一些热点的关键词供用户选择,一定程度上提高了获取信息的效率。

但是通常推送的热点的关键词是由网站的开发人员根据经验选取的,然后将这些关键词推送到网站中为用户搜索提供方便,但是这种被动的推送方式并没有考虑到用户的区域化需求,比如在一些政府网站中,许多的搜索信息具有地域特征,不同的地域的用户所关注的信息是不同的,而上述方法推送的关键词往往是没有区别的,因此影响了获取信息效率的提高。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种关键词推送的方法及装置。

为解决上述技术问题,一方面,本发明提供了一种关键词推送的方法,该方法包括:

获取网站在预设时段内产生的历史关键词;

统计对应不同地理范围的历史关键词的累计搜索次数,所述地理范围为使用所述历史关键词进行搜索的客户端所属的地理范围;

根据所述累计搜索次数,对对应不同地理范围的历史关键词分别进行排序;

在所述客户端访问所述网站时,根据所述客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给所述客户端。

另一方面,本发明还提供了一种关键词推送的装置,该装置包括:

获取单元,用于获取网站在预设时段内产生的历史关键词;

统计单元,用于统计对应不同地理范围的历史关键词的累计搜索次数,所述地理范围为使用所述历史关键词进行搜索的客户端所属的地理范围;

排序单元,用于根据所述累计搜索次数,对对应不同地理范围的历史关键词分别进行排序;

推送单元,用于在所述客户端访问所述网站时,根据所述客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给所述客户端。

借由上述技术方案,本发明提供的关键词推送的方法及装置,能够通过获取网站在预设时段内产生的历史关键词,然后对获取到的历史关键词进行统计,得到不同的地理范围内的历史关键词的累计搜索次数,然后根据得到的累计搜索次数对不同的地理范围内的历史关键词进行排序。当客户端访问该网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端。与现有技术相比,本发明能够根据客户端所属的不同的地理范围,将预设时段内客户端在网站中进行获取信息时通过搜索功能使用的历史关键词分别进行统计并排序,实现当客户端访问网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端,进而使客户端可以根据推送的具有时间及地域个性化的关键词进行搜索,提高了客户端在网站中获取信息的效率。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种关键词推送的方法流程图;

图2示出了本发明实施例提供的另一种关键词推送的方法流程图;

图3示出了本发明实施例提供的一种关键词推送的装置的组成框图;

图4示出了本发明实施例提供的另一种关键词推送的装置的组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

为解决现有在网站中获取信息效率低的问题,本发明实施例提供了一种关键词推送的方法,如图1所示,该方法包括:

101、获取网站在预设时段内产生的历史关键词。

获取在预设时段内访问网站的所有客户端在使用搜索功能进行信息搜索时使用的历史关键词。所述预设时段可以是在获取历史关键词的当前时间的前一周、前十天或者前一个月等。具体的预设时段的选取可以根据网站更新信息的周期或者特殊情况的需求选择合适的预设时段。

102、统计对应不同地理范围的历史关键词的累计搜索次数。

对由步骤101获取到的预设时段内的历史关键词进行分类统计,具体的是按照不同的地理范围将历史关键词进行分类,并将得到的不同地理范围内的历史关键词进行搜索次数的统计,得到每个历史关键词在预设时段内对应的累计搜索次数,一个历史关键词对应一个累计搜索次数。其中地理范围为使用历史关键词进行搜索的客户端所属的地理范围。

103、根据累计搜索次数,对对应不同地理范围的历史关键词分别进行排序。

在对不同地理范围内的历史关键词进行累计搜索次数的统计之后,还需要根据累计搜索次数的多少分别对不同地理范围内的历史关键词进行排序,对于累计搜索次数相同的历史关键词随机进行排序,排序中不存在相同排序序号,最终得到一个地理范围内对应一个历史关键词的排序。

需要说明的是对历史关键词进行排序的排序规则可以是由多到少或者由少到多。

104、在客户端访问网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端。

当某一客户端进行网站的访问时,首先确定该客户端所属的地理范围,然后将根据对应地理范围为客户端个性化推送关键词。具体的个性化推送过程为:确定访问网站的客户端所属的地理范围;查找所属地理范围对应的由步骤104得到的历史关键词的排序;从排序中累计搜索次数最多的历史关键词开始提取预设数量的关键词;将预设数量的关键词推送给该客户端。其中预设数量的值可以根据实际的网站的需求进行具体的设定。

另外,将所述关键词推送给客户端指的是将预设数量的关键词推送到网站中,具体的推送形式可以为:在客户端打开网站时将关键词推送到网站的搜索功能框的下方或者网站中其他的位置;或者当客户端打开网站并且使用搜索功能进行搜索时,即当搜索功能框处于输入状态时,在搜索功能框下方的一个动态显示的窗口中显示关键词,其中动态显示是指当用户在确定搜索的关键词之后该窗口消失。此外,对推送的关键词在网站中的显示的位置顺序没有特别的规定,在网站设计时可以自由设定。

本实施例提供的关键词推送的方法,能够通过获取网站在预设时段内产生的历史关键词,然后对获取到的历史关键词进行统计,得到不同的地理范围内的历史关键词的累计搜索次数,然后根据得到的累计搜索次数对不同的地理范围内的历史关键词进行排序。当客户端访问该网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端。与现有技术相比,本实施例能够根据客户端所属的不同的地理范围,将预设时段内客户端在网站中进行获取信息时通过搜索功能使用的历史关键词分别进行统计并排序,实现当客户端访问网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端,进而使客户端可以根据推送的具有时间及地域 个性化的关键词进行搜索,提高了客户端在网站中获取信息的效率。

进一步的,作为对图1所示实施例的细化及扩展,本发明还提供了另一实施例。如图2所示,该实施例中关键词推送的方法包括:

201、从网站的log日志中提取历史关键词对应的时间信息。

客户端在访问网站时,对应网站的服务器通常会产生多种类型的log日志文件,这些log日志文件中记录了关于客户端访问网站以及与网站服务器交互的信息。因此从这些log日志文件中可以获取客户端在网站中使用历史关键词进行搜索的时间信息。所以在获取历史关键词之前首先要获取到网站的log日志文件,然后从log日志文件中提取历史关键词的时间信息,本实施中提取的时间信息为客户端使用历史关键词进行搜索的起始时间。需要说明的是从网站的log日志中提取历史关键词对应的时间信息,就是从网站的log日志文件中提取历史关键词对应的时间信息。

202、根据时间信息获取预设时段内的历史关键词。

根据由步骤201提取到的时间信息即起始时间来获取预设时段内客户端在网站中进行搜索使用的所有历史关键词,历史关键词也是从网站log日志中提取得到的。具体的是将初始时间在预设时段内的对应的所有的历史关键词提取出来。

203、从网站的log日志中提取使用历史关键词进行搜索的客户端的网间协议(internetprotocol,简称ip)地址。

在网站的log日志中不仅记录有关于客户端访问网站以及与网站服务器交互的信息,而且还记录有每个客户端的行为对应的客户端的ip地址。因此,从网站的log日志中也可以提取到使用历史关键词进行搜索的客户端的ip地址。

204、根据ip地址记录使用历史关键词进行搜索的客户端所属的地理范围。

根据由步骤203中提取得到的ip地址来记录使用历史关键词进行搜索的客户端所属的地理范围。具体的是通过对ip地址的预定字段的识别,确定使用历史关键词进行搜索的客户端所属的地理范围并记录下来。其中,预定字段中的不同数值对应不同的地区或国家。

需要说明的是,ip地址是根据不同类型的网络定义的,通常使用的网络包含a、b、c三种网络。对于三种不同的网络对应ip地址中,预定字段的定义也是不同的。若为a类网络,则预定字段是指ip地址中的第一段号码;若为b类网络,则预定字段是指ip地址中的第一段和第二段号码;若为c类网络,则预定字段是指ip地址中的第一段、第二段以及第三段号码。对ip地址的预定字段的识别是指,将得到的客户端的ip地址与ip地址库中的ip地址的对应的预定字段进行比对,根据比对的结果就可以确定使用历史关键词进行搜索客户端所属的地理范围。

另外还需要说明的是,本实施例中的可以提供的ip地址库中包括国内所有的省、市、县(区)以及其他国家ip地址,对于其他国家的ip地址只能识别是哪个国家的,不能细化到各省市。

205、统计对应不同地理范围的历史关键词的累计搜索次数。

该步骤中统计历史关键词的累计搜索次数的实现方式与图1步骤102的实现方式相同,此处不再赘述。但是需要另外说明的,其中的地理范围是根据步骤204中ip地址确定的地理范围。在将地理范围进行分为不同的地理范围时,可以将不同的地理范围定义为不同的县(区),也可以定义为不同的市等。具体的可以根据网站提供的信息表现出的区域差异性来设定。若网站提供的信息主要着重于不同的市,并不具体到每个市所对包括的县(区)的信息,则将不同的地理范围设定为不同的市;若网站提供的信息主要着重于一个市中不同的县(区),则将不同的地理范围设定为不同的县(区)。

206、根据累计搜索次数,对对应不同地理范围的历史关键词分别进行排序。

该步骤的实现方式与图1步骤103的实现方式相同,此处不再赘述。

207、在客户端访问网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端。

该步骤的实现方式与图1步骤104的实现方式相同,此处不再赘述。

进一步的,作为对上述图1和图2所示方法的实现,本发明实施例另 一实施例还提供了一种关键词推送的装置,用于对上述图1和图2所示的方法进行实现。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图3所示,该装置包括:获取单元31、统计单元32、排序单元33及推送单元34。

获取单元31,用于获取网站在预设时段内产生的历史关键词;

统计单元32,用于统计对应不同地理范围的历史关键词的累计搜索次数,地理范围为使用历史关键词进行搜索的客户端所属的地理范围;

排序单元33,用于根据累计搜索次数,对对应不同地理范围的历史关键词分别进行排序;

推送单元34,用于在客户端访问网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端。

进一步的,如图4所示,装置进一步包括:

第一提取单元35,用于在获取网站在预设时段内产生的历史关键词之前,从网站的log日志中提取历史关键词对应的时间信息,时间信息为客户端使用历史关键词进行搜索的起始时间。

进一步的,获取单元31用于:

根据时间信息获取预设时段内的历史关键词。

进一步的,如图4所示,装置进一步包括:

第二提取单元36,用于在统计对应不同地理范围的历史关键词的累计搜索次数之前,从网站的log日志中提取使用历史关键词进行搜索的客户端的网间协议ip地址;

记录单元37,用于根据ip地址记录使用历史关键词进行搜索的客户端所属的地理范围。

进一步的,记录单元37用于:

通过对ip地址的预定字段的识别,确定使用历史关键词进行搜索的客户端所属的地理范围,其中,预定字段中的不同数值对应不同的地区或国家。

本实施例提供的关键词推送的装置,能够通过获取网站在预设时段内产生的历史关键词,然后对获取到的历史关键词进行统计,得到不同的地理范围内的历史关键词的累计搜索次数,然后根据得到的累计搜索次数对不同的地理范围内的历史关键词进行排序。当客户端访问该网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端。与现有技术相比,本实施例能够根据客户端所属的不同的地理范围,将预设时段内客户端在网站中进行获取信息时通过搜索功能使用的历史关键词分别进行统计并排序,实现当客户端访问网站时,根据客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给客户端,进而使客户端可以根据推送的具有时间及地域个性化的关键词进行搜索,提高了客户端在网站中获取信息的效率。

所述关键词推送的装置包括处理器和存储器,上述获取单元31、统计单元32、排序单元33及推送单元34等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取网站在预设时段内产生的历史关键词;统计对应不同地理范围的历史关键词的累计搜索次数,所述地理范围为使用所述历史关键词进行搜索的客户端所属的地理范围;根据所述累计搜索次数,对对应不同地理范围的历史关键词分别进行排序;在所述客户端访问所述网站时,根据所述客户端所属的地理范围对应的历史关键词的排序,从累计搜索次数最多的历史关键词开始顺序提取预设数量的关键词推送给所述客户端。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁 盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1