时效需求识别方法及装置的制造方法

文档序号:9375820阅读:627来源:国知局
时效需求识别方法及装置的制造方法
【专利说明】
【技术领域】
[0001]本发明涉及互联网技术领域,尤其涉及一种时效需求识别方法及装置。
【【背景技术】】
[0002]用户在查询最近事件或热门人物时,不仅期望搜索结果与该事件或热门人物相关,而且还期望搜索结果是近期或最新的,即对搜索结果的时效性具有一定需求。将用户对搜索结果的时效性的需求,称为时效需求。
[0003]在一种识别时效需求的方法中,考虑到有时效需求的搜索词(query)的检索频次在某一时间点会突然增长或在某一时间段会持续增长,基于该特点,通过对用户的qu e r y进行挖掘,以挖掘出具有时效需求的query,进而识别出时效需求。但是,这种方法很大程度上依赖用户的检索行为数据,即通过query检索频次的变化特征识别出时效需求,属于基于后验知识的识别方法,识别效率较低。

【发明内容】

[0004]本发明的多个方面提供一种时效需求识别方法及装置,用以提高识别时效需求的效率。
[0005]本发明的一方面,提供一种时效需求识别方法,包括:
[0006]接收用户输入的搜索词;
[0007]根据预先从时效站点报道的时效事件中提取出的能够反映时效需求的表达特征,识别所述搜索词是否具有时效需求。
[0008]本发明的另一方面,提供一种时效需求识别装置,包括:
[0009]接收模块,用于接收用户输入的搜索词;
[0010]识别模块,用于根据预先从时效站点报道的时效事件中提取出的能够反映时效需求的表达特征,识别所述搜索词是否具有时效需求。
[0011]在本发明中,预先从时效站点报道的时效事件中提取出能够反映时效需求的表达特征,基于预先提取的能够反映时效需求的表达特征,判断用户输入的搜索词是否具有时效需求。预先从时效站点报道的时效事件中提取的能够反映时效需求的表达特征属于先验知识,本发明充分利用时效需求识别的先验知识,不依赖于用户使用搜索词的检索行为数据等后验知识,可以更及时地识别出时效需求,提高了识别时效需求的效率。
【【附图说明】】
[0012]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本发明一实施例提供的时效需求识别方法的流程示意图;
[0014]图2为本发明一实施例提供的从时效站点报道的时效事件中提取表达特征的方法的流程示意图;
[0015]图3为本发明一实施例提供的步骤201的实施方式的流程示意图;
[0016]图4为本发明一实施例提供的时效需求识别装置的结构示意图;
[0017]图5为本发明另一实施例提供的时效需求识别装置的结构示意图。
【【具体实施方式】】
[0018]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0019]发明人通过对突发事件/热点人物/热门话题等时效事件的报道过程以及用户的搜索行为进行分析发现,现实世界中产生突发事件/热点人物/热门话题后,首先随之在一些站点上出现最早的报道,例如新闻报道,接着会有一些用户用不同形式的query进行搜索,于是出现一些更全面深入或简单转载的报道,根据时效事件的热度不同,有不同数量的用户继续进行搜索。在该突发事件/热点人物/热门话题持续一段时间后,用户对此关注度逐步降低,报道的数量和搜索的数量也降低。由此可见,某个时效事件产生后,首先是通过一些站点,例如新闻媒体等形成报道,然后才出现用户的搜索行为。能满足用户时效需求的查询结果必然是在相应的时效事件产生并被收录之后。为便于描述,将那些能够在用户的搜索行为之前及时报道时效事件的站点称为时效站点,例如,时效站点可以是新闻站点或一些能够及时转载新事件或热门话题的博客、论坛等。
[0020]根据上述特点,本发明提供一种时效需求识别方案,其主要原理是:预先从时效站点所报道的时效事件中提取能够反映时效需求的表达特征,这样在用户输入搜索词进行搜索时,可以基于预先提取的能够反映时效需求的表达特征判断用户的搜索词是否具有时效需求,用以提高识别时效需求的效率。
[0021]图1为本发明一实施例提供的时效需求识别方法的流程示意图。如图1所示,该方法包括:
[0022]101、接收用户输入的搜索词。
[0023]102、根据预先从时效站点报道的时效事件中提取出的能够反映时效需求的表达特征,判断搜索词是否具有时效需求。
[0024]在本实施例中,在用户输入搜索词进行搜索时,基于预先从时效站点报道的时效事件中提取出的能够反映时效需求的表达特征,对用户输入的搜索词进行时效需求识别。预先从时效站点报道的时效事件中提取出的能够反映时效需求的表达特征这一知识属于先验知识,本实施例充分利用时效需求识别的先验知识,不依赖于用户使用搜索词的检索行为数据等后验知识,有利于更及时地识别出时效需求,提高了识别时效需求的效率。
[0025]通过本实施例提供的方法对用户输入的搜索词进行时效需求识别,有利于满足用户的搜索需求,一旦识别出用户的搜索词具有时效需求,则可以向用户推荐与搜索词相关且满足时效需求的搜索结果,便于用户快速从搜索结果中获取所需的信息,提高用户对搜索结果的满意度。
[0026]在实施本实施例提供的时效需求识别方法之前,需要预先从时效站点报道的时效事件中提取出能够反映时效需求的表达特征。一种从时效站点报道的时效事件中提取表达特征的实施方式如图2所示,包括:
[0027]201、获取时效站点。
[0028]202、从时效站点报道的时效事件中,提取能够反映时效需求的表达特征。
[0029]203、存储表达特征。
[0030]在步骤203中,不限定表达特征的存储形式,例如可以将表达特征存储到特征词典、数据库或信息列表等中。
[0031]其中,步骤201,即获取时效站点的一种实施方式,如图3所示,包括:
[0032]2011、获取在距当前指定时间段内报道过新的时效事件的站点作为初始站点。
[0033]2012、统计初始站点的点击展现率、引用率及报道及时度中的至少一个。
[0034]2013、根据初始站点的点击展现率、引用率以及报道及时度中的至少一个,从所述初始站点中选择站点作为所述时效站点,直到所述时效站点对时效事件的覆盖率大于预设覆盖率门限为止。
[0035]在上述步骤2011中,所述距当前指定时间段内中的指定时间段可以是半年、一个月或两周等,则距当前指定时间段内可以是距当前半年内、距当前一个月内或距当前两周内等等。即在获取时效站点之前,首先获取在距当前半年、一个月或两周内等报道过新的时效事件的站点作为初始站点。
[0036]可选的,在获得初始站点之后,可以去除初始站点中的低质站点,所述低质站点是指站点质量低于质量门限的站点,例如已知的作弊站点或商品站点等。通过对初始站点进行过滤可以降低低质站点带来的不利影响,有利于提高后续提取到的表达特征的精度。
[0037]在上述步骤2012中,初始站点的点击展现率可以通过初始站点报道的时效事件的点击展现率获得。初始站点报道的时效事件的点击展现率是指对该初始站点报道的时效事件被点击次数与被展现次数进行加权平均获得的结果。
[0038]初始站点的引用率可以通过初始站点报道的时效事件的引用率获得。初始站点报道的时效事件的引用率是指时效事件在该初始站点上被其他站点引用或转载的次数与该时效事件被其它站点引用或转载的总次数的比值。
[0039]初始站点的报道及时度可以通过初始站点报道时效事件的时间与时效事件的发生时间之间的平均时间间隔来体现。该平均时间间隔越短,说明报道越及时,站点的时效性越强;该平均时间间隔越长,说明报道及时性越差,站点的时效性越差。例如,其中,初始站点报道时效事件的时间与时效事件的发生时间之间的平均时间间隔可以采用以下方式获取:选定若干历史时效事件,统计该初始站点报道每个历史时效事件的时间与每个历史时效事件的产生时间之间的时间间隔,再取若干个时间间隔的平均值。
[0040]值得说明的是,时效站点可以通过点击展现率、引用率及报道
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1