热点事件与实时评论的获取方法及装置的制作方法

文档序号:6435798阅读:416来源:国知局
专利名称:热点事件与实时评论的获取方法及装置的制作方法
技术领域
本发明涉及信息检索领域,尤其涉及一种热点事件与实时评论的获取方法及装置。
背景技术
通过搜索门户的搜索,可以获取到时事类网站的热点事件与实时评论等相关时事类内容;但是目前国内包括世界的时事类内容的发现与追踪,基本上还依赖于传统的人工整理的方法,该人工整理的方法获取的时事类内容准确,但无法快速发现并获取当前的热点事件与实时评论。

发明内容
本发明的实施例提供一种热点事件与实时评论的获取方法及装置,能够快速发现并获取当前的热点事件与实时评论。为达到上述目的,本发明的实施例采用如下技术方案一种热点事件与实时评论的获取方法,包括实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息;为所述最新热点事件与实时评论的相关信息建立实时索引;根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容;将与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示。一种热点事件与实时评论的获取装置,包括第一获取单元,用于实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息;索引建立单元,用于为所述第一获取单元获取的最新热点事件与实时评论的相关信息建立实时索引;第二获取单元,用于根据用户输入的查询关键字和查询参数查询所述实时索引, 获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容;显示单元,用于将所述第二获取单元获取的与所述检索关键字对应的热点事件与实时评论的相关内容显示。本发明实施例提供的方法及装置,用户在获取与查询关键字和查询参数对应的点事件与实时评论的相关信息时,是查询从各个时事评论网站用户发布的最新热点事件与实时评论的相关信息的实时索引获取的,所以检测到的与该查询关键字和查询参数对应的热点事件与实时评论的相关内容比比较快速,与现有技术中依赖于传统的人工整理的方法相比,实现了快速发现并获取当前的热点事件与实时评论的目的。


为了更清楚地说明本发明实施例,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例中一种热点事件与实时评论的获取方法流程图;图2为本发明实施例中一种实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息的方法流程图;图3为本发明实施例中当使用爬虫系统在按照社会化信息实时获取各个时事评论网站用户的基本信息的方法流程图;图4为本发明实施例中通过搜索门户和索引系统的交互实现获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容的方法流程图;图5为本发明实施例中根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容的方法流程图;图6为本发明实施例中一种热点事件与实时评论的获取装置的组成框图;图7为本发明实施例中另一种热点事件与实时评论的获取装置的组成框图;图8为本发明实施例中另一种热点事件与实时评论的获取装置的组成框图;图9为本发明实施例中另一种热点事件与实时评论的获取装置的组成框图;图10为本发明实施例中另一种热点事件与实时评论的获取装置的组成框图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明的实施例提供一种热点事件与实时评论的获取方法,如图1所示,该方法包括101、实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信
肩、ο其中,所述实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息,可以通过但不局限于以下的方法实现,如图2所示,包括1011、按照社会化信息实时获取各个时事评论网站用户的基本信息,所述用户的基本信息包含用户的统一资源定位符(Uniform/Universal Resource Locator,Url)信息, 所述社会化信息包括用户的粉丝列表和/或关注列表;另外,该用户的基本信息除了 Url信息外,还保护用户标识、用户昵称等其他信息,本发明实施例对此不进行具体的限制。其中,按照社会化信息实时获取各个时事评论网站用户的基本信息,可以通过实时爬虫系统实现,但本发明实施例对此并不进行限制,任何可以实时获取各个时事评论网站用户的基本信息的方法,都属于本发明实施例保护的范围。另外,需要说明的是,当使用爬虫系统在按照社会化信息实时获取各个时事评论网站用户的基本信息时,可以通过触发并调度已存储的用户基本信息库来实现,具体如图3所示为首先,调度模块接收发现模块提交的发现各个时事评论网站用户的基本信息发现请求;其次,调度模块按照社会化信息从用户基本信息库(用户种子库)获取各个时事评论网站用户的基本信息(用户种子信息),并将用户的基本信息返回给发现模块,发现模块便获取了各个时事评论网站用户的基本信息。1012、根据所述tol信息下载对应网页内容。另外,为了能够以最快的方式获取最新,最热,最及时的时事评论信息,在根据所述tol信息下载所述用户发布的评论内容时,可以通过多线程并采用异步的方式,根据所述tol信息下载所述用户发布的评论信息。需要说明的是,当步骤1011中将获取的链接暂存时,在执行步骤1012之前,需要调度模块调度出该链接。另外,需要说明的是,在获取了所述用户的tol信息之后,可以直接执行步骤1013 的操作,也可以将该获取链接暂存,等待调度模块的调度之后再执行步骤1013的操作,本发明实施例对此不进行限制。当将该用户的Url信息暂存时,可以为该用户的Url信息设置一个缓存队列,将该用户的Url信息暂存到存储队列中,当被调度模块调用时,按照队列先进先出的原则,将先缓存的用户的tol信息调出,以保证获取的热点事件与实时评论的相关信息实时性;但本发明实施例对此也不进行具体限制,任何可以暂存该用户的Url信息的存储方式,都属于本发明实施例保护的范围,考虑到队列先进先出的特性,优选队列暂存。1013、解析所述网页内容,获取所述用户发布的最新热点事件与实时评论的相关
fn息ο102、为所述最新热点事件与实时评论的相关信息建立实时索引。其中,所述实时索引包括内存索引和磁盘索引;为所述最新热点事件与实时评论的相关信息建立实时索引包括通过索引接口为所述最新热点事件与实时评论的相关信息建立内存索引;当所述内存索引超过预定大小后,将所述内存索引合并到磁盘索引。103、根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容。在具体实施该步骤时,该通过搜索门户和索引系统的交互实现,具体的如图4所示,包括首先,用户通过搜索门户输入查询关键字和查询参数;其次,索引系统在接收到用户输入的查询关键字和查询参数后,根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容;再次, 索引系统将获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容返回给搜索门户。其中,在根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容时,可以通过但不局限于以下的方法实现,具体如图5所示,该方法包括1031、对所述查询关键字进行分词处理,并根据所述查询参数拼装查询逻辑。1032、根据分词处理后的查询关键字和所述查询逻辑查询所述实时索引,得到查询结果。1033、对所述查询结果进行归并、二次排序以及过滤操作,得到与所述查询关键字
6和查询参数对应的热点事件与实时评论的相关内容。104、将与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示。
其中,在将与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示时,可以根据用户具体的需求,将该与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容,以图文并茂的方式重组,并将重组后的以图文并茂与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示给检索用户,达到界面友好的目的,但本发明实施例对此不进行限制,任何显示该与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容的显示方法,都属于本发明实施例保护的范围之内。进一步的,在按照社会化信息实时获取各个时事评论网站用户的基本信息之后, 还可以将所述用户的基本信息保存到基本信息数据库,以便查询用户在查询时的再次使用。进一步的,为了方便实时评论信息在数据库中的存储,本发明实施例在数据库中分别预定义了用户信息表、评论内容信息表和用户表;其中,所述用户信息表用户存储时事评论用户的基本信息;所述评论内容信息表用户存储评论内容;所述用户表用于存储用户的标识和用户的Url信息。在根据所述Url信息下载所述用户发布的最新热点事件与实时评论的相关信息之后,根据所述Url信息和下载的所述用户发布的最新热点事件与实时评论的相关信息,更新数据库中预定义的评论内容信息表和用户表。其中,更新用户信息表的操作具体操作包括在根据所述链接获取所述用户的基本信息之后,查询存储在数据库中的预定义的用户信息表,确定所述用户信息表中是否存在所述用户的基本信息;若所述用户信息表中不存在所述用户的基本信息,则将用户的基本信息存储在所述用户信息表中;若所述用户信息表中存在所述用户的基本信息,则在所述用户信息表中更新所述用户的基本信息。其中,更新评论内容信息表和用户表的操作具体包括在根据所述tol信息下载所述用户发布的评论内容之后,根据所述tol信息和下载的所述用户发布的评论内容,更新数据库中预定义的评论内容信息表和用户表。需要说明的是,本发明实施例中的数据库可以为分布式数据库,但本发明实施例对此不进行限制。本发明实施例中,用户在获取与查询关键字和查询参数对应的点事件与实时评论的相关信息时,是查询从各个时事评论网站用户发布的最新热点事件与实时评论的相关信息的实时索引获取的,所以检测到的与该查询关键字和查询参数对应的热点事件与实时评论的相关内容比比较快速,与现有技术中依赖于传统的人工整理的方法相比,实现了快速发现并获取当前的热点事件与实时评论的目的。并且,本发明实施例中,在根据所述tol信息下载所述用户发布的评论信息时,可以通过多线程并采用异步的方式,根据所述tol信息下载所述用户发布的评论信息,能够以最快的方式获取最新,最热,最及时的时事评论信息。本发明的实施例还提供一种热点事件与实时评论的获取装置,如图6所示,包括 第一获取单元21、索引建立单元22、第二获取单元23、显示单元对。第一获取单元21,用于实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息。索引建立单元22,用于为所述第一获取单元获取的最新热点事件与实时评论的相关信息建立实时索引。第二获取单元23,用于根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容。显示单元M,用于将所述第二获取单元获取的与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示。其中,在所述显示单元M将所述与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示时,可以根据用户具体的需求, 将该与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容,以图文并茂的方式重组,并将重组后的以图文并茂与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示给检索用户,达到界面友好的目的,但本发明实施例对此不进行限制, 任何显示该与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容的显示方法,都属于本发明实施例保护的范围之内。进一步,如图7所示,所述第一获取单元21包括第一获取模块211、下载模块 212、解析获取模块213。第一获取模块211,用于按照社会化信息实时获取各个时事评论网站用户的基本信息,所述用户的基本信息包含用户的Url信息,所述社会化信息包括用户的粉丝列表和/ 或关注列表;另外,该用户的基本信息除了 Url信息外,还保护用户标识、用户昵称等其他信息;其中,所述第一获模块211按照社会化信息实时获取各个时事评论网站用户的基本信息,可以通过实时爬虫系统实现,但本发明实施例对此并不进行限制,任何可以获取各个时事评论网站用户用户的基本信息的方法,都属于本发明实施例保护的范围。下载模块212,用于根据所述tol信息下载对应网页内容;其中,所述下载模块213 根据所述tol信息下载对应网页内容时,可以通过多线程并采用异步的方式进行,但本发明实施例对此不进行限制。解析获取模块214,用于解析所述网页内容,获取所述用户发布的最新热点事件与实时评论的相关信息。进一步可选的,如图8所示,该热点事件与实时评论的获取装置还包括数据保存单元25。数据保存单元25,用于在按照社会化信息实时获取各个时事评论网站用户的基本信息之后,将所述用户的基本信息保存到数据库。进一步可选的,所述实时索引包括内存索引和磁盘索引;如图9所示,所述索引建立单元22包括索引建立模块221和索引合并模块222。索引建立模块221,用于通过索引接口为所述最新热点事件与实时评论的相关信息建立内存索引。索引合并模块222,用于当所述内存索引超过预定大小后,将所述内存索引合并到磁盘索引。进一步可选的,如图10所示,所述第二获取单元23包括分词处理模块231、拼装模块232、查询模块233、获取模块234。分词处理模块231,用于对所述查询关键字进行分词处理;
8
拼装模块232,用于根据所述查询参数拼装查询逻辑;查询模块233,用于根据分词处理后的查询关键字和所述查询逻辑查询所述实时索引,得到查询结果;获取模块234,用于对所述查询结果进行归并、二次排序以及过滤操作,得到与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容。需要说明的是,本发明实施例所包含各功能模块的其他描述,可以参考图1至图5 对应的描述,本发明实施例此处将不再赘述。本发明实施例中,用户在获取与查询关键字和查询参数对应的点事件与实时评论的相关信息时,是查询从各个时事评论网站用户发布的最新热点事件与实时评论的相关信息的实时索引获取的,所以检测到的与该查询关键字和查询参数对应的热点事件与实时评论的相关内容比比较快速,与现有技术中依赖于传统的人工整理的方法相比,实现了快速发现并获取当前的热点事件与实时评论的目的。并且,本发明实施例中,在根据所述tol信息下载所述用户发布的评论信息时,可以通过多线程并采用异步的方式,根据所述tol信息下载所述用户发布的评论信息,能够以最快的方式获取最新,最热,最及时的时事评论信息通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本发明各个实施例所述的方法。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
权利要求
1.一种热点事件与实时评论的获取方法,其特征在于,包括实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息;为所述最新热点事件与实时评论的相关信息建立实时索引;根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容;将与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示。
2.根据权利要求1所述的方法,其特征在于,所述实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息,包括按照社会化信息实时获取各个时事评论网站用户的基本信息,所述用户的基本信息包含用户的统一资源定位符Url信息,所述社会化信息包括用户的粉丝列表和/或关注列表;根据所述Url信息下载对应网页内容;解析所述网页内容,获取所述用户发布的最新热点事件与实时评论的相关信息。
3.根据权利要求2所述的方法,其特征在于,在按照社会化信息实时获取各个时事评论网站用户的基本信息之后,还包括将所述用户的基本信息保存到基本信息数据库。
4.根据权利要求1所述的方法,其特征在于,所述实时索引包括内存索引和磁盘索引; 为所述最新热点事件与实时评论的相关信息建立实时索引包括通过索引接口为所述最新热点事件与实时评论的相关信息建立内存索引;当所述内存索引超过预定大小后,将所述内存索引合并到磁盘索引。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容包括对所述查询关键字进行分词处理,并根据所述查询参数拼装查询逻辑;根据分词处理后的查询关键字和所述查询逻辑查询所述实时索引,得到查询结果;对所述查询结果进行归并、二次排序以及过滤操作,得到与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容。
6.一种热点事件与实时评论的获取装置,其特征在于,包括第一获取单元,用于实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息;索引建立单元,用于为所述第一获取单元获取的最新热点事件与实时评论的相关信息建立实时索引;第二获取单元,用于根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容;显示单元,用于将所述第二获取单元获取的与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示。
7.根据权利要求6所述的装置,其特征在于,所述第一获取单元包括第一获取模块,用于按照社会化信息实时获取各个时事评论网站用户的基本信息,所述用户的基本信息包含用户的统一资源定位符Url信息,所述社会化信息包括用户的粉丝列表和/或关注列表;下载模块,用于根据所述Url信息下载对应网页内容;解析获取模块,用于解析所述网页内容,获取所述用户发布的最新热点事件与实时评论的相关信息。
8.根据权利要求7所述的装置,其特征在于,还包括数据保存单元,用于在按照社会化信息实时获取各个时事评论网站用户的基本信息之后,将所述用户的基本信息保存到数据库。
9.根据权利要求6所述的装置,其特征在于,所述实时索引包括内存索引和磁盘索引; 所述索引建立单元包括索引建立模块,用于通过索引接口为所述最新热点事件与实时评论的相关信息建立内存索引;索引合并模块,用于当所述内存索引超过预定大小后,将所述内存索引合并到磁盘索引。
10.根据权利要求6-9任一项所述的装置,所述第二获取单元包括 分词处理模块,用于对所述查询关键字进行分词处理;拼装模块,用于根据所述查询参数拼装查询逻辑;查询模块,用于根据分词处理后的查询关键字和所述查询逻辑查询所述实时索引,得到查询结果;获取模块,用于对所述查询结果进行归并、二次排序以及过滤操作,得到与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容。
全文摘要
本发明实施例公开了一种热点事件与实时评论的获取方法及装置,涉及信息检索领域,能够快速发现并获取当前的热点事件与实时评论。本发明的方法包括实时获取各个时事评论网站用户发布的最新热点事件与实时评论的相关信息;为所述最新热点事件与实时评论的相关信息建立实时索引;根据用户输入的查询关键字和查询参数查询所述实时索引,获取与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容;将与所述查询关键字和查询参数对应的热点事件与实时评论的相关内容显示。本发明的实施例主要用于热点事件与实时评论的获取过程中。
文档编号G06F17/30GK102508884SQ20111031730
公开日2012年6月20日 申请日期2011年10月18日 优先权日2011年10月18日
发明者刘坤, 刘飞, 王泽辉, 罗鑫平, 陈远翔 申请人:盘古文化传播有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1