一种处理舆情话题的方法、装置和系统与流程

文档序号:15683829发布日期:2018-10-16 20:51阅读:139来源:国知局

本发明涉及通信领域技术,尤其涉及一种处理舆情话题的方法、装置和系统。



背景技术:

随着互联网的迅猛发展,其作为一块正在加速膨胀的思想阵地,已成为舆情事件的重要发生地和扩散地。新闻网站不断转载各种媒体报道的事件;再加上互联网的虚拟性、隐蔽性、发散性和渗透性等特点,越来越多的人愿意通过各种互动社区表达个人对舆情事件的看法。互联网信息传播的速度极快,网络舆情的爆发将以“内容威胁”的形式逐渐对社会公共安全形成威胁,对舆情话题的传播、扩散、网民评论情况越来越难以全面掌握,舆情事件的发展趋势难以控制。



技术实现要素:

本发明实施例提供了一种处理舆情话题的方法、装置和系统,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。

本发明实施例提供了一种处理舆情话题的方法,该方法包括:在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。

相应的,本发明实施例提供了一种处理舆情话题的装置,包括:检索模块,用于在网络中检索包含舆情信息的舆情话题;获取模块,用于获取所述舆情话题的特征信息;检测模块,用于检测所述舆情话题的特征信息是否符合报警条件;存储模块,用于当符合报警条件时,保存所述舆情话题及其特征信息。

相应的,本发明实施例提供了一种处理舆情话题的系统,包括:网络侧服务器和处理舆情话题的装置;所述网络侧服务器,用于提供包含舆情信息的舆情话题;所述处理舆情话题的装置,用于在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。

本发明实施例提供了一种处理舆情话题的方法、装置及系统,用于在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。使用本发明实施例提供的处理舆情话题的方法、装置及系统,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且,可以对保存的舆情话题进行管理,并持续追踪,获取其传播、点击、评论等的变化趋势,全面掌握舆情话题。并且可以对舆情话题进行分析整理,生成舆情简报。

附图说明

图1为本发明实施例中处理舆情话题的方法流程示意图;

图2为本发明另一实施例中处理舆情话题的方法流程示意图;

图3为本发明另一实施例中处理舆情话题的装置示意图;

图4为本发明另一实施例中处理舆情话题的系统示意图。

具体实施方式

下面结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。

为了解决现有技术存在的问题,本发明实施例提供了一种处理舆情话题的方法,如图1所示,包括以下步骤:步骤101、在网络中检索包含舆情信息的舆情话题;具体的,用户通过输入舆情信息,检索包含该舆情信息的舆情话题,还可以选择数据库中存储的舆情信息进行检索,该舆情信息预先保存在数据库中并定期更新。该预先在数据库中存储的舆情话题的舆情信息,可以包括发布人、发布地点、发布时间、标题、分类等,当用户检索舆情话题时,可以主动将上述舆情信息提供给用户。

步骤102、获取舆情话题的特征信息,检测舆情话题的特征信息是否符合报警条件;具体的,可以在指定网站或全网中获取舆情话题的传播情况,例如可以在指定的网站中,根据预置的关键词规则和/或样本文档,获取该舆情话题的相关联话题及相似度,具体实现时可以使用网络爬虫技术进行采集;还可以在全部网络中,根据舆情话题的全网关键词,获取该舆情话题的相关联话题及相似度,具体实现时可以使用元搜索技术。该步骤主要提供原始统计数据,即在指定网站或者全部网络中,具有多少该舆情话题的相关联话题及相似度,当然,该相关联话题包括舆情话题本身。进行全网搜索时,可以主要搜索各种类型的站点,如网页类、新闻类、论坛类博客类等。

上述在关键词规则和样本文档之间的逻辑关系可以是“与”,也可以是“或”,其中关键词搜索采用布尔逻辑运算的复杂条件,样本文档可采用单一文本片段或多文本片段。而且使用多样本文档方式时,可以通过不同片段找到相关信息,多角度综合获知舆情话题的情况,有效的解决同一事件不同描述方式的问题。

还可以获取该舆情话题在网络中的敏感信息、转载量、点击量、评论量、持续时间长度和相关联话题量等特征信息的数量和/或数量的变化量,并与预置的报警阈值进行比较;若大于报警阈值,则检测结果为符合报警条件;若不大于报警阈值,则检测结果为不符合报警条件。上述报警阈值可以为一项或者多项,具体使用时与获取的舆情话题的特征信息相对应,例如获取了舆情话题的点击量、回复量,则进行检测时使用点击量报警阈值和回复量报警阈值。而且,检测时可以同时使用某一个或多个特征信息的数量,还可以同时使用某一个或多个特征信息的数量增加量、增加率,还可以既使用一个或多个特征信息的数量,又使用一个或多个特征信息的数量增加量等。

其中,获取敏感信息时,需要对包含舆情话题的网页文本数据进行分词处理,然后根据预置的敏感词,获取网页文本数据中的敏感信息。具体的,运用中文分词技术对网页文本数据进行分词处理,正序及倒序的分析网页文本中的所有词,然后根据预置的敏感词,获取该网页中具有的敏感词。该预置的敏感词存储在数据库中,根据国家法律规定的敏感词进行设置,或者用户自行设置。

步骤103、当符合报警条件时,保存舆情话题及其特征信息。

具体的,当该舆情话题的一个或多个特征信息符合报警条件时,保存该舆情话题及其特征信息,可以采用数据挖掘技术定期进行对其分析及追踪,以便获知该舆情话题的进展。例如通过周期性分析舆情话题的转载情况及点击量、评论量的变化过程,形成对该舆情话题的连续追踪。用户可以通过修改定时器来设定或修改定期分析的具体时间。

然后,可以保存分析结果并展示,以便用户查看。保存分析结果时,可以按照分析时间的不同分别保存,以便查看某个时间段中该舆情话题的相关信息,该相关信息包括舆情话题分布情况、点击量及评论量等。管理保存的多个舆情话题时,还可以按照相似度进行分类,查看时可以在某类话题下查找相应的舆情话题的分析结果,例如相关信息、变化趋势、是否报警等。

此外,还可以根据舆情话题的特征信息,生成舆情简报,例如对舆情话题的所属网站、发布时间、传播路径等进行统计分析,生成舆情简报并保存在分析结果中,以便辅助用户更好的把握舆情传播规律,为制定舆情处理和舆情引导提供数据依据,还可以查看引导效果。

通过上述描述,可以看出,使用本发明实施例提供的处理舆情话题的方法,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且能够对舆情话题进行管理,并进行持续追踪,分析舆情话题的传播、点击、评论的变化趋势,对需要预警的话题进行预警提示。还可以自动对互联网上的舆论信息进行综合分析整理,为生成舆情简报提供数据材料。进一步支撑全面掌握舆情事件,为舆论处理和引导决策提供重要支持,持续追踪分析舆论引导的效果。

检索舆情话题时,用户可以按照需要添加话题,还可以同时设置多篇样例文本或关键词,多角度描述该话题,以便全面分析话题的传播演化趋势;并可以选择通过元搜索技术对互联网信息进行统计,了解互联网中关于该舆情话题的报道情况。通过自动分析舆情话题在网络中传播的过程,包括其相关信息的转载、点击、评论等信息在不同时间段的变化规律,并可以以图表的方式展现给用户,从而辅助用户更好地把握舆情传播规律,很好的完成了互联网舆情话题追踪系统的各项功能。

下面通过具体实施例对本发明实施例提供的处理舆情话题的方法进行详细说明,如图2所示,包括以下步骤:步骤201、获取用户选择的舆情信息;具体的,用户可以输入舆情信息,也可以在提供的舆情信息中进行选择。该舆情信息包括但不限于:发布人、发布地点、发布时间、标题、分类。

步骤202、在网络中检索包含该舆情信息的舆情话题;具体的,可以在指定的网站或全部网络中进行检索,以便获取舆情话题的传播情况,例如可以在指定的网站中,根据预置的关键词规则和/或样本文档,获取该舆情话题的相关联话题及相似度,具体实现时可以使用网络爬虫技术进行采集;可以在全部网络中,根据舆情话题的全网关键词,获取该舆情话题的相关话题及相似度,具体实现时可以使用元搜索技术。这样,可以获知在指定网站或者全部网络中,具有多少该舆情话题的相关话题联及相似度,还可以知道该话题的传播路径,当然,该相关联话题包括舆情话题本身。进行全网搜索时,可以主要搜索各种类型的站点,如网页类、新闻类、论坛类博客类等。

上述在关键词规则和样本文档之间的逻辑关系可以是“与”,也可以是“或”,其中关键词搜索采用布尔逻辑运算的复杂条件,样本文档可采用单一文本片段或多文本片段。使用多样本文档方式时,还可以通过不同片段找到相关信息,多角度综合获知舆情话题的情况;有效的解决同一事件不同描述方式的问题。

步骤203、获取该舆情话题的特征信息;具体的,获取该舆情话题在网络中的敏感信息、转载量、点击量、评论量、持续时间长度和相关话题量等特征信息的数量和/或数量的变化量,并与预置的报警阈值进行比较;若大于报警阈值,则检测结果为符合报警条件;若不大于报警阈值,则检测结果为不符合报警条件。上述报警阈值可以为一项或者多项,具体使用时与获取的舆情话题的特征信息相对应,例如获取了舆情话题的点击量、回复量,则进行检测时,使用点击量报警阈值和回复量报警阈值。而且,检测时可以同时使用某一个或多个特征信息的数量,还可以同时使用某一个或多个特征信息的数量增加量、增加率,还可以既使用一个或多个特征信息的数量,又使用一个或多个特征信息的数量增加量等。

其中,运用中文分词技术对网页文本数据进行分词处理,正序及倒序的分析网页文本中的所有词,然后根据预置的敏感词,获取该网页中具有的敏感词。该预置的敏感词存储在数据库中,根据国家法律规定的敏感词进行设置,或者用户自行设置。

步骤204、检测舆情话题的特征信息是否符合报警条件;当该舆情话题的一个或多个特征信息符合报警条件时,保存该舆情话题及其特征信息,并可以采用数据挖掘技术定期进行分析及追踪,以便获知该舆情话题的进展。例如通过周期性分析舆情话题的转载情况及点击量、评论量的变化过程,形成对该舆情话题的连续追踪。用户可以通过定时器设定或修改定期分析的具体时间。

步骤205、当符合报警条件时,保存该舆情话题及其特征信息;步骤206、定期分析该舆情话题,并保存分析结果;当该舆情话题的一个或多个特征信息符合报警条件时,可以保存该舆情话题及其特征信息,以便可以采用数据挖掘技术定期进行分析及追踪,以便获知该舆情话题的进展。例如通过周期性分析舆情话题的转载情况及点击量、评论量的变化过程,形成对该舆情话题的连续追踪。用户可以通过定时器设定或修改定期分析的具体时间。

步骤207、根据舆情话题的相关特征信息,生成舆情简报;对舆情话题的所属网站、发布时间、传播路径等进行统计分析,生成舆情简报,以便辅助用户更好的把握舆情传播规律,为制定舆情处理和舆情引导提供数据依据,还可以查看引导效果。

步骤208、查看分析结果。管理保存的多个舆情话题时,可以按照相似度进行分类,查看时可以在某类话题下查找相应的舆情话题的分析结果,例如相关信息、变化趋势、是否报警等。

通过上述描述,可以看出,使用本发明实施例提供的处理舆情话题的方法,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且能够对舆情话题进行管理,并进行持续追踪,分析舆情话题的传播、点击、评论的变化趋势,对需要预警的话题进行预警提示。还可以自动对互联网上的舆论信息进行综合分析整理,为生成舆情简报提供数据材料。进一步支撑全面掌握舆情事件,为舆论处理和引导决策提供重要支持,持续追踪分析舆论引导的效果。

检索舆情话题时,用户可以按照需要添加话题,还可以同时设置多篇样例文本或关键词,多角度描述该话题,以便全面分析话题的传播演化趋势;并可以选择通过元搜索技术对互联网信息进行统计,了解互联网中关于该舆情话题的报道情况。通过自动分析舆情话题在网络中传播的过程,包括其相关信息的转载、点击、评论等信息在不同时间段的变化规律,并可以以图表的方式展现给用户,从而辅助用户更好地把握舆情传播规律,很好的完成了互联网舆情话题追踪系统的各项功能。

相应的,本发明实施例还提供了一种处理舆情话题的装置,如图3所示,包括:检索模块301,用于在网络中检索包含舆情信息的舆情话题;获取模块302,用于获取所述舆情话题的特征信息;检测模块303,用于检测所述舆情话题的特征信息是否符合报警条件;

存储模块304,用于当符合报警条件时,保存所述舆情话题及其特征信息。

较佳的,该获取模块302,用于在指定的网站中,根据预置的关键词规则和/或样本文档,获取所述舆情话题的相关联话题及相似度;和/或在全部网络中,根据所述舆情话题的全网关键词,获取所述舆情话题的相关联话题及相似度。

较佳的,该获取模块302,用于对包含所述舆情话题的网页文本数据进行分词处理,根据预置的敏感词,获取所述网页文本数据中的敏感信息。

较佳的,该检测模块303,用于获取所述特征信息的数量和/或变化量,与预置的报警阈值进行比较;若大于所述报警阈值,则检测结果为符合报警条件;若不大于所述报警阈值,则检测结果为不符合报警条件。

较佳的,该装置还包括:分析模块305,用于采用数据挖掘技术,定期分析所述舆情话题及其特征信息;保存分析结果并展示。

较佳的,该装置还包括:生成模块306,用于根据所述舆情话题的特征信息,生成舆情简报。

通过上述描述,可以看出,使用本发明实施例提供的处理舆情话题的装置,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且能够对舆情话题进行管理,并进行持续追踪,分析舆情话题的传播、点击、评论的变化趋势,对需要预警的话题进行预警提示。还可以自动对互联网上的舆论信息进行综合分析整理,为生成舆情简报提供数据材料。进一步支撑全面掌握舆情事件,为舆论处理和引导决策提供重要支持,持续追踪分析舆论引导的效果。

检索舆情话题时,用户可以按照需要添加话题,还可以同时设置多篇样例文本或关键词,多角度描述该话题,以便全面分析话题的传播演化趋势;并可以选择通过元搜索技术对互联网信息进行统计,了解互联网中关于该舆情话题的报道情况。通过自动分析舆情话题在网络中传播的过程,包括其相关信息的转载、点击、评论等信息在不同时间段的变化规律,并可以以图表的方式展现给用户,从而辅助用户更好地把握舆情传播规律,很好的完成了互联网舆情话题追踪系统的各项功能。

相应的,本发明实施例还提供了一种处理舆情话题的系统,如图4所示,包括:网络侧服务器401和处理舆情话题的装置402;所述网络侧服务器401,用于提供包含舆情信息的舆情话题;所述处理舆情话题的装置402,用于在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。

通过上述描述,可以看出,使用本发明实施例提供的处理舆情话题的方法、装置和系统,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且能够对舆情话题进行管理,并进行持续追踪,分析舆情话题的传播、点击、评论的变化趋势,对需要预警的话题进行预警提示。还可以自动对互联网上的舆论信息进行综合分析整理,为生成舆情简报提供数据材料。进一步支撑全面掌握舆情事件,为舆论处理和引导决策提供重要支持,持续追踪分析舆论引导的效果。

检索舆情话题时,用户可以按照需要添加话题,还可以同时设置多篇样例文本或关键词,多角度描述该话题,以便全面分析话题的传播演化趋势;并可以选择通过元搜索技术对互联网信息进行统计,了解互联网中关于该舆情话题的报道情况。通过自动分析舆情话题在网络中传播的过程,包括其相关信息的转载、点击、评论等信息在不同时间段的变化规律,并可以以图表的方式展现给用户,从而辅助用户更好地把握舆情传播规律,很好的完成了互联网舆情话题追踪系统的各项功能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1