一种智能的舆情突发事件应急处理系统及方法

文档序号:8498640阅读:850来源:国知局
一种智能的舆情突发事件应急处理系统及方法
【技术领域】
[0001] 本发明属于计算机应用领域,涉及将自然语言处理技术、本体理论和语义关联技 术应用于互联网舆情突发事件的智能识别和防控方案的自动生成。它基于计算机信息处理 方法实现对应急防控预案的格式化转化,实现舆情突发事件情景与预案之间的语义匹配, 实现对各种互联网舆情突发事件的准确识别和辅助决策。
【背景技术】
[0002] 随着互联网技术的不断发展,互联网已成为一种被广泛使用的大众媒介,其触角 几乎伸向社会的各个领域,并逐渐成为公众舆论的一个新的重要媒介。网络舆情是公众在 互联网上公开表达的对某种社会现象或社会问题的具有一定影响力和倾向性的共同意见, 网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些网络舆情突发事件不能及时 妥善处理,极有可能诱发民众的不良情绪及不良行为的发生,进而对社会稳定形成严重威 胁。迫切需要一种技术手段能够实现对网络舆情信息的自动监控,能够对舆情突发事件的 处置提供决策支持。

【发明内容】

[0003] 本发明就是针对上述需求,提出了一种计算机应用系统一舆情突发事件应急处理 系统,它能够对互联网舆情进行实时监控,能够辅助决策者根据舆情突发事件的实际情况 有针对性地形成相适合的防控方案,加快对网络舆情突发事件的处置响应速度。
[0004] 本发明所要解决的技术问题由以下技术方案实现:
[0005] -种智能的舆情突发事件应急处理系统,其特征在于:该系统包括互联网信息采 集与解析模块、互联网信息分析模块、网络文本类别判断与聚类分析模块、应急处理方案生 成模块和应急处理效果评估模块;所述互联网信息采集与解析模块用于从互联网上采集信 息,抽取出网页中自然语言文字以及网页的元数据信息,并保存到数据库中;所述互联网信 息分析模块用于对采集来的信息中的自然语言文字进行特征抽取,形成文本特征;所述网 络文本类别判断与聚类分析模块用于对网络文本的类别进行判断,对累积网络文本进行聚 类分析;所述应急处理方案生成模块用于根据舆情事件的具体情况自动生成相应的处理预 案,决策人员可以基于处理预案制定执行方案;所述应急处理效果评估模块用于对执行方 案的执行效果进行评估。
[0006] -种智能的舆情突发事件应急处理系统及方法,其特征在于该方法包括以下步 骤:
[0007] ①互联网信息采集与解析:由连接互联网的计算机从互联网论坛、博客、新闻网站 上采集论坛帖子、博客内容和网站新闻网页等网络数据,然后,利用计算机采用基于规则的 信息抽取技术自动地对网络数据进行解析,从其中抽取两类信息:自然语言文字信息和网 页的元数据信息;自然语言文字信息包括新闻标题、新闻正文、论坛帖子标题、帖子内容等 信息;网页的元数据信息包括发表时间、作者、发帖者、帖子回复量、帖子阅读量、出现的网 站名称、网站URL等信息,解析出来的信息保存到数据库中,信息采集与解析是一个持续的 过程,形成对互联网站的自动连续监控;
[0008] ②互联网信息分析:首先利用自然语言处理技术的中文分词方法对网络文本的标 题和正文内容分别进行分词,并对分词结果中每个词项的词性进行标注,之后舍弃掉除名 词、动词、形容词之外的词项,然后利用文本多精度表示方法抽取网络文本的单个词项特征 和词项关联特征,再根据分词结果中的词性标注情况识别出网络文本中的地理位置特征和 人物特征,地理位置特征是网络文本中出现的地理位置名称、人物特征是网络文本中出现 的人物名称;
[0009] ③将步骤②处理后的网络文本中的词项与计算机数据库中设定的舆情类别的词 项特征进行比对匹配,并根据匹配结果将网络文本按照计算机数据库中设定的舆情类别进 行归类处理;将不能归类的网络文本进行聚类分析,把内容相近的网络文本聚成簇,若簇内 网络文本数量超出设定阈值,则对簇内网络文本进行舆情类别的词项特征抽处理,并将抽 取的舆情类别的词项特征补充到计算机数据库中;对于完成归类的网络文本转入步骤④; 其中,匹配内容包括单个词项特征、词项关联特征、地理位置特征和人物特征;
[0010] ④如果在指定时间段内,属于某一类别的网络文本的数量或者出现该类别网络文 本的网站数量超过指定的阈值,则启动应急预案;
[0011] 完成智能舆情突发事件的应急处理。
[0012] 其中,在步骤④之后还包括应急处理效果评估步骤:首先按照评估指标采集指标 数据,然后将指标数据输入评估公式得出量化评估结果。
[0013] 其中,在步骤③中根据匹配结果将网络文本按照计算机数据库中设定的舆情类别 进行归类处理具体为:网络文本类别判断的方法是将网络文本的词项与每个舆情类别的词 项特征进行比对匹配,分别在单个词特征、词关联特征、地理位置特征和人物特征四个方面 进行匹配运算,根据匹配情况得到网络文本与各个舆情类别的相似度值,将文本归属为相 似度值最高的舆情类别。
[0014] 其中,步骤③中对簇内网络文本进行舆情类别的词项特征抽处理,具体为:假设 簇T包含的网络文本有T= {tub,…tn},利用文本多精度表示方法抽取出每个文本心的 单个词项特征和词项关联特征,再采用统计方法计算出T中所有文本的所有单个词项特征 和词项关联特征的统计分布规律,选择在T中一半以上网络文本中出现过的词汇作为舆情 类别词项特征,并计算出其在T内的平均发生频率作为舆情类别特征词项的频率;其中, 1 < i < n〇
[0015] 其中,步骤④中应急预案的生成方法为:基于互联网舆情事件情景本体知识库模 型和网络舆情防控措施预案本体知识库,利用语义匹配技术根据舆情事件情景的具体情 况,从防控措施预案库中自动匹配出最适合的应急处理预案。
[0016] 与现有的技术相比,本发明具有以下的优点和有益效果:
[0017] 1、本发明不仅能够对网络舆情进行自动监控,还能够针对突发舆情事件给出防控 措施方案。
[0018] 2、本发明的舆情类型识别计算机数据库具有可扩展性,通过文本聚类分析不断补 充新型舆情类型特征到数据库中,使系统能够识别新增类型的舆情事件。
【附图说明】
[0019] 图1系统模块组成图
[0020] 图2舆情分类体系模型图
[0021]图3舆情分类体系概念属性模型图
[0022] 图4舆情分类体系示意图
[0023] 图5类别特征产生过程工作原理图
[0024] 图6语义匹配原理图
[0025] 图7基于网络文本聚类的知识扩展图
[0026] 图8舆情事件情景本体知识库图
[0027] 图9舆情防控措施预案本体知识库图
[0028] 图10网络舆情防控知识语义模型图
[0029] 图11基于语义的匹配方法图
[0030] 图12应急处理效果评估指标体系图
【具体实施方式】
[0031] 下面将结合附图和具体实施例对本发明做进一步说明。但本发明的实施方式不限 于此。
[0032] 本实施例提供一种智能的舆情突发事件应急处理系统,该系统包括互联网信息采 集与解析模块,互联网信息分析模块,网络文本类别判断与聚类分析模块,应急处理方案生 成模块,应急处理效果评估模块,如附图1所示;所述互联网信息采集与解析模块用于从互 联网上采集信息,抽取出网页中自然语言文字以及网页的元数据信息,并保存到数据库中; 所述互联网信息分析模块用于对采集来的信息中的自然语言文字进行特征抽取,形成文本 特征;所述网络文本类别判断与聚类分析模块用于对网络文本的类别进行判断,对累积网 络文本进行聚类分析;所述应急处理方案生成模块用于根据舆情事件的具体情况自动生成 相应的处理预案,决策人员可以基于处理预案制定执行方案;所述应急处理效果评估模块 用于对执行方案的执行效果进行评估。
[0033] 本实施例还提供一种智能的舆情突发事件应急处理系统的工作方法,该方法包括 以下步骤:
[0034] ①互联网信息采集与解析:由连接互联网的计算机从互联网论坛、博客、新闻网站 上采集论坛帖子、博客内容和网站新闻网页等网络数据,然后,利用计算机采用基于规则的 信息抽取技术自动地对网络数据进行解析,从其中抽取两类信息:自然语言文字信息和网 页的元数据信息。自然语言文字信息包括新闻标题、新闻正文、论坛
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1