舆情信息的告警方法及装置的制造方法

文档序号:9579310阅读:263来源:国知局
舆情信息的告警方法及装置的制造方法
【技术领域】
[0001] 本发明涉及计算机领域,具体而言,涉及一种舆情信息的告警方法及装置。
【背景技术】
[0002] 如今我们已经完全进入互联网时代,对于及时发现并处理关于诸多互联网应用产 品的网络舆情,显得越来越重要。其中,网络舆情是指在互联网上流行的对社会问题不同看 法的网络舆论,是社会舆论的一种表现形式,是通过互联网传播的公众对现实生活中某些 热点、焦点问题所持的有较强影响力、倾向性的言论和观点。如果能尽早发现并及时处理关 于上述产品的网络舆情,可极大程度地控制网络上公众舆论对上述产品的影响。
[0003] 目前,通常采用的对网络舆情的控制方法是通过预定规则来识别并阻止某些舆 情,例如,以微博为例,通常设定的一种预定规则是为微博粉丝数或评论数设定阈值,即,通 过限制对产品的评论数量来控制舆情;或者,另一种预定规则是设定关键词,如"支付宝漏 洞",即,通过预先设定的关键词筛选过滤网络舆情,从而实现对关于产品的网络舆情进行 控制。然而,这些控制方式的准确率普遍较低,通常只有2%左右。也就是说,现有的对网络 舆情的控制方法还无法准确识别出网络中对产品产生消极影响的舆情,更加无法及时准确 地对这些舆情发出告警,以实现对网络舆情地有效控制。
[0004] 针对上述的问题,目前尚未提出有效的解决方案。

【发明内容】

[0005] 本发明实施例提供了一种舆情信息的告警方法及装置,以至少解决现有技术无法 对舆情信息进行准确告警的技术问题。
[0006] 根据本发明实施例的一个方面,提供了一种舆情信息的告警方法,包括:从网络信 息中识别出待检测舆情信息;对上述待检测舆情信息进行预处理,将预处理后的上述待检 测舆情信息划分为多个特征字段;至少根据预处理后的上述待检测舆情信息对应的上述特 征字段与已告警的舆情信息对应的特征字段的相似度,判断上述待检测舆情信息是否满足 告警条件;若满足上述告警条件,则对上述待检测舆情信息进行告警。
[0007] 可选地,上述至少根据预处理后的上述待检测舆情信息对应的上述特征字段与已 告警的舆情信息对应的特征字段的相似度,判断上述待检测舆情信息是否满足告警条件包 括:在上述已告警的舆情信息对应的特征字段中查找是否至少包括一条舆情信息对应的上 述特征字段与上述待检测舆情信息对应的上述特征字段的相似度小于等于第一预定阈值; 若在上述已告警的舆情信息对应的特征字段中查找到至少包括一条上述舆情信息对应的 上述特征字段与上述待检测舆情信息对应的上述特征字段的相似度小于等于第一预定阈 值,则判断出上述待检测舆情信息不满足上述告警条件。
[0008] 可选地,上述至少根据预处理后的上述待检测舆情信息对应的上述特征字段与已 告警的舆情信息对应的特征字段的相似度,判断上述待检测舆情信息是否满足告警条件包 括:在上述已告警的舆情信息对应的特征字段中查找是否至少包括一条舆情信息对应的上 述特征字段与上述待检测舆情信息对应的上述特征字段的相似度小于等于第一预定阈值; 若在上述已告警的舆情信息对应的特征字段中未查找出一条上述舆情信息对应的上述特 征字段与上述待检测舆情信息对应的上述特征字段的相似度小于等于上述第一预定阈值, 则在未告警的舆情信息对应的特征字段中查找满足与上述待检测舆情信息对应的上述特 征字段的相似度小于等于第二预定阈值的条件的上述未告警的舆情信息对应的特征字段, 判断满足上述条件的上述未告警的舆情信息的数量是否大于等于第三预定阈值;若满足上 述条件的上述未告警的舆情信息的数量大于等于上述第三预定阈值,则判断出上述待检测 舆情信息满足上述告警条件,将对上述待检测舆情信息进行告警。
[0009] 可选地,上述在上述已告警的舆情信息对应的特征字段中查找是否至少包括一条 舆情信息对应的上述特征字段与上述待检测舆情信息对应的上述特征字段的相似度小于 等于第一预定阈值包括:分别根据上述待检测舆情信息对应的上述特征字段中的每一个待 检测特征字段在上述已告警的舆情信息对应的特征字段中进行查找,得到与每一个上述待 检测特征字段对应的特征集合;按照预定的顺序将每一个上述待检测特征字段对应的特征 集合中的上述已告警的舆情信息对应的上述特征字段与上述待检测舆情信息对应的上述 特征字段进行比较,判断上述已告警的舆情信息对应的上述特征字段与上述待检测舆情信 息对应的上述特征字段的相似度是否小于等于上述第一预定阈值;上述若在上述已告警的 舆情信息对应的特征字段中查找到至少包括一条上述舆情信息对应的上述特征字段与上 述待检测舆情信息对应的上述特征字段的相似度小于等于第一预定阈值,则判断出上述待 检测舆情信息不满足上述告警条件包括:只要查找到一条上述已告警的舆情信息对应的上 述特征字段与上述待检测舆情信息对应的上述特征字段的相似度小于等于上述第一预定 阈值,则判断出上述待检测舆情信息为已告警的舆情信息,上述待检测舆情信息不满足上 述告警条件。
[0010] 可选地,上述在未告警的舆情信息对应的特征字段中查找满足与上述待检测舆情 信息对应的上述特征字段的相似度小于等于第二预定阈值的条件的上述未告警的舆情信 息对应的特征字段,判断满足上述条件的上述未告警的舆情信息的数量是否大于等于第三 预定阈值包括:分别根据上述待检测舆情信息对应的上述特征字段中的每一个待检测特征 字段在上述未告警的舆情信息对应的特征字段中进行查找,得到与每一个上述待检测特征 字段对应的特征集合;按照预定的顺序将每一个上述待检测特征字段对应的特征集合中的 上述未告警的舆情信息对应的特征字段与上述待检测舆情信息对应的上述特征字段进行 比较,判断上述未告警的舆情信息对应的上述特征字段与上述待检测舆情信息对应的上述 特征字段的相似度是否小于等于上述第二预定阈值;将查找到的与上述待检测舆情信息对 应的上述特征字段的相似度小于等于上述第二预定阈值的上述未告警的舆情信息计数;上 述若满足上述条件的上述未告警的舆情信息的数量大于等于上述第三预定阈值,则判断出 上述待检测舆情满足上述告警条件,将对上述待检测舆情信息进行告警包括:当查找到与 上述待检测舆情信息对应的上述特征字段的相似度小于等于上述第二预定阈值的上述未 告警的舆情信息的数量达到上述第三预定阈值时,则判断出上述待检测舆情信息满足上述 告警条件,将对上述待检测舆情信息进行告警。
[0011] 可选地,上述对上述待检测舆情信息进行预处理,将预处理后的上述待检测舆情 信息划分为多个特征字段包括:提取上述待检测舆情信息的主题;对上述主题进行哈希转 码操作得到预定码长的哈希码;将上述哈希码划分为上述多个特征字段。
[0012] 可选地,上述从网络信息中识别出待检测舆情信息包括以下至少之一:通过贝叶 斯分类判断识别出上述待检测舆情信息;或者,通过支持向量机SVM分类判断识别出上述 待检测舆情信息。
[0013] 可选地,与上述待检测舆情信息对应的上述特征字段之间的上述相似度为海明距 离。
[0014] 根据本发明实施例的另一方面,还提供了一种舆情信息的告警装置,包括:识别单 元,用于从网络信息中识别出待检测舆情信息;预处理单元,用于对上述待检测舆情信息进 行预处理,将预处理后的上述待检测舆情信息划分为多个特征字段;判断单元,用于至少根 据预处理后的上述待检测舆情信息对应的上述特征字段与已告警的舆情信息对应的特征 字段的相似度,判断上述待检测舆情信息是否满足告警条件;告警单元,用于在满足上述告 警条件时,对上述待检测舆情信息进行告警。
[0015] 可选地,上述判断单元包括:第一查找模块,用于在上述已告警的舆情信息对应的 特征字段中查找是否至少包括一条舆情信息对应的上述特征字段与上述待检测舆情信息 对应的上述特征字段的相似度小于等于第一预定阈值;第一判断模块,用于在上述已告警 的舆情信息对应的特征字段中查找到至少包括一条上述舆情信息对应的上述特征字段与 上述待检测舆情信息对应的上述特征字段的相似度小于等于第一预定阈值时,判断出上述 待检测舆情信息不满足上述告警条件。
[0016] 可选地,上述判断单元包括:第二查找模块,用于在上述已告警的舆情信息对应的 特征字段中查找是否至少包括一条舆情信息对应的上述特征字段与上述待检测舆情信息 对应的上述特征字段的相似度小于等于第一预定阈值;第三查找模块,用于在上述已告警 的舆情信息对应的特征字段中未查找出一条上述舆情信息对应的上述特征字段与上述待 检测舆情信息对应的上述特征字段的相似度小于等于上述第一预定阈值时,在未告警的舆 情信息对应的特征字段中查找满足与上述待检测舆情信息对应的上述特征字段的相似度 小于等于第二预定阈值的条件的上述未告警的舆情信息对应的特征字段,判断满足上述条 件的上述未告警的舆情信息的数量是否大于第三预定阈值;第二判断模块,用于在满足上 述条件的上述未告警的舆情信息的数量大于上述第三预定阈值时,判断出上述待检测舆情 信息满足上述告警条件,将对上述待检测舆情信息进行告警。
[0017] 可选地,上述第一查找模块包括:第一查找子模块,用于分别根据上述待检测舆情 信息对应的上述特征字段中的每一个待检测特征字段在上述已告警的舆情信息对应的特 征字段中进行查找,得到与每一个上述待检测特征字段对应的特征集合;第一比较子模块, 用于按照预定的顺序将每一个上述待检测特征字段对应的特征集合中的上述已告警的舆 情信息对应的上述特征字段与上述待检测舆情信息对应的上述特征字段进行比较,判断上 述已告警的舆情信息对应的上述特征字段与上述待检测舆情信息对应的上述特征字段的 相似度是否小于等于上述第一预定阈值;上述第一判断模块包括:第一判断子模块,用于 只要查找到一条上述已告警的舆情信息对应的上述特征字段与上述待检测舆情信息对应 的上述特征字段的相似度小于等于上述第一预定阈值时,判断出上述待检测舆情信息为已 告警的舆情信息,上述待检测舆情信息不满足上述告警条件。
[0018] 可选地,上述第三查找模块包括:第二查找子模块,用于分别根据上述待检测舆情 信息对应的上述特征字段中的每一个待检测特征字段在上述未告警的舆情信息对应的特 征字段中进行查找,得到与每一个上述待检测特征字段对应的特征集合;第二比较子模块, 用于按照预定的顺序将每一个上述待检测特征字段对应的特征集合中的上述未告警的舆 情信息对应的特征字段与上述待检测舆情信息对应的上述特征字段进行比较,判断上述未 告警的舆情信息对应的上述特征字段与上述待检测舆情信息对应的上述特征字段的相似 度是否小于等于上述第二预定阈值;计数子模块,用于将查找到的与上述待检测舆情信息 对应的上述特征字段的相似度小于等于上述第二预定阈值的上述未告警的舆情信息计数; 上述第二判断模块包括:告警子模块,用于在查找到的与上述待检测舆情信息对应的上述 特征字段的相似度小于等于上述第二预定阈值的上述未告警的舆情信息的数量达到上述 第三预定阈值时,判断出上述待检测舆情信息满足上述告警条件,将对上述待检测舆情信 息进行告警。
[0019] 可选地,上述对上述预处理单元包括:提取模块,用于提取上述待检测舆情信息的 主题;转码模块,用于对上述主题进行哈希转码操作得到预定码长的哈希码;划分模块,用 于将上述哈希码划分为上述多个特征字段。
[0020] 可选地,与上述待检测舆情信息对应的上述特征字段之间的上述相似度为海明距 离。
[0021] 在本发明实施例中,通过将从网络信息中识别出的待检测舆情信息进行预处理 后,至少根据预处理后的上述待检测舆情信息对应的特征字段与已告警的舆情信息对应的 特征字段的相似度,判断上述待检测舆情信息是否满足告警条件,进而判断出上述待检测 舆情信息是否已经告警过,避免对待检测舆情信息的重复告警,从而实现对舆情信息的准 确告警。
[0022] 进一步,将待检测舆情信息与未告警的舆情信息进行相似度比较,当满足相似度 判断条件的未告警的舆情信息的数量大于预定
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1