社会场景自动识别及其检查计划动态生成方法与流程

文档序号:31539201发布日期:2022-09-16 23:24阅读:来源:国知局

技术特征:
1.一种社会场景自动识别及其检查计划动态生成方法,其特征在于,包括以下步骤:s1.接收开放式社会性事件文本;s2.分别抽取每个社会性事件文本中的场景和事件;s3.将场景与场景舱中的已知场景进行匹配,根据匹配结果将相应的场景归类为已知场景或未知场景;s4.将已知场景列入待处理清单,将未知场景列入候选场景列表;s5.将候选场景列表中满足推送条件的场景,或场景及相应事件推送给相关部门以供相关部门添加相应未知场景至场景舱;基于待处理清单动态生成检查清单,并基于检查清单和预警规则向相关部门派发检查工作。2.根据权利要求1所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s1中,所述的开放式社会性事件文本包括舆情热点和公众诉求;对于舆情热点进行社会性事件甄别,采用网络爬虫从各大新闻载体中爬取娱乐、体育和国际版块以外的新闻报道以筛选出新闻类社会性事件后进入步骤s2;对于公众诉求,根据数据字排除咨询类事件以筛选出民生类社会性事件后进入步骤s2。3.根据权利要求2所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s1中,通过以下方式从新闻载体中筛选出新闻类社会性事件:s11.锁定舆情热点,累计相应事件在所有新闻载体中的浏览量、评论数、点赞量、转发量,并基于浏览量、评论数、点赞量、转发量判断是否满足热点条件,若是,则将相应事件作为舆情热点;s12.排除非社会性事件,提取步骤s21中锁定的舆情热点事件,采用经过训练的bert模型判断相应舆情热点是否为娱乐、体育和国际的非社会性事件以筛选出新闻类社会性事件。4.根据权利要求1所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s2具体包括:s21.根据百度paddlenlp的中文全词类序列标注工具生成标注序列,形如:t
ner
={(word1,tag1),(word2,tag2),...,(word
m
,tag
m
)},其中tag
i
的值域为中文全词类的实体标签,word
i
为tag
i
对应到输入文本中的词串;s22.基于数据结构双向链表合并序列t
ner
中相邻同标签、不及物动词和助词、副词和修饰词、场景词和方位词等词串得到新的标注序列t

ner
;s23.将序列t

ner
分割成t
word
和t
tag
两个序列后,采用多关键词匹配算法wumanber找到场景词标签在t
tag
序列中的位置,并根据位置将t
word
和t
tag
划分成子句集;s24.从中文全词类序列标注工具的标签结果集中统计出主谓宾、主谓及动宾的事件抽取的模式串;s25采用wumanber算法从t
tag
子串中找出事件模式串的匹配位置,并根据匹配位置在对应的t
word
子串中查找主谓宾、主谓及动宾词串以抽取场景和事件;s26当事件抽取模板对当前句子抽取失效时,采用依存句法分析器抽取文本的主谓宾三元组作为事件抽取的补充。
5.根据权利要求4所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s3中的匹配为相似度匹配,且先对步骤s2中抽取出来的主谓宾、主谓及动宾词串进行同义词替换计算以对词串进行标准化,然后与场景舱中的已知场景进行相似度匹配。6.根据权利要求1所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s3具体包括:将属于同一场景的事件归入相应场景得到格式为场景x[事件1,事件2,...,事件n]的场景事件集;将每个场景x依次与场景场景舱中的已知场景进行相似度匹配,根据最大相似度值将场景x判断为已知场景或未知场景;步骤s4具体包括:将已知场景x及其事件集列入待处理清单,将未知场景x及其事件集列入候选场景列表。7.根据权利要求6所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s5具体包括:对候选场景列表中各未知场景x累加事件数量,当未知场景x的事件数量n达到设定数量值时,将相应场景x或及其事件集推送给相关部门,由相关部门协同领域专家将新场景x添加至场景舱作使其为已知场景。8.根据权利要求7所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,所添加的新场景的内容包括场景名称和相应场景的检查清单,及检查清单中新增检查项与检查问题的映射关系。9.根据权利要求7所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s5还包括:对各未知场景x中的各事件进行新颖性判断,对一个未知场景x协同事件累计数和事件新颖性判断其是否满足推送条件。10.根据权利要求6所述的社会场景自动识别及其检查计划动态生成方法,其特征在于,步骤s5中,检查清单动态生成方法包括:s51.从场景舱中匹配待处理清单中所有已知场景x的场景名;s52.根据场景名从场景舱中调取相应的检查清单,并将检查清单中的所有检查项条目的分值均设为m;s53.对场景x的各事件分别识别检查问题;s54.对于识别出来的每个检查问题,根据检查问题和检查项映射表,将对应的检查项累加所映射检查问题的发生次数;s55.根据分值按值倒叙排列检查清单的检查项目以形成动态检查清单。

技术总结
本方案公开了一种社会场景自动识别及其检查计划动态生成方法,包括:S1.接收开放式社会性事件文本;S2.分别抽取社会性事件文本中的场景和事件;S3.将场景与已知场景进行匹配,并将相应的场景归类为已知场景或未知场景;S4.将已知场景列入待处理清单,将未知场景列入候选场景列表;S5.将候选场景列表中满足推送条件的场景,或场景及相应事件推送给相关部门以供相关部门添加相应未知场景至场景舱;基于待处理清单动态生成检查清单,并基于检查清单和预警规则向相关部门派发检查工作。本方案为相关部门扩充综合查一次运行系统的已知场景提供技术支持和数据支持,并且能够事先场景突出问题重点检查重点提醒,弱化检查长期合格的检查项目。的检查项目。的检查项目。


技术研发人员:宋超伟 谢秋妹 杨立功
受保护的技术使用者:浙江嘉兴数字城市实验室有限公司
技术研发日:2022.06.10
技术公布日:2022/9/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1