本发明涉及安全生产管理领域中的人工智能技术,尤其涉及一种基于知识图谱的工业安全生产违规处罚管理方法及系统。
背景技术:
1、在目前的工业生产中,大多还依靠简单的纸质和手动查找安全生产相关法律法规,一线执法人员大多还不能准确合理的依据相关法律法规进行现场执法问题,并且效率不高,导致工业生产安全监管较为繁琐。
2、而知识图谱(knowledge graph)是一种将数据中的实体、属性和关系用一种结构化、可视化的表现形式展现出来的方法。知识图谱在工业安全生产信息化建设中拥有巨大的潜力,能很好地克服知识的获取与整合的困难,而图数据库完美支持节点和节点间错综复杂的关系网,可以完全匹配工业生产安全中知识图谱存储的全部需求。
3、但是现有技术中,知识图谱建立过程相对繁琐,实体和属性往往通过人工标定,样本范围有限,难以适应散乱的工业安全生产法律法规,普适性不强,因此,将知识图谱应用在工业安全生产违规处罚管理中还存在一定的技术缺陷。
技术实现思路
1、有鉴于此,本发明首先提供一种基于知识图谱的工业安全生产违规处罚管理方法,通过建立知识图谱和使用协同过滤,快速得到最匹配当前工业生产安全违规行为的处罚决定,使得工业生产安全执法更加快捷、准确。
2、为了解决上述技术问题,本发明采用了如下的技术方案:
3、一种基于知识图谱的工业安全生产违规处罚管理方法,其关键在于,包括知识图谱构建步骤、问题分类定义步骤和问题处理步骤,其中:
4、所述知识图谱构建步骤包括:
5、s11:数据采集与处理,用于实现非结构化数据采集和文本预处理,所述非结构化数据包括安全生产法律法规文本以及相关的违法处罚记录;
6、s12:知识抽取,用于实现命名实体识别、关系抽取和属性抽取;
7、s13:知识融合,用于实现实体消歧和实体对齐;
8、s14:知识存储,用于形成实体-关系-实体三元组并存储构建得到图数据库;
9、所述问题分类定义步骤包括:
10、s21:根据知识图谱构建步骤中的命名实体类型对问题进行分类,并对应每个类别定义问题模板;
11、所述问题处理步骤包括:
12、s31:根据工业安全生产违规行为输入文本信息形成问句;
13、s32:文本预处理,用于对问句中的文本信息进行实体抽取;
14、s33:命名实体识别和问题分类,通过识别步骤s31抽取的实体信息并确定问题类型;
15、s34:模板匹配,根据确定的问题类型匹配步骤s21定义的问题模板;
16、s35:知识库查询,根据匹配的问题模板从步骤s14构建得到的图数据库中查询答案;
17、s36:输出问题答案,得到工业安全生产违规处罚推荐方案。
18、可选地,步骤s12中抽取的命名实体和关系是根据安全生产违规处罚相关要求预先定义的。
19、可选地,步骤s11中通过爬虫脚本获取网页信息或人工录入的方式,获得安全生产法律法规文本以及相关的违法处罚记录。
20、可选地,步骤s11中的对文本数据进行预处理后,还使用biose标注体系对文本进行字级别的语料标注。
21、可选地,,步骤s12中采用bi-lstm层次关系抽取模型进行知识抽取。
22、可选地,步骤s32中采用bert-bilstm-ma-crf命名实体识别模型对用户输入的问句进行预处理和实体抽取。
23、可选地,步骤s34中通过寻找相似度最高的问句模板进行模板匹配,且所述相似度按照余弦距离进行计算。
24、可选地,步骤s21中将问题分为五个类别,分别为:义务条款及内容、处罚条款及内容、逾期处罚内容、处罚主体以及违法次数。
25、基于上述方法,本发明还提供一种基于知识图谱的工业安全生产违规处罚管理系统,其关键在于,包括问句输入模块、问句处理模块和答案输出模块,所述问句输入模块用于根据工业安全生产违规行为输入文本信息形成问句,所述问句处理模块用于按照前文所述的基于知识图谱的工业安全生产违规处罚管理方法进行问句处理,所述答案输出模块用于输出工业安全生产违规处罚推荐方案。
26、本发明的显著效果是:
27、本发明对散乱的工业安全生产法律法规进行数据数据处理,提取出违法行为和处罚方式实体,并构建违法行为和处罚方式知识图谱,基于知识图谱的相似度和基于协同过滤,计算违法行为和处罚方式相似度和实体间相互评分,获得最适合当前违法行为的处罚方式,解决当前工业生产中不能准确依据法律法规来进行执法的问题,在使用本发明时,可通过违法行为和处罚方式之间的相似度,预测工业生产中的安全隐患,做好工业生产安全保障。
1.一种基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,包括知识图谱构建步骤、问题分类定义步骤和问题处理步骤,其中:
2.根据权利要求1所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s12中抽取的命名实体和关系是根据安全生产违规处罚相关要求预先定义的。
3.根据权利要求1所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s11中通过爬虫脚本获取网页信息或人工录入的方式,获得安全生产法律法规文本以及相关的违法处罚记录。
4.根据权利要求1所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s11中的对文本数据进行预处理后,还使用biose标注体系对文本进行字级别的语料标注。
5.根据权利要求1-4任一所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s12中采用bi-lstm层次关系抽取模型进行知识抽取。
6.根据权利要求5所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s32中采用bert-bilstm-ma-crf命名实体识别模型对用户输入的问句进行预处理和实体抽取。
7.根据权利要求5所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s34中通过寻找相似度最高的问句模板进行模板匹配,且所述相似度按照余弦距离进行计算。
8.根据权利要求5所述的基于知识图谱的工业安全生产违规处罚管理方法,其特征在于,步骤s21中将问题分为五个类别,分别为:义务条款及内容、处罚条款及内容、逾期处罚内容、处罚主体以及违法次数。
9.一种基于知识图谱的工业安全生产违规处罚管理系统,其特征在于,包括问句输入模块、问句处理模块和答案输出模块,所述问句输入模块用于根据工业安全生产违规行为输入文本信息形成问句,所述问句处理模块用于按照权利要求1-8任一所述的基于知识图谱的工业安全生产违规处罚管理方法进行问句处理,所述答案输出模块用于输出工业安全生产违规处罚推荐方案。