本申请涉及煤矿安全,特别涉及一种基于煤矿案例文本信息的事理图谱分析方法及系统。
背景技术:
1、煤炭在经济社会发展中具有不可替代的作用,在能源消费体系中占有重要地位,但在煤矿开采过程中的矿井事故却造成了巨大的伤亡损失。
2、对过往的事故案例研究,以及运用事故致因理论对事故进行分析,是预防矿井突出事故的基础,传统的案例致因分析的过程是采用大量的人工阅读方式,通过过往的知识以及经验,识别出描述文本中的致因信息,整个工作过程枯燥无趣且耗费时间很长,同时,分析结果可能会受到阅读人员的心理、生理疲劳程度和知识、经验的影响,往往导致结果判断标准不一致,进而引发工作失误。
3、因而,亟需提供一种针对上述现有技术不足的技术方案。
技术实现思路
1、本申请的目的在于提供一种基于煤矿案例文本信息的事理图谱分析方法及系统,以解决或缓解上述现有技术中存在的问题。
2、为了实现上述目的,本申请提供如下技术方案:
3、本申请提供一种基于煤矿案例文本信息的事理图谱分析方法,包括:步骤s101、基于模版抽取算法,对预先获取的事故报告样本进行情景事件抽取,构建矿井突出事故的初始事理图谱k1;步骤s102、基于强化学习算法,对所述初始事理图谱k1中的事故逻辑关系进行优化,得到所述矿井突出事故的应用事理图谱;步骤s103、基于预设布局算法,对所述应用事理图谱的图谱数据进行布局展示,生成所述矿井突出事故的事故主图解。
4、优选的,在步骤s101中,所述基于模版抽取算法,对预先获取的事故报告样本进行情景事件抽取,包括:根据获取的所述事故报告样本,构建所述矿井突出事故的事故语料库;其中,所述事故语料库包括:关键词库和字典库;基于所述关键词库,提取事故报告样本中的关键语句;基于所述字典库,对提取的所述煤矿案例文本中的关键语句进行规范化处理,得到所述事故报告样本的关键语句的规范化表达。
5、优选的,在步骤s101中,所述构建所述矿井突出事故的初始事理图谱k1,包括:将得到的所述事故报告样本的关键语句的规范化表达,输入预训练的语言表征模型,对所述关键语句进行向量化表示;将所述关键语句的向量化表示作为节点特征输入预先构建的区分矩阵中,计算组成规范化表达的关键语句中的每个词语之间的相似度,以对多关联节点进行约简操作,得到组成规范化表达的关键语句中,满足预设相似度阈值的全部词语;其中,所述多关联节点表征组成规范化表达的关键语句中有关联的词语;基于凝聚式层次聚类算法,对组成规范化表达的关键语句中,满足预设相似度阈值的全部词语进行聚类操作,得到组成规范化表达的关键语句中,满足所述预设相似度阈值的词语的多个节点簇,多个所述节点簇组成所述初始事理图谱k1。
6、优选的,按照公式:
7、
8、确定所述区分矩阵m*(k1)中的元素a*;其中,ui,uj分别表示组成规范化表达的关键语句中的第i个、第j个词语,simbert(ui,uj)为ui与uj的bert句向量相似度。
9、优选的,步骤s102包括:基于强化学习算法,对所述初始事理图谱k1中的全部节点簇和事故逻辑关系分别进行增加、删除、修改操作,生成所述应用事理图谱k2。
10、优选的,步骤s102还包括:基于凝聚式层次聚类算法,对所述应用事理图谱k2进行聚类操作,得到所述矿井突出事故的应用事理图谱k3。
11、优选的,在步骤s103中,基于凝聚式聚类算法,根据所述应用事理图谱k2的节点簇之间的相似度,对所述应用事理图谱k2的节点簇再次进行分簇,并计算再次分簇后的各分簇之间的相似度,直至各分簇之间的相似度小于预设簇间相似度阈值,聚类操作结束,得到所述矿井突出事故的应用事理图谱k3。
12、优选的,在步骤s103中,基于动态规划算法,对所述应用事理图谱k2中的节点按照时间顺序进行布局,并模拟所述应用事理图谱k2中的节点之间的事故逻辑关系,得到所述矿井突出事故的事故主图解;或者,基于所述动态规划算法,对所述应用事理图谱k3的节点按照时间顺序进行布局,并模拟所述应用事理图谱k3中的节点之间的事故逻辑关系,得到所述矿井突出事故的事故主图解。
13、优选的,还包括:基于社区发现算法,对所述事理图谱k3中的节点簇进行识别,并对识别结果进行布局展示,得到所述矿井突出事故的事故细分图解。
14、本申请实施例还提供一种基于煤矿案例文本信息的事理图谱分析系统,包括:初始图谱构建单元,配置为基于模版抽取算法,对预先获取的事故报告样本进行情景事件抽取,构建矿井突出事故的初始事理图谱k1;应用图谱构建单元,配置为基于强化学习算法,对所述初始事理图谱k1中的事故逻辑关系进行优化,得到所述矿井突出事故的应用事理图谱;事故图解生成单元,配置为基于预设布局算法,对所述应用事理图谱的图谱数据进行布局展示,生成所述矿井突出事故的事故主图解。
15、有益效果:
16、本申请实施例提出的基于煤矿案例文本信息的事理图谱分析方法中,基于模版抽取算法,对预先获取的事故报告样本进行情景事件抽取,构建矿井突出事故的初始事理图谱k1;然后,基于强化学习算法,对初始事理图谱k1中的事故逻辑关系进行优化,得到矿井突出事故的应用事理图谱,并基于预设布局算法,对应用事理图谱的图谱数据进行布局展示,生成矿井突出事故的事故主图解。籍此,通过事故报告样本自动生成事故图解,利用自动生成的事故图解,不仅能够帮助专业人员快速理解事故发生原因,提高事故报告的阅读速度,降低非专业人员的分析门槛,提升事故指引分析的效率;而且,通过对矿井突出事故的时间特征、地点特征、不安全行为、不安全物态、工种等因素与事故进行多维度统计,可深入分析各种因素的分布特征,为煤矿开展安全管理工作提供数据支撑,对安全生产形势进行评估,指导安全生产以及精细化管理。
1.一种基于煤矿案例文本信息的事理图谱分析方法,其特征在于,包括:
2.根据权利要求1所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,在步骤s101中,所述基于模版抽取算法,对预先获取的事故报告样本进行情景事件抽取,包括:
3.根据权利要求2所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,在步骤s101中,所述构建所述矿井突出事故的初始事理图谱k1,包括:
4.根据权利要求3所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,
5.根据权利要求1所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,
6.根据权利要求5所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,还包括:
7.根据权利要求6所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,在步骤s103中,
8.根据权利要求5所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,在步骤s103中,
9.根据权利要求1所述的基于煤矿案例文本信息的事理图谱分析方法,其特征在于,还包括:
10.一种基于煤矿案例文本信息的事理图谱分析系统,其特征在于,包括: