一种事故分析模型训练方法、装置及设备与流程

文档序号:29566381发布日期:2022-04-09 02:35阅读:89来源:国知局
一种事故分析模型训练方法、装置及设备与流程

1.本说明书实施例涉及计算机应用技术领域,尤其涉及一种事故分析模型训练方法、装置及设备。


背景技术:

2.在各种业务执行的过程中,通常会发生各类事故。例如,生产事故、泄密事故、安全事故等。
3.为了方便进行应急管理,通常需要针对影响事故发生的因素进行分析,从而方便后续通过多种改进措施来预防事故的产生。影响因素例如,生产安全规范程度、保密措施有效程度、生产流程监管力度等。
4.但是目前,难以针对事故的影响因素进行分析。


技术实现要素:

5.为了解决上述技术问题,本说明书实施例提供了一种事故分析模型训练方法及装置。技术方案如下所示。
6.本说明书实施例第一方面提供一种事故分析模型训练方法,包括:
7.针对待分析机构,获取事故样本集合;所述事故样本集合包括事故正样本和事故负样本;不同事故样本对应于不同时间段;
8.事故正样本的标签用于表征对应时间段内待分析机构有事故发生;事故正样本的特征包括:事故发生前第一预设时长内待分析机构所发生事件的第一事件特征,以及事故发生后第二预设时长内待分析机构所发生事件的第二事件特征;
9.事故负样本的标签用于表征对应时间段内待分析机构无事故发生;事故负样本的特征包括:对应时间段内待分析机构所发生事件的第三事件特征;
10.构建事故分析待训练模型,具体包括:获取若干事件类型,并在事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,以及在事故分析待训练模型中创建事故对应的事故节点;所述事故分析待训练模型为贝叶斯网络模型;
11.根据所述事故样本集合,训练所述事故分析待训练模型,得到事故分析模型;所述事故分析模型至少用于分析事件类型与事故之间的影响关系。
12.可选地,所述获取事故样本集合,包括:
13.从若干数据源获取待分析机构的相关数据;所述相关数据包括:待分析机构相关事件的事件信息,以及待分析机构相关事故的事故信息;
14.从所述相关数据中,获取事故样本添加到事故样本集合中。
15.可选地,所述事件信息至少包括发生时间;所述事故信息至少包括发生时间;
16.所述从所述相关数据中,获取事故样本添加到事故样本集合中,包括:
17.从预设时间点开始,循环执行以下步骤,直到满足第一停止条件:
18.在确定所述相关数据中存在发生时间在指定时间段内的相关事故的情况下,根据
所确定的事故生成事故正样本;所述指定时间段为当前预设时间点之后第三预设时长的时间段;将所生成的事故正样本添加到事故样本集合中;
19.在确定所述相关数据中不存在发生时间在所述指定时间段内的相关事故的情况下,根据发生时间在所述指定时间段内的相关事件生成事故负样本;将所生成的事故负样本添加到事故样本集合中;
20.将当前预设时间点之后第四预设时长的时间点确定为当前预设时间点。
21.可选地,所述获取若干事件类型,包括:
22.从所述事故样本集合中事故样本的事件特征中,确定若干事件类型。
23.可选地,所述从所述事故样本集合中事故样本的事件特征中,确定若干事件类型,包括:
24.针对所述事故样本集合中任一事故正样本,从该事故正样本的第一事件特征中,确定事故前事件类型,从该事故正样本的第二事件特征中,确定事故后事件类型。
25.可选地,所述训练所述事故分析待训练模型,包括:
26.通过训练确定所述事故分析待训练模型的网络结构;
27.基于所确定的网络结构,通过训练确定所述事故分析待训练模型的参数。
28.可选地,所述通过训练确定所述事故分析待训练模型的网络结构,包括:
29.确定所述事故分析待训练模型的初始网络结构;
30.循环执行以下步骤,直到满足第二停止条件:
31.基于预设评分函数对当前事故分析待训练模型的网络结构进行评分;
32.通过预设启发式算法更新当前事故分析待训练模型的网络结构。
33.可选地,所述预设评分函数为贝叶斯评分函数,所述预设启发式算法为模拟退火搜索算法。
34.可选地,所述通过训练确定所述事故分析待训练模型的参数,包括:
35.在所述事故样本集合中不存在所述事故分析待训练模型中任一事件类型的情况下,根据预设先验分布,利用期望最大化算法确定所述事故分析待训练模型的参数。
36.可选地,所述事故分析模型还用于:在确定部分节点所对应随机变量的取值的情况下,利用信念传播算法确定任一其他节点的边缘概率分布。
37.本说明书实施例第二方面提供一种事故分析模型训练装置,包括:
38.样本获取单元,用于针对待分析机构,获取事故样本集合;所述事故样本集合包括事故正样本和事故负样本;不同事故样本对应于不同时间段;
39.事故正样本的标签用于表征对应时间段内待分析机构有事故发生;事故正样本的特征包括:事故发生前第一预设时长内待分析机构所发生事件的第一事件特征,以及事故发生后第二预设时长内待分析机构所发生事件的第二事件特征;
40.事故负样本的标签用于表征对应时间段内待分析机构无事故发生;事故负样本的特征包括:对应时间段内待分析机构所发生事件的第三事件特征;
41.模型构建单元,用于构建事故分析待训练模型,具体包括:获取若干事件类型,并在事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,以及在事故分析待训练模型中创建事故对应的事故节点;所述事故分析待训练模型为贝叶斯网络模型;
42.训练单元,用于根据所述事故样本集合,训练所述事故分析待训练模型,得到事故
分析模型;所述事故分析模型至少用于分析事件类型与事故之间的影响关系。
43.可选地,所述样本获取单元具体用于:
44.从若干数据源获取待分析机构的相关数据;所述相关数据包括:待分析机构相关事件的事件信息,以及待分析机构相关事故的事故信息;
45.从所述相关数据中,获取事故样本添加到事故样本集合中。
46.可选地,所述事件信息至少包括发生时间;所述事故信息至少包括发生时间;
47.所述样本获取单元具体用于:
48.从预设时间点开始,循环执行以下步骤,直到满足第一停止条件:
49.在确定所述相关数据中存在发生时间在指定时间段内的相关事故的情况下,根据所确定的事故生成事故正样本;所述指定时间段为当前预设时间点之后第三预设时长的时间段;将所生成的事故正样本添加到事故样本集合中;
50.在确定所述相关数据中不存在发生时间在所述指定时间段内的相关事故的情况下,根据发生时间在所述指定时间段内的相关事件生成事故负样本;将所生成的事故负样本添加到事故样本集合中;
51.将当前预设时间点之后第四预设时长的时间点确定为当前预设时间点。
52.可选地,所述模型构建单元包括:
53.事件类型确定子单元,用于从所述事故样本集合中事故样本的事件特征中,确定若干事件类型。
54.可选地,所述事件类型确定子单元,具体用于:
55.针对所述事故样本集合中任一事故正样本,从该事故正样本的第一事件特征中,确定事故前事件类型,从该事故正样本的第二事件特征中,确定事故后事件类型。
56.可选地,所述模型训练单元,包括:
57.网络结构训练子单元,用于通过训练确定所述事故分析待训练模型的网络结构;
58.参数训练子单元,用于基于所确定的网络结构,通过训练确定所述事故分析待训练模型的参数。
59.可选地,所述网络结构训练子单元,具体用于:
60.确定所述事故分析待训练模型的初始网络结构;
61.循环执行以下步骤,直到满足第二停止条件:
62.基于预设评分函数对当前事故分析待训练模型的网络结构进行评分;
63.通过预设启发式算法更新当前事故分析待训练模型的网络结构。
64.可选地,所述预设评分函数为贝叶斯评分函数,所述预设启发式算法为模拟退火搜索算法。
65.可选地,所述参数训练子单元,具体用于:
66.在所述事故样本集合中不存在所述事故分析待训练模型中任一事件类型的情况下,根据预设先验分布,利用期望最大化算法确定所述事故分析待训练模型的参数。
67.可选地,所述事故分析模型还用于:在确定部分节点所对应随机变量的取值的情况下,利用信念传播算法确定任一其他节点的边缘概率分布。
68.本说明书实施例第三方面提供一种电子设备,包括处理器及存储器;所述存储器存储有可被处理器调用的程序;其中,所述处理器执行所述程序时,实现如前述任一实施例
所述的事故分析模型训练方法。
69.本说明书实施例第四方面提供一种机器可读存储介质,其上存储有程序,该程序被处理器执行时,实现如前述任一实施例所述的事故分析模型训练方法。
70.上述技术方案通过针对事件类型与事故,构建贝叶斯网络模型作为事故分析模型进行训练,得到基于事件类型的事故分析模型。事故分析模型可以用于分析事件类型与事故之间的影响关系,从而方便针对事故的影响因素进行分析。
附图说明
71.为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
72.图1是本说明书实施例提供的一种事故分析模型训练方法的流程示意图;
73.图2是本说明书实施例提供的一种事故分析模型的结构示意图;
74.图3是本说明书实施例提供的一种事故分析模型训练装置的结构示意图;
75.图4是用于配置本说明书实施例方法的一种设备的结构示意图。
具体实施方式
76.为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于公开的范围。
77.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
78.在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
79.应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种对象,但这些信息不应限于这些术语。这些术语仅用来将同一类型的对象彼此区分开。例如,在不脱离本发明范围的情况下,第一对象也可以被称为第二对象,类似地,第二对象也可以被称为第一对象。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
80.在各种业务执行的过程中,通常会发生各类事故。例如,生产事故、泄密事故、安全事故等。
81.为了方便进行应急管理,通常需要针对事故发生的影响因素进行分析,从而方便后续通过改进影响因素来预防事故的产生。影响因素例如,生产安全规范程度、保密措施有效程度、生产流程监管力度等。
82.为了便于理解,在一种具体的应用实施例中,某企业保管有客户的保密数据,但是泄密事故时有发生。经过专家分析,影响因素至少包括:员工操作规范程度、设备保密力度、保密数据价值、泄密惩罚力度等。例如,泄密惩罚力度较轻,可能会影响泄密事故的发生;保密数据价值较高,可能会影响泄密事故的发生。之后可以从员工操作规范和泄密惩罚制度等多种影响因素上进行改进,预防泄密事故的发生。
83.但在现有方案中,影响因素通常难以量化,例如,生产安全规范程度难以通过相对客观的方式进行评估,只能主观确定;泄密惩罚力度也只能主观确定。
84.相对应地,难以量化的影响因素与事故产生之间的影响关系也难以通过量化手段确定,从而难以针对事故进行分析。
85.例如,在某工厂的生产事故存在几十个影响因素的情况下(例如,流水线操作规范、包装操作规范、员工生产规范等等),难以针对几十个影响因素同时改进,通常需要确定出关键的影响因素进行改进。
86.但是较多的影响因素本身就难以量化,例如,员工保护措施的严密程度、生产规范程度,都难以给出客观的量化指标。因此,也难以通过量化的手段,确定出几十个影响因素对事故的影响关系,从而难以相对客观地确定出关键影响因素,难以有效预防事故的发生。
87.为了解决上述技术问题,本说明书实施例提供了一种事故分析模型训练方法。
88.由于多种影响因素本身难以量化,因此,可以选择能够反映影响因素的可量化数据进行事故分析。
89.在本方法中,可以通过可量化的事件进行事故分析。事件的量化数据可以至少包括事件是否发生和事件发生次数。当然,可选地,也可以将事件本身看作影响因素,对于事故的发生存在一定影响。
90.针对待分析的机构(具体可以是企业、集团、机关、行政部门等),可以获取待分析机构所发生的事件进行事故分析。所获取的事件可以包括经营事件、行政事件、人事变动事件等等。例如,员工工资发放、工商变更、行政处罚记录、高层人事变动、生产规范宣传、获奖记录等等。
91.为了便于解释,在本说明书实施例中,可选地,事件可以是待分析机构所发生的相关事件,具体可以包括行政事件、奖惩事件、人事变动事件等等。可选地,事故可以是待分析机构遭受损失的事件,损失具体可以包括财产损失、生命损失、声誉损失等等。也就是说,可选地,事件可以包含事故。
92.此外,可选地,为了便于区分,事件可以不包含事故,只包含非事故事件。
93.可选地,所获取的事件可以在一定程度上反映出各种影响因素的情况。
94.例如,针对影响因素生产规范程度,如果某企业经常受到生产规范的处罚,存在较多的生产规范处罚事件,则可以一定程度上反映出该企业的生产规范程度较低。如果某机关受到上级机关的生产规范奖励,存在生产规范奖励事件,则可以一定程度上反映出该机关的生产规范程度较高。
95.又例如,针对影响因素企业稳定程度,如果某企业的高层人事经常变动,存在较多的高层人事变动事件,则可以一定程度上反映出该企业的企业稳定程度较低。
96.而所获取的事件通常可以通过简单的统计方法进行量化。例如,事件是否发生、事件发生次数、涉及人数、涉及金额等等。
97.为了便于理解,下面给出几种具体的示例。
98.例如,可以通过获取待分析机构的行政处罚记录,确定出其中的生产规范处罚事件。具体可以统计在某一年内生产规范处理事件的发生次数和处罚金额。其中,发生次数和处罚金额的多少都可以一定程度上量化反映影响因素生产规范程度。
99.例如,可以通过获取待分析机构的企业变更记录,确定出其中的高层人事变动事件。具体可以统计在某一年内高层人事变动事件的发生次数和变动人数。发生次数和变动人数的多少可以一定程度上量化反映影响因素企业稳定程度。
100.此外,除了上述事件的量化,针对事故也可以进行量化。例如,事故是否发生、事故造成损失的多少、事故涉及金额、事故涉及人数等等。
101.由于事件和事故都可以进行量化,因此,可以通过量化的手段确定事件对事故的影响。
102.在本方法中,通过可量化的事件进行事故分析,具体可以是分析事件类型与事故之间的影响关系。
103.例如,针对生产规范惩罚事件类型、高层人事变动事件类型、安全知识宣传事件类型等,分析这些类型的事件对事故的影响。
104.由于这些类型的事件都可以进行量化,因此,可以采用量化手段分析这些事件类型对事故的影响。
105.在本方法中,可以采用贝叶斯网络模型,分析事件类型对事故的影响。
106.具体地,可以在贝叶斯网络模型中,针对不同事件类型和事故分别构建节点,每个节点可以对应于一个随机变量。之后通过训练确定节点对应随机变量的概率分布,从而可以确定出事故的条件概率分布,确定出事故在若干事件类型的不同取值条件下的不同发生概率,从而方便分析事件类型与事故之间的影响关系。
107.之后也可以利用贝叶斯网络模型进行事故预测和事故溯因,具体可以是在确定部分节点的随机变量取值后,可以通过信念传播算法计算其他节点的边缘概率分布。
108.例如,可以针对某个时间段内发生的事件类型,确定贝叶斯网络模型中对应节点的随机变量取值,从而可以通过信念传播算法计算事故对应节点的边缘概率分布,确定事故发生的边缘概率分布。也可以根据所发生事故的情况,确定贝叶斯网络模型中事故对应节点的随机变量取值,从而可以通过信念传播算法计算其他事件类型对应节点的边缘概率分布,进而确定可能造成此次事故的事件类型。
109.例如,在某一年内发生了10次高层人事变动事件,而贝叶斯网络模型中高层人事变动事件类型对应节点的随机变量是高层人事变动事件发生次数,因此,可以直接确定对应节点的取值为10。
110.之后可以根据所确定的事件类型对应节点的随机变量取值,通过信念传播算法确定出事故对应节点的边缘概率分布。具体地,事故对应节点的随机变量可以是事故是否发生,边缘概率分布具体可以是事故发生的边缘概率和事故不发生的边缘概率。
111.又例如,在发生了生产事故后,贝叶斯网络模型中事故对应节点的随机变量(事故是否发生)的取值可以确定为“是”,从而可以根据信念传播算法确定出贝叶斯网络模型中其他事件类型节点的边缘概率分布,从而可以分析出其他事件类型的事件是否发生,方便分析本次生产事故的原因。
112.综上所述,本说明书实施例所提供的一种事故分析模型训练方法中,可以针对事件类型与事故,构建贝叶斯网络模型作为事故分析模型进行训练,得到基于事件类型的事故分析模型。
113.事故分析模型可以用于通过多种方式分析事件类型与事故之间的影响关系,方便针对事故进行分析,从而方便预防事故的发生。
114.下面结合附图,针对本说明书实施例提供的一种事故分析模型训练方法进行详细解释。
115.如图1所示,为本说明书实施例提供的一种事故分析模型训练方法的流程示意图。其中至少可以包括以下步骤。在一种可选的实施例中,该方法流程可以应用于生产事故场景,针对生产事故进行分析。
116.s101:针对待分析机构,获取事故样本集合。
117.其中,事故样本集合可以包括事故正样本和事故负样本;不同事故样本可以对应于不同时间段。
118.事故正样本的标签可以用于表征对应时间段内待分析机构有事故发生;事故正样本的特征可以包括:事故发生前第一预设时长内待分析机构所发生事件的第一事件特征,以及事故发生后第二预设时长内待分析机构所发生事件的第二事件特征。
119.事故负样本的标签可以用于表征对应时间段内待分析机构无事故发生;事故负样本的特征可以包括:对应时间段内待分析机构所发生事件的第三事件特征。
120.s102:构建事故分析待训练模型,具体包括:获取若干事件类型,并在事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,以及在事故分析待训练模型中创建事故对应的事故节点。
121.其中,事故分析待训练模型可以为贝叶斯网络模型。
122.s103:根据事故样本集合,训练事故分析待训练模型,得到事故分析模型。
123.事故分析模型至少可以用于确定事件类型与事故之间的影响关系。
124.上述方法流程,通过事故样本集合中事故样本的事件特征和事故标签,可以训练贝叶斯网络模型,得到基于事件类型的事故分析模型,从而方便针对待分析机构的事故进行分析,具体可以包括确定事件类型对事故的影响关系,也可以包括针对部分确定取值的节点,使用信念传播算法确定其他节点的边缘概率分布,从而方便进行事故预测或事故溯因。
125.此外,由于训练事故分析模型的事故样本集合中,事故正样本的特征中包括了事故后所发生事件的事件特征。因此,事故分析模型也可以学习到事故的发生对于其他事件类型的影响。
126.下面针对各个步骤进行详细的解释。
127.s101:针对待分析机构,获取事故样本集合。
128.下面分别针对待分析机构和事故样本集合这两点进行解释。
129.1、待分析机构。
130.在一种可选的实施例中,待分析机构可以是需要进行事故分析的机构,机构具体可以是企业、集团、机关、行政部门等等。
131.在一种可选的实施例中,可以针对多个待分析机构中的每个待分析机构,获取事
故样本集合用于训练事故分析模型。
132.可选地,可以针对多个待分析机构,获取事故样本集合。具体可以综合多个待分析机构的事故样本得到一个事故样本集合,用于训练事故分析模型。
133.可选地,所针对的不同待分析机构可以是相同行业或者相近行业或者存在相似业务的机构,从而可以综合多个待分析机构的事故样本,提高事故样本数量,也可以提高事故分析模型的效果。
134.2、事故样本集合。
135.在一种可选的实施例中,事故样本集合中可以包含若干事故样本。可选地,事故样本的特征可以包括事件相关的特征,事故样本的标签可以用于表征事故相关的信息。为了便于描述,将事故样本的特征称为事件特征,将事故样本的标签称为事故标签。
136.可选地,事故样本的事件特征可以用于表征事故相关事件的特征,具体可以是无事故情况下的事件的特征,也可以是有事故情况下事故前后事件的特征。可选地,事故样本的事件特征中,可以包括事件类型以及对应的事件相关量化数据,从而方便后续训练用于确定事件类型和事故之间影响关系的事故分析模型。事件相关量化数据可以包括:事件是否发生、事件发生次数、事件涉及人数等。
137.可选地,事故样本的事故标签可以用于表征事故的相关信息。事故相关信息例如,事故是否发生、事故类型、事故等级、事故涉及人数等等。
138.在一种可选的实施例中,可以区分事故是否发生的事故样本。可选地,事故样本集合中可以包含事故正样本和事故负样本,具体可以包含若干事故正样本和若干事故负样本。针对事故正样本和事故负样本,所确定的事件特征可以并不相同。
139.可选地,不同事故样本可以对应于不同时间段,其中,不同事故样本对应的不同时间段可以存在重合部分。不同事故样本对应的不同时间段也可以长度不同。
140.可选地,如果某一时间段内待分析机构发生事故,则可以确定该时间段对应的事故样本为事故正样本。而该事故样本的事故标签可以根据所发生事故的相关信息确定,该事故样本的事件特征可以根据所发生事故的前后事件确定,从而方便确定事故前发生事件类型对事故的影响,也方便确定事故对事故后发生事件类型的影响。
141.因此,可选地,事故正样本的标签可以用于表征对应时间段内待分析机构有事故发生。事故正样本的特征可以包括:事故发生前第一预设时长内待分析机构所发生事件的第一事件特征,以及事故发生后第二预设时长内待分析机构所发生事件的第二事件特征。其中的第一预设时长和第二预设时长并不具体限定,可以是根据专家经验指定的,也可以是通过数据统计方法确定的。
142.可选地,第一事件特征可以是一种或多种事件类型的特征。具体可以是根据事故发生前第一预设时长内待分析机构所发生的若干事件,确定出第一事件特征。第二事件特征可以是一种或多种事件类型的特征。具体可以是根据事故发生后第二预设时长内待分析机构所发生的若干事件,确定出第二事件特征。
143.可选地,如果某一时间段内待分析机构没有发生事故,则可以确定该时间段对应的事故样本为事故负样本。由于该时间段内不存在事故,该事故样本的事故标签可以表征对应时间段内待分析机构无事故发生,并且可以将该事故样本对应时间段内的事件都看作是事故发生前的事件,该事故样本的事件特征可以根据对应时间段内待分析机构所发生的
事件确定。
144.因此,可选地,事故负样本的标签可以用于表征对应时间段内待分析机构无事故发生;事故负样本的特征可以包括:对应时间段内待分析机构所发生事件的第三事件特征。
145.可选地,第二事件特征可以是一种或多种事件类型的特征。具体可以是根据对应时间段内待分析机构所发生的若干事件,确定出第三事件特征。
146.为了便于理解,下面给出事故样本的示例。
147.某一事故样本的特征可以是:行政处罚3次、生产规范宣传2次、高层人事变动4次。该事故样本的标签可以是:无事故发生。
148.另一事故样本的特征可以是:事故前行政处罚10次、事故前生产规范宣传0次、事故前高层人事变动9次、事故后法律诉讼3次。该事故样本的标签可以是:有事故发生、事故等级2级、事故涉及5人。
149.另一事故样本的特征可以是:存在经营异常事件、存在违法违规事件、不存在工商变更。该事故样本的标签可以是:无事故发生。
150.当然,本方法流程并不限定事故样本的特征形式或标签形式,上述示例仅仅用于示例性说明。其中,有无事故发生可以使用数据替换,具体可以使用1表征有事故发生,使用0表征无事故发生。
151.在明确了事故样本之后,本方法流程并不限定事故样本集合的来源。可以是直接从待分析机构获取,也可以是通过数据融合的方式,从多个数据来源获取。
152.在一种可选的实施例中,获取事故样本集合,可以包括:从若干数据源获取待分析机构的相关数据。从待分析机构的相关数据中,可以获取事故样本添加到事故样本集合中。
153.可选地,若干数据源可以包括监管部门或行政部门等,从其中可以方便地获取到待分析机构的经营数据和处罚信息等。若干数据源也可以包括若干待分析机构相关的网站,例如,可以从待分析机构的官网获取数据,具体可以是奖励信息、高层人事变动等。
154.可选地,待分析机构的相关数据可以包括:待分析机构相关事件的事件信息,以及待分析机构相关事故的事故信息。
155.此外,可选地,所获取的待分析机构相关数据的形式可能是文本或图片,因此,需要通过特征工程,针对相关数据进行信息提取,从而方便后续从待分析机构相关数据中获取事故样本。
156.例如,可以通过文本结构化解析,从事故报告抽取事故相关信息,如处罚机关,处罚金额等。
157.本方法流程并不限定从待分析机构的相关数据中获取事故样本的方法。
158.可选地,可以直接确定若干时间段,根据时间段内的事故和事件,获取事故样本。具体地,可以确定出若干时间段后,针对任一时间段,如果相关数据显示该时间段内待分析机构发生事故,则可以获取事故正样本;如果相关数据显示该时间段内待分析机构没有发生事故,则可以获取事故负样本。
159.在一种可选的实施例中,可以针对待分析机构的事件和事故按照时间进行排序,再通过滑动窗口获取事故样本。
160.可选地,待分析机构的相关信息中,事件信息至少包括发生时间,事故信息至少包括发生时间;从待分析机构的相关数据中,获取事故样本添加到事故样本集合中,可以包括
以下步骤。
161.从预设时间点开始,循环执行以下步骤s1-s3,直到满足第一停止条件。本实施例并不具体限定第一停止条件,可选地,第一停止条件可以是事故样本集合中样本数量达到上限,或者循环次数达到上限,或者指定时间段内不存在事件或事故,或者指定时间段内包含当下的时间点。指定时间段为当前预设时间点之后第三预设时长的时间段。
162.s1:在确定待分析机构相关数据中存在发生时间在指定时间段内的相关事故的情况下,根据所确定的事故生成事故正样本;将所生成的事故正样本添加到事故样本集合中。
163.s2:在确定待分析机构相关数据中不存在发生时间在指定时间段内的相关事故的情况下,根据发生时间在指定时间段内的相关事件生成事故负样本;将所生成的事故负样本添加到事故样本集合中。
164.s3:将当前预设时间点之后第四预设时长的时间点确定为当前预设时间点。
165.可选地,第三预设时长可以看作是滑动窗口的长度,第四预设时长可以看作是滑动窗口的步长。第三预设时长和第四预设时长可以不同。
166.在本实施例中,通过滑动窗口获取事故样本,可以增加事故样本的数量,方便提高后续模型训练的效果。
167.在一种可选的实施例中,具体根据所确定的事故生成事故正样本,可以是根据单个事故生成事故正样本。
168.可选地,在确定待分析机构相关数据中存在发生时间在指定时间段内的相关事故的情况下,根据所确定的事故生成事故正样本,可以针对所存在的每个事故生成一个事故正样本。
169.例如,如果存在3个事故,则可以分别针对每个事故,根据该事故的相关信息确定事故正样本的事故标签,并根据该事故前第一预设时长内待分析机构所发生事件,得到事故正样本的第一事件特征;根据该事故后第二预设时长内待分析机构所发生事件,得到事故正样本的第二事件特征。从而可以得到3个事故正样本。
170.此外,可选地,在具体获取事故样本,确定事故样本的事件特征时,可以避免将其他事故作为事件特征。当然,在其他可选的实施例中,也可以能够将其他事故作为事件特征。
171.s102:构建事故分析待训练模型,具体包括:获取若干事件类型,并在事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,以及在事故分析待训练模型中创建事故对应的事故节点。
172.其中,事故分析待训练模型可以为贝叶斯网络模型。
173.在一种可选的实施例中,由于事故分析模型可以用于确定事件类型与事故之间的影响关系,因此,通常需要选择可能影响事故的事件类型,用于创建事件节点。
174.因此,可选地,获取若干事件类型,具体可以是根据专家经验,获取到若干可能影响事故的事件类型。
175.可选地,获取若干事件类型,也可以是根据所获取的客观数据确定,具体可以是根据事故样本集合确定。具体地,获取若干事件类型,可以包括:从事故样本集合中事故样本的事件特征中,确定若干事件类型。
176.可选地,事件特征中可以包括事件类型。
177.因此,具体从事件特征中确定事件类型,可以直接从事件特征中获取所包含的事件类型。
178.在本实施例中,通过事故样本集合确定若干事件类型,并创建对应的事件节点,可以方便后续根据事故样本集合训练事故分析待训练模型。
179.此外,由于事故正样本的特征中包括事故前发生事件的特征和事故后发生事件的特征,因此,可以区分不同的事件类型。具体可以包括事故前事件类型和事故后事件类型。
180.可选地,从事故样本集合中事故样本的事件特征中,确定若干事件类型,可以包括:针对事故样本集合中任一事故正样本,从该事故正样本的第一事件特征中,确定事故前事件类型,从该事故正样本的第二事件特征中,确定事故后事件类型。
181.相对应地,可选地,事故负样本的事件特征可以看作是事故前发生事件的特征。
182.在一种可选的实施例中,在贝叶斯网络模型中创建节点时,由于贝叶斯网络模型中的节点需要对应于随机变量的概率分布,因此,在具体创建节点时,需要指定节点对应的随机变量。
183.本方法流程并不具体限定指定节点对应随机变量的方法,可以是人工指定,也可以是按照预设的“事件或事故是否发生”随机变量进行确定。
184.在一种可选的实施例中,事故样本集合中的事故样本特征中,可以包含有事件的量化数据和事故的量化数据,可以根据事故样本集合中的事故样本特征确定事件节点对应的随机变量或事故节点对应的随机变量。
185.可选地,在事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,具体并不限定针对每个事件类型所创建的事件节点数量,可以针对每个事件类型创建对应的一个或多个事件节点,用于对应不同的随机变量。
186.例如,针对高层人事变动事件类型,可以创建对应于“高层人事变动事件是否发生”这一随机变量的事件节点,也可以创建对应于“高层人事变动事件涉及人数”这一随机变量的事件节点,也可以创建对应于“高层人事变动事件发生次数”这一随机变量的事件节点。
187.可选地,在事故分析待训练模型中创建事故对应的事故节点,可以创建事故对应的一个或多个事故节点,用于对应不同的随机变量。
188.例如,在创建事故节点时,可以创建多个事故节点,分别对应于事故是否发生的随机变量、事故等级的随机变量、事故发生部门的随机变量等等。当然,也可以创建单个事故节点。
189.此外,可选地,还可以在事故分析待训练模型中创建其他可能对事故产生影响的节点。可选地,可以在事故分析待训练模型中针对待分析机构的相关信息创建信息节点。待分析机构的相关信息可以包括待分析机构的规模、行业、员工人数等等。
190.在一种可选的实施例中,s102中在事故分析待训练模型中已经创建了节点,而节点之间的边可以预先指定,具体可以是根据人工经验或者专家指导进行指定。需要说明的是,贝叶斯网络模型中包含节点和边,组成了有向无环图。并且,贝叶斯网络模型中的边可以表征所连接节点之间的概率依赖关系。
191.因此,可以根据经验,确定节点对应的随机变量之间可能存在的概率依赖关系,得到初始的事故分析待训练模型,以便于后续的模型训练。
192.s103:根据事故样本集合,训练事故分析待训练模型,得到事故分析模型。
193.其中,事故分析模型至少可以用于确定事件类型与事故之间的影响关系。
194.为了便于理解,如图2所示,为本说明书实施例提供的一种事故分析模型的结构示意图。
195.事故分析模型中可以包括4个事件节点1-4和1个事故节点。
196.事件节点1对应于事故前行政处罚事件类型,也对应于随机变量“事故前行政处罚事件是否发生”。
197.事件节点2对应于事故前人事变动事件类型,也对应于随机变量“事故前人事变动事件是否发生”。
198.事件节点3对应于事故后行政处罚事件类型,也对应于随机变量“事故后行政处罚事件是否发生”。
199.事件节点4对应于事故后法律诉讼事件类型,也对应于随机变量“事故后法律诉讼事件是否发生”。
200.事故节点对应于随机变量“事故是否发生”。
201.此外,事故分析模型中存在从事件节点1指向事故节点的有向边,从事件节点2指向事故节点的有向边,从事故节点指向事件节点3的有向边和从事故节点指向事件节点4的有向边。
202.需要说明的是,事故分析模型中的参数,就是每个节点对应随机变量的条件概率分布。
203.例如,事故节点对应随机变量的条件概率分布,可以是在事故前行政处罚事件是否发生和事故前人事变动事件是否发生的条件下的概率分布。根据这一概率分布,可以方便确定事故前行政处罚事件和事故前人事变动事件对事故发生的影响关系。
204.可见,在上述事故分析模型示例中,事故前行政处罚事件是否发生,以及事故前人事变动事件是否发生,对于事故的是否发生存在一定的影响关系,具体的影响关系可以根据条件概率分布进行分析。此外,事故是否发生,对于事故后行政处罚事件是否发生,以及事故后法律诉讼事件是否发生也存在一定的影响关系,具体的影响关系可以根据条件概率分布进行分析。
205.在一种可选的实施例中,训练所述事故分析待训练模型,可以包括:通过训练确定事故分析待训练模型的网络结构;基于所确定的网络结构,通过训练确定事故分析待训练模型的参数。
206.换言之,在训练贝叶斯网络模型时,需要先通过训练确定网络结构,再确定出模型参数。
207.1、网络结构。
208.在一种可选的实施例中,通过训练确定事故分析待训练模型的网络结构,可以设置贝叶斯评分函数用于确定损失,再通过预设的搜索算法针对网络结构进行更新迭代(具体可以是更新有向边的数量和位置),直到满足停止条件,停止条件具体可以是贝叶斯评分满足条件,或者最终收敛,或者迭代次数达到预设上限。
209.可选地,预设的搜索算法可以包括模拟退火搜索算法、爬山算法等。
210.可选地,可以采用基于贝叶斯评分函数的模拟退火搜索算法,来定性地分析因子
之间的拓扑关系:f:d

g。
211.其中d为数据集,g为贝叶斯网络结构。具体步骤可以包括:1)根据专家经验确定模型初始结构。2)通过机器学习优化结构。首先通过贝叶斯评分函数获得因子间的影响程度;其次通过模拟退火启发式搜索算法迭代发现下一个分数更高的结构。3)当结构趋于稳定,根据专家经验修正最终结构。从而可以结合客观数据和业务经验,构建出事故分析模型的网络结构,并且由于各个节点都存在对应的随机变量,因此可解释性较强。
212.可选地,通过训练确定事故分析待训练模型的网络结构,可以包括:确定事故分析待训练模型的初始网络结构;循环执行以下步骤,直到满足第二停止条件:基于预设评分函数对当前事故分析待训练模型的网络结构进行评分,通过预设启发式算法更新当前事故分析待训练模型的网络结构。
213.可选地,确定事故分析待训练模型的初始网络结构,需要确定事故分析待训练模型中各个节点之间的有向边。
214.可选地,可以根据业务经验和专家指导,针对事故分析待训练模型中各个节点之间可能的影响,在不同节点之间构建有向边。例如,经过专家指导,认为事故前发生高层人事变动事件对事故产生的影响较大,因此,可以针对事故前高层人事变动事件类型对应的事件节点和事故节点,构建从该事件节点指向该事故节点的有向边。通过这种方式,可以得到一个初始网络结构,方便后续模型训练。
215.可选地,也可以针对事故样本集合进行分析,初步确定影响关系较大的不同节点,构建有向边,也可以得到一个初始网络结构。
216.本实施例并不限定第二停止条件,具体可以是网络结构趋于收敛,也可以是循环次数达到预设上限,也可以是基于贝叶斯评分函数得到的评分大于预设评分阈值,满足一定要求等等。
217.可选地,具体针对事故分析待训练模型的网络结构进行评分时,预设评分函数可以是贝叶斯评分函数,也可以是其他评分函数。
218.可选地,预设启发式算法可以是蚁群算法或模拟退火算法等等。
219.在一种可选的实施例中,在循环停止后,可以确定出事故分析待训练模型的网络结构,方便后续进行参数学习。可选地,由于事故分析待训练模型中的节点对应的随机变量都具有实际含义,因此,可以进一步借助业务经验和专家指导针对事故分析待训练模型的网络结构进行修正。例如,循环停止后,事故分析待训练模型的网络机构中,存在从事故后事件类型对应节点指向事故前事件类型对应节点的有向边,而实际中由于时序关系的存在,并不存在事故后事件对事故前事件的影响,因此,可以删除该有向边,或者修改该有向边的方向。
220.需要说明的是,贝叶斯网络模型中,能够体现出不同节点之间的概率依赖关系,换言之,在事故分析模型中,除了体现出事件节点与事故节点之间的概率依赖关系,例如,事件类型对于事故的影响,事故对于事件类型的影响等等,还可以体现出不同事件节点之间的概率依赖关系,也就是不同事件类型之间的影响,从而方便待分析机构从全局分析事故产生的原因,并针对性地进行改进。
221.例如,事故分析模型可以用于确定事件类型与事故之间的影响关系,具体可以包括事故前事件类型对事故的影响关系,以及事故对事故后事件类型的影响关系。此外,还可
以包括事件类型之间的影响关系。具体可以是,违法事件类型与经营异常事件类型之间可能存在影响关系。
222.2、模型参数。
223.参数学习的目标是,给定网络结构g和训练样本集d(即事故样本集合),确定贝叶斯网络模型各节点对应随机变量的条件概率分布。
224.其中,如果事故样本集合中包含贝叶斯网络模型中各节点对应的随机变量相关数据,即,事故样本集合是针对事故分析待训练模型的完备数据集,则可以直接根据事故样本集合确定条件概率分布。
225.可选地,在事故样本集合中存在事故分析待训练模型中每个事件类型的情况下,可以通过最大似然估计方法和贝叶斯估计方法进行参数学习。
226.可选地,事故样本集合中存在事故分析待训练模型中每个事件类型,具体可以是事故样本集合中存在事故分析待训练模型中每个事件类型相关的事件特征,从而方便根据客观数据确定事故分析待训练模型中每个事件节点的概率分布。
227.例如,在构建事故分析待训练模型时,根据事故样本集合中事故样本的事件特征中,确定事件类型用于创建对应的事件节点的情况下,事故样本集合中存在事故分析待训练模型中每个事件类型。
228.可选地,事故样本集合中也可能不存在事故分析待训练模型中的任一事件类型,具体地,事故样本集合中可能不存在事故分析待训练模型中任一事件类型相关的事件特征,事故样本集合中可以不存在事故分析待训练模型中一个或多个事件类型相关的事件特征。
229.可选地,在构建事故分析待训练模型时,可以获取若干事件类型,具体可以是根据专家经验获取事件类型。但是这些事件类型的相关数据可能难以收集到,因此,事故样本集合中可能不存在部分所获取的事件类型。
230.针对这些事故样本集合缺失的事件类型,所对应的事件节点难以根据客观数据确定概率分布。
231.在一种可选的实施例中,在事故样本集合中不存在事故分析待训练模型中任一事件类型的情况下,可以采用期望最大化算法确定事故分析待训练模型的参数。
232.其中,期望最大化算法的原理是先假设一组模型参数,从而确定出缺失数据的概率分布。再根据缺失数据的概率分布,综合其他数据,可以通过极大化似然函数可以确定出新的模型参数,进而循环执行上述步骤,根据新的模型参数确定缺失数据的概率分布,直到满足循环停止条件。循环停止条件具体可以是达到收敛条件。
233.可选地,可以通过预设的先验分布,假设一组模型参数。预设先验分布可以是狄利克雷先验分布。
234.在一种可选的实施例中,通过训练确定事故分析待训练模型的参数,可以包括:在事故样本集合中不存在事故分析待训练模型中任一事件类型的情况下,根据预设先验分布,利用期望最大化算法确定事故分析待训练模型的参数。
235.可选地,期望最大化算法可以包含以下步骤:循环执行以下步骤,e步和m步交替迭代执行,直到满足预设循环停止条件。
236.e步:计算事故分析待训练模型中的联合概率分布的条件概率期望。
237.具体地,可以通过以下公式进行计算:
238.q(z)=p(z|d,θi)
239.其中,事故样本集合为d,事故样本集合所缺失的事件类型为z,事故分析待训练模型的参数为θ,其中,θi可以表示当前的模型参数。第一次循环中的模型参数可以是假设的。
240.之后可以根据q(z)确定出关于θ的似然函数:
241.l(θ)=q(z)log p(d,z|θ)
242.m步:极大化似然函数,得到新的模型参数θ
i+1
。具体可以通过以下公式进行计算:
[0243][0244]
可选地,如果θ
i+1
已经收敛,则算法结束,输出最终的模型参数θ,否则继续迭代处理。
[0245]
之后可以利用新的模型参数θ
i+1
循环执行e步,直到满足循环停止条件。
[0246]
循环停止条件可以是模型参数收敛,或者循环达到预设上限。
[0247]
本方法流程并不限定似然函数的形式,上述仅仅用于示例性说明。
[0248]
可选地,采用期望最大em算法迭代计算概率分布,具体步骤为循环执行以下步骤,e步和m步交替执行。
[0249]
其中,e步为:
[0250]
q(z)=p(z|d,θi)
[0251]
其中,事故样本集合为d,事故样本集合所缺失的事件类型为z,事故分析待训练模型的参数为θ,其中,θi可以表示当前的模型参数。第一次循环中的模型参数可以是假设的。
[0252]
m步为:
[0253][0254]
可选地,如果θ
i+1
已经收敛,则算法结束,输出最终的模型参数θ,否则继续迭代处理。
[0255]
之后可以利用新的模型参数θ
i+1
循环执行e步,直到满足循环停止条件。
[0256]
循环停止条件可以是模型参数收敛,或者循环达到预设上限。
[0257]
其中,关于θ的似然函数可以是根据以下不等式确定的。
[0258][0259]
在固定参数θ的情况下,上述不等式可以取等号。
[0260]
在通过上述实施例确定出模型参数后,可以得到事故分析模型。
[0261]
可选地,事故分析模型可以根据其中事故节点的条件概率分布,确定其他事件节点对于事故的影响关系,从而可以确定出事件类型对事故的影响关系,以及事故对其他事件类型的影响关系。
[0262]
此外,还可能确定出不同事件类型之间的影响关系。
[0263]
可见,事故分析模型可以从全局的视角把握事件类型和事故之间的影响关系,从而方便针对事故进行分析。
[0264]
在一种可选的实施例中,可以通过确定部分节点的随机变量取值,根据事故分析模型针对其他节点确定边缘概率分布,从而方便进行预测和溯因。
[0265]
可选地,事故分析模型还可以用于:在确定部分节点所对应随机变量的取值的情况下,利用信念传播算法确定任一其他节点的边缘概率分布。
[0266]
可选地,可以是在确定一个或多个节点所对应随机变量的取值的情况下,利用信念传播算法确定任一其他节点的边缘概率分布。
[0267]
具体地,可以在确定部分事件节点的随机变量取值的情况下,例如,确定部分事件类型的事件已经发生,从而可以确定这部分事件类型对应的事件节点的随机变量取值,进而可以通过信念传播算法,确定出事故节点的随机变量边缘概率分布,从而可以确定在已经发生部分事件类型事件的条件下,事故相关情况的概率分布,具体可以是事故是否发生的概率分布,进而可以帮助分析预测事故是否发生。
[0268]
当然,事故相关情况也可以包括事故等级、事故发生部门、事故涉及人数等等的随机变量,都可以根据信念传播算法确定出边缘概率分布,帮助分析预测事故可能的情况。
[0269]
当然,也可以在已经发生事故的情况下,根据事故的相关信息,确定事故节点的随机变量取值,进而通过信念传播算法,确定其他事件节点的边缘概率分布,具体可以是确定其他事件节点是否发生的边缘概率分布,从而帮助分析确定事故发生的原因。
[0270]
信念传播算法可以计算事故分析模型中每个随机变量的边缘概率分布。随机变量的影响可以在事故分析模型的网络结构中传播,当观察到一部分随机变量的取值,就可以推断目标变量的边缘概率分布。根据目标变量(可以是事故相关的随机变量,也可以是其他事件类型的随机变量)的边缘概率分布,可以进行分析,具体地,由于各个变量都具有明确的意义,可解释性较强,因此,可以结合主观的业务经验或者专家指导,帮助进行全面分析。具体可以结合事故分析模型的结果和主观经验互相验证,从而方便针对事故进行全面分析,对应急管理提出辅助的建议。
[0271]
综上所述,事故分析模型可以用于从多种角度针对事故与事件类型之间的影响关系进行分析,可以确定事件类型对事故的影响程度,也可以根据条件利用信念传播算法进行预测和溯因等等,方便针对事故进行全面分析。
[0272]
上述方法流程通过针对事件类型和事故构建贝叶斯网络模型,作为事故分析模型帮助进行事故分析,可以从全局视角观测事件类型在不同条件下对事故的影响程度,并且可以显性地表达各个随机变量的意义,具有较强的可解释性,也就使得可以结合专家指导或业务经验,针对事故分析模型的结果进行分析和验证,也可以进行解释和修正。
[0273]
例如,针对事故分析模型中事故节点的条件概率分布(高层人事变动事件发生,则事故发生概率为90%,不发生概率为10%),可以结合业务经验进行解释和修正。具体可以针对条件概率分布进行解释,高层人事变动很容易导致事故发生。而这一解释也能够被业务经验验证。
[0274]
因此,上述方法流程的事故分析模型是基于客观数据训练得到的,实现了针对不同事件类型对事故影响关系的量化,不仅深刻揭示事故规律,而且可以提供一种衡量管理手段,通过控制不同事件类型的条件,实现精细化管理和精准执法。
[0275]
同时,也可以方便基于大量客观数据与专家经验,为应急管理提供双重驱动的学习与结论验证的能力。
[0276]
并且,上述方法流程可以通过信念传播算法,动态观察在不同条件下事件类型与事故之间的影响程度,为应急管理提供了一种可交互的工作模式,且可通过不完全证据推理结论。
[0277]
此外,上述方法流程的可扩展性强,在添加新的事件节点或事故节点(具体可以是添加新的事件类型或新的事故信息)时,可以直接根据已有的网络结构,快速执行训练,不需要大幅改变模型配置。
[0278]
为了便于理解,本说明书实施例还提供了一种应用实施例。
[0279]
在安全生产事故的场景中,可以通过构建生产事故分析待训练模型,用于分析任一机构的事件类型与生产事故之间的影响关系。
[0280]
具体地,可以针对待分析机构,获取生产事故样本集合。
[0281]
其中,生产事故样本集合可以包括事故正样本和事故负样本;不同事故样本可以对应于不同时间段。
[0282]
事故正样本的标签可以用于表征对应时间段内待分析机构有生产事故发生;事故正样本的特征可以包括:生产事故发生前第一预设时长内待分析机构所发生事件的第一事件特征,以及生产事故发生后第二预设时长内待分析机构所发生事件的第二事件特征。
[0283]
事故负样本的标签可以用于表征对应时间段内待分析机构无生产事故发生;事故负样本的特征可以包括:对应时间段内待分析机构所发生事件的第三事件特征。
[0284]
之后,可以构建生产事故分析待训练模型,具体包括:获取若干事件类型,并在生产事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,以及在生产事故分析待训练模型中创建生产事故对应的事故节点。
[0285]
其中,生产事故分析待训练模型可以为贝叶斯网络模型。
[0286]
具体地,所获取的事件类型可以包括:生产规范日常检查事件、生产规范惩罚事件、安全知识宣传事件、安全设施建设事件等等。这些事件类型可以是根据业务经验和专家指导确定的,也可以是根据生产事故样本集合中事故样本的事件特征确定的。
[0287]
具体地,针对生产事故创建对应的事故节点,可以指定生产事故是否发生、生产事故等级、生产事故涉及人数、生产事故所在部门等随机变量创建对应的事故节点。
[0288]
最后,可以根据生产事故样本集合,训练生产事故分析待训练模型,得到生产事故分析模型。
[0289]
生产事故分析模型至少可以用于确定事件类型与生产事故之间的影响关系。
[0290]
上述应用实施例的具体解释可以参见上述方法流程的解释。
[0291]
对应于上述方法流程,本说明书实施例还提供了一种装置实施例。
[0292]
如图3所示,为本说明书实施例提供的一种事故分析模型训练装置的结构示意图。其中可以包括以下单元。
[0293]
样本获取单元301,用于针对待分析机构,获取事故样本集合。
[0294]
事故样本集合包括事故正样本和事故负样本;不同事故样本对应于不同时间段。
[0295]
事故正样本的标签用于表征对应时间段内待分析机构有事故发生;事故正样本的特征包括:事故发生前第一预设时长内待分析机构所发生事件的第一事件特征,以及事故发生后第二预设时长内待分析机构所发生事件的第二事件特征。
[0296]
事故负样本的标签用于表征对应时间段内待分析机构无事故发生;事故负样本的
特征包括:对应时间段内待分析机构所发生事件的第三事件特征。
[0297]
模型构建单元302,用于构建事故分析待训练模型,具体包括:获取若干事件类型,并在事故分析待训练模型中针对所获取的每个事件类型创建对应的事件节点,以及在事故分析待训练模型中创建事故对应的事故节点。
[0298]
事故分析待训练模型为贝叶斯网络模型。
[0299]
训练单元303,用于根据事故样本集合,训练事故分析待训练模型,得到事故分析模型。
[0300]
事故分析模型至少用于分析事件类型与事故之间的影响关系。
[0301]
可选地,样本获取单元301可以具体用于:从若干数据源获取待分析机构的相关数据;相关数据包括:待分析机构相关事件的事件信息,以及待分析机构相关事故的事故信息。从相关数据中,获取事故样本添加到事故样本集合中。
[0302]
可选地,事件信息至少包括发生时间;事故信息至少包括发生时间。
[0303]
样本获取单元301可以具体用于:从预设时间点开始,循环执行以下步骤,直到满足第一停止条件:在确定相关数据中存在发生时间在指定时间段内的相关事故的情况下,根据所确定的事故生成事故正样本;指定时间段为当前预设时间点之后第三预设时长的时间段;将所生成的事故正样本添加到事故样本集合中;在确定相关数据中不存在发生时间在指定时间段内的相关事故的情况下,根据发生时间在指定时间段内的相关事件生成事故负样本;将所生成的事故负样本添加到事故样本集合中。将当前预设时间点之后第四预设时长的时间点确定为当前预设时间点。
[0304]
可选地,模型构建单元302包括:事件类型确定子单元302a,用于从事故样本集合中事故样本的事件特征中,确定若干事件类型。
[0305]
可选地,事件类型确定子单元302a,具体用于:针对事故样本集合中任一事故正样本,从该事故正样本的第一事件特征中,确定事故前事件类型,从该事故正样本的第二事件特征中,确定事故后事件类型。
[0306]
可选地,模型训练单元303,包括:网络结构训练子单元303a,用于通过训练确定事故分析待训练模型的网络结构。
[0307]
参数训练子单元303b,用于基于所确定的网络结构,通过训练确定事故分析待训练模型的参数。
[0308]
可选地,网络结构训练子单元303a,具体用于:确定事故分析待训练模型的初始网络结构;循环执行以下步骤,直到满足第二停止条件:基于预设评分函数对当前事故分析待训练模型的网络结构进行评分;通过预设启发式算法更新当前事故分析待训练模型的网络结构。
[0309]
可选地,预设评分函数可以为贝叶斯评分函数,预设启发式算法可以为模拟退火搜索算法。
[0310]
可选地,参数训练子单元303b,具体用于:在事故样本集合中不存在事故分析待训练模型中任一事件类型的情况下,根据预设先验分布,利用期望最大化算法确定事故分析待训练模型的参数。
[0311]
可选地,事故分析模型还用于:在确定部分节点所对应随机变量的取值的情况下,利用信念传播算法确定任一其他节点的边缘概率分布。
[0312]
上述装置实施例的具体解释可以参见上述方法流程的解释。
[0313]
本说明书实施例还提供一种电子设备,包括处理器及存储器;存储器存储有可被处理器调用的程序;其中,处理器执行该程序时,实现如上述任一方法实施例所述的事故分析模型训练方法。
[0314]
本说明书实施例还提供一种机器可读存储介质,其上存储有程序,该程序被处理器执行时,实现如上述任一方法实施例所述的事故分析模型训练方法。
[0315]
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现如上述任一方法实施例所述的事故分析模型训练方法。
[0316]
图4示出了本说明书实施例所提供的一种更为具体的计算机设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
[0317]
处理器1010可以采用通用的cpu(central processing unit,中央处理器)、微处理器、应用专用集成电路(application specific integrated circuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
[0318]
存储器1020可以采用rom(read only memory,只读存储器)、ram(random access memory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
[0319]
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
[0320]
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。
[0321]
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
[0322]
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
[0323]
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一方法实施例所述的事故分析模型训练方法。
[0324]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动
态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0325]
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
[0326]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
[0327]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0328]
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1