一种辐射场异常监测数据自动识别方法与流程

文档序号:29790664发布日期:2022-04-23 17:33阅读:136来源:国知局
一种辐射场异常监测数据自动识别方法与流程

1.本发明属于辐射监测领域,具体涉及一种辐射场异常监测数据自动识别方法。


背景技术:

2.对核设施中场所辐射剂量率的监测是核设施运行状态下安全监控的重要环节。当前核设施内场所辐射剂量率测量设备种类较多,能够满足测量需求,测量点位覆盖场所关键区域。
3.但目前测量数据处理水平较低,仅通过判断是否超阈值方式进行报警,为保证该方式不会漏报警,通常将阈值设置偏低,这样会导致大量的无效报警,影响运维人员的工作效率。因此,需开发一种辐射场异常监测数据自动识别方法,使其准确高效地自动识别异常数据,从而更好的满足核设施现场的使用要求、提高辐射防护管理水平。


技术实现要素:

4.针对现有技术中存在的缺陷,本发明的目的在于提供一种辐射场异常监测数据自动识别方法,该方法使用辐射场多点位的测量数据作为数据集,根据辐射场数据在空间和时间尺度上的潜在规律,识别辐射场数据流的异常节点,可以应用于存在多种工况的辐射场。
5.为达到以上目的,本发明采用的技术方案是:一种辐射场异常监测数据自动识别方法,所述方法包括以下步骤:
6.s1、将核设施内辐射场中的辐射剂量率数据进行预处理并分类,形成对应数据集;
7.s2、对每类数据抽取训练集,构建孤立树,所有孤立树的合集构成孤立森林;
8.s3、通过所述孤立森林对所述数据集进行异常评分,并据此判断所述辐射场中的辐射剂量率数据有无异常。
9.进一步,所述方法还包括将最新获取的辐射剂量率数据加入步骤s1中所述数据集后进行迭代。
10.进一步,步骤s1包括根据不同测量场景对所述辐射剂量率数据进行分类,并分别存储作为不同数据集。
11.进一步,步骤s2包括以下子步骤:
12.s201、在每个数据集中随机抽取n个元素组成训练集,若数据集中元素小于n则全部抽取,存储于孤立树根节点,在所述根节点数据的最大值及最小值之间以平均分布随机生成分割值,将根节点数据中小于分割值及大于等于分割值的两部分,分别存储于左右子节点;
13.s202、从所述左右子节点在各自节点数据的最大值及最小值之间以平均分布随机生成分割值,将训练集中小于分割值及大于等于分割值的两部分,分别存储于所述左子节点以及所述右子节点的左右子节点;
14.s203、重复步骤s202,直至满足预设条件时将分割次数记为步长h;
15.s204、重复步骤s201-s203,直至所述孤立树的数量达到设定值,此时所有孤立树的合集构成孤立森林。
16.进一步,为保证充分覆盖数据集中所有元素,需构建多个孤立树构成孤立森林。
17.进一步,步骤s203中所述预设条件包括子节点中只有1个元素、子节点中只有相同元素、分割次数达到限定值、子节点是否达到预设高度中任一条件。
18.进一步,所述分割次数限定值h=log2(n)。
19.进一步,步骤s3中所述的训练集的异常评分方法如下:
20.s301、遍历所述孤立森林中的各孤立树,得到孤立树中的路径长度平均值,所述路径长度平均值为步长h的期望值c(ψ);
21.所述步长h的期望值c(ψ)通过以下公式进行计算
[0022][0023]
式中ψ为孤立树中的元素个数;h(i)为调和数,其值为ln(i)+0.5772156649;
[0024]
s302、计算所述孤立树中每个元素的异常评分s,设置异常分数阈值k,若所述异常评分s大于该异常分数阈值k,则判定为该元素为数据异常,若所述异常评分s小于该异常分数阈值k,则判定为该元素为数据正常。
[0025]
进一步,所述异常分数阈值k根据训练集所在场景,用户需求进行设置。
[0026]
进一步,第i个元素的异常评分s为
[0027][0028]
式中e(h(i))为点i在孤立树中分割次数的期望值,该值为遍历孤立森林中的各孤立树,点i在孤立树中的分割次数平均值。
[0029]
本发明的效果在于:采用本发明所公开的一种辐射场异常监测数据自动识别方法,使用辐射场多点位的测量数据作为数据集,根据辐射场数据在空间和时间尺度上的潜在规律,识别辐射场数据流的异常节点,可以应用于存在多种工况的辐射场,基于孤立森林技术,对辐射场监测数据集进行训练,对辐射场数据流进行实时评分检测,并将新数据加入训练集进行迭代计算分析。由于采用非监督智能算法,不需要对训练集进行评价。可利用过往的监测数据进行大数据分析,自动识别异常数据,提高运维人员工作效率,更好的满足核设施现场使用要求、提升辐射防护管理水平,并且异常数据识别效率高、使用范围广、对工作人员专业度要求低。
附图说明
[0030]
图1为本发明所述的一种辐射场异常监测数据自动识别方法的方法流程图;
[0031]
图2为本发明所述的一种辐射场异常监测数据自动识别方法中分割次数的期望值e(h(x))与异常评分s的函数关系曲线示意图;
[0032]
图3为本发明所述的一种辐射场异常监测数据自动识别方法中的异常数据异常评
分分布图;
[0033]
图4为为本发明所述的一种辐射场异常监测数据自动识别方法中对实测数据进行数据分析后得到的异常数据和正常数据分布图。
具体实施方式
[0034]
下面结合附图和具体实施方式对本发明作进一步描述。
[0035]
实施例一
[0036]
如图1所示,一种辐射场异常监测数据自动识别方法,包括以下步骤:
[0037]
s1、将核设施内辐射场中的辐射剂量率数据进行预处理并分类,形成对应数据集;
[0038]
所述预处理及分类步骤包括根据不同测量场景对辐射剂量率数据进行分类,并分别存储作为不同数据集。
[0039]
选取某核设施内辐射场中辐射剂量率监测数据,如果该辐射场内仅有一个核设施,故无需对核设施辐射场中区域辐射剂量率数据进行预处理并分类,只形成1个数据集。
[0040]
s2、对每类数据抽取训练集,构建孤立树,所有孤立树的合集构成孤立森林。
[0041]
s3、通过所述孤立森林对所述数据集进行异常评分,判断辐射场数据有无异常。
[0042]
所述方法还包括将最新获取的辐射剂量率数据加入步骤s1中所述数据集后进行迭代。
[0043]
其中,步骤s2中所述构建孤立树步骤包括以下子步骤:
[0044]
s201、在每个数据集中随机抽取256个元素组成训练集,若数据集中元素小于256则全部抽取,存储于孤立树根节点。在根节点数据的最大值及最小值之间以平均分布随机生成分割值,将根节点数据中小于分割值及大于等于分割值的两部分,分别存储于左右子节点。
[0045]
在本实施例中,组成训练集的元素个数为256个,事实上对此不作限制。
[0046]
承接上例,如果该辐射场内仅有的一个核设施形成的1个数据集包含8281个元素。在数据集中随机抽取256个元素构成训练集生成孤立树,为保证充分覆盖数据集中所有元素,需构建多个孤立树构成孤立森林,在本实例中以构建100个孤立树为例进行举例说明。
[0047]
s202、从所述左右子节点在各自节点数据的最大值及最小值之间以平均分布随机生成分割值,将训练集中小于分割值及大于等于分割值的两部分,分别存储于所述左子节点以及所述右子节点的左右子节点。
[0048]
s203、重复步骤s202,直至满足预设条件时将分割次数记为步长h。
[0049]
预设条件包括子节点中只有1个元素或子节点中只有相同元素或分割次数达到限定值或子节点是否达到预设高度。
[0050]
在本实施例中,分割次数限定值h=log2(256)=8。此时将分割次数记为步长h,记录孤立树中每个元素的分割次数。
[0051]
s204、重复步骤s201-s203,直至所述孤立树的数量达到设定值,此时所有孤立树的合集构成孤立森林。
[0052]
步骤s3中所述的训练集的异常评分方法如下:
[0053]
s301、根据步长h计算步长h的期望值c(ψ);
[0054]
步长h的期望值c(ψ)为
[0055][0056]
式中ψ为孤立树中的元素个数;h(i)为调和数,其值为ln(i)+0.5772156649。
[0057]
在本实施例中,由公式可得,步长h的期望值c(256)=10.2448。
[0058]
s302、计算所述孤立树中每个元素的异常评分s,设置异常分数阈值k,若所述异常评分s大于该异常分数阈值k,则判定为该元素为数据异常,若所述异常评分s小于该异常分数阈值k,则判定为该元素为数据正常。
[0059]
第i个元素的异常评分s为
[0060][0061]
式中e(h(i))为点i在孤立树中分割次数的期望值,该值为遍历孤立森林中的各孤立树,点i在孤立树中的分割次数平均值。
[0062]
如图2所示,根据分割次数的期望值e(h(i))与异常评分s的函数关系曲线可知:
[0063]
e(h(i))

0,s

1;
[0064]
e(h(i))

ψ-1,s

0;
[0065]
e(h(i))

c(ψ),s

0.5。
[0066]
s趋近于1时为该点位为异常数据,s趋近于0时该点位为正常数据。通常情况下,异常分数阈值k根据训练集所在场景,用户需求进行设置。
[0067]
在本实施例中,结合训练集所在场景,用户需求将异常分数阈值设置为0.5。
[0068]
如图3所示,对本实施例中构建的100个孤立树进行异常评分计算,并根据设置的异常分数阈值k,得到异常数据的异常评分分数分布图。
[0069]
如图4所示,对实时获取的辐射剂量率数据进行实时显示,并对其中的异常数据和正常数据进行标注,图中黑色圆点代表正常数据,黑色三角为异常数据,由于代表正常数据的黑色圆点比较集中,看上去近似一条直线。
[0070]
通过上述实施例可以看出,本发明公开的一种辐射场异常监测数据自动识别方法,所述方法使用辐射场多点位的测量数据作为数据集,根据辐射场数据在空间和时间尺度上的潜在规律,识别辐射场数据流的异常节点,可以应用于存在多种工况的辐射场,基于孤立森林技术,对辐射场监测数据集进行训练,对辐射场数据流进行实时评分检测,并将新数据加入训练集对进行迭代计算分析。采用非监督智能算法,不需要对训练集进行评价。可利用过往的监测数据进行大数据分析,自动识别异常数据,提高运维人员工作效率,更好的满足核设施现场使用要求、提升辐射防护管理水平,并且异常数据识别效率高、使用范围广、对工作人员专业度要求低。
[0071]
本发明所述的方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1