一种核电厂质量缺陷报告与外部事件信息的精准匹配方法与流程

文档序号:35890231发布日期:2023-10-28 19:44阅读:37来源:国知局
一种核电厂质量缺陷报告与外部事件信息的精准匹配方法与流程

本发明属于核电,具体涉及一种应用于核电厂质量缺陷报告精确匹配核电厂外部事件信息的方法,为填报人在填写质量缺陷报告时提供相关外部事件信息的精准推送。


背景技术:

1、目前的核电基地大多经过多年的运行,在现有已建设投用的业务系统和经验反馈系统中分别积累了大量质量缺陷报告数据和外部事件信息数据。由于这些数据均分散在不同的业务系统中,形成了信息孤岛,未得到有效的整合,业务部门主要通过经验反馈部门的定期推送进行学习,但定期推送无法满足业务人员对当前工作中历史经验反馈的实时需求,往往无法及时得到最想要的经验反馈数据信息。

2、一般产生质量缺陷报告后,业务人员需要自己去其他业务系统搜索相应的外部事件信息(包括国外的iaea事件报告、wano事件报告)对其进行原因分析,并制定相应的纠正措施。因此有必要设计一种外部事件信息的经验反馈智能推送方法应用于质量缺陷报告准备期间,在核电厂质量缺陷报告填写人填报质量缺陷报告时,实现对历史外部事件信息的精准推送。


技术实现思路

1、本发明的目的是提供一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,为质量缺陷报告填报人填写质量缺陷报告时,提供外部经验的参考和借鉴。

2、本发明的技术方案如下:一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,包括以下步骤:

3、步骤1:设备编码计算规则;

4、步骤2:核电专业语义相似度计算规则;

5、步骤3:各堆型的设备编码与语义相似度分值计算;

6、步骤4:修正因子处理,增强经验反馈数据的准确性;

7、步骤5:智能推荐。

8、所述的步骤1将数据根据堆型和设备编码归类计算,利用设备编码的匹配规则匹配,其中,质量缺陷报告的“设备编码”字段根据所属堆型类型进行划分,包括:cnp300、candu、cnp-600、cnp-1000、hpr1000、cpr-1000,利用正则表达式判断该质量缺陷报告数据的“设备编码”是否符合其堆型的设备编码规则。

9、所述的步骤1中的设备编码规则包括如下:

10、1)“设备编码”字段不符合该堆型的设备编码规则

11、如不符合,则基于自然语言处理方法将质量缺陷报告的“qdr主题”字段与外部事件信息中的“cr主题”字段剔除相关设备编码后根据步骤3中的语义相似度方法进行自然语言语义相似度匹配,对相似度的打分进行归一化,得到匹配分值w主题得分,如果w主题得分大于等于给定的相关分值w限定分值,则计入集合s得分集合;

12、2)“设备编码”字段符合该堆型的设备编码规则

13、如果输入的设备编码符合该堆型的设备编码规则,通过以下规则进行匹配:外部事件信息的“涉及设备”字段,与输入的质量缺陷报告的“设备编码”字段进行完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码去机组号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码+设备编号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数;

14、如果以上规则都不成立,使用正则表达式提取外部事件报告的“主题”字段中的相关设备编码,与输入的质量缺陷报告的“设备编码”字段进行完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码去机组号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码+设备编号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数。

15、所述的步骤2在采用堆型和设备编码类型匹配的基础上,引入核电专业分词语义相似度匹配方法,基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图dag,动态规划查找最大概率路径,找出基于词频的最大切分组合,采用基于汉字成词能力的hmm模型,调用了viterbi算法得到分词结果,根据分词结果调用余弦相似度算法获得相似度值。

16、所述的步骤3包括:

17、1)质量缺陷报告属于cnp300、candu;

18、2)质量缺陷报告属于cnp-600、cnp-1000、hpr1000、cpr-1000;

19、3)若质量缺陷报告的“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段按照上述规则都不一致。

20、所述的步骤3中的步骤1)包括:

21、a)设备编码分值为wa,若质量缺陷报告“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段全部一致时,wa取最大分值,如果不一致,判断上述编码去掉第一位机组号后比较是否一致(堆型cnp300除外);如果一致,设备编码分值wa=0.9wa;如果不一致,判断质量缺陷报告是否属于candu,如果是则判断上述设备编码中包含的系统编码、设备编码是否一致,如果一致,设备编码分值wa=0.8wa;如果不一致,设备编码分值wa=0;然后考虑质量缺陷报告中的“qdr主题”字段与外部事件信息中的“事件标题”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化;最高分值wb;匹配的总得分w设备+主题得分=wa+wb,只推送总得分在给定的相关分值w限定分值及以上分数的数据计入集合s得分集合;

22、b)若质量缺陷报告的“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段按照上述规则都不一致,用缺陷报告数据qdr中的“qdr主题”、“设备名称”、“初步原因分析”字段与外部事件信息中的“事件标题”、“事件概要”、“事件描述英文”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化,匹配的总得分we,只推送总得分在给定的相关分值w限定分值及以上分数的数据计入集合s得分集合。

23、所述的步骤3中的步骤2)包括:

24、设备编码分值为wa,若质量缺陷报告“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段全部一致时,wa取最大分值,如果不一致,判断上述编码去掉第一位机组号后比较是否一致;如果一致,设备编码分值wa=0.9wa;如果是则判断上述系统编码中包含的系统编码是否一致,如果一致,设备编码分值wa=0.8wa。如果不一致,设备编码分值wa=0。然后考虑质量缺陷报告中的“qdr主题”字段与外部事件信息中的“事件标题”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化;最高分值wb。匹配的总得分w设备+主题得分=wa+wb,只推送总得分在给定的相关分值w限定分值及以上分数的数据计入集合s得分集合。

25、所述的步骤3中的步骤3)包括:

26、用缺陷报告数据qdr中的“qdr主题”、“设备名称”、“初步原因分析”字段与外部事件信息中的“事件标题”、“事件概要”、“事件描述英文”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化,匹配的总得分we,只推送总得分在给定的相关分值w限定分值及以上分数的数据计入集合s得分集合。

27、所述的步骤4包括:

28、对关键的数据进行加分处理,质量缺陷报告相匹配的外部事件信息s得分集合中的分值相同的外部事件信息的“ines分级”字段;

29、如果有得分相同的情况,则判断外部事件信息中的“ines分级”字段,为n则额外增加wi*n分;

30、如果有得分相同的情况,则判断外部事件信息数据中的“直接原因”和“根本原因”字段,都不为空,则加d分;

31、如果有得分相同的情况,外部事件信息的“事件标题”与质量缺陷报告中“qdr主题”可语义匹配到如下关键字时,匹配到任一关键词并且相同,增加一定的优先推送分值,比如关键字为:“巡检”、“高处作业”、“淹溺”、“焊接”、“射线”、“rt”、“探伤”、“腐蚀检查”、“脚手架”、“超声检查”、“射线检查”、“电焊”,“气割”,“砂轮打磨切割”、“研磨”,“烘烤”、“氩弧焊”、“气焊”、“在役检查”等。如匹配上,则推荐度分数相同的情况下优先推送。

32、所述的步骤5包括:

33、根据以上匹配规则,将质量缺陷报告对应外部事件信息的每个s得分集合,按照分值从高到低的顺序进行推荐,根据业务规则和相似度计算方法,调整各分数之间的比重,统计数据之间的相似度、准确率、匹配率,得出最佳匹配结果,实现精准推送功能。

34、本发明的有益效果在于:目前,核电厂在进行质量缺陷报告填报工作时,只能通过手动查询的方式查找历史外部事件信息,面临效率低下以及准确率不高的问题。通过本发明可以在质量缺陷报告填报时自动快速定位并推送相关外部事件信息这一经验反馈数据,为质量缺陷报告的填报提供参考,减轻质量缺陷报告填报人员的时间和精力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1