基于高阶拓扑结构的异常行为评估方法、系统及设备

文档序号:36733057发布日期:2024-01-16 12:45阅读:36来源:国知局
基于高阶拓扑结构的异常行为评估方法、系统及设备

本发明属于机器学习,具体是涉及到一种基于高阶拓扑结构的异常行为评估方法、系统及设备。


背景技术:

1、随着信息技术的不断兴起及区域医疗的蓬勃发展,医疗机构将病历信息联网保存,将与医疗保险有关的医保数据上传到相应的医保局,医保数据开始实现互联互通,其规模逐渐增长。医保数据包括参保人、诊断、用药、检查情况等信息,其中蕴含了大量的医疗服务知识和规律,也隐藏了少量的异常行为。由于医保数据数量大、产生快、维度高,同时异常行为主体复杂,因此,在医保数据中快速发现规律、评估异常行为具有非常重要的意义。

2、现有的异常行为评估模型虽然构建了费用相关的特征,但是这些特征缺乏对就诊行为过程的特征提取,导致评估模型的性能受到较大影响。在整个就诊行为过程中包含多个不同类型的实体,这些实体依据不同的历史就诊记录相互连接构成了关联关系。部分研究中针对不同类型的实体或者不同类型的关联关系,采用有监督学习或者半监督学习的方式来捕捉网络中的高阶拓扑结构,但由于标记样本获取困难且标签信息不完整等问题导致样本标签不足,而样本标签不足的问题会对模型的性能和泛化能力产生负面影响,导致评估模型的准确性下降。


技术实现思路

1、本发明提供一种基于高阶拓扑结构的异常行为评估方法、系统及设备,以解决样本标签不足导致评估模型准确性下降的问题。

2、第一方面,本发明提供一种基于高阶拓扑结构的异常行为评估方法,该方法包括如下步骤:

3、获取目标医院的历史诊疗数据;

4、通过特征统计算法从所述历史诊疗数据中提取异常行为特征;

5、结合所述历史诊疗数据和所述异常行为特征构建所述目标医院的异质图网络;

6、基于编码器和对比损失函数构建图神经网络模型,并利用所述图神经网络模型从所述异质图网络中提取高阶拓扑结构特征,所述编码器为基于异质多头注意力机制的编码器;

7、结合所述高阶拓扑结构特征和所述异常行为特征构建所述目标医院的异常行为评估模型;

8、将所述历史诊疗数据输入至所述异常行为评估模型,并通过所述异常行为评估模型评估所述目标医院中的异常行为。

9、可选的,所述基于编码器和对比损失函数构建图神经网络模型,并利用所述图神经网络模型从所述异质图网络中提取高阶拓扑结构特征包括如下步骤:

10、基于编码器和对比损失函数构建图神经网络模型;

11、对所述异质图网络进行数据增强处理,得到两个不同的异质图网络视图,两个所述异质图网络视图的节点数据分布均与所述异质图网络相同,且节点特征和节点关联关系均与所述异质图网络不同;

12、基于两个所述异质图网络视图并通过所述对比损失函数更新所述图神经网络模型的模型参数;

13、利用所述图神经网络模型中的所述编码器提取所述异质图网络中的高阶拓扑结构特征。

14、可选的,所述对所述异质图网络进行数据增强处理,得到两个不同的异质图网络视图包括如下步骤:

15、统计所述异质图网络中的节点边数量以及所述异质图网络中所有节点的节点特征数量;

16、结合所述节点边数量和所述节点特征数量生成扰动概率;

17、利用伯努利分布为所述异质图网络中的每个节点边和每个节点特征均生成一个扰动随机数;

18、将所述扰动随机数小于所述扰动概率的节点边去除,并将所述扰动随机数小于所述扰动概率的节点特征屏蔽,得到一个所述异质图网络对应的异质图网络视图;

19、对所述异质图网络重复一次上述步骤,得到另一个不同的异质图网络视图。

20、可选的,所述编码器由多个图神经网络层组成,每个所述图神经网络层均包含异质注意函数、异质信息传递函数和聚合函数。

21、可选的,所述利用所述图神经网络模型中的所述编码器提取所述异质图网络中的高阶拓扑结构特征包括如下步骤:

22、选取所述异质图网络中的任一节点作为目标节点,并选取所述异质图网络中任一与所述目标节点不同类型的节点作为源节点;

23、利用所述图神经网络模型中的所述编码器将所述目标节点和所述源节点的节点特征投射至目标特征空间,得到所述目标节点和所述源节点的目标节点特征;

24、结合所述目标节点特征和所述异质图网络的关联关系类型,并根据所述异质注意函数在所述目标特征空间建立所述目标节点和所述源节点之间的目标异质注意函数;

25、结合所述关联关系类型和所述异质图网络的实体类型,并根据所述异质信息传递函数在所述目标特征空间构建所述目标节点的目标异质信息传递函数;

26、结合所述目标异质注意函数和所述目标异质信息传递函数计算得到所述目标节点的一阶邻居聚合信息;

27、将所述一阶邻居聚合信息映射至所述目标节点的原始特征空间,得到高阶拓扑结构特征。

28、可选的,两个所述异质图网络视图分别为第一异质网络视图和第二异质网络视图,所述基于两个所述异质图网络视图并通过所述对比损失函数更新所述图神经网络模型的模型参数包括如下步骤:

29、对于所述异质网络图中的同一节点,分别从所述第一异质网络视图和所述第二异质网络视图中获取第一表示向量和第二表示向量;

30、将所述第一表示向量和所述第二表示向量组合为正样本对,并将所述第一异质网络视图和所述第二异质网络视图中其他所有节点的表示向量组合为负样本集合;

31、基于所述负样本集合并通过所述对比损失函数分别计算所述正样本对在两个所述异质图网络视图中的正样本对相似度;

32、结合所述正样本对相似度和所述正样本对的正样本对数量计算得到正样本对相似度平均值作为对比损失函数值;

33、利用反向传播算法计算所述对比损失函数值对所述图神经网络模型中模型参数的更新梯度;

34、通过优化算法并根据所述更新梯度更新所述模型参数。

35、可选的,所述第一异质图网络视图的所述正样本对相似度计算公式如下:

36、

37、式中:表示所述第一异质图网络视图的所述正样本对相似度,表示所述异质图网络中的节点,表示第个节点的第一表示向量,表示第个节点的第二表示向量,表示所述第一异质图网络视图的所述正样本对,表示所述第一异质图网络视图和所述第二异质图网络视图之间的负样本对,表示所述第一异质图网络视图内的负样本对,表示温度参数,,表示两层感知机,表示指示函数;

38、所述第二异质图网络视图的所述正样本对相似度计算公式如下:

39、

40、式中:表示所述第一异质图网络视图的所述正样本对相似度,表示所述第二异质图网络视图的所述正样本对,表示所述第二异质图网络视图和所述第一异质图网络视图之间的负样本对,表示所述第二异质图网络视图内的负样本对。

41、可选的,所述对比损失函数值的计算公式如下:

42、

43、式中:表示所述对比损失函数值,表示所述正样本对的样本对数量。

44、第二方面,本发明还提供一种基于高阶拓扑结构的异常行为评估系统,所述系统包括:

45、数据获取模块,用于获取目标医院的历史诊疗数据;

46、异常特征提取模块,用于通过特征统计算法从所述历史诊疗数据中提取异常行为特征;

47、图网络构建模块,用于结合所述历史诊疗数据和所述异常行为特征构建所述目标医院的异质图网络;

48、高阶特征提取模块,用于基于编码器和对比损失函数构建图神经网络模型,并利用所述图神经网络模型从所述异质图网络中提取高阶拓扑结构特征,所述编码器为基于异质多头注意力机制的编码器;

49、评估模型构建模块,用于结合所述高阶拓扑结构特征和所述异常行为特征构建所述目标医院的异常行为评估模型;

50、模型评估模块,用于将所述历史诊疗数据输入至所述异常行为评估模型,并通过所述异常行为评估模型评估所述目标医院中的异常行为。

51、第三方面,本发明还提供一种设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中所述的基于高阶拓扑结构的异常行为评估方法。

52、本发明的有益效果是:

53、本发明所采用的基于高阶拓扑结构的异常行为评估方法包括如下步骤:获取目标医院的历史诊疗数据;通过特征统计算法从历史诊疗数据中提取异常行为特征;结合历史诊疗数据和异常行为特征构建目标医院的异质图网络;基于编码器和对比损失函数构建图神经网络模型,并利用图神经网络模型从异质图网络中提取高阶拓扑结构特征;结合高阶拓扑结构特征和异常行为特征构建目标医院的异常行为评估模型;将历史诊疗数据输入至异常行为评估模型,并通过异常行为评估模型评估目标医院中的异常行为。通过上述步骤,基于历史诊疗数据构建出了医院多类型主体的异质图网络,通过图神经网络模型的编码器和对比损失函数,不仅可以更加细粒度地挖掘异质图网络中的高阶拓扑结构特征,根据高阶拓扑结构特征构建评估模型时还能避免模型对少数类别样本的训练不充分,致使模型欠拟合,因此可以提升评估模型的评估精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1