非接触式测量下基于多重注意力机制的患者识别方法及其系统

文档序号:32243016发布日期:2022-11-18 22:54阅读:44来源:国知局
非接触式测量下基于多重注意力机制的患者识别方法及其系统

1.本发明涉及一种在非接触测量方式下追踪识别属于真正患者的方法,尤其是利用注意力机制在异质结构图中识别出患者的一种非接触式测量下基于多重注意力机制的患者识别方法, 以及实现该方法的系统,属于人工智能医疗检测领域。


背景技术:

2.健康问题成为人们最关心的问题,因而各类体检出现状况的人群都会涌入医疗机构,给那些真正亟需诊断和治疗的病人的看病效率大打折扣,也出现了繁复混杂的医疗数据,致使专业人员很难、也几乎不可能在各大医疗机构中实现统一的医疗数据的整合以及对真正属于病患或疑似随访者的医疗信息提取从而进行相关的医学研究。
3.现有技术通过仪器检测数据的追踪,仅仅获得检测的结果,仍然需要结合病历进行分析而确知是否得病或已经不健康或亚健康,无法高效率地进行科学研究资料的获取,一般需要研究者或医生针对性地利用计算机系统对医疗数据进行人工的记录和整理。要在就诊者-医疗机构-科室-仪器这样的多元关系中找出所需要的病患或不健康、亚健康信息,并进一步整合是一个不小的大数据处理问题。


技术实现要素:

4.本发明从就诊者的医疗历程出发,从图的概念着手考虑以下几个问题:第一分析就诊者的就诊轨迹中所遇到的节点的特点,第二就诊者的就诊规律,第三,基于图的人工智能模型的构建。本发明的患者包括医学确诊的病患、医学疑似病患(例如病灶存在变化建议继续随访)、亚健康人群(医学数据显示偏移正常一定范围但未出现不可接受的症状,且在医学上建议继续观察或建议采取预防措施的人群)。就诊者包括患者、普通随访人群、体检人群。
5.为解决现有技术的医疗数据中识别就诊者是否真正属于病患的,从而获取有效医疗信息的问题,从实现上述三个考虑的问题出发,以最终从海量的医疗数据中获取所需要的研究资料,本发明一方面提供了非接触式测量下基于多重注意力机制的患者识别方法,其特征在于包括如下步骤:
6.s1非接触测量数据集d以及患者诊断结果的深度学习模型m的构建;
7.s2根据所述数据集d建立基于多层注意力机制的患者识别模型a;
8.s3获取待测数据,利用所述模型a识别患者,并根据所述深度学习模型m获得所识别的患者的健康状况分类。
9.其中s1具体包括:
10.s1-1网络系统的架构,s1-2非接触测量数据的获取,s1-3基于诊断数据的深度学习模型m 建立。
11.其中s1-1包括:
12.s1-1-1在不同医疗机构中部署至少一个数据集成安全网关bn(n∈[2,+∞],n∈z
+
),利用所述至少一个数据集成安全网关bn对相应的至少一个医疗数据资源an进行加密;
[0013]
s1-1-2设置专线网络,核心交换机,通过专线网络进行交互并传输至核心交换机实现数据的集成,同时存储于数据库服务器sv中。
[0014]
其中s1-2包括:在所述至少一个数据集成安全网关bn所在的医疗机构用非接触式测量仪(例如生命体征雷达检测仪)对被测试者的生命体征信号进行检测,收集测试数据,同时收集就诊者的性别、年龄基本信息,进行用户群划分,并传送至相应的医疗资源an中,同时存储于数据库服务器sv中,形成数据集d。
[0015]
其中s1-3包括:积累数据库服务器sv中的测试数据,建立本地区域化的诊断数据(即包括测试数据以及包括诊断结果在内的诊断信息),基于诊断数据进行深度学习,并且诊断数据随着医疗资源数据的不断扩大和变化随时进行深度学习的优化,最终获取测试数据-诊断结果形式的深度学习模型m。
[0016]
其中,所述深度学习模型包括:卷积神经网络模型cnn、对抗生成网络gan、支持向量机svm、循环神经网络rnn。cnn从真实测量数据集的特征提取中获得诊断结果的归类,gan利用随机测量数据的判断训练而获得待测数据的实际准确归类,svm也是从数据到分类的有力工具,而rnn 则关注数据的时间积累从而获得特征的规律,从而从单独一个测量数据中预测其诊断结果。由于深度学习的模型m能够针对不同的非测量数据识别出多个不同的诊断结果,从而为注意力机制的识别结果的分类提供了基础。
[0017]
其中深度学习模型m建立过程为:
[0018]
s1-3-1所述数据库服务器sv调用数据集d,分为训练集d1、验证集d2和测试集d3;
[0019]
s1-3-2利用训练集d1中非接触测量信号数据,即一个周期性的生命体征的微动电压,是经过信号处理单元的放大、滤波、电平搬移和模数转换处理后而获得,作为深度学习模型m的输入端,而输出端通过全连接层fc和softmax函数为就诊者提供健康、亚健康、患病、病重四个分类;
[0020]
s1-3-3通过交叉熵损失函数反向传播优化模型网络参数,使用验证集d2验证准确率,当准确率大于预设值90-95%时即获得深度学习模型m。
[0021]
其中s2具体包括:
[0022]
s2-1建立属性异构信息网络模型ahin;由于就诊者-医疗机构-科室-仪器-时间五个实体的多元关系中在图论中属于异构图关系,即五个实体作为节点,其之间的关系存在有向的连接关系,即医疗机构和就诊者之间存在选择关系,有些医疗机构对特定的疾病有专长,就诊者就倾向于前往这类医疗机构就诊,因而五个实体中从能够反映真正患者的就诊轨迹的规律上看其重要性也是不同的。例如,医疗机构的专长决定了看有些疾病可能人数很多,而另一些疾病的则少,根据病患的病情不同,一些科室可能就访的频次也不同,甚至无需与之发生联系,比如大多数情况无需前往手术室,一旦前往则大概率存在病患。而对于健康人群的体检则一般无需关注医疗机构专长而只要具备体检设定点或前往指定医院即可,具有不确定因素。
[0023]
因此我们从上述五个实体出发考虑就诊者的医疗路径在其成为本发明所定义的病患中的重要性,从而通过对路径的情况分类而使用注意力机制去捕捉这些重要性信息,最终通过一种多层的感知机制对是否属于病患做出判断,从而能够从就诊者本身出发,跳
过海量的医疗数据搜寻而直接通过模型a挑选出来属于病患的具体的人,无需查询具体详细医疗数据而只关注就诊者与其他实体之间是否有过属于访问关系。因此理解就诊者在各个实体之间访问的行为轨迹成为识别的关键所在,对此需要构建属性异构信息网络模型ahin(attributedheterogeneous information network)。
[0024]
s2-1具体包括:
[0025]
s2-1-1对就诊者的所有就诊记录抽取出来,并从中构建了就诊者、医院、科室药物、非接触式测量仪、日期五个实体;其中,将所述就诊记录中药物和科室直接合并,只考虑就诊者是否存在从科室就诊出来进行取药的情况不考虑具体药物的品种。一则消除图的复杂性,二则也更符合病患的就诊轨迹特点。
[0026]
日期单位为天。由此,注意力机制就会排除基本在360天左右定点去某家医疗机构就诊的情况,也即这情况很可能就是每年定期体检的人群而非病患,但仍然不排除随访人群,于是科室药物实体成为关注的重要节点,对于随访者一般只会定期专门去往专门的仪器设备科室(放射科、核磁共振科室等)进行专业的详细检查,不会采用本发明非接触式测量仪,因此非接触式测量仪也是判断患者的重要关注的轨迹节点。
[0027]
s2-1-2通过对真实就诊场景中的不同类型五个实体及其相互关系建模成ahin,表示为异构图 g={v,e,x},其中v为不同类型实体集,即节点集合(包括就诊者、医院、科室药物、非接触式测量仪、日期五个实体的节点),e为关系集,x为信息矩阵,设就诊者节点集在所述数据集d中每个就诊者u∈u都拥有一个标签lu
*
∈{0,1},*表示上标,表示该就诊者是否属于患者,当不属于时为0,属于则为1,将数据集d划分为训练集dtr={(u,lu)},验证集dv={(u',lu')},以及最终用于预测就诊者是否属于病的概率的测试集dt={(u”,lu”)}, 训练集、验证集、测试集比例为1-4:1:4-1。
[0028]
根据前面所分析的实体作为节点的在之间相互关系不同地位和病患与非病患路径的特点,在异构图g建立之后需要借助图论将图中基于结构信息和语义对数据集d进行处理。
[0029]
在s2-1之后步骤s2-2包括:选取以就诊者为端点的语义路径,根据选取的语义路径找到邻居节点,具体包括:
[0030]
s2-2-1定义元路径和多重语义路径,具体地,元路径表示为记作元路径a1a2…al+1
,其中描述了就诊者a1和a
l+1
之间的元路径复合关系;多重路径表示为记作多重路径a1a2…al+1
,其中描述了就诊者a1和a
l+1
之间的多重路径复合关系,表示合成算符;
[0031]
结合实际的患者与非患者的就诊轨迹一般特点,我们选取如下路径形式:设就诊者p、医院h、科室药物c、非接触式测量仪n、日期t,所选取的路径为:
[0032]
元路径:ptp、php、pcp、pnp、ptp;
[0033]
二重路径:phcp、pcnp、phtp、pctp、pntp;可以理解的是phnp的情况与pcnp情况可以合并,因为不论是在医疗机构就诊还是在具体的某一科室中就诊,都指向了非接触式测量仪n,只要跟踪仪器就能获得有效的信息,同时考虑到减少运算量,我们仅仅考虑pcnp情况。此外对于逻辑上排除的路径也不予考虑,比如pchp,即就诊时逻辑上时到了医疗机构之
后才寻访某个科室。而日期t由于是独立实体,具有可交换性,因此涉及t的排序变化对于重要性计算都是等同的。例如phtp和pthp是等同的,即h和t是可交换的。
[0034]
三重路径:phcnp、phctp、pcntp,同理phntp路径不考虑;
[0035]
四重路径:phcntp。
[0036]
s2-2-2选取基于所述所选取的路径的合适的邻居,具体包括:
[0037]
s2-2-2-1基于元路径的邻居集合。给定属性异构信息网络中的就诊者u,基于元路径的邻居被定义为ahin中就诊者u的给定元路径下的聚合邻居集;
[0038]
s2-2-2-2基于多重路径采样的邻居集合。给定属性异构信息网络中的就诊者u,基于多重路径采样的邻居被定义为ahin中用户u的给定多重路径下的聚合邻居集;
[0039]
s2-2-2-3构建异构子图,通过元路径和多重路径分解成多个不同程度的子图结构,记为设元路径数为n,则元路径合并形成多路径后,异构图将被分解为n个不同层次的元路径子图,对于多重路径子图同理定义。
[0040]
为进一步构建模型a,首先需要分析基于元路径和多重路径的邻居对基于真实数据集d的患者识别的影响,然后提出引入了一种基于多重注意机制的模型运用于患者识别。
[0041]
在s2-2之后步骤s2-3包括构建基于异构图的多层次(多重)注意机制的患者识别模型hgmhapr(heterogeneousgraphbasedmultihierarchicalattentionmechanismforpatientrecognization)作为基于注意力机制的患者识别模型a,具体包括:
[0042]
s2-3-1节点聚合;
[0043]
利用定义好的元路径和多重路径采样的方式得到基于这些路径的邻居集合,通过集成邻居的特征信息来更加准确的表达就诊者的向量表示p。根据以上的实体重要性和路径特点分析,每个实体作为异构图中的节点,其基于元路径或者多重路径的邻居在学习特定任务的节点向量表示时都有不同的重要性,例如,对就诊者-医疗机构-就诊者模式的路径php的邻居集合里,每个邻居节点的特征与目标节点的特征的相似度有差异,对于我们通过邻居节点学习到目标节点的特征表示有着不同的影响。因此,我们在这里引入节点注意力机制,它可以学习到每个节点不同的重要性,并将这些有意义的邻居的向量表示聚合在一起形成对于特定路径的节点的向量表示。
[0044]
具体包括:s2-3-1-1给定通过路径ρ连接的节点对(i,j),将重要性定义为这就表示着邻居节点j对于目标节点i的重要性度量。基于路径ρ的节点对(i,j)的重要性公式可以如下表示:
[0045][0046]
其中pi,pj分别代表的是就诊者节点i和就诊者节点j的向量表示,ρ代表的连接两个节点的路径,a
node
是执行节点注意力机制的深层神经网络。
[0047]
实际上,在给定的同一条采样路径下,所有目标节点的邻居都是通过相同的连接模式被采样到,因此对于给定采样路径ρ,所有基于采样路径的节点对都共享a
node
。在得到邻居域中某个邻居节点j目标节点i的重要性之后,为了方便比较不同邻居节点的重要性系数,s2-3-1-2通过softmax函数对重要性做归一化的处理:
[0048][0049]
其中a
ρ
为路径ρ的节点注意力向量,其标注上标转置符t之后代表对节点注意力向量进行转置操作,||为拼接操作,af为激活函数,对于路径ρ,为与节点i相连的所有节点个数(即邻居域节点个数)。af包括relu、leakyrelu、sigmoid、tanh。
[0050]
正如从公式(2)中可以看到的,(i,j)的权重系数取决于它们的特征向量p
x
(x=i,j,k)。权重系数是非对称的,因为它们对彼此的贡献程度也是不同的。这是因为目标节点发生变化,它的邻居域也会随之改变。它们拥有不同的邻居,所以归一化项(分母)会有很大的不同。
[0051]
接着步骤s2-3-1-3对节点i的基于元路径或多重路径的向量表示通过邻居的投影特征与相应的系数进行聚合,如下所示:
[0052][0053]
其中表示的是节点i在路径ρ上学习到的向量表示,σ是激活函数,优选地,σ为relu、leakyrelu、sigmoid或tanh。
[0054]
目标节点的向量表示都是由路径ρ采样得到的邻居聚合的。每个注意力权重系数都是针对单条特定的元路径或者多重路径生成的,因此我们认为它是特定语义的,通过这种方式能够捕获一种语义信息。
[0055]
异构图呈现出无标度的特性使得图数据的方差较大。我们将节点注意力扩展到多头注意力,使训练过程更加稳定,解决了方差大的问题。
[0056]
为此,将节点注意力机制重复k次,并将每次学习到的向量表示拼接起来,
[0057][0058]
在特定的子图结构中(即以就诊者为端点的那些子图),给定路径集{ρ1,ρ2,

,ρm}(即以就诊者为端点的特定子图结构中所有路径),邻居节点的特征在经过节点注意力机制的学习后,我们可以得到m组路径特定的节点向量表示,记作
[0059]
s2-3-2路径聚合。通常,子图中每个节点都包含多种类型的语义信息。前面节点注意力机制学习到了子图上每条路径上的节点向量表示。然而,特定单条路径的节点向量表示只能从一个方面反映节点信息。为了学习更全面的节点向量表示,需要将每条路径揭示的语义信息组合到每个不同的子图中,融合这些语义信息。
[0060]
在特定的任务中,每条路径对节点向量表示的都有不同的影响。在我们构建的异构图g 中,连接目标节点的路径采样的意义都不同,通过路径采样得到的与目标患者同一科室就诊的患者集合和同一天有过就诊记录的患者集合学习到的向量表示,对于我们要判断就诊者是否为患者有着不一样的重要程度。因此在这一部分,我们需要学习不同路径对于我们最终任务的影响力。
[0061]
而对于路径的关注度系数可以反映不同路径对节点向量表示的影响力。我们提出
一种路径注意力机制来自动学习不同路径的重要性,因此,
[0062]
s2-3-2-1聚合子图中所有路径的节点向量表示,生成子图特定的向量表示,表达如下:
[0063][0064]
其中zk代表的是特定子图的向量表示,ρ={ρ1,ρ2,

,ρj}代表特定子图中的路径集合, 为特定任务的路径ρi的重要性,为特定任务的路径ρi的向量表示,j≤m。
[0065]
特定任务可以是选取感兴趣的值对应的那些路径。
[0066]
为了了解子图中不同路径的对于最终任务的影响程度,我们采用注意力机制去赋予不同路径不同的权重。我们首先通过对变换后的路径向量表示与路径注意力向量q0的相似性来衡量路径特定的节点向量表示的重要性,如下所示:
[0067][0068]
其中ω
ρi
表示路径的重要性,q0代表路径注意力向量,w0是权重矩阵,b0是偏置向量。且ω
ρi
、q0、w0、b0对于子图中所有路径(包括特定任务的路径的向量)表示都共享。在获得子图中每条路径的向量表示的重要性,通过softmax函数做归一化的处理为得到:
[0069][0070]
s2-3-2-2将学习到子图中每条路径的的权重作为系数,对所有路径ρ特定的向量表示进行加权求和,得到特定子图向量表示zk,其中对于子图给定的一组特定路径的节点向量表示作为输入,每条路径的重要性可以表示为:
[0071]apath
为路径注意力机制的深层神经网络,对所有子图共享;
[0072]
s2-3-2-3单独聚集每个子图内的指定路径的向量表示,并生成n个特定子图指定的向量向量表示,表示为n为特定子图数(例如子图为所有元路径、二重路径、三重路径的三类子图集合,则特定子图数为3,再例如一种情况是一共有三类子图集合,只是其中至少一类中存在元路径、二重路径、三重路径中的至少两种,即存在混合路径种类,则特定子图数还是为3)。注意到在路径注意力机制聚合中,每个子图的过程都是相对独立的,并且显然n<j。
[0073]
s2-3-3子图的聚合,获得第一最终的节点向量表示z。子图上特定单条路径的节点向量只能从一个方面反映节点信息。在上一节中我们可以看到,同一节点在每条路径上向量表示对于最终任务的重要性是不同的。一般来说,当同一节点位于不同的网络结构中时,它对目标节点也可能扮演不同的角色。现有研究表示不同子图对于最终任务的影响程度也有所不同。在这里,为了学习不同子图的重要性,提出了一种子图注意力机制。类似于路径注意力机制的聚合过程,给定子图特定的向量集合不同子图对于最终任务的重要性程度,表示如下:
[0074][0075][0076]
于是得到第一最终的节点向量表示中的元素。
[0077]
s2-3-4不同地域的聚合,获得第二最终的向量表示z'。同一地域的第一最终的节点z上特定单条路径的节点向量表示同样不足以全面反映节点信息。在上一节中子图聚合中仍然可以看到,同一第一最终节点z在每条子图路径上向量表示对于最终任务的重要性是不同的, 即存在不同的重要性程度θ
si
。一般来说,当第一最终节点z节点位于不同的地域网络结构中时,我们意识到:它对目标节点也可能对重要性的贡献也有所不同。
[0078]
对于不同地域(rgi(i=1,2

n),n为地域数)的医疗系统,由于其呈现的地区性特点,对于不同地域的不同子图对于最终任务的影响程度也有所不同。
[0079]
为了学习不同地域中不同子图的重要性,提出了一种地域注意力机制。类似于路径注意力机制的聚合过程,给定子图特定的向量表示集合,不同地域rgi中子图对于最终任务的重要性程度,表示如下:
[0080]
为了学习不同地域对重要性的贡献,再次提出了一种地域注意力机制。先单独聚集每个地域rgi,i∈[1,n],i∈z
+
(z
+
为正整数集)内的指定第一最终的节点的向量表示,并生成r个指定地域的向量表示为同理,类似于子图注意力机制的聚合过程,给定地域特定的向量表示集合,不同地域对于最终任务的重要性程度,可以表示如下:
[0081][0082][0083][0084]
其中a
subgraph
和a
subregion
分别为子图注意力机制和地域注意力机制的深层神经网络, a
subregion
对于所有子地域共享,μ
si
和ν
ti
分别表示子图和特定地域的重要性程度,q1和q2分别代表子图和特定地域的注意力向量,w1和w2是权重矩阵,b1和b2是偏置向量,重要性、注意力向量、权重矩阵、偏置向量分别在各自的子图集、特定地域之间共享,p为子图集所有子图总数,q为地域集中所有子地域总数,z
pi
为中的元素。具体地说,μ
si
和ν
ti
越大则分别代表子图和特定地域对最终任务来说越重要。最后,我们需要融合每个子图和每个特定地域所包含的信息,聚合特定子图的节点向量表示来分别获得最终的节点向量表示z(公式(12))和第二最终的向量表示z':
[0085][0086]
s2-3-5将第一最终的向量表示z和/或第二最终的向量表示z'输入多层感知机(mlp)进行病患识别,使用训练集dtr训练模型,采用交叉熵作为损失函数(loss),通过反向传播最小化函数来优化模型权值。交叉熵分别被表示为:
[0087]

[0088]
其中y
l
是具有标签的节点索引的集合,和y分别是标签节点的预测向量表示和相应的标签,w是分类器的参数,当使用验证集dv预测准确率acc大于预设阈值thres,loss 趋于稳定值时认为获得了给定路径集{ρ1,ρ2,

,ρm}的基于注意力机制的患者识别模型a,记作 a=mlp[region(subgraph{path[node(ρ1,ρ2,

,ρm)]})],其中node(ρ1,ρ2,

,ρm)表示节点聚合(其形式即公式(4)),path[node(ρ1,ρ2,

,ρm)]表示节点聚合基础上的路径聚合(其形式即公式(5)),subgraph{path[node(ρ1,ρ2,

,ρm)]}表示路径聚合基础上的子图聚合(其形式即公式(12)),region(subgraph{path[node(ρ1,ρ2,

,ρm)]})表示子图聚合基础上的地域聚合(其形式即公式(16)),mlp[
·
]为多层感知机。
[0089]
在基于异构图g模型中,我们使用上述通过注意力机制框架来学习权重,并逐层聚合信息,从而得到有意义的就诊者节点向量表示。最后将就诊者节点向量表示用于进行预测就诊者是否是病患。
[0090]
s3具体包括:
[0091]
s3-1获取测试集dt作为待测数据,将其中就诊者的向量表示输入到所述模型a中识别出患者的概率其中pu为第u个患者的向量表示;
[0092]
s3-2将概率大于预设值pos
p
的患者的非接触式测量的测试数据输入到深度学习模型m中得到被识别的患者的具体诊断分类;
[0093]
s3-3将所有概率大于预设值pos
p
的患者的诊断分类class保存到数据库服务器sv中形成医疗数据信息库i(d,m,a,class),其中d,m,a分别为数据集、深度学习模型以及基于注意力机制的患者识别模型。
[0094]
本发明的另一个方面,提供了非接触式测量下基于注意力机制的患者识别系统,其特征在于包括非接触式测量仪、非接触式测量网络系统、客户端,其中非接触式测量仪用于对就诊者进行非接触式生命体征测量仪,包括了发射天线、接收天线,等效采样接收机、信号处理单元、方波激励源和时序控制单元,其中,
[0095]
所述非接触式测量仪为生命体征雷达检测仪,其方波激励源产生的一路方波驱动发射电路形成双极型发射高斯脉冲,连续向对就诊者发射;生命体征雷达检测仪的方波激励源产生的另一路方波通过时序控制单元的精确延时后驱动取样脉冲产生电路,形成单极性取样高斯脉冲;双极型发射高斯脉冲经发射天线发射后,遇到就诊者发生反射,接收天线恰好接收该回波脉冲信号,经过精确延时的取样脉冲也正好到来;等效采样接收机对回波信号进行累积,得到一个输出电压信号,生命体征发生变化,等效采样接收机输出电压信号也随之改变,就诊者发生的微弱周期运动,通过回波信号的频率或相位的变化,等效采样接收机便可以获得一个周期性的生命体征的微动电压信号;电压信号经过信号处理单元的放大、滤波、电平搬移和模数转换处理后,传送至医疗机构中设置的非接触式测量网络系统
中;
[0096]
所述非接触式测量网络系统包括:以太网,核心交换机、专线网络、至少一个数据集成网关bn,与所述至少一个数据集成网关bn可数据交互的相应的至少一个医疗资源an,以及数据库服务器sv,其中,以太网用于接收非接触式生命体征测量仪和/或和客户端的数据交互,并且以太网与核心交换机、核心交换机与专线网络,专线网络与至少一个数据集成网关bn,以及核心交换机与数据库服务器sv之间可数据交互;
[0097]
所述数据库服务器sv用于调用数据集进行深度学习模型以及基于注意力机制的患者识别模型的建模以实现本发明第一个方面的非接触式测量下基于注意力机制的患者识别。
[0098]
本发明的第三个方面,提供一种非暂时性存储介质,其中存储有可由所述数据库服务器 sv运行而实现上述患者识别方法的计算机可读程序。
[0099]
有益效果
[0100]
(1)基于注意力机制的患者识别模型避免了繁重的医疗数据搜寻而直接从就诊者信息出发获得是否属于患者的识别结果,大大提高了资料整合效率;
[0101]
(2)通过非接触式测量的深度学习进一步对基于注意力机制的患者识别模型识别的患者进行诊断结果的分类,从而为医学研究提供了较为快捷完备的系统的研究资料。
附图说明
[0102]
图1元路径(a)、二重路径(b)、三重路径(c)和四重路径(d)定义示意图,
[0103]
图2多层注意力机制的患者识别模型a的构建流程示意图,
[0104]
图3本发明实施例3的非接触式测量下基于注意力机制的患者识别系统结构组成示意图,
[0105]
图4医疗数据信息库i(d,m,a,class)建立流程示意图。
[0106]
其中附图标记,1生命体征雷达检测仪,2非接触式测量网络系统。
具体实施方式
[0107]
实施例1
[0108]
本实施例对于本发明的原理进行说明,非接触式测量下基于注意力机制的患者识别方法,基本原理是利用ahin建模真实就诊场景,将患者识别问题建模为ahin中的一个分类问题,并通过元路径和多重路径来捕获ahin中的交互信息。其次,通过多层注意力机制将这些交互信息汇聚进行学习。最后将学习到的向量表示信息输入多层感知机(mlp)进行患者识别,即本发明所提出的hgmhapr模型的完整内容。
[0109]
其中,在步骤s1中,在结构化的非接触测试数据经过处理后,建立了异构图g。需要通过图表示学习算法将数据转化成低维向量表示,采用基于语义路径的方法抽取网络中的结构信息和丰富语义对数据进行处理。
[0110]
s2-1中根据元路径和多重语义路径的定义,本实施例就诊者ahin中元路径和多重语义路径的含义进一步阐名。如图1(a)所示,我们构建了一个ahin来对就诊场景进行建模。实体属性异构网络中包含多种类型的对象(即包括就诊者p、医院h、科室药物c、非接触式测量仪n、日期t五个实体的节点),具有丰富的属性和关系。
[0111]
在ahin中,两个就诊者可以通过多条元路径连接,例如就诊者-科室药物-就诊者(pcp)、就诊者-非接触式测量仪-就诊者(pnp)、就诊者-日期-就诊者(ptp)。不同的元路径总是表达不同的语义。例如,路径pcp表示该元路径连接的两个就诊者在同一个科室看过病或都采用过药物。而路径ptp表示该元路径连接的两个就诊者在同一天有过就诊记录。两个就诊者可以通过多条多重语义路径连接。例如1(b),路径phtp表示该路径连接的两个就诊者同一天在同一个家医疗机构看过病。通过路径phntp与就诊者连接的表示与其同一天在同一家医疗机构的同一台非接触式测量仪上检测过。同理图1(c)和1(d)个多重路径情况以此类比分析。
[0112]
异构图g中目标节点表征的学习的关键在于如何准确的传播聚合邻居的信息。基于上述的元路径和多重语义路径的定义去选取基于语义路径合适的邻居。
[0113]
s2-2中基于元路径的邻居集合以及基于多重路径采样的邻居集合我们举例来说明就诊ahin中选取的邻居节点。例如给出元路径php,就诊者x的邻居是y和z。同样,基于多重路径phntp的就诊者x的邻居只有y。显然,基于元路径的邻居和基于多重路径的邻居都可以利用ahin中不同方面的结构信息。选取合适的节点之后,我们需要将这些邻居节点的特征信息聚合并传播给目标节点,用以学习目标节点的最终向量表示。
[0114]
在s3中,我们首先对真实就诊场景和医疗数据进行观察,分析了基于元路径和多重路径的邻居对基于真实数据的患者识别的影响,然后提出引入了一种基于多重注意机制的模型a 运用于患者识别检测。我们在图2中展示了该模型的总体结构。首先,我们基于不同的元路径和多重路径聚合每个用户的邻居,以整合ahin中多个方面的结构信息去更好地进行表示学习。在此基础上,通过语义关注度区分元路径和多重路径的差异,得到特定任务特定语义节点向量的最优加权组合。最后考虑不同的异构子图对于最终目的的重要性,我们对异构子图这一层也采用了注意力机制学习不同子图的偏好。
[0115]
对于真实患者以及测试数据集d观察可以看出,患者通常更倾向于多实体之间发生连接关系,通过不同类型实体的交互紧密的聚合在一起。患者更倾向于在同一家医院进行就诊或者同一科室留下医疗记录,而体检人员明显地与非测量仪器n发生连接关系。为了验证不同交互关系下的患者的聚合情况,我们在真实数据集上进行实验。我们首先基于两条元路径php 和ptp收集每个患者基于元路径的邻居,我们统计患者的数量。并根据不同的路径分为多个组,计算每个小组的患者的比例。如表1,通过观察结果表示不同的基于元路径的邻居对患者的影响程度(提升率)不同。可以看到不同的语义路径对于患者有不同的重要性,因此能够采用注意力机制去捕获这些不同的重要性。
[0116]
表1元路径php和ptp中不同患者节点邻居数的统计患者数量提升率比对表
[0117]
患者节点邻居数123>3php1300276058506300ptp380540800770
[0118]
实施例2
[0119]
如图2所示,以就诊者节点向量维输入端,通过节点注意力机制、路径注意力机制、子图注意力机制、地域注意力机制而获得第一第二最终的向量表示,利用多层感知机mlp输出患者的预测概率,通过交叉熵损失函数loss进行反向传播,调整注意力机制参数和mlp网络参数,最后当准确率acc大于阈值thres(70-80%)时认为已经建立了hgmhapr模型,即完
成基于注意力机制的患者识别模型a的构建。表2给出了不同的训练集dtr,验证集dv,以及最终用于预测就诊者是否属于病的概率的测试集dt比例的条件下,hgmhapr模型的预测准确率acc的结果。
[0120]
表2 hgmhapr模型的预测准确率acc的结果
[0121]
dtr:dv:dt1:1:32:1:23:1:1acc0.830.810.82
[0122]
实施例3
[0123]
如图3所示,本实施例给出了本发明非接触式测量下基于注意力机制的患者识别系统,包括生命体征雷达检测仪1、非接触式测量网络系统2、客户端,其中生命体征雷达检测仪1用于对就诊者进行非接触式生命体征测量仪,包括了发射天线、接收天线,等效采样接收机、信号处理单元、方波激励源和时序控制单元,其中,生命体征雷达检测仪的方波激励源产生的一路方波驱动发射电路形成双极型发射高斯脉冲,连续向对就诊者发射;生命体征雷达检测仪的方波激励源产生的另一路方波通过时序控制单元的精确延时后驱动取样脉冲产生电路,形成单极性取样高斯脉冲;双极型发射高斯脉冲经发射天线发射后,遇到就诊者发生反射,接收天线恰好接收该回波脉冲信号,经过精确延时的取样脉冲也正好到来;等效采样接收机对回波信号进行累积,得到一个输出电压信号,生命体征发生变化,等效采样接收机输出电压信号也随之改变,就诊者发生的微弱周期运动,通过回波信号的频率或相位的变化,等效采样接收机便可以获得一个周期性的生命体征的微动电压信号;电压信号经过信号处理单元的放大、滤波、电平搬移和模数转换处理后,传送至医疗机构中设置的非接触式测量网络系统2中;
[0124]
所述非接触式测量网络系统2包括:以太网,核心交换机、专线网络、至少一个数据集成网关bn,与所述至少一个数据集成网关bn可数据交互的相应的至少一个医疗资源an,以及数据库服务器sv,其中,以太网用于接收非接触式生命体征测量仪和/或和客户端的数据交互,并且以太网与核心交换机、核心交换机与专线网络,专线网络与至少一个数据集成网关bn,以及核心交换机与数据库服务器sv之间可数据交互;
[0125]
所述数据库服务器sv用于调用数据集d进行深度学习模型cnn以及基于注意力机制的患者识别模型a的建模以实现本发明第一个方面的非接触式测量下基于注意力机制的患者识别。
[0126]
其中深度学习模型cnn建立过程为:
[0127]
s1-3-1所述数据库服务器sv调用数据集d,分为训练集d1、验证集d2和测试集d3;
[0128]
s1-3-2利用训练集d1中非接触测量信号数据,即一个周期性的生命体征的微动电压,是经过信号处理单元的放大、滤波、电平搬移和模数转换处理后而获得,作为深度学习模型cnn的输入端,而输出端通过全连接层fc和softmax函数为就诊者提供健康、亚健康、患病、病重四个分类;
[0129]
s1-3-3通过交叉熵损失函数反向传播优化学习模型网络参数,使用验证集d2验证准确率,当准确率大于预设值90-95%时即获得深度学习模型cnn。
[0130]
接着深度学习模型m将用于步骤s3:
[0131]
s3-1获取测试集dt作为待测数据,将其中就诊者的向量表示输入到所述模型a中识别出患者的概率其中pu为第u个患者的向量表示;
[0132]
s3-2将概率大于预设值80%的患者的非接触式测量的测试数据输入到训练好的深度学习模型 cnn中得到被识别的患者的具体诊断分类;
[0133]
s3-3将所有概率大于预设80%的患者的诊断分类class保存到数据库服务器sv中形成医疗数据信息库i(d,m,a,class),其中d,m,a分别为数据集、深度学习模型以及基于注意力机制的患者识别模型(如图4所示,其中模型a部分如图2所示)。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1