一种就诊预测方法与流程

文档序号:11951249阅读:130来源:国知局
一种就诊预测方法与流程
本发明涉及智能医疗
技术领域
,尤其涉及一种就诊预测方法。
背景技术
:患者到医院就诊,通常是由患者根据自己的情况选择就诊科室,或者由他人(例如医院工作人员)代为选择就诊科室,即为患者进行分诊。可见,目前的分诊技术还停留在人工分诊阶段,没有解决方案实现自动为患者进行分诊。技术实现要素:本发明的目的是提供一种就诊预测方法,以实现自动为患者进行分诊。本发明的目的是通过以下技术方案实现的:一种就诊预测方法,包括:获取对象的就诊状态时序链,所述就诊状态时序链由按照就诊转换顺序排列的所述对象每次就诊的就诊状态构成;根据状态预测数学模型,确定各个就诊状态基于所述对象的就诊状态时序链的发生概率;所述状态预测数学模型是根据多个对象的就诊状态时序链构建的;根据确定的各个就诊状态基于所述对象的就诊状态时序链的发生概率,预测所述对象本次就诊的就诊状态。本发明实施例提供的技术方法,预先根据多个对象的就诊状态时序链构建状态预测数学模型,进而根据该状态预测数学模型,确定各个就诊状态基于对象(即患者)的就诊状态时序链的发生概率,根据确定的各个发生概率,预测对象的本次就诊的就诊状态。在将本发明实施例提供的技术方案应用于对患者 进行分诊的场景,那么,就诊状态就是患者就诊的科室。由于本发明实施例提供的方案,其各个步骤均可通过系统自动实现,从而实现了自动分诊。应当指出的是,本发明实施例提供的技术方案不仅适用于对患者进行分诊,还可以适用于其他的就诊预测,例如预测患者的患病风险等等。附图说明图1为本发明一个实施例提供的方法流程图;图2为本发明另一个实施例提供的方法流程图;图3为本发明又一个实施例提供的方法流程图。具体实施方式下面将结合附图,对本发明实施例提供的技术方案进行详细说明。实施例1本发明实施例1提供一种就诊预测方法,其流程如图1所示,其具体包括如下操作:步骤100、获取对象的就诊状态时序链,所述就诊状态时序链由按照就诊转换顺序排列的该对象每次就诊的就诊状态的构成。步骤110、根据状态预测数学模型,确定各个就诊状态基于上述对象的就诊状态时序链的发生概率。其中,状态预测数学模型是根据多个对象的就诊状态时序链构建的。步骤120、根据确定的各个发生概率,预测上述对象本次就诊的就诊状态。其中,可以将给予上述对象的就诊状态时序链的发生概率最大的就诊状态,确定为该对象的本次就诊的就诊状态。应当指出的是,在实际应用过程中,出于实际需要的考虑,或者结合其他参数进行分诊时,也可以预测发生概率不是最大的就诊状态为对象本次就诊的就诊状态,具体的预测方式与实际需要有关,本发明对此不作限定。本发明实施例提供的技术方法,预先根据多个对象的就诊状态时序链构建状态预测数学模型,进而根据该状态预测数学模型,确定各个就诊状态基于对象(即患者)的就诊状态时序链的发生概率,根据确定的各个发生概率,预测对象的本次就诊的就诊状态。在将本发明实施例提供的技术方案应用于对患者进行分诊的场景,那么,就诊状态就是患者就诊的科室。由于本发明实施例提供的方案,其各个步骤均可通过系统自动实现,从而实现了自动分诊。应当指出的是,本发明实施例提供的技术方案不仅适用于对患者进行分诊,还可以适用于其他的就诊预测,例如预测患者的患病风险等等。本发明实施例中,就诊状态可以是患者就诊的科室,也可以是患者就诊所诊断出的疾病,还可以是患者就诊的科室和所诊断出的疾病。本发明实施例中,如果就诊状态是患者就诊的科室,那么,就诊状态时序链中的一个就诊状态可以通过该就诊状态的标识信息表示;也可以通过该就诊状态的标识信息和截止到该次就诊、该对象到该科室就诊的次数表示;又可以通过该就诊状态的标识信息和该对象该次就诊所诊断出的疾病的标识信息表示;还可以通过该就诊状态的标识信息、截止到该次就诊、该对象到该科室就诊的次数和该对象该次就诊所诊断出的疾病的标识信息表示。当然,也可以通过其他方式表示。本发明实施例中,如果就诊状态是患者就诊所诊断出的疾病,那么,就诊状态时序链中的一个就诊状态可以通过对象一次就诊所诊断出的疾病的标识信息表示;也可以通过对象一次就诊所诊断出的疾病的标识信息和截止到该次就诊、该对象被诊断出该疾病的次数表示;又可以通过对象一次就诊所诊断出的疾病的标识信息和该对象该次就诊的科室的标识信息表示;还可以通过对象一次就诊所诊断出的疾病的标识信息,截止到该次就诊、该对象被诊断出该疾病的次数和该对象该次就诊的科室的标识信息表示。当然,也可以通过其他方式表示。实施例2为了实施本发明提供的技术方案,需要构建状态预测数学模型。本发明实施例2以对患者进行分诊的具体应用场景为例,提供了状态预测数学模型的构建方法,具体可以采用如下方式构建状态预测数学模型:选择所述各个科室中的部分科室作为输入状态集合S,剩余科室作为输出状态集合V;根据输入状态集合S中的任意两个科室之间的转换概率,确定状态集转移矩阵A,所述状态集转移矩阵A中的一个元素为输入状态集合S中的一个科室与另一个科室之间的转换概率,任意两个科室之间的转换概率是根据任意两个科室在多个对象的就诊状态时序链中的相互转换的次数确定的;根据输出状态集合V中的各个科室在多个对象的就诊状态时序链中与其他科室之间转换的次数,确定输出序列概率分布矩阵B,所述输出序列概率分布矩阵B中的一个元素为输出状态集合V中的一个科室与输入状态集合S中的一个科室之间的转换概率;根据输入状态集合S中的各个科室的初始分布概率,确定初始状态概率分布矩阵π,所述初始状态概率分布矩阵π的元素为所述输入状态集合S中的各个科室的初始分布概率,科室的初始分布概率是根据科室在多个对象的就诊状态时序链中的出现次数确定的,所述状态预测数学模型表示为五元组<S,V,A,B,π>。应当指出的是,构建状态预测数学模型的实现方式有多种,以上仅为举例说明。凡能够基于历史数据进行状态预测的数学模型均可以作为本发明实施例中的状态预测数学模型。本实施例2中,输出状态集合V中的各个科室在多个对象的就诊状态时序链中与其他科室之间转换的次数可以但不仅限于是:每个科室的正向直接转换频数、正向间接转换频数、逆向直接转换频数和逆向间接转换频数之和。相应的,根据每个科室的正向直接转换频数、正向间接转换频数、逆向直接转换频数和逆向间接转换频数之和,确定输出序列概率分布矩阵B。其中,各个科室的正向直接转换频数是各个科室在多个对象的就诊状态时序链中与其他科室存在的正向直接转换关系的出现次数,对象的就诊状态时序链中,时序相邻(就诊转换顺序相邻)的两次就诊中前一次就诊的科室到后一次就诊的科室的转换关系作为后一次就诊的科室的正向直接转换关系。科室Ci的正向直接转换频数NDi可以通过如下公式表示:其中,N为参与统计的科室数量(例如按照上述方式选择的分类后的科室数量),U为参与统计的患者数量,w’ai为满足公式中条件下,患者a到科室Ci就诊的次数,公式中的条件是指在患者a前一次在科室Cj就诊后,后一次到科室Ci就诊,o为传递步数,如果科室Cj和科室Ci在就诊状态时序链中相邻,则它们之间的传递步数为1,如果中间隔了一个科室,则传递步数为2,以此类推。其中,科室的正向间接转换频数是该科室在多个对象的就诊状态时序链中与其他各个科室存在正向间接转换关系的出现次数和传递步数对应的权重值乘积,对象的就诊状态时序链中,时序不相邻的两次就诊中前一次就诊的科室到后一次就诊的科室的转换关系作为后一次就诊的科室的正向间接转换关系。科室Ci的正向间接转换频数NSi可以通过如下公式表示:其中,mij为在患者的就诊状态时序链中,科室Cj到科室Ci之间的传递步数为s时对应的权重值,其取值可以但不仅限于为w”ai为满足公式中条件且科室Cj到科室Ci的传递步数相同时,患者a到科室Ci就诊的次数,公式中的条件是指在患者a前一次在科室Cj就诊后,隔至少一次后到科室Ci就诊。例如,各个患者从科室Cj到科室Ci的转换次数总共有100次,其中,20次,科室Cj到科室Ci的传递步数为3,另外80次,科室Cj到科室Ci的传递步数为1,那么,在统计时,分别将20与传递步数3对应的权重值作乘法,将 80与传递步数1对应的权重值作乘法之后,再进行统计。其中,科室的逆向直接转换频数是该科室在多个对象的就诊状态时序链中与其他科室存在逆向直接转换关系的出现次数,时序相邻的两次就诊中后一次就诊的科室到前一次就诊的科室的转换关系作为前一次就诊的科室的逆向直接转换关系。科室Ci的逆向直接转换频数RDi可以通过如下公式表示:其中,N为参与统计的科室数量(例如按照上述方式选择的分类后的科室数量),U为参与统计的患者数量,w”’ai为满足公式中条件时,患者a到科室Ci就诊的次数,公式中的条件是指在患者a前一次在科室Ci就诊后,后一次到科室Cj就诊。其中,科室的逆向间接转换频数是该科室在多个对象的就诊状态时序链中与其他各个科室存在逆向间接转换关系的出现次数和传递步数对应的权重值乘积,时序不相邻的两次就诊中后一次就诊的科室到前一次就诊的科室的转换关系作为前一次就诊的科室的逆向间接转换关系。科室Ci的逆向间接转换频数RSi可以通过如下公式表示:其中,mij为在患者的就诊状态时序链中,科室Cj到科室Ci之间的传递步数为s时对应的权重值,其取值可以但不仅限于为w””ai为满足公式中条件且科室Cj到科室Ci的传递步数相同时,患者a到科室Ci就诊的次数,公式中的条件是指在患者a前一次在科室Ci就诊后,隔至少一次后到科室Cj就诊。例如,各个患者从科室Ci到科室Cj的转换次数总共有100次,其中,20次,科室Ci到科室Cj的传递步数为3,另外80次,科室Ci到科室Cj的传递步数为1,那么,在统计时,分别将20与传递步数3对应的权重值作乘法,将80与传递步数1对应的权重值作乘法之后,再进行统计。应当指出的是,以上仅为举例说明。在实际应用中,可以仅根据每个科室的正向直接转换频数确定矩阵B,也可以仅根据每个科室的正向直接转换频数和正向间接转换频数确定矩阵B,还可以仅根据每个科室的正向直接转换频数和逆向直接转换频数确定矩阵B。等等。具体的,可以将输出状态集合V中的各个科室在多个对象的就诊状态时序链中与其他科室之间转换的次数作为初始值,通过EM算法迭代收敛最终确定输出序列概率分布矩阵B。例如,选取科室C1、C2、C3和C4构成输入状态集合S,其余科室构成输出序列V。输入状态集合中的各个科室间独立,计算输出序列概率分布矩阵B的过程,就是求取基于输入状态集合S中每个科室、输出序列V中每个科室的联合分布概率。具体可以通过EM算法实现,E步骤和M步骤分别通过如下公式实现:Qi(zi):=p(zi|xi;θ),p(zi|xi;θ)=NDi+NSi+RDi+RSiΣin(NDi+NSi+RDi+RSi)θ:=argmaxθΣiΣziQi(zi)logp(zi,xi;θ)Qi(zi)]]>其中,E步骤即计算对数似然函数的期望Qi(zi)。具体的,xi即为输出序列中的一个科室Ci,zi即为即为基于科室Ci、输入状态集合中的一个科室。M步骤即更新zi的θ,以便下一次迭代。通过迭代执行E步骤和M步骤,最终收敛确定B,从而确定上述五元组。本实施例2中,确定任意两个科室之间的转换概率的一种实现方式如下:将多个对象的就诊状态时序链中每两个科室之间存在各个传递步数的间接转换关系的出现次数与各个传递步数对应的权重值乘积,与每两个科室之间存在直接转换关系的出现次数之和,确定为每两个科室之间的转换频数,时序相邻的两次就诊中的两个科室之间存在直接转换关系,时序不相邻的两次就诊中的两个科室之间存在间接转换关系;根据每两个科室之间的转换频数,确定每两个科室之间的转换概率。任意两个科室之间的转换概率可以通过如下公式表示:其中,o∈{1,2,……,t},表示参与统计的每个患者的就诊状态时序链中,科室Ci与科室Cj之间双向混合加权的转换频数。以科室Cj和科室Ci为例,假设这两个科室之间存在直接转换关系的出现次数为10次,传递步数为1时、存在间接转换关系的出现次数为5次,传递步数为3时、存在间接转换关系的出现次数为15次,传递步数1对应的权重值为s1,传递步数为3对应的权重值为s3,那么,根据10+5×s1+15×s3的计算结果确定科室Cj和科室Ci之间的转换频数。应当指出的是,以上仅为举例说明。在实际应用中,可以仅根据每两个科室之间存在直接转换关系的出现次数确定每两个科室之间的转换频率。疾病之间存在直接或间接的关联,在就诊过程中则体现在科室之间的直接或间接、正向或逆向的转换关系。例如,患者到内科就诊,被诊断出患有糖尿病,而糖尿病的并发症则是肾病、眼疾等等,那么,患者间隔几次就诊之后可能就需要到肾外科、眼科就诊;又例如,患者到发热门诊被诊断出发烧,发烧可能引起肺炎,那么,患者可能需要再次到肺炎对应的科室就诊,而肺炎可能再次引起发烧,患者还可能再回到发热门诊就诊。可见,根据上述四种转换频数确定矩阵B、以及根据每两个科室之间存在各个传递步数的间接转换关系的出现次数与每两个科室之间存在直接转换关系的出现次数确定每两个科室之间的转换概率,是双向混合加权统计方式,符合疾病之间存在关联这一客观事实,据此建立的数学模型可以准确预测分诊结果,在实现自动分诊的基础上,进一步提高了分诊结果的准确性。实施例3实施例3中,为了简化运算,构建状态预测数学模型之前,可以仅选择就诊次数较多的科室构成就诊状态时序链,忽略就诊次数较少的科室。相应的实现方式如图2所示,可以如下操作:步骤200、根据多个对象的每次就诊的记录,统计多个对象到各个科室就诊的总次数;步骤210、根据多个对象到各个科室就诊的总次数,对各个科室进行排序得到就诊状态序列;步骤220、降序选取所述就诊状态序列中的部分科室,使得多个对象到选取的科室就诊的总次数之和满足就诊次数阈值;步骤230、根据选取的科室,生成每个对象的就诊状态时序链。上述生成对象的就诊状态时序链的各个步骤的具体实现方式分别如下:步骤200的实现方式:一种简单的实现方式是,从患者的每次就诊的记录中提取科室的信息,并根据提取的科室信息对各个科室的就诊次数进行计数,将各个科室的计数结果作为其总次数。在实际应用过程中,不同医院甚至同一个医院保存的患者的就诊记录可能存在格式不统一的问题。例如,从His、PSCS、Lis、Ris等信息系统中提取出的就诊记录分别具有不同的数据格式。那么,在统计次数之前,首先需要统一数据格式。其实现方式可以是从患者的就诊记录中提取历史就诊的科室的信息,并按照预定格式逐条缓存每条记录中提取到的信息。所谓患者的就诊记录,即患者每次就诊的时间、科室、诊断结果(疾病)等信息。本发明实施例中,将一个患者一次就诊的时间、科室和诊断结果等信息作为一条历史就诊记录。该步骤中,既可以获取系统中的全部患者的就诊记录,也可以获取一部分患者的就诊记录。在对数据格式进行统一之后,如果认为就诊记录可信赖,直接根据缓存的信息统计各科室的就诊总次数。否则,对上述缓存的信息进行去重、错误信息 删除等操作,然后统计各个科室的就诊总次数。其中,对缓存的信息进行去重,是指删除重复的信息。例如,缓存中有两条或两条以上相同的信息,则仅保留一条该信息,删除其他重复的信息。其中,错误信息删除是指将不符合预定要求的信息删除。预定要求具体是什么要求,可以根据实际应用的需求确定,本发明对此不作限定。其中,科室ci的就诊总次数可以如下格式缓存:(ci:wai)其中,ci为科室的标识信息,wai为患者a到科室ci就诊的总次数,“:”表示字段间级联。步骤210的具体实现方式:可以直接按照各科室的就诊总次数对各科室进行排序。也可以分别对各科室的就诊总次数进行均一化处理,并根据均一化处理后的结果对各科室进行排序。具体的,对科室ci的就诊总次数进行均一化处理是指将科室ci的就诊总次数除以各个科室的就诊总次数之和。步骤220的具体实现方式:按照就诊次数阈值,选取就诊总次数之和满足该就诊次数阈值的前N个科室。其中,就诊次数阈值可以是各科室就诊总次数之和的90%~99%。为了进一步简化运算,还可以对科室进行分类(或称为合并)。具体的,可以步骤200中对科室进行分类,即对科室进行分类,根据多个对象的每次就诊的记录,统计分类后得到的各个科室的总次数;也可以在步骤220中对科室进行分类,对选取的科室进行分类,根据分类后得到的科室,生成每个对象的就诊状态时序链。其中,分类规则可以但不仅限于根据国际医学标准确定。其中,分类后的科室C包含就诊记录中记载的至少一个科室。即,科室C是一个科室集合。假设根据多个对象的每次就诊的记录提取科室的信息,确定总共有200个科室,每个科室可表示为ci。可以是:首先将这200个科室(如果经过去重、错误信息删除等操作,实际科室数量可能小于200)按照预定的规则分类,最终得到35个分类后的科室,表示为Ci(例如,Ci为内科,包括如下分类前的科室:心脏内科、消化内科、肝脏内科),然后统计各个Ci的就诊总次数;也可以是:首先统计这200个科室(如果经过去重、错误信息删除等操作,实际科室数量可能小于200)的就诊总次数,然后将这些科室按照预定的规则分类,最终得到35个分类后的科室,根据之前的统计结果,确定各个Ci的就诊总次数;基于这两种实现方式,相应的,步骤210中,是对分类后的各科室进行排序。还可以是:在对分类前的科室进行排序之后,按照上述方式对各个科室进行分类,并基于之前的排序结果对分类后的各个科室进行排序。还可以是:按照就诊次数阈值,选取就诊总次数之和满足该就诊次数阈值的前M个分类前的科室,对前M个科室进行分类,得到N个分类后的科室。等等。步骤230的具体实现方式:如果没有对科室进行分类,则直接根据选取的科室获取患者的就诊状态时序链。如果对科室进行分类,则根据选取的分类后的科室获取患者的就诊状态时序链。以对科室进行分类为例,患者的就诊状态时序链中的元素可以表示为kai,其键值key=Ci,其取值value=wai。并且,患者的就诊状态时序链中的元素按照就诊转换顺序排列。应当指出的是,对科室进行分类,以及按照就诊次数阈值选取科室(或者科室类别)的目的是为了降低运算时间,简化运算。在实际应用中,也可以不进行上述操作。那么,上述kai的key=ci。实施例4本发明实施例4提供了基于上述构建的状态预测数学模型<S,V,A,B,π>,确定各个就诊状态基于上述对象的就诊状态时序链的发生概率的实现方式。其 实现方式可以但不仅限于如图3所示,具体包括如下操作:步骤300、将上述对象的就诊科室时序链中的每相邻两个科室在输出序列概率分布矩阵B中的转移概率的乘积,确定为局部概率Pr(t)。步骤310、确定上述对象的就诊状态时序链中最后一个科室分别与各个科室之间在输出序列概率分布矩阵B中的转移概率Prj(t+1),将局部概率分别与各个科室与最后一个科室之间的转移概率的乘积Pr(t)*Prj(t+1),确定为基于所述对象的就诊状态时序链的发生概率。确定了各个科室基于上述对象的就诊状态时序链的发生概率,即可基于此,预测该对象本次就诊的科室。本发明实施例提供的方法,状态预测数学模型<S,V,A,B,π>是根据多个对象的就诊状态时序链构建得到的。其中,统计的对象越多,状态预测数学模型越能够精准地预测对象的就诊状态。在实际应用中,通常都会根据至少一家医院的所有患者的就诊状态时序链构建状态预测数学模型,均能够保证预测的准确性。因此,采用本发明实施例提供的方法,还能够避免人工分诊造成的患者实际病症与就诊的诊室不匹配或者需要先到其他科室治疗或检查再转到就诊的科室的问题。应当指出的是,以上是以科室作为就诊状态为例进行的说明。但并不表示,本发明实施例中,就诊状态仅限于科室。当就诊状态是所诊断出的疾病,或者科室和疾病时,其实现方式可以参照上述各实施例,本发明不再赘述。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1