医学解释模型的建立方法和装置与流程

文档序号:14874881发布日期:2018-07-07 05:16阅读:677来源:国知局
本申请涉及计算机领域,特别是涉及一种医学解释模型的建立方法和装置。
背景技术
:随着计算机技术的发展,智能诊断模型在医疗诊断领域的发展越来越迅速。该智能诊断模型能够为医务人员的工作提供辅助性的帮助,从而降低对患者病情的误诊率和漏诊率。然而,通常情况下,智能诊断模型的输入为若干症状的描述,输出的结果为健康指标参数或者疾病诊断结果,医务人员并不能知道若干症状与输出的结果之间的关系,也就是说,医务人员面对的是一个黑盒子。因此,即使智能诊断模型的输出结果很准确,仍然无法增加医务人员对该结果的信服度,从而限制了智能诊断模型的使用范围,也不能让医务人员明确症状和疾病之间存在的关系。技术实现要素:本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。根据本申请的一个方面,提供了一种医学解释模型的建立方法,包括:步骤s1将用于描述患者症状的症状信息的特征值代入医学模型,得到健康预测结果;步骤s2,将所述症状信息和所述健康预测结果输入到医学解释模型,对所述医学解释模型进行训练,使得训练后得到的所述医学解释模型能够表征所述医学模型;和步骤s3,将所述训练后得到的所述医学解释模型呈现给用户。本申请利用由医学模型获得的结果对医学解释模型进行训练,能够很好地对医学模型的处理结果进行分析,能够让用户对原本内部算法不公开的医学模型的运算规则有客观的认识,从而提高对医学模型的认知程度,以及更加明了症状与健康预测结果之间的关系。本申请的技术方案的优势是,应用高维特征进行模型构建,同时对模型的预测结果进行溯源。这样既不影响模型效果,也增加了模型的可理解性。根据本申请的另一个方面,提供了一种医学解释模型的建立装置,包括:数据生成模块,其配置成将用于描述患者症状的症状信息的特征值代入医学模型,得到健康预测结果;模型建立模块,其配置成将所述症状信息和所述健康预测结果输入到医学解释模型,对所述医学解释模型进行训练,使得训练后得到的所述医学解释模型能够表征所述医学模型;和显示模块,其配置成将所述训练后得到的所述医学解释模型呈现给用户。根据本申请的另一个方面,提供了一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述的方法。根据本申请的另一个方面,提供了一种计算机可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述的方法。根据本申请的另一个方面,提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述的方法。根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。附图说明后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:图1是根据本申请的医学解释模型的建立方法一个实施例的流程图;图2是根据本申请的医学解释模型的建立方法步骤s1的一个实施例的流程图;图3是根据本申请的医学解释模型的建立装置一个实施例的框图;图4是根据本申请的医学解释模型的建立装置的数据生成模块的一个实施例的框图。具体实施方式根据本申请的一个方面,参见图1,提供了一种医学解释模型的建立方法,包括:步骤s1,将用于描述患者症状的症状信息的特征值代入医学模型,得到健康预测结果。在步骤s1后,还包括:步骤s2,将所述症状信息和所述健康预测结果输入到医学解释模型,对所述医学解释模型进行训练,使得训练后得到的所述医学解释模型能够表征所述医学模型。在步骤s2后,还包括:步骤s3,将所述训练后得到的所述医学解释模型呈现给用户。可选地,参见图2,步骤s1包括:步骤s11,获取用于描述患者症状的症状信息的特征值集合,所述特征值集合包括两个以上的特征值;步骤s12,基于特征值集合中的特征值随机生成若干个标签;步骤s13,基于所述标签生成样本集合;和步骤s14,将所述样本集合输入到所述医学模型,得到对应的健康预测结果。采用上述步骤,针对当前患者的症状或体征,将大的集合组成若干个样本集合,从而随机生成了相似的症状信息数据,这些数据来源于可信赖的数据,因此生成的样本集合中的数据也是可信赖的。将这些数据输入医学模型,得到多个健康预测结果,该健康预测结果表示患者患病的可能性或者概率。可选地,步骤s1还包括:步骤s15为对应的健康预测结果赋予与所述样本集合的标签相同的标签,并将样本集合和健康预测结果以及各自对应的标签存入数据库。将对应的健康预测结果与所述样本集合的标签设置为相同的标签的目的是使得输入和输出的数据保持同步,防止输入数据和输出数据之间的不同步导致对医学解释模型的训练错误。可选地,步骤s11可以包括:步骤s111,将特征值输入到所述医学模型,得到对应的健康预测结果,该健康预测结果是表示健康状况的概率集合,所述概率集合包括至少一个概率值;步骤s112,如果所述概率集合中的一个或者多个概率值大于或等于设定阈值,则将该组症状信息作为所述用于获取描述患者症状的症状信息,执行步骤s12;和步骤s113,如果所述概率集合中的概率值低于设定阈值,则替换该特征值集合的至少一个特征值,重新执行步骤s111。该步骤能够更加准确地筛选出可以作为训练集的数据,如果概率集合中的一个或者多个概率值均小于设定阈值,说明利用该组数据并不能预测出准确的结果,因此并不适合作为训练集的数据。在对该组数据进行调整后,满足了设定阈值,说明该组信息与某种或者某些疾病结果有重要的关联,因此可以作为训练集的数据。通过这种方式得到的训练集数据,能够使得后续模型的分析更加准确。可选地,步骤s12包括:步骤s121,将所述特征值集合中的特征值均标记为1,得到一个1*n的初始向量,其中,n为特征值的个数,n≥2;和步骤s122,生成m*n维随机矩阵,其中,m为待生成的样本集合的数量,m≥1,可选地,m=500;所述随机矩阵中的元素为随机生成的1或0,将该随机矩阵的行向量作为标签,得到m个标签。可选地,步骤s13具体为:按照标签中元素的顺序查找对应的特征值,如果标签的元素为1,则将该元素对应的特征值列入样本集合,如果标签的元素为0,则在所述样本集合的相应位置补零,从而生成样本集合。例如,假设针对患者出现的特征,获得该患者症状的症状信息的集合,该集合中的各个症状信息如表一所示:表一其中,第一行的数据为症状信息,将所述症状信息的集合中的症状信息的标签均赋值为1,得到一个1*4的初始向量[1111],将该初始向量作为原始的症状信息的特征值集合的标签。基于初始向量[1111]生成3*4维随机矩阵其中,3为待生成的样本集合的数量,该矩阵中的元素均为1或0,1或0分别表示该样本集合出现或不出现该症状信息,从而得到若干个包含症状信息的样本集合,并将该随机矩阵的行向量作为对应的样本集合的标签,生成如下数据,如表二所示:表二例如,生成的第一个症状信息的集合为{胸闷_描述:间断|诱因:活动后|转归:不缓解|部位:心前区,无,无,压痛_描述:重度|诱因:无|转归:可缓解|部位:剑突下},样本集合为{x1,0,0,x4},对应的标签为[1001]。表三示出了将上述三个样本集合输入医学模型后得到的健康预测结果,可选地,该数字表示患某种疾病的概率值。表三预测概率0.90.30.25可选地,在步骤s2中:所述医学解释模型为公式(1):其中,xi表示第i个特征值,参数wi表示第i个特征值的权重,p表示所述医学解释模型的参考结果,n表示特征值的个数。该方法基于症状信息的特征值,生成多个样本集合,代入医学模型,得到相应的预测结果,将这些样本集合和与之对应的预测结果之间建立线性回归模型,线性回归模型可以针对每个症状体征得到相应的权重,此权重即反映了症状体征对结果的正负向影响及影响程度,从而达到模型预测结果溯源的目的。本申请的医学解释模型采用一次特征的模型,即线性模型,该模型能够天然进行特征权重的解释。由于线性模型略去了二次特征或更高维特征的应用,因此计算速度更快,能够给用户提供实时的结果。将线性模型呈现给用户,可以让用户清楚地认识到各个症状与结果之间的关系。如果采用更高维的模型,会使用户理解起来更加困难,不能快速地理解权重与各个症状之间的关系。因此采用线性模型提高了溯源的速度,并且得到的溯源结果更容易被用户理解。同时,医学模型仍然采用高维模型,因此预测结果仍然是准确的,不会受到医学解释模型的影响。因此,在使用时,可以同时使用两个模型,将医学模型采用高维特征进行模型构建,能够保证预测结果的准确性,医学解释模型采用线性模型对医学模型的预测结果进行溯源,向用户呈现权重等信息。这样既不影响医学模型的预测效果,也增加了医学模型的可理解性。上述公式(1)中的各个权重可以用最小二乘法、最小一乘法、有偏回归、岭回归等方法进行拟合。可选地,权重可以采用机器学习算法进行计算。可选地,步骤s2包括:步骤s21,随机初始化wi;步骤s22,分别将所述症状信息和所述健康预测结果代入所述医学解释模型的xi和p;和步骤s23,不断调整wi,直到仅将所述症状信息代入所述医学解释模型得到的预测结果接近或者等于所述健康预测结果。其中,步骤s23可以包括:步骤s231,利用公式(2)计算样本集合中特征值之间的距离dij,其中,dij表示特征值xi与xj之间的距离,vik和vjk分别表示xi的第k个属性与xj的第k个属性,q表示距离的参数,可选地,q=1,或者q=2,n表示属性的数量。由于症状信息是由多个词语进行描述的,因此,症状信息的特征值具有多个属性。步骤s232,利用公式(3)计算相似度sij,sij=1-|dij|,(0<|dij|<1)(3)其中,sij表示特征值xi与xj之间的相似度;步骤s233,利用公式(4)和(5)计算权重误差δwj;wj={wi|i=1,2,3...n}(4)其中,σ为步宽,n表示特征值的个数,通常为正实数,一般取0.1-0.3之间,wj为权重wi的集合;误差总和e的计算公式如下式(6),δwj的此种计算方式能够使得误差总和e的收敛速度最小:其中,m表示样本集合的总数,n表示特征值的个数,pj表示第j个样本集合通过医学模型计算得到的健康预测结果;步骤s234,利用公式(7)对权重进行调整wj+1=wj+δwj,0≤j≤m-1(7)其中,wj+1为调整后的权重的集合。不断调整权重,使得利用医学解释模型与医学模型计算得到的结果之间的差值落入误差允许的范围,例如,设置误差小于或者等于20%,则停止调整;或者将所有样本集合都参与运算后,停止调整。当wi为正数时,表示对应的特征值xi与最终的医学解释模型的预测概率结果之间是正相关的关系,反之,为负相关。wi的绝对值越大,则表示其对应的症状信息与最终的医学解释模型的预测结果相关的程度越大。这样,通过特征的权重得出特征与最终预测概率之间的正向或者负向相关性及相关程度,从而达到对医学模型溯源的目的。可选地,该方法还包括:步骤s4,当有新的用于描述患者症状的症状信息的特征值时,分别代入所述医学模型和所述医学解释模型,分别得到新的健康预测结果和新的参考结果。在步骤s4后,该方法还包括;步骤s5,如果所述新的健康预测结果和所述新的参考结果差值大于或等于设定阈值,则重复步骤s2。采用上述步骤,当在实践中,用户得到新的数据时,可以补充训练数据集中数据,通过实时更新数据、更新模型,可以使得医学解释模型更加接近于医学模型,而且能够适应人类出现的新的症状和疾病,更加适应医学水平的发展。可选地,该方法还包括:步骤s6,将健康预测结果作为健康结果输入预测疾病的知识库,所述知识库的内容包括:健康结果、与患者症状相对应的症状体征信息,从而得到与该健康预测结果对应的症状体征信息,取所述症状体征信息与所述用于描述患者症状的症状信息的交集,将该交集的内容呈现给用户。以上交集中的症状体征信息与上述步骤中代入医学模型进行溯源的症状信息相互辅助,为诊断模型使用者提供更全面的原因解释,便于其对医学模型的理解与信任更加深入。本申请提供的方法的优势在于,在依然使用高维特征的医学模型情况下,仍然可以得到单个症状或体征信息对预测结果的影响的正负相关性及相关程度,从而达到诊断原因溯源的目的;并且另一方面,依据文献、知识库等进行诊断原因的溯源,能够从另一个角度验证医学解释模型的正确性和医学模型的预测原则。综上所述,本申请提供了技术方案a1,一种医学解释模型的建立方法,该方法包括:步骤s1,将用于描述患者症状的症状信息的特征值代入医学模型,得到健康预测结果;步骤s2,将所述症状信息和所述健康预测结果输入到医学解释模型,对所述医学解释模型进行训练,使得训练后得到的所述医学解释模型能够表征所述医学模型;和步骤s3,将所述训练后得到的所述医学解释模型呈现给用户。本申请提供了基于技术方案a1的技术方案a2,其中,步骤s1包括:步骤s11,获取用于描述患者症状的症状信息的特征值集合,所述特征值集合包括两个以上的特征值;步骤s12,基于特征值集合中的特征值随机生成若干个标签;步骤s13,基于所述标签生成样本集合;和步骤s14,将所述样本集合输入到所述医学模型,得到对应的健康预测结果。本申请提供了基于技术方案a1或a2的技术方案a3,其中,步骤s1还包括:步骤s15,为对应的健康预测结果赋予与所述样本集合的标签相同的标签,并将样本集合和健康预测结果以及各自对应的标签存入数据库。本申请提供了基于技术方案a1至技术方案a3的任意一个的技术方案a4,其中,步骤s12包括:步骤s121,将所述特征值集合中的特征值均标记为1,得到一个1*n的初始向量,其中,n为特征值的个数,n≥2;和步骤s122,生成m*n维随机矩阵,其中,m为待生成的样本集合的数量,m≥1,可选地,m=500;所述随机矩阵中的元素为随机生成的1或0,将该随机矩阵的行向量作为标签,得到m个标签。本申请提供了基于技术方案a1至技术方案a4的任意一个的技术方案a5,其中,步骤s13包括:按照标签中元素的顺序查找对应的特征值,如果标签的元素为1,则将该元素对应的特征值列入样本集合,如果标签的元素为0,则在所述样本集合的相应位置补零,从而生成样本集合。本申请提供了基于技术方案a1至技术方案a5的任意一个的技术方案a6,其中,在步骤s2中,所述医学解释模型为:其中,xi表示第i个特征值,n表示特征值的个数,参数wi表示第i个特征值的权重,p表示所述医学解释模型的参考结果。本申请提供了基于技术方案a1至技术方案a6的任意一个的技术方案a7,其中,步骤s2包括:步骤s21,随机初始化wi;步骤s22,分别将所述症状信息和所述健康预测结果代入所述医学解释模型的xi和p;和步骤s23,不断调整wi,直到仅将所述症状信息代入所述医学解释模型得到的预测结果接近或者等于所述健康预测结果。本申请提供了基于技术方案a1至技术方案a7的任意一个的技术方案a8,其中,步骤s23包括:步骤s231,利用下面公式计算样本集合中特征值之间的距离dij,其中,dij表示特征值xi与xj之间的距离,n表示属性的数量,vik和vjk分别表示xi的第k个属性与xj的第k个属性,q表示距离的参数,可选地,q=1,或者q=2;步骤s232,利用下面公式计算相似度sij:sij=1-|dij|,(0<|dij|<1)其中,sij表示特征值xi与xj之间的相似度;步骤s233,利用下面两个公式计算权重误差δwj:wj={wi|i=1,2,3...n}其中,σ为步宽,n表示特征值的个数,wj为权重wi的集合,pj表示第j个样本集合通过医学模型计算得到的健康预测结果;和步骤s234,利用下面公式(1-6)对权重进行调整wj+1=wj+δwj,0≤j≤m-1其中,wj+1为调整后的权重的集合。本申请提供了基于技术方案a1至技术方案a8的任意一个的技术方案a9,该方法还包括:步骤s4,当有新的用于描述患者症状的症状信息的特征值时,分别代入所述医学模型和所述医学解释模型,分别得到新的健康预测结果和新的参考结果。可选地,该方法还可以包括:步骤s5,如果所述新的健康预测结果和所述新的参考结果差值大于或等于设定阈值,则重复步骤s2。本申请还提供了一种与上述方法对应一致的医学解释模型的建立装置,该装置的各个模块通过与实现方法相同或者相似的方式实现。根据本申请的另一方面,参见图3,还提供了技术方案b1,一种医学解释模型的建立装置,包括:1数据生成模块,其配置成将用于描述患者症状的症状信息的特征值代入医学模型,得到健康预测结果;2模型建立模块,其配置成将所述症状信息和所述健康预测结果输入到医学解释模型,对所述医学解释模型进行训练,使得训练后得到的所述医学解释模型能够表征所述医学模型;和3显示模块,其配置成将模型建立模块的所述训练后得到的所述医学解释模型呈现给用户。本申请提供了基于技术方案b1的技术方案b2,参见图4,其中,1数据生成模块包括:11数据获取模块,其配置成获取用于描述患者症状的症状信息的特征值集合,所述特征值集合包括两个以上的特征值;12标签生成模块,其配置成基于所述数据获取模块得到的特征值集合中的特征值随机生成若干个标签;13样本集合生成模块,其配置成基于所述标签生成模块生成的所述标签生成样本集合;和14结果获得模块,其配置成将所述样本集合输入到所述医学模型,得到对应的健康预测结果。本申请提供了基于技术方案b1或b2的技术方案b3,其中,1数据生成模块还包括:15数据库存储模块,其配置成为对应的健康预测结果赋予与所述样本集合的标签相同的标签,并将样本集合和健康预测结果以及各自对应的标签存入数据库。本申请提供了基于技术方案b1至技术方案b3的任意一个的技术方案b4,其中,12标签生成模块包括:121向量初始化模块,其配置成将所述特征值集合中的特征值均标记为1,得到一个1*n的初始向量,其中,n为特征值的个数,n≥2;和122标签随机生成模块,其配置成生成m*n维随机矩阵,其中,m为待生成的样本集合的数量,m≥1,所述随机矩阵中的元素为随机生成的1或0,将该随机矩阵的行向量作为标签,得到m个标签。本申请提供了基于技术方案b1至技术方案b4的任意一个的技术方案b5,其中,13样本集合生成模块具体为:按照标签中元素的顺序查找对应的特征值,如果标签的元素为1,则将该元素对应的特征值列入样本集合,如果标签的元素为0,则在所述样本集合的相应位置补零,从而生成样本集合。本申请提供了基于技术方案b1至技术方案b5的任意一个的技术方案b6,在2模型建立模块中,所述医学解释模型为:其中,xi表示第i个特征值,参数wi表示第i个特征值的权重,n表示特征值的个数,p表示所述医学解释模型的参考结果。本申请提供了基于技术方案b1至技术方案b6的任意一个的技术方案b7,其中,2模型建立模块包括:21权重初始化模块,其配置成随机初始化wi;22模型运算模块,其配置成分别将所述症状信息和所述健康预测结果代入所述医学解释模型的xi和p;和23权重调整模块,其配置成不断调整wi,直到仅将所述症状信息代入所述医学解释模型得到的预测结果接近或者等于所述健康预测结果。本申请提供了基于技术方案b1至技术方案b7的任意一个的技术方案b8,其中,23权重调整模块包括:231距离计算模块,被配置成利用下面公式计算样本集合中特征值之间的距离dij:其中,dij表示特征值xi与xj之间的距离,n表示属性的数量,vik和vjk分别表示xi的第k个属性与xj的第k个属性,q表示距离的参数,可选地,q=1,或者q=2。232相似度计算模块,被配置成基于231距离计算模块的结果,利用下面公式计算相似度sij:sij=1-|dij|,(0<|dij|<1)其中,sij表示特征值xi与xj之间的相似度;233权重误差计算模块,被配置成基于232相似度计算模块的结果,利用下面两个公式计算权重误差δwj:wj={wi|i=1,2,3...n}其中,σ为步宽,n表示特征值的个数,wj为权重wi的集合,pj表示第j个样本集合通过医学模型计算得到的健康预测结果;和234权重调整模块,被配置成基于233权重误差计算模块的结果,利用下面公式对权重进行调整wj+1=wj+δwj,0≤j≤m-1其中,wj+1为调整后的权重的集合。本申请提供了基于技术方案b1至技术方案b8的任意一个的技术方案b9,该装置还包括:4新数据计算模块,其配置成当有新的用于描述患者症状的症状信息的特征值时,分别代入所述医学模型和所述医学解释模型,分别得到新的健康预测结果和新的参考结果;和根据本申请的另一方面,还提供了技术方案c1:一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如技术方案a1至a9的任一项所述的方法。根据本申请的另一方面,还提供了技术方案d1:一种计算机可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如技术方案a1至a9任一项所述的方法。根据本申请的另一方面,还提供了技术方案e1:一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行如技术方案a1至a9任一项所述的方法。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetictape),软盘(英文:floppydisk),光盘(英文:opticaldisc)及其任意组合。以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1