辅助诊断装置和方法与流程

文档序号:14862240发布日期:2018-07-04 08:15阅读:706来源:国知局
辅助诊断装置和方法与流程
本申请涉及计算机信息处理领域,特别是涉及一种辅助诊断装置和方法。
背景技术
:目前,医学领域的智能诊断模型应用越来越广泛。通常情况下,该模型能够给出预测疾病的患病概率。对于模型而言,输入给模型的信息越完整全面,覆盖的疾病表现越多,则模型越容易综合这些信息得出更可靠的结果。但是,基于某些疾病出现的疾病表现数量较多,由于时间、医疗成本的限制,医护人员不可能逐一进行询问,这样会导致输入给模型的信息不够完整和全面,从而导致模型预测的结果不准确。另一方面,由于医护人员的经验各不相同,在根据病人现有疾病表现很难对病情进行判断的情况下,某些医护人员可能会难以确定下一步询问和检查的项目,从而导致诊断时间的延长,如果询问和检查的项目与病人真正的病情相关度不大,可能会引起诊断结果的偏差。技术实现要素:本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。根据本申请的一个方面,提供了一种辅助诊断装置,所述装置包括:输入模块,其被配置为获取对应于第一输入项的第一数据,所述第一输入项用于描述第一问询和检查项目;和数据处理模块,其被配置为基于所述第一输入项和所述输入模块获取的所述第一数据预测疾病种类,得到用于进一步确定疾病种类的第二输入项,以用于辅助诊断,其中,所述第二输入项对应于第二问询和检查项目,所述第二问询和检查项目为在所述装置能够处理的所有问询和检查项目中除去第一问询和检查项目外,包括在与所述疾病种类对应的第三问询和检查项目中的问询和检查项目。该装置能够帮助用户,尤其是医务人员快速确定下一步需要问询和检查的项目,从而提高确诊速度和判断的准确率。可选地,所述数据处理模块包括:疾病种类预测模块,其被配置为基于所述输入模块获取的所述第一数据,预测所述疾病种类的概率,输出预测结果;知识库检索模块,其被配置为根据所述疾病种类预测模块的所述预测结果,在知识库中查询与所述疾病种类对应的第三问询和检查项目;和第二输入项计算模块,其被配置为计算在所述装置能够处理的所有问询和检查项目中除去第一问询和检查项目外,包括在与所述知识库检索模块得到的所述第三问询和检查项目中的问询和检查项目所对应的所述第二输入项。可选地,所述疾病种类预测模块包括:疾病种类计算模块,其被配置为基于所述输入模块获取的所述第一数据,预测可能存在的若干疾病种类的每一个的概率;和疾病种类排序模块,其被配置为对所述概率进行排序,得到所述概率最高的前n个疾病种类并输出,其中n>0。可选地,所述第二输入项计算模块包括:问询和检查项目移除模块,其被配置为将从所述知识库检索模块得到的第三问询和检查项目中移除所述第一问询和检查项目,得到第四问询和检查项目;和问询和检查项目选择模块,其被配置为在所述问询和检查项目移除模块得到的第四问询和检查项目中选出所述装置能够处理的问询和检查项目,得到所述第二问询和检查项目;和第二输入项映射模块,根据所述问询和检查项目选择模块的所述第二问询和检查项目,得到所述第二输入项。可选地,所述数据处理模块还包括:信息增益计算模块,其被配置为计算所述第二输入项中每一个与所述疾病种类的信息增益;和第二输入项排序模块,其被配置为基于所述信息增益计算模块得到的所述信息增益,得到所述信息增益最大的前m个第二输入项,将所述前m个第二输入项输出,其中,m>0。根据本申请的另一个方面,提供了一种辅助诊断方法,包括:步骤1,获取对应于第一输入项的第一数据,所述第一输入项用于描述第一问询和检查项目;步骤2,基于所述第一输入项和所述第一数据预测疾病种类,得到用于进一步确定疾病种类的第二输入项,以用于辅助诊断,其中,所述第二输入项对应于第二问询和检查项目,所述第二问询和检查项目为在所述方法能够处理的所有问询和检查项目中除去第一问询和检查项目外,包括在与所述疾病种类对应的第三问询和检查项目中的问询和检查项目。可选地,所述步骤2包括:步骤21,基于所述第一数据,预测所述疾病种类的概率,输出预测结果;步骤22,根据所述预测结果,在知识库中查询与所述疾病种类对应的第三问询和检查项目;和步骤23,计算在所述方法能够处理的所有问询和检查项目中除去所述第一问询和检查项目外,包括在与所述第三问询和检查项目中的问询和检查项目所对应的所述第二输入项。根据本申请的另一个方面,提供了计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述的方法。根据本申请的另一个方面,提供了计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述的方法。根据本申请的另一个方面,提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述的方法。根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。附图说明后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:图1是本申请的辅助诊断装置的一个实施例的原理框图;图2是图1所示数据处理模块的一个实施例的原理框图;图3是本申请的辅助诊断方法的一个实施例的流程图;图4是图3所示方法的步骤二的一个实施例的流程图。具体实施方式根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。根据本发明的一个方面,如图1所示,提供了一种辅助诊断装置,该装置可以包括:输入模块,其被配置为获取对应于第一输入项的第一数据,所述第一输入项用于描述第一问询和检查项目;和数据处理模块,其被配置为基于所述第一输入项和所述输入模块获取的所述第一数据预测疾病种类,得到用于进一步确定疾病种类的第二输入项,以用于辅助诊断,其中,所述第二输入项对应于第二问询和检查项目,所述第二问询和检查项目为在所述装置能够处理的所有问询和检查项目中除去第一问询和检查项目外,包括在与所述疾病种类对应的第三问询和检查项目中的问询和检查项目。该装置能够帮助用户,尤其是医务人员快速确定下一步需要问询和检查的项目,从而提高确诊速度和判断的准确率。可选地,如图2所示,数据处理模块可以包括:疾病种类预测模块,其被配置为基于所述输入模块获取的所述第一数据,预测所述疾病种类的概率,输出预测结果;知识库检索模块,其被配置为根据所述疾病种类预测模块的所述预测结果,在知识库中查询与所述疾病种类对应的第三问询和检查项目;和第二输入项计算模块,其被配置为计算在所述装置能够处理的所有问询和检查项目中除去第一问询和检查项目外,包括在与所述知识库检索模块得到的所述第三问询和检查项目中的问询和检查项目所对应的所述第二输入项。具体地,例如,辅助诊断装置可以提供若干输入项,也就是该装置能够处理的输入项。这些输入项通常用于描述患者的疾病表现、体征和其他信息,诸如,体温、心跳、脉搏、头晕、胸闷等,每个输入项对应有一个或多个输入框,用户可以将患者的疾病表现、体征和其他信息填入对应的输入框,比如,体温数据、心跳速率、某个症状是否存在、症状的严重程度等等,从而使得辅助诊断装置能够获得患者的疾病表现信息集合s1。疾病种类预测模块能够根据输入的数据计算出患者的疾病种类,例如,计算得到5个疾病种类。该疾病种类可以是患者可能患有的疾病,例如,病毒性感冒、细菌性感冒、肺炎等,然后将计算结果输出给知识库检索模块。知识库检索模块能够在知识库进行检索。知识库中可以包括但不限于疾病种类、疾病表现、输入项之间的对应关系。优选地,该知识库还可以包括索引、医生、科室、治疗方法、药物、住院建议、并发症等中一种或几种信息。从知识库中得出以上5个疾病对应的所有疾病表现,这些疾病表现组成疾病表现集合s3,最终要得到的建议询问和检查的项目都来自于这个集合。由于该疾病表现集合s3能够对应该辅助诊断装置中的若干输入项,因此在该疾病表现集合s3中除去疾病表现集合s1外,选择那些同时包括在该装置能够处理的疾病表现集合s5和所述疾病种类对应的疾病表现集合s3的疾病表现,得到疾病表现集合s2,并且能够得到对应的第二输入项,从而能够为用户提供接下来应该询问和检查的方向和/或需要填充的信息数据。可选地,所述疾病种类预测模块可以包括:疾病种类计算模块,其被配置为基于所述输入模块获取的所述第一数据,预测可能存在的若干疾病种类的每一个的概率;和疾病种类排序模块,其被配置为对所述概率进行排序,得到所述概率最高的前n个疾病种类并输出,其中n>0。由于根据多个输入信息,模型可能计算出多种可能的结果,因此采用概率的方式对各个结果进行描述,能够使用户得到更直观的认识。设置排序模块的目的在于当得到的疾病种类过多时,对于概率较低的结果可能没有继续分析的必要性,因此仅对概率高的疾病种类进行分析,能够提高数据处理的速度,并且提高结果预测的准确性。可选地,第二输入项计算模块可以包括:问询和检查项目移除模块,其被配置为将从所述知识库检索模块得到的第三问询和检查项目中移除所述第一问询和检查项目,得到第四问询和检查项目;问询和检查项目选择模块,其被配置为在所述问询和检查项目移除模块得到的第四问询和检查项目中选出所述装置能够处理的问询和检查项目,得到所述第二问询和检查项目;和第二输入项映射模块,根据所述问询和检查项目选择模块的所述第二问询和检查项目,得到所述第二输入项。例如,用户已知信息已经被填入输入框中,因此不应当再出现在后续的建议询问和检查或者填写要求中,故需要对第三输入项进行筛选。从疾病表现的角度分析,设置输入项移除模块的目的是将疾病表现集s3与该患者已经出现的疾病表现集合s1做差集得到疾病表现集s4。由于得到建议询问和检查的疾病表现的目的之一是为模型有更加全面的特征可以进行预测,因此建议询问和检查的疾病表现应该是模型能够分析和处理的疾病表现。设置输入项选择模块的目的是将疾病表现集s4与模型所使用的输入项代表的疾病表现集合s5作交集,得到疾病表现集s2。可选地,如图2所示,数据处理模块可以包括:信息增益计算模块,其被配置为计算所述第二输入项中每一个与所述疾病种类的信息增益;和第二输入项排序模块,其被配置为基于所述信息增益计算模块得到的所述信息增益,得到所述信息增益最大的前m个第二输入项,将所述前m个第二输入项输出给辅助信息生成模块,其中,m>0。由于疾病表现集s2中是所有可以询问和检查或填写的疾病表现,但一般情况下其数量过大,医务人员没有足够的时间针对所有的疾病表现一一进行询问和检查,因此有选择地对其进行排序,从而按照重要程度对建议问询和检查项目进行排序,可以给医生提供有针对性的信息,从而极大地提高问诊效率。可选地,本申请根据每个第二输入项,计算其与所预测的疾病种类的信息增益,得到信息增益最大的前m个输入项,即为最终建议询问和检查的结果,优选地,m=10。可选地,信息增益计算模块可以包括:熵值计算模块,其被配置为计算第二输入项对应疾病种类的熵值,如公式(1)和(2):p(x=xi)=pi,i=1,2,...,n(2)其中,h(x)表示熵函数,pi为预测的第i个疾病种类占所有预测疾病种类的总数量的比例,n为预测的疾病种类的数量,x为第二问询和检查项目对应的疾病表现集合,xi为第二问询和检查项目,n为第二问询和检查项目的数量;得到的熵值越大,则表示第二问询和检查项目对疾病种类的不确定性越大。条件熵计算模块,其被配置为计算第二输入项对应的疾病表现的每一个对应于疾病种类的条件熵,如公式(3),该公式中参数的计算如公式(4)和(5):其中,h(y|xi)表示第二输入项xi对应于疾病种类的条件熵;pi表示与xi对应的疾病种类的数量占疾病种类总数的百分比;n为预测的疾病种类的数量;k为在预测的疾病种类对应的问询和检查项目中出现第二问询和检查项目的次数;h(y|d(xi))表示疾病种类中出现xi的条件熵;表示疾病种类中未出现xi的条件熵;p(d(xi))为该包含xi的疾病种类占所有包含xi的疾病种类数量的比重;为该不包含xi的疾病种类占所有不包含xi的疾病种类数量的比重;和增益计算模块,其被配置为基于熵值计算模块的熵值和条件熵计算模块的条件熵计算第二输入项的信息增益,如公式(6):h=h(x)-h(y|x)(6)信息增益表示得知特征x的信息而使得y的信息的不确定性的减少的程度,所以信息增益越大,表明这个特征对于区分y的类别越有显著作用。本申请中借助信息增益获得那些对于疾病的区分具有显著作用的疾病表现对应的输入项。通过计算信息增益,可以筛选出最有必要询问和检查的项目,从而提高诊断的效率,节省时间,并且能够获得更加准确的结果。具体地,假设针对知识库中疾病表现对于疾病的信息增益的计算过程如下表一所示:表一疾病种类疾病表现第二输入项dis1z1,z2x1,x2dis2z1,z3x1,x3dis3z2,z3,z4x2,x3,x4dis4z1,z2,z3x1,x2,x3dis5z4x4具体地,预测的疾病种类为5个疾病种类,例如,5种疾病,每种疾病的预测概率均为0.2,则利用熵值计算模块计算每个第二输入项对于疾病的熵,如公式(7):条件熵计算模块依次计算每个疾病表现相对疾病的条件熵,以疾病表现z1为例,其对应的第二输入项为x1,在所有的疾病中出现x1的有3个,未出现x1的有2个,则上述公式(4)和(5)可以简化为公式(8)和(9),第二输入项中的x1对应于疾病种类的条件熵为公式(10):增益计算模块,其被配置为基于公式(7)和(10)的结果计算第二输入项的中x1的信息增益,按照这种方式计算其他的第二输入项信息增益。依次计算后,得到信息增益最大的疾病表现,即为建议询问和检查的疾病表现。可选地,该装置还可以包括:辅助信息生成模块,其被配置为基于所述数据处理模块得到的所述第二输入项,生成辅助诊断信息。可选地,在辅助信息生成模块中,辅助诊断信息可以包括以下信息的一个或者多个:对第二输入项的提示信息、对第二输入项的标记信息、与第二输入项对应的参考文献信息、对第二输入项的描述信息。例如,用户界面上可以通过高亮、闪动、打标记、输出提示信息等方式提示用户哪些选项为第二输入项,也可以提供参考文献、描述信息的阅览。可选地,该装置还可以包括:响应模块,其被配置为响应用户指令,重新触发输入模块。这样,用户可以根据辅助诊断信息的结果自主选择是否重新运行该装置,如果得到的结果并不能帮助该用户得到更加确定的答案,则用户可以根据辅助诊断信息的提示,继续输入患者数据,重新运行该辅助诊断装置,得到新的第二输入项,进而再次得到辅助诊断信息。该过程可以反复循环,直至得到满意的结果。辅助诊断模型根据病人描述的既往史、现病史等信息,计算出该患者最有可能患有的若干种疾病及相应的患病概率,辅助医生进行疾病诊断。在此基础上,医生需要进一步询问更详细的疾病表现或进行相关检查来确认患者是否患有相关疾病。本申请借鉴机器学习分类算法的评价指标“信息增益”,计算若干种疾病所有问询和检查项目的信息增益,并进行升序排序,将排序前若干个,例如10个返回给医生作为询问和检查方面的建议。本申请根据信息增益的方式找出被预测疾病的关键疾病表现来进行询问和检查,为医生提供问诊及检查建议,方便医生工作。根据本申请的另一个方面,如图3所示,还提供了一种辅助诊断方法,包括:步骤1,获取对应于第一输入项的第一数据,所述第一输入项用于描述第一问询和检查项目;和步骤2,基于所述第一输入项和所述第一数据预测疾病种类,得到用于进一步确定疾病种类的第二输入项,以用于辅助诊断,其中,所述第二输入项对应于第二问询和检查项目,所述第二问询和检查项目为在所述方法能够处理的所有问询和检查项目中除去第一问询和检查项目外,包括在与所述疾病种类对应的第三问询和检查项目中的问询和检查项目。可选地,如图4所示,所述步骤2包括:步骤21,基于所述第一数据,预测所述疾病种类的概率,输出预测结果;步骤22,根据所述预测结果,在知识库中查询与所述疾病种类对应的第三问询和检查项目;和步骤23,计算在所述方法能够处理的所有问询和检查项目中除去所述第一问询和检查项目外,包括在与所述第三问询和检查项目中的问询和检查项目所对应的所述第二输入项。可选地,步骤21包括:步骤211,基于所述第一数据,预测可能存在的若干疾病种类的每一个的概率;和步骤212,对所述概率进行排序,得到所述概率最高的前n个疾病种类并输出,其中n>0。可选地,步骤23包括:步骤231,从所述第三问询和检查项目中移除所述第一问询和检查项目,得到第四问询和检查项目;步骤232,从所述第四问询和检查项目中选出所述方法能够处理的问询和检查项目,得到所述第二问询和检查项目;和步骤233,根据所述第二问询和检查项目,得到所述第二输入项。可选地,步骤2还包括:步骤24,计算所述第二输入项中每一个与所述疾病种类的信息增益;和步骤25,基于所述信息增益,得到所述信息增益最大的前m个第二输入项,将所述前m个第二输入项输出,其中,m>0。可选地,步骤24包括:步骤241,计算第二输入项对应疾病种类的熵值,步骤242,计算第二输入项的每一个对应于疾病种类的条件熵,步骤243,基于所述熵值和所述条件熵计算第二输入项的信息增益。可选地,该方法还包括:步骤5,基于所述第二输入项,生成辅助诊断信息。可选地,该方法还包括:步骤6,响应用户指令,重复上述步骤。应当理解的是,本申请的方法中各个步骤的具体实现方式和计算方法与装置中的各个模块的实现方式和计算方法相同或者相似。根据本申请的另一个方面,还提供了一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述的方法。根据本申请的另一个方面,还提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述的方法。根据本申请的另一个方面,还提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述的方法。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetictape),软盘(英文:floppydisk),光盘(英文:opticaldisc)及其任意组合。以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1