归属度判别装置的制作方法

文档序号:6408128阅读:167来源:国知局
专利名称:归属度判别装置的制作方法
技术领域
本发明涉及通过综合2群线性判别的分析结果进行多群判别,从而判别被检测数据归属哪一群的归属度判别装置。该装置可以有效地用于例如疾病的诊断(患者属于何种疾病群的诊断)。
2群线性判别分析,作为统计判别所着眼的对象属于2群内哪一群的方法,是最普通的方法。另外从获得知识的观点看,由于2群线性判别分析最后是根据2群线性判别函数的判别值的正负来判别属于2群内的哪一群的,所以,信息压缩率非常高。
另一方面,对于某种疾病数据,作为从所考虑的多群中决定1群的方法(诊断系统),有以专家系统为代表的符号化的知识和利用推论法进行演绎而实现的方法、利用神经元网络学习的方法和像作为多元分析的应用的多群判别那样归纳实现的方法等。
如果人们考虑一下例如经验丰富的专科医生是经过什么样的思考过程从多群中决定1群的,就会知道,决不是一下就从多群中决定1群的,而是将所能考虑的群压缩为数群,通过对它们进行相互比较,决定出最像的群。这种过程叫作“选优过程”,这是人们比较擅长的。
关于这种多群模型的认识,在电子情报通信学会论文誌A Vol.J72—A No.1 pp.41—48(1989年1月)上有关于利用对判别的多群模型认识的记载。
在这种多群模型的认识中,对于所有的对,进行2群间的判别,综合这些结果得出对多群的判断结果。即,不是对全群假定共同的方差协方差矩阵,而是对每个对,假定方差协方差矩阵,对未知输入模型X,计算到各群Πi,Πj的马哈赖诺毕斯距离Di2,Dj2和后验概率P(Πi|x),P(Πj|x),根据马哈赖诺毕斯距离Di2,Dj2的大小或后验概率P(Πi|x),P(Πj|x)的大小得出判别结果,并在将其进行标准化(标准化对统计量)综合的基础上,最后得出未知输入模型x的分类结果。但是,对于后验概率P(Πi|x),P(Πj|x)没有登载具体的计算方法。
此外,其中,作为得出最后结果的方法,给出了多数决定法、极大极小法、以及利用期望值决定的方法。所谓多数决定法,就是集中2群判别结果,根据多数决定得出正确的答案。所谓极大极小法,就是在马哈赖诺毕斯距离中求极大值,当距离增大时就否定属于该群,对群数多的情况是有效的。所谓利用期望值决定的方法,就是取关于群Πi的标准化对统计量的期望值,以给出最佳结果的群为解的方法。
但是,在这种先有的多群判别中,例如在实际构筑判别各种疾病的系统时,由于用于获得知识(线性判别函数的计算等)的数据的质的差别,通常,得到的线性判别函数的可靠性不同。
另外,在实际的疾病的判别中,有具有非常重要意义的组合的2群判别和不怎么有意义的组合的2群判别,平等地考虑所有组合的2群判别是不能令人满意。可以认为,专科医生是在无意识中根据经验进行处理的。
上述情况,对于现实中的多群判别系统,特别是进行疾病判别的系统,是非常重要的问题。
本发明就是考虑了这些情况而提出的,其目的是提供一种可靠性比先有的归属度判别装置高的归属度判别装置,该装置根据2群线性判别,计算被检测数据属于多群中的哪一群,同时,对每个2群的组合判别均求出其支持度,通过参照其支持度,判断被检测数据的归属度而进行归属度的判别。


图1是本发明的结构框图,如图所示,本发明的归属度判别装置包括存储装置101、判别函数设定装置102、2群判别结果计算装置103、支持度确定装置104和归属度计算装置105。
存储装置101用于对大量的群预先存储各群的特征模型判别函数设定装置102用于对存储装置101中存储的许多群全部进行组合,从其中选择任意的2群,并对每一个2群分别设定将所选择的各2群进行最佳二分的线性判别函数;2群判别结果计算装置103用于使用由判别函数设定装置102设定的各2群的线性判别函数,对各2群计算出被检测数据属于哪一群的2群判别结果支持度确定装置104用于对各2群确定由2群判别结果计算装置103计算出的2群判别结果的支持程度;归属度计算装置105用于根据各2群的2群判别结果和支持度计算被检测数据对各群的归属度。
作为本发明中的存储装置101,可以使用软盘装置及磁盘装置等各种外部存储装置。
作为判别函数设定装置102、2群判别结果计算装置103、支持度确定装置104和归属度计算装置105,可以使用由CPU、ROM、RAM、I/O通道构成的微处理器。
在本发明中,利用支持度确定装置104确定的支持度最好通过考虑以下三个因素进行确定,这三个因素是将是用小方差判别的还是用大方差判别的情况数量化的2群判别度、将线性判别函数的可靠性的程度数量化的判别函数的确信度和将想进行判别的2群的重要性程度数量化的重要度。
另外,支持度确定装置104的支持度中的2群判别度最好通过求被检测数据对各2群的马哈赖诺毕斯距离的平方以及这些数值的距离比,将该距离比规范化后作为2群判别度。
支持度确定装置104的支持度中的判别函数的确信度,最好利用由判别函数设定装置对各2群分别设定线性判别函数时的判别性能评价指标之一的相关比进行确定。
按照本发明,利用判别函数设定装置从存储装置中存储的大量的群中选择任意的2群,设定将所选择的2群进行最佳二分的线性判别函数。然后,使用该线性判别函数,利用2群判别结果计算装置可以得到被检测数据属于2群内哪一群的2群判别结果,同时,利用支持度确定装置可以得到该2群判别结果的支持度,对所有的2群对的组合都进行上述过程。
并且,根据所得到的2群判别结果和支持度,计算被检测数据对各群的归属度。这样,便可判别在获得知识的实际情况中的确实的疾病群。
下面,参照附图所示的实施例详细说明本发明。
图1是本发明的结构框图。
图2是本发明的归属度判别装置的一个实施例的框图。
图3是本发明的归属度判别装置的处理概况的框图。
图4是表示知识获得过程和判别诊断过程的详细情况的框图。
图5是2群判别度Rij的函数f(x)的曲线。
图6是知识获得过程和判别诊断过程的全部处理内容的流程图。
图7是表示判别诊断过程的详细内容的流程图。
图8是表示实际进行归属度判别时的输出数据结果单(支持模式无)的例子的说明图。
图9是表示实际进行归属度判别时的输出数据结果单(支持模式距离比)的例子的说明图。
图10是表示实际进行归属度判别时的输出数据结果单(支持模式距离比,相关比)的例子的说明图。
10-数据库12-2群判别分析装置14-存储装置16-控制装置18-输出装置但是,本发明并不限于该实施例。
在本实施例中,说明使用由血液分析装置得到的WBC(白血球数)、RBC(红血球数)、HGB(血红蛋白量)、MCV(平均红血球体积)、MCHC(平均红血球血红蛋白浓度)、PLT(血小板数)、RDW(红血球分布幅度)等7种测定数据,判断7维被检测数据X(=X1、X2、X3、X4、X5、X6、X7)属于β—地中海贫血、缺铁性贫血、二次性贫血①、二次性贫血②、二次性贫血③、再生不良性贫血+MDS、溶血性贫血①、溶血性贫血②、巨红芽球性贫血、缺铁性贫血治疗中,脐带血、多血症、正常(成人)、正常(小孩)等14群中的哪一群(疾病)。
图2是本发明的归属度判别装置的一个实施例的结构框图。图中,10是由软盘装置或磁盘装置等各种外部存储装置构成的数据库,12是2群判别分析装置,14是例如RAM那样的存储装置,16是控制装置,18是由CRT显示装置等那样的显示装置及点阵打印机那样的印刷装置构成的输出装置。2群判别分析装置12和控制装置16可以利用由CPU、ROM、RAM、I/O通道构成的微处理器构成。
图3是本发明的归属度判别装置的处理概况的框图,下面,根据该框图说明本装置的处理概况。
首先,说明知识获得过程。
在由本装置进行的归属度的判别中,对于每一个上述各群(疾病)i1,2,…,14,必须确保大量的质量高的知识获得的数据DiD1,D2,…,D14。
该知识获得数据群Di是实际分析属于β—地中海贫血、缺铁性贫血、二次性贫血①、二次性贫血②、二次性贫血③、再生不良性贫血+MDS、溶血性贫血①、溶血性贫血②、巨红芽球性贫血、缺铁性贫血治疗中,脐带血、多血症、正常(成人)、正常(小孩)等14群人的血液时,分别记录的属于各群人的WBC、RBC、HGB、MCV、MCHC、PLT、RDW等7种血液测定数据。该获得知识数据群Di被存储到数据库10内。
2群判别分析装置12从数据库10读取该获得知识数据群Di,对该获得知识数据群Di的所有的2群对的组合进行2群判别分析,从而获得线性判别函数Fij等的知识。获得的知识被存储到存储装置14内。
下面,说明判别诊断过程。
控制装置16读入未知的被检测数据x,根据被检测数据x和获得的知识,计算出被检测数据x属于各种疾病的可能性作为2群判别结果Aij及其支持度Sij的数值。所谓被检测数据x,就是要对属于哪一种疾病进行研究的、患者的实际的WBC、RBC、HGB、MCV、MCHC、PLT、RDW等7种血液数据。
作为数值计算出的属于各种疾病的可能性的结果,将各群集中起来,作为归属度Ki输给输出装置18。在本装置中,根据未知的被检测数据x和上述获得的知识进行疾病的判别。
图4是表示上述获得知识过程和判别诊断过程的详细情况的框图。图中,获得知识过程用框20表示,判别诊断过程用框22表示。下面,参照该框图详细说明本装置的处理过程。
在2群判别分析装置12中,具体地说,对14群即获得知识数据D1,D2,…,D14的所有的2群对,进行2群线性判别分析。2群对的组合(i,j)总共有14C2=(14×13)/2=91种。与该组合对应地也需要91种用于划分2群的线性判别函数Fij(X1,X2,…,X7)。
线性判别函数Fij(X1,X2,…,X7)的形式如下Fij(X1,X2,…,X7)=aij0+aij1X1+aij2X2+…aij7X7…………(1)其中,aij0,aij1,aij2,…,aij7是系数,X1,X2,…,X7为变量。
求对获得知识数据的疾病群Di,Dj进行最佳判断的线性判别函数Fij(X1,X2,…,X7)的方法,即为了求上述系数aij0,aij1,aij2,…,aij7,可以使用众所同知的方法。另外,求获得知识数据的疾病群Di,Dj和各平均值矩阵Yi,Yj、各方差协方差矩阵Si,Sj及相关比的方法也是大家熟知的。这些矩阵Yi,Yj,Si,Sj在计算后面所述的到被检测数据的群i,j的马哈赖诺毕斯距离的平方Mi,Mj时使用。
以上的每个2群对(i,j)所得到的线性判别函数式的系数aij0,aij1,aij2,…,aij7、平均值矩阵Yi,Yj、方差协方差矩阵Si,Sj和相关比,就是本装置中使用的获得的知识。
在控制装置16中,根据被检测数据X和获得的知识,将被检测数据X属于各种疾病的可能性计算成数值。
即,选择疾病的2群对(i,j),根据被检测数据X和与该2群对对应的线性判别函数Fij(X1,X2,…,X7),求被检测数据X属于疾病i还是属于疾病j。这时,断定属于疾病i时,取Aij=1,断定属于疾病j时,取Aij=0。将被检测数据X(X1,X2,…,X7)代入上述(1)式后,根据得到的判别函数值的正负,可以确定该2群判别结果Aij。
为了计算属于疾病i的可能性的程度Ki,只用上述2群判别结果Aij的信息就可以求出可能性的程度Ki。但是,通常,精度不太高。这是因为有用大方差判别的情况和用小方差判别的情况,而上述计算没有考虑这一点。
因此,在本发明中,引入对群i与群j的2群判别结果的支持度Sij的概念,即使是相同的2群判别结果,也可以考虑是何种程度的判别度。2群判别结果的支持度表示2群判别结果的程度,取0~1的数值。该支持度越接近于1,表示对2群判别结果的支持度越高,即,表示是用大方差判别的;支持度越接近于0,表示对2群判别结果的支持度越低,即,表示是用小方差判别的。
下面,说明具体的2群判别结果的支持度Sij的计算例子。在本说明中,对判别函数的确信度Cij、重要度Wij和2群判别度Rij分别进行说明。
(1)判别函数的确信度Cij的计算方法由于判别函数的获得可以根据现实的数据进行,所以,各群的知识获得数据的质量当然就对知识即判别函数影响很大。在2群判别分析中,为了表示得到的2群线性判别函数Fij(X1,X2,…,X7)的判别性能,有时使用相关比。
该相关比用于将被检测数据X代入判别群i与群j的2群的线性判别式后,求出所得到的判别函数值Z的两群的度数分布,计算出各群的判别函数值的平均值矩阵Yi,Yj、方差σI2,σJ2(采样数ni,nj)、两群全体的平均值矩阵YT和方差σT2(采样数nT(=nI+nJ))。
这里,设同类方差为σW2,则同类方差σW2可以表示为σW2=(nIσI2+nJσJ2)/nT设类间方差为σB2,则类间方差σB2可以表示为σB2=(nI(YI-YT)2+nJ(YJ-YT)2/nT另外,由于σT2=σW2+σB2,所以,相关比由下式算出相关比Cij=σB2/σT2(0<相关比<1)如果判别能力高,则类间方差大,同类方差变小,所以,该相关比成为接近于1的值。将该相关比规定为判别函数的确信度。(2)重要度Wij的设定被检测数据X对i群的归属度,可以作为在全部14个群内除了群i与群i外与13个群的2群对线性判别结果而求出。计算对群i的归属度时,通常,对于13组(在本实施例中,对于1个群,存在13组2群对)2群对,重要度有差别。例如,计算对缺铁性贫血群的归属度时,与β—地中海贫血群、正常群等类似群的判别。在临床上是重要的,但是,与多血症群等的判别,在信息方面不太有价值,在临床上重要度也不大。将这种关系用13个满分(在本实施例中,对于1个群,存在13组2群对)作为重要度Wij分配给各2群对。
(3)2群判别度Rij的计算方法计算被检测数据X到疾病群i,j的马哈赖诺毕斯距离的平方Mi,Mj)。
众所周知,到疾病i的马哈赖诺毕斯距离的平方Mi可以根据被检测数据X、由知识获得所得到的疾病i群的平均值矩阵Yi和方差协方差矩阵Si,由下式求得。即,Mi=t(X-Yi)Si-1(X-Yi)其中,t表示转置矩阵,-1表示逆矩阵。
按照同样的办法,也可以求出到疾病j的马哈赖诺毕斯距离的平方Mj。
根据2个马哈赖诺毕斯距离的平方,设定Mi相对于Mj的相对马哈赖诺毕斯距离的平方之比MRij,利用函数f将该值MRij变换为0~1的数值,规定为2群判别度Rij。
例如,设MRij(=Mj/Mi)为X,则利用关系式1可以算出Rij。即,(关系式1)Rij=f(x)=1-exp(-0.366×(x-1))1+exp(-0.366×(x-1))]]>其中,x≤1时,令Rij=0。
图5是上述函数f(x)的曲线。该函数f(x)是用于标准化的函数的一个例子,可以将取1~∞的数值的MRij连续地变换为0~1。
常数-0.366的根据是被检测数据X到i群和j群的马哈赖诺毕斯距离之比为2时(到j群的距离是到i群的距离的2倍时,因MRij是平方,所以取为4),设定2群判别度Rij为0.5。关于该常数-0.366,应根据进行判别的群的相对远近程度而改变。
另外,还有使用将2群线性判别式应用于获得知识数据时的判别命中率的方法。
根据上述结果,可以利用下式求出对判别结果的支持度Sij。即,Sij=Rij×Cij×Wij利用下式求出对i群的归属度Ki。即,(关系式2)Ki=Σj=1nAij×Sij×1/(n-1)]]>其中,n=14,j≠i。另外,Aij=1时,判别为疾病i,Aij=0时,判别为疾病j。
上述归属度Ki的取值范围为0≤Ki≤1。
支持度Sij即使只用2群判别度Rij也可以使判别精度比先有的装置高,若再考虑判别函数的确信度Cij(Sij=Rij×Cij),就与获得知识数据的实际情况一致了。
此外,若再考虑重要度Wij(Sij=Rij×Cij×Wij),就可以进一步接近人的判断。
下面,参照图6和图7所示的流程图说明这种处理动作的内容。
图6是知识获得过程和判别诊断过程的全部处理内容的流程图。
如图所示,在本装置的处理中,首先,在知识获得过程中,根据获得知识数据群Di,对每个2群对,获得线性判别函数Fij、平均值矩阵Yi、方差协方差矩阵Si、相关比Cij(S31)。
然后,设定每个2群对的重要度Wij(S32)。该重要度Wij可以和获得知识数据群Di一起预先设定。
并且,在判别诊断过程中,使用这些线性判别函数Fij、平均值矩阵Yi、方差协方差矩阵Si、相关比Cij和重要度Wij,对被检测数据X进行多群判别(S33)。
图7是表示判别诊断过程的详细内容的流程图。
在判别诊断过程的处理中,首先输入被检测数据X(S41),指定任意的群i(S42),将被检测数据X代入线性判别函数式Fij,确定2群判别结果Aij(S43)。
接着,根据被检测数据X、平均值矩阵Yi和方差协方差矩阵Si计算马哈赖诺毕斯距离的平方Mi,Mj(S44)、根据马哈赖诺毕斯距离的平方Mi,Mj之比MRij计算2群判别度Rij(S45)。
然后,根据相关比Cij、重要度Wij和2群判别度Rij计算2群判别结果Aij的支持度Sij(S46)。
这时,检查指定群i的所有组合ij(其中,j≠i)是否结束(S47)如果已全部结束,就根据2群判别结果Aij及该2群判别结果的支持度Sij计算指定群i的归属度Ki(S48)。
最后,对所有的群i检查是否结束(S49),如果对所有的群i已结束,就将归属度Ki换为按数值大小的顺序排列(S50),确定可能性最高的群i(S51)。
实际进行上述处理时的输出数据结果单的例子示于图8~图10。这些图所示的是以有二次性贫血③疾病的体检结果作为被检测数据,经过上述过程求各群的归属度Ki的情况。
这些图中,图8是只使用2群判别结果未考虑2群判别结果的支持度Sij的情况(支持模式无);图9是在2群判别结果的支持度Sij内只考虑2群判别度Rij的情况(支持模式距离比);图10是在2群判别结果的支持度Sij内,考虑了2群判别度Rij和判别函数的确信度Cij的情况(支持模式距离比,相关比)。
各模式中归属度Ki的计算式如下支持模式没有时(关系式3)Ki=Σj=1nAij×1/(n-1)]]>(j≠i)支持模式为距离比时,(关系式4)Ki=Σj=1nAij×Rij×1/(n-1)]]>(j≠i)支持模式为距离比和相关比时,(关系式5)Ki=Σj=1nAij×Rij×Cij×1/(n-1)]]>(j≠i)未考虑判别结果的支持度Sij时,如图8所示,二次性贫血③群与溶血性贫血①群的归属度Ki相同,但是,考虑了判别结果的支持度Sij时,图9是只考虑2群判别度Rij的情况和图10是2群判别度Rij和判别函数的确信度Cij都考虑的情况,都是二次性贫血③群的归属度Ki为第1位。
此外,对于支持度Sij,若将未考虑判别函数的确信度Cij的情况(图9)与考虑的情况(图10)进行比较,可以看出考虑了判别函数的确信度Cij的情况(图10),第1位与第2位之差相对地大。
这样,根据获得知识数据群D1,…,Dn对所有的2群对的组合进行2群判别分析,可以得到作为知识的判别函数Fij。并且,使用该判别函数Fij对未知的被检测数据X进行全部组合的2群判别分析,得到2群判别结果Aij和支持度Sij,通过根据该2群判别结果Aij和支持度Sij计算被检测数据X对各群的归属度Ki,可以判断与获得知识的实际情况一致的确实的疾病群。
按照本发明,是从大量的群中选择任意的2群,设定将所选择的群进行最佳二分的线性判别函数,利用该线性判别函数得到被检测数据属2群内哪一群的2群判别结果,同时,得到该2群判别结果的支持度,根据得到的2群判别结果和支持度,最后算出被检测数据对各群的归属度,所以,可以判断与获得知识的实际情况一致的确实的疾病群。
权利要求
1.归属度判别装置,其特征在于具有存储装置、判别函数设定装置、2群判别结果计算装置、支持度确定装置和归属度计算装置。存储装置,用于对大量的群预先存储各群的特征模型;判别函数设定装置,用于从存储装置存储的大量的群中对所有的组合选择任意的2群,并对每个2群分别设定将所选择的2群进行最佳二分的线性判别函数;2群判别结果计算装置,用于使用由判别函数设定装置设定的每个2群的线性判别函数,对每个2群计算被检测数据属于哪一群的2群判别结果;支持度确定装置,用于对每个2群确定由2群判别结果计算装置计算的2群判别结果的支持度;归属度计算装置,用于根据每个2群的2群判别结果和支持度,计算被检测数据对各群的归属度。
2.按权利要求1所述的归属度判别装置,其特征在于利用支持度确定装置确定的支持度通过考虑以下三个因素进行确定,这三个因素是将用小方差判别的还是用大方差判别的情况数量化的2群判别度、将线性判别函数的确实程度数量化的判别函数的确信度和将要判别的2群的重要性程度数量化的重要度。
3.按权利要求2所述的归属度判别装置,其特征在于由支持度确定装置确定的支持度中的2群判别度,通过求被检测数据到各2群的马哈赖诺毕斯距离的平方及其数值的距离比并将该距离比规范化后规定为2群判别度而求出。
4.按权利要求2所述的归属度判别装置,其特征在于由支持度确定装置确定的支持度中的判别函数的确信度由利用判别函数设定装置对每个2群分别设定线性判别函数时的判别性能的评价指标之一即相关比来决定。
全文摘要
本发明的归属度判别装置,具有对大量的群预先存储各群的特征模型的存储器和CPU,利用CPU从存储器存储的大量的群中对所有的组合选择任意的2群,对每个2群分别设定将所选择的各2群进行最佳二分的线性判别函数,利用设定的每个2群的线性判别函数计算被检测数据对于每个2群属于哪一群的2群判别结果,对每个2群确定其支持度,根据每个2群的2群判别结果和支持度计算被检测数据对各群的归属度。
文档编号G06F15/18GK1121207SQ9411700
公开日1996年4月24日 申请日期1994年9月30日 优先权日1993年9月30日
发明者金井一之 申请人:东亚医用电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1