相似病例检索装置以及相似病例检索方法

文档序号:6397029阅读:337来源:国知局
专利名称:相似病例检索装置以及相似病例检索方法
技术领域
本发明涉及病例检索装置以及病例检索方法,在医疗信息系统领域中,从存储了包含医用图像和该医用图像的读影报告的病例数据的病例数据库中,检索与作为对象的读影报告相似的病例数据。
背景技术
近年,为了支援基于读影医疗的医用图像的读影、基于临床医疗的诊断,而将与过去读影以及诊断出的医用图像、其读影结果以及诊断结果等相关的信息存储到数据库中的研究盛行。此外,提出有一种相似病例检索系统,医师从上述数据库中检索与读影/诊断对象的医用图像相似的医用图像以及该医用图像的读影结果、诊断结果等的相关信息。
在以往的病例检索系统中,多个记载了读影/诊断结果的文本数据(以下记载为 “读影报告”)保存在数据库中。因此,从数据库中检索具有与医师输入的读影报告(以下记载为“检索对象”)内所含有的文字串相似的文字串的读影报告。然后,将所检索的读影报告和医用图像作为检索结果而输出(参照非专利文献I)。
在这种以往的病例检索系统中,使用具有以读影报告内所含有的各关键词的个数为要素的向量,来检索读影报告。具体地说,通过对检索对象的向量与数据库内的读影报告的向量之间的距离进行计算,由此对数据库内的各读影报告相对于检索对象的相似度进行计算。然后,优先检索含有计算出的相似度较高的读影报告的读影报告。
现有技术文献
非专利文献
非专利文献I :基于文本的相似诊疗文本检索系统(生物体医工学44 (I): 199-206,2006)发明内容
发明要解决的课题
根据上述以往的病例检索系统,能够将检索对象与文字串的一致率较高的读影报告,检索作为与检索对象相似的读影报告。
然而,仅通过向医师提示含有检索对象与文字串的一致率较高的读影报告的病例数据,不能够得知相对于当前诊断中的病例在医学上以何种程度接近。因此,医师不能够决定病名的情况较多。因此,医师使用利用其他检索关键词检索到的多个病例数据,来诊断检索对象的症状。换句话说,在以往的方法中,存在的课题为,有时不能够从多个病例数据中检索适当的病例数据。
因此,本发明是为了解决上述以往的课题而进行的,其目的在于提供一种相似病例检索装置,能够从多个病例数据中检索适当的病例数据。
用于解决课题的手段
本发明一个方案的相似病例检索装置为,具备关键词提取部,从作为文本数据的读影报告中提取关键词,该文本数据记载了在对医用图像进行读影时成为诊断对象的诊断项目、和表示上述诊断项目的症状的诊断结果;诊断树解析部,参照存储有诊断树的诊断树存储部,根据上述关键词提取与上述读影报告对应的诊断流程即对象诊断流程,该诊断树以树结构表示包含到病名被决定为止的诊断项目和该诊断项目的症状的多个诊断流程; 相似诊断流程提取部,根据对诊断项目的症状进行判断的困难度的程度即诊断项目的难易度、或者决定病名的困难度的程度即病名的难易度,从上述诊断树存储部所存储的诊断树所包含的多个诊断流程中,提取与上述对象诊断流程相似的相似诊断流程;以及相似病例检索部,从病例数据存储部所存储的多个病例数据中,检索与上述相似诊断流程对应的病例数据。
根据该构成,能够使用根据难易度而提取的相似诊断流程,来检索病例数据。由此,能够着眼于难易度较高的诊断项目或者病名,而有效地检索病例数据,因此能够检索适当的病例数据。
此外,上述病名的难易度也可以被计算为,在上述诊断树中,含有同一病名的诊断流程的数量越多,则该病名的难易度越高。此外,上述诊断项目的难易度也可以被计算为, 上述诊断树中的诊断项目的症状的分支数越多,则该诊断项目的难易度越高。此外,上述病名的难易度也可以被计算为,从上述诊断树中的诊断项目的症状分支出的病名的数量越多,则该病名的难易度越高。此外,上述病名的难易度也可以计算为,对每个病名预先决定的值即表示病名的出错容易度的值越大,则该病名的难易度越高。
根据这些构成,能够提高医师在诊断中困惑的诊断项目或者病名的难易度,因此能够检索更适当的病例数据。
此外,也可以为,在至少提取2个上述对象诊断流程、且上述2个对象诊断流程包含于相互不同的诊断树的情况下,上述相似诊断流程提取部对每个诊断树提取上述相似诊断流程。
根据该构成,即使在提取了多个对象诊断流程的情况下,也能够提取相似诊断流程。
此外,本发明不仅能够实现为这种相似病例检索装置,还能够实现为以这种相似病例检索装置所具备的特征性构成部的动作为步骤的相似病例检索方法。此外,本发明还能够实现为使计算机执行相似病例检索方法所含有的各步骤的程序。然后,这种程序当然能够经由CD-ROM (Compact Disc Read Only Memory :只读存储型光盘)等非暂时性记录介质或者互联网等传送介质来发布。
发明的效果
根据本发明,能够着眼于难易度较高的诊断项目或者病名而有效地检索病例数据,能够从多个病例数据中检索适当的病例数据。


图I是表示医师的医用图像的读影顺序的流程图。
图2是表示读影报告的一个例子的图。
图3是表示诊断树的一个例子的图。
图4是用于说明难易度的图。
图5是用于说明难易度的图。
图6是用于说明难易度的图。
图7是用于说明难易度的图。
图8是用于说明难易度的图。
图9是表示本发明的实施方式的相似病例检索系统的功能构成的框图。
图10是表示关键词提取部的详细功能构成的框图。
图11是表示难易度评价部的详细功能构成的框图。
图12是表示相似病例检索部的详细功能构成的框图。
图13是表示本发明的实施方式的相似病例检索系统的利用状态的图。
图14是表示由本发明的实施方式的相似病例检索系统进行处理的流程的流程图。
图15是表示由关键词提取部进行的处理的流程的流程图。
图16是表示由难易度评价部进行的处理的流程的流程图。
图17是表示由相似诊断流程提取部进行的处理的流程的流程图。
图18是表示由相似诊断流程提取部进行的处理的流程的流程图。
图19是表示由相似诊断流程提取部进行的处理的流程的流程图。
图20是表示由相似诊断流程提取部进行的处理的流程的流程图。
图21是表示由相似诊断流程提取部进行的处理的流程的流程图。
图22是用于说明多个诊断树的变更方法的图。
图23是表示由相似病例检索部进行的处理的流程的流程图。
图24是表示由检索病例控制部进行的处理的流程的流程图。
图25是表示在相似病例检索实验中使用的诊断树的图。
图26是表示相似病例检索实验的结果的图。
图27是表示相似病例检索实验的结果的图。
图28是表示相似病例检索实验的结果的图。
图29是表示相似病例检索实验的结果的图。
具体实施方式
在对本发明一个方案的病例检索装置进行说明之前,首先,使用图I以及图2对医师的一般的医用图像的读影顺序进行简单说明。图I是表示医师的医用图像的读影顺序的流程图。此外,图2是表示读影报告以及医用图像的一个例子的图。
对在此使用的用语进行简单说明。“诊断项目”是指在对医用图像进行读影时成为诊断对象的病变的种类、部位。“症状”是指病变、部位的状态。此外,“诊断结果”是指医师通过对诊断项目进行诊断而得到的该诊断项目的症状。
此外,“读影报告”是记载了诊断项目和诊断结果的文本数据。例如,在读影报告中存在“肿瘤边界部清晰平滑”的记载的情况下,诊断项目为”肿瘤边界部”,诊断结果为“清晰平滑”。
此外,“病名”是指根据各诊断项目的诊断结果、医师最终决定的疾病的名称。此外,“病例数据”是指含有医用图像和读影报告的数据。
以下,使用图I来说明医师的诊断顺序。
首先,医师得到成为诊断对象的医用图像(例如通过CT (Computed Tomography 计算机断层扫描)或者MRI (Magnetic Resonance Imaging :磁共振成像)等得到的图像) (SOO)0
接下来,医师对医用图像进行读影,并对诊断项目进行诊断(S01)。
在此,在不能够判断诊断项目的症状的情况下(S02的否),医师对与当前读影的医用图像的诊断项目以及诊断结果相似的、过去读影了的医用图像的诊断项目以及诊断结果进行检索(S03 ),利用检索结果来对诊断项目进行诊断(SOI)。
另一方面,在能够判断诊断项目的症状的情况下(S02的是),如图2所示那样,医师将诊断项目以及诊断结果输入到读影报告的意见栏。
在此,在为了决定病名而需要的诊断项目的诊断未结束的情况下(S05的否),再次返回步骤S01,对下一个诊断项目进行诊断。
另一方面,在为了决定病名而需要的诊断项目的诊断全部结束的情况下(S05的否),医师判断是否能够决定病名(S06)。
在此,在不能够决定病名的情况下(S06的否),医师从过去的病例数据中,检索与当前读影的医用图像的诊断项目以及诊断结果相似的过去的病例数据(以下称为“相似病例”)(S07),并判断是否能够利用检索结果来决定病名。
另一方面,在能够决定病名的情况下(S06的是),医师根据诊断项目的诊断结果来决定病名(S08)。然后,如图2所示那样,医师将决定的病名输入病名栏。
医师按照以上那样的顺序进行医用图像的读影。此时,对于诊断项目的症状的诊断、病名的决定,在判断时困惑的情况下,医师检索相似病例。然后,医师通过将检索结果与当前读影的医用图像进行比较,由此能够得到用于诊断项目的诊断或者病名的决定的线索。
在此,对于相似病例的检索,更具体地进行了考虑。在上述的医师的读影顺序中, 在步骤S03以及S07中进行相似病例的检索。具体地说,步骤S03中的相似病例的检索,是步骤S02判断是否能够进行诊断项目的症状的判断的分支步骤,因此,表示医师对于某个诊断项目的诊断困惑的情况。另一方面,步骤S07中的相似病例的检索,是步骤S06判断是否能够决定病名的分支步骤,表示医师在诊断项目的诊断结束之后对于病名的决定困惑的情况。对这些读影顺序中的医师的状态进行分析的结果,确定了医师需要进行相似病例的检索的状态和其原因主要为以下5种。
以下对这5种原因进行详细说明。
(I)在对诊断项目进行诊断时,能够判断为该诊断项目的症状的症状彼此非常相似。
在医师对诊断项目进行诊断时,在能够判断为该诊断项目的症状的症状彼此相似的情况下,难以分辨该症状间的不同而判断适当的症状。作为其结果,可以认为需要进行相似病例检索的可能性较高。
(2)在对诊断项目进行诊断时,能够判断为该诊断项目的症状的症状的数量较多。
在医师对诊断项目进行诊断时,在能够判断为该诊断项目的症状的症状为多个的情况下,难以判断为是哪个症状的可能性较高。作为其结果,可以认为需要进行相似病例检索。
( 3)为了决定病名而需要进行诊断的诊断项目的数量较多。
在为了决定病名而必须对较多诊断项目进行诊断的情况下,与该诊断项目的数量成正比例地难以决定病名。作为其结果,可以认为需要进行相似病例检索的可能性较高。
(4)即使对为了决定病名而需要进行诊断的诊断项目全部进行了诊断,也不能够决定病名。
医师按顺序对诊断项目进行诊断,而决定病名。此时,有时虽然诊断项目的诊断全部结束、已没有应诊断的诊断项目,但病名未被决定为一个。换句话说,有时即使诊断项目的诊断结束,还存在较多病名的选择项。在这种情况下,医师难以决定病名。由此,可以认为需要进行相似病例检索的可能性较高。
(5)仅通过对I种诊断项目进行诊断,不能够决定病名。
医师在决定病名之前,对各种诊断项目(形状、花纹等)进行诊断。该诊断项目的种类数越多则越难以决定病名,可以认为需要进行相似病例检索的可能性较高。
上述5个项目全部是在决定诊断项目的诊断或者病名时,医师困惑到哪种程度这样的诊断症状或者决定病名的困难度所相关的项目。因此,如果能够利用医师对于各诊断项目、病名困惑到哪种程度,而提示容易困惑的过去的病例数据,则可以认为对于医师来说是有用的。
例如,在对检索对象的读影报告(症状A)的相似病例进行检索时,如果不仅提示症状A、还能够检索含有对于诊断项目来说能够判断的多个症状(例如症状A、B、C、D、E、F、G) 之中在判断时困惑的症状(例如仅为症状A、D、G)的病例数据,对于医师来说是有用的。此时,困惑的病例(症状D、G)与检索对象的文字串(症状A)不同,因此通过现有技术中的、基于读影报告中的文字串的一致程度的相似病例的检索方法,并不能够进行检索。
鉴于这些情况,本发明人研究了如下的方法不仅是文字串的一致,还能够如上述那样利用诊断的困难度,来检索相似病例。以下,将该诊断的困难度记载为诊断的难易度或者仅记载为难易度。
在此,对诊断的难易度更详细地进行说明。诊断的难易度表示医师在对诊断项目进行诊断(症状和病名的判断)时,对症状的判定困惑到何种程度。例如,难易度表示对诊断项目的症状是症状A还是症状B进行判断时困难到哪种程度。此外,例如,难易度表示对病名是病名C或者是病名D进行决定时困难到哪张程度。
通过利用这种诊断的难易度来检索相似病例,医师能够检索在诊断时困惑的病例。然而,在过去的读影报告中,未记载各诊断项目的难易度。此外,对于过去的病例,难以使医师从现在开始赋予难易度。由此,诊断的难易度需要根据读影报告以外来决定。
因此,本发明人着眼于医师的诊断顺序与诊断的难易度之间的关系。对于医师正进行诊断的病例,如果能够根据其诊断的顺序来提取难易度,则能够检索医师在诊断时困惑的病例。以下,对根据诊断顺序来提取难易度的方法进行说明。
首先,说明诊断流程。医师基于医学知识来判断各诊断项目的症状。医师通过反复进行多次该诊断项目的症状的判断,由此决定最终的病名。如此,将病名、到该病名被决定为止应诊断的诊断项目以及该诊断项目的症状,称为诊断流程。
具体地说,医师首先对预先决定的诊断项目进行诊断。例如,在进行乳房超声波诊断的情况下,首先医师对边界部的症状(边界为清晰平滑/清晰粗糙/不清晰)进行判断。 接下来,医师根据边界部的诊断结果,对下一个诊断项目进行诊断。例如,如果边界部为清晰平滑,则医师接着进行形状的诊断。此外,如果边界部为清晰粗糙或者不清晰,则医师接着进行分界线的断裂的诊断。换句话说,医师根据诊断项目的诊断结果,在使接着进行诊断的诊断项目变化的同时对诊断项目进行诊断,最后决定病名。
因此,诊断流程能够由将诊断项目与症状组合了的树结构来表示。此外,能够根据检查部位、诊断图像的种类,在某种程度上预先决定该诊断流程。由此,能够根据医学书、过去病例来构建该树。以下,将由树结构表示了该诊断流程的结构称为诊断树。
此外,一般,医师不会根据I种诊断树来决定病名,而从各种角度反复进行诊断来决定病名。因此,对于I个诊断对象将多个种类的诊断树(与形状相关的诊断树、与组织结构相关的诊断树等)组合来进行诊断的情况较多。在此,图3表示对于乳房超声波诊断的形状的诊断树的例子。
诊断树具有诊断项目、症状的种类、病名的信息。当将诊断树中的某一个流程称为诊断流程时,当前的读影报告所记载的内容由诊断项目、诊断结果、病名构成,因此如果参照诊断树,则能够确定诊断流程。此外,可知读影报告所记载的诊断流程在诊断树中处于何处。
另一方面,诊断树具有诊断项目、症状的种类、病名的信息,因此对于需要根据树的分支信息和它们的个数来进行上述的相似病例检索的原因,能够根据以下的指标分别计算出诊断的难易度。
对于(I)的评价指标
为了对能够判断为某个诊断项目的症状的症状彼此非常相似的情况进行评价,观察在对该诊断项目进行了判断的症状之前存在多少相同的病名即可。例如,在如图4那样对诊断项目a进行了判断之后,在图案A与图案B中存在较多相同的病名的情况下,可以认为该症状未成为将这些病名进行区别的要素。因此,由于在症状彼此中没有将作为对象的病名大幅区分那样的特征、即进行判断的症状彼此相似,因此可以认为难以进行该症状间的判断。因此,通过根据诊断树对某个诊断项目下的病名数进行计数,由此对难易度进行评价。
对于(2)的评价指标
为了根据诊断树对症状的种类较多的情况进行评价,使用诊断树中的症状的种类数(相对于诊断项目的枝杈的数量)即可。例如,对于图3的形状这种诊断项目,根据症状的个数(四个不规则形、多边形、分叶形、圆·椭圆)来评价难易度。如图5那样,该种类数越多,则评价为难易度越高的诊断项目。
对于(3)的评价指标
为了对即使根据诊断树对多个诊断项目进行诊断、也未决定病名的情况进行评价,使用诊断树所包含的诊断项目数即可。在对于图6那样的诊断树,对实线箭头和虚线箭头的流程进行了比较的情况下,评价为诊断的次数较多的实线一方难以诊断、难易度较高。
对于(4)的评价指标
说明对全部诊断项目进行诊断、病名也未决定的情况。在存在如图7那样的诊断树的情况下,如箭头所示那样对诊断项目进行了诊断。在这种情况下,即使诊断项目的诊断全部结束,也必须从病名1、2、3中决定某一个。此时,根据诊断树中的病名数来评价难易度即可。例如,在图7中,病名1、2、3的病名数为(3个)。在图3中,根据与边界部清晰平滑、 形状为不规则形的诊断树相对的病名数(2个)来评价难易度。
在上述情况下,即使在病名的个数较少的情况下,能够考虑到有时也难以进行病名的选择。此时,按照每个病名,对该病名的出错容易度进行评价。在此,病名的出错容易度是指,将对于读影报告的结果、在之后的诊断中该读影结果被变更了何种程度计算为指标。例如,将医师的诊断大体区分时,具有基于读影医疗的读影和基于临床医生的诊断这2 个阶段。此时,也可以将读影时的病名与医师最终决定的病名不同的概率作为出错容易度。 另一方面,在基于读影医疗的读影过程中,存在I次读影和2次读影,也可以将该I次读影和2次读影的结果不同的概率作为病名的出错容易度。以下,将这些集中记载为疾病数据。
对于(5)的评价指标
为了对在一个诊断项目的种类中,未决定病名的情况进行评价,从读影报告中提取项目数、并对使用的诊断树的个数进行计算即可。对图8那样的存在与形状相关的诊断树和与颜色相关的诊断树的情况进行说明。此时,如各个箭头那样进行诊断并到达病名I。 在该情况下,读影报告中含有与各个诊断树相关的文字串(例如“项目a”等)。由此,通过对读影报告的文字串进行解析,并与各诊断树匹配,由此可知使用了几个诊断树。此外,该诊断树的个数越多、则进行越复杂的诊断,并评价为难易度越高。
在以下的实施方式中,不是根据使用的诊断树的个数来评价难易度的方法,而是作为例子表示能够将组合诊断树而提示的病例有效地变化的情况。
如此,对于上述评价指标,能够根据诊断树来推断上述项目的诊断的难易度。关于各难易度的计算,在实施方式的说明时进行详细说明。
根据这些情况,本发明人得到如下想法通过根据读影报告和含有诊断流程的诊断树来推断难易度,由此实现相似病例检索的目的。
以下,参照附图对基于该想法而构成的本发明的实施方式进行说明。此外,在以下说明的实施方式均表示本发明的优选的一个具体例。换句话说,以下的实施方式中表示的数值、形状、材料、构成要素、构成要素的配置以及连接方式、步骤、步骤的顺序等,为本发明的一个例子,不意图限定本发明。此外,对于以下的实施方式的构成要素中、表示本发明的最上位概念的独立请求项未记载的构成要素,作为构成更优选的方式的任意的构成要素进行说明。
(实施方式)
图9是表示本实施方式的相似病例检索系统100的构成的框图。如图9所示那样, 相似病例检索系统100具备相似病例检索装置I、输入部2、相似病例显示部6以及读影支援数据库10。
(输入部2)
输入部2是供医师输入读影报告的设备(例如键盘或者鼠标等)。输入部2将医师输入的文档数据、选择结果向关键词提取部3发送。
(相似病例显示部6)
相似病例显示部6从相似病例检索部5受理病例数据,并向医师提示。相似病例显示部6例如为PC (Personal Computer :个人计算机)用的显示器、TV (Television 电视机)、医疗用读影监视器等。
(相似病例检索装置I)
相似病例检索装置I是用于从病例数据存储部9中检索与由输入部2输入的读影报告相似的病例数据的装置。相似病例检索装置I具备关键词提取部3、难易度评价部4以及相似病例检索部5。
(关键词提取部3)
关键词提取部3从输入部2接收读影报告的文档数据,从文档数据的中提取与医学用语、诊断项目、诊断结果相关的关键词,向难易度评价部4发送。换句话说,关键词提取部3从输入部2接收读影报告,并从接收的读影报告中提取关键词。
图10是表示关键词提取部3的详细功能构成的框图。如图10所示那样,关键词提取部3具备文字串解析部31和文字串比较部32。
文字串解析部31对于从输入部2受理的读影报告,进行文字串解析,并对名词、助词等进行分类。然后,文字串解析部31将完成解析的文字串向文字串比较部32发送。
文字串比较部32受理由文字串解析部31解析的文字串,并将这些文字串与关键词字典存储部7所储存的文字串进行比较,在一致的情况下将该关键词(以下也称为“文字串”)向难易度评价部4发送。
(难易度评价部4)
难易度评价部4受理从关键词提取部3所提取的文字串,并从诊断树存储部8读出诊断树。难易度评价部4根据这些文字串和诊断树来计算诊断项目的难易度,并向相似病例检索部5发送。
图11是表示难易度评价部4的详细功能构成的框图。如图11所示那样,难易度评价部4具备诊断树解析部41和相似诊断流程提取部42。
诊断树解析部41参照诊断树存储部8,根据由关键词提取部3提取的关键词,提取与由输入部2输入的读影报告对应的诊断流程即对象诊断流程。
具体地说,诊断树解析部41将从关键词提取部3接收的文字串与诊断树存储部8 内所储存的多个诊断树分别进行比较,选择含有关键词的诊断树。接下来,诊断树解析部41 根据选择的诊断树和文字串,对当前的读影报告在上述诊断树中、读影报告与哪个诊断流程对应进行解析。然后,诊断树解析部41将诊断树和与当前的读影报告对应的树内位置信息(对象诊断流程)向相似诊断流程提取部42发送。
相似诊断流程提取部42根据诊断项目的难易度或者病名的难易度,从诊断树存储部8所存储的诊断树所含有的多个诊断流程中,提取与对象诊断流程相似的相似诊断流程。具体地说,相似诊断流程提取部42,例如以越是包括有对象诊断流程中含有的难易度较高的诊断项目或者病名的诊断流程、越提取为相似诊断流程的方式,从多个诊断流程中提取相似诊断流程。
更具体地说,相似诊断流程提取部42接收诊断树和树内位置信息,并取得与当前的读影报告对应的对象诊断流程中含有的各诊断项目的难易度。接下来,相似诊断流程提取部42将含有难易度较高的诊断项目的诊断流程提取为相似诊断流程,并向相似病例检索部5发送。
(相似病例检索部5)
相似病例检索部5从难易度评价部4受理相似诊断流程,并对病例数据存储部9 的病例数据的相似度进行计算,将相似度较高的病例数据向相似病例显示部6发送。换句话说,相似病例检索部5从病例数据存储部9所存储的多个病例数据中,检索与相似诊断流程对应的病例数据。换句话说,相似病例检索部5对根据相似诊断流程而诊断的病例数据进行检索。并且,相似病例检索部5还对根据对象诊断流程而诊断的病例数据进行检索。
图12是表示相似病例检索部5的详细功能构成的框图。如图12所示那样,相似病例检索部5具备检索病例控制部51和相似度评价部52。
检索病例控制部51从难易度评价部4受理相似诊断流程。在此,如果没有来自输入部2的输入,则检索病例控制部51直接将相似诊断流程向相似度评价部52发送。另一方面,在存在来自输入部2的输入的情况下,检索病例控制部51对相似诊断流程赋予加权而向相似度评价部52发送相似诊断流程。
相似度评价部52接收相似诊断流程,并对病例数据存储部9所存储的病例数据的诊断流程与相似诊断流程的相似度进行计算。接着,将相似度较高的病例数据向相似病例显示部6发送。
(读影支援数据库10)
读影支援数据库10具备关键词字典存储部7、诊断树存储部8以及病例数据存储部9。
(关键词字典存储部7)
关键词字典存储部7存储关键词提取所使用的医学用语。
(诊断树存储部8)
诊断树存储部8储存与诊断项目和其症状的种类等的诊断流程相关的信息。换句话说,诊断树存储部8存储有诊断树,该诊断树以树结构来表示含有到病名被决定为止的诊断项目和该诊断项目的症状的多个诊断流程。
(病例数据存储部9)
病例数据存储部9储存有过去的读影报告和诊断所使用的医用图像。换句话说, 病例数据存储部9存储有读影报告和医用图像的组即病例数据。
(系统的利用方式)
图13是表示本实施方式的相似病例检索系统100的利用方式的图。
相似病例检索系统100具备相似病例检索装置I、输入部2、相似病例显示部6以及读影支援数据库10。相似病例检索系统100根据由输入部2输入的读影报告,实现难易度评价,并对于输入的读影报告,从读影支援数据库10中检索诊断的难易度较高的病例数据,并将其结果向相似病例显示部6提示。
接下来,对如以上那样构成的相似病例检索系统100的各种动作进行说明。
(相似病例检索的处理的整体概要)
图14是表不在相似病例检索系统100中进行的处理的流程的流程图。图14对应于图I的步骤S03、S07。
(相似病例检索系统的处理流程)
(S10 :输入读影报告)
在步骤SlO中,输入部2受理来自医师的读影报告的输入,并向相似病例检索装置I发送。在此,将图2所示那样的、医师在读影报告中输入了“边界部为清晰平滑,形状为不规则形。怀疑为乳头腺管癌。”的情况作为例子,而具体地进行说明。在步骤SlO中,医师的输入即“边界部为清晰平滑,形状为不规则形。怀疑为乳头腺管癌。”被向相似病例检索装置I发送。
(Sll :提取关键词)
在步骤Sll中,关键词提取部3接受读影报告的文档数据,从该文档数据中提取与诊断相关的文字串,并向难易度评价部4发送。以下,使用图15对步骤Sll的详细内容进行说明。
在步骤S30中,关键词提取部3读入从输入部2接收的读影报告。
在步骤S31中,文字串解析部31对于从输入部2接受的读影报告,进行文字串解析,并对名词、助词等进行分类。然后,文字串解析部31将完成解析的文字串向文字串比较部32发送。
在步骤S32中,文字串比较部32从文字串解析部31接收完成解析的文字串,并将其与关键词字典存储部7所存储的文字串进行比较。
在步骤S33中,文字串比较部32仅将关键词字典存储部7所存储的文字串中、与从文字串解析部31接收的文字串一致的文字串向难易度评价部4发送。例如,在步骤SlO 中受理了“边界部为清晰平滑,形状为不规则形。怀疑为乳头腺管癌。”这种输入的情况下, 在步骤Sll中,文字串解析部31从“边界部为清晰平滑,形状为不规则形。”中解析文字串。 例如,文字串比较部32以“边界部/为/清晰平滑/,/形状/为/不规则形/。怀疑/为 /乳头腺管癌/。”的方式分解文字串。然后,文字串解析部31通过将所分解的文字串与关键词字典存储部7所存储的文字串(具有边界部、清晰平滑、形状、不规则形、乳头腺管癌)进行对照,由此向难易度评价部4发送“边界部”、“清晰平滑”、“形状”、“不规则形”、“乳头腺管癌”。
(S12:评价难易度)
在步骤S12中,难易度评价部4接受从关键词提取部3提取的文字串,并从诊断树存储部8接受诊断树。难易度评价部4根据这些文字串和诊断树来计算诊断项目的难易度, 并向相似病例检索部5发送。以下,使用图16对步骤S12的详细内容进行说明。
在步骤S40中,难易度评价部4读入从关键词提取部3接收的文字串。
在步骤S41中,诊断树解析部41将从关键词提取部3接收的文字串与诊断树存储部8所储存的诊断树进行比较,而对诊断树进行选择。换句话说,诊断树解析部41参照诊断树存储部8,确定含有与由关键词提取部3提取的关键词一致的诊断项目、症状以及病名的诊断树。
在步骤S42中,诊断树解析部41根据接收的文字串和选择的诊断树,解析当前的读影报告与诊断树所含有的多个诊断流程中的哪个诊断流程相对应。然后,诊断树解析部 41将诊断树和当前的读影报告中的树内位置信息向相似诊断流程提取部42发送。换句话说,诊断树解析部41将与读影报告对应的诊断流程作为对象诊断流程向相似诊断流程提取部42发送。
在步骤S43中,相似诊断流程提取部42接收诊断树和树内位置信息,并对各诊断项目计算相对于当前的读影报告的难易度。例如,在步骤Sll中,考虑“边界部”、“清晰平滑”、“形状”、“不规则形”以及“乳头腺管癌”被提取为关键词的情况。此时,诊断树解析部 41将“边界部”、“清晰平滑”、“形状”、“不规则形”以及“乳头腺管癌”与图3的诊断树的文字串进行比较,而提取与当前输入的读影报告对应的对象诊断流程。之后,使用如此提取的对象诊断流程,对难易度的评价进行说明。
(S43 :评价诊断树内难易度)
在步骤S43中,相似诊断流程提取部42计算在提取相似诊断流程时利用的难易度。
(第一难易度模式根据同一病名数计算难易度)
此外,在步骤S43中,也可以根据与诊断项目相对的病名的一致数(同一病名数)来决定难易度。在即使对全部诊断项目进行诊断、也未决定病名的情况下,诊断变得困难。因此,相似诊断流程提取部42以诊断项目的分支下的病名一致到何种程度作为基准,来评价难易度。具体地说,相似诊断流程提取部42以在同一病名数较多的情况下、难易度变高的方式对病名的难易度进行评价,以在较少的情况下、难易度变低的方式对病名的难易度进行评价。换句话说,相似诊断流程提取部42以含有同一病名的诊断流程越多、则难易度越高的方式对病名的难易度进行计算。以下,使用图17对步骤S43的详细内容进行说明。
在步骤S70中,相似诊断流程提取部42读入诊断树。
在步骤S71中,相似诊断流程提取部42计算检索对象的流程。
在步骤S72中,相似诊断流程提取部42存储检索对象诊断流程(以下也称为检索对象流程)的病名。
在步骤S73中,相似诊断流程提取部42对读入的诊断树的项目分支数进行计数。
在步骤S74中,相似诊断流程提取部42读入项目分支。
在步骤S75中,相似诊断流程提取部42对与在分支下存在的步骤S72中存储的病名相同的病名数进行计数。
在步骤S76中,相似诊断流程提取部42根据同一病名数来计算该诊断项目的难易度。
步骤S77是确认是否针对全部项目对病名数进行了计数的分支步骤,在全部项目的计数完成的情况下,进入到结束,在未完成的情况下,进入到步骤S74并继续进行同一病名数的计数。
使用图3,对根据同一病名数计算难易度的情况的具体例进行说明。在此,注目于诊断项目“形状”下的症状的种类“不规则形”、“多边形”、“分叶形”。作为“不规则形”下的病名,存在“乳头腺管癌”、“实体管癌”。作为“多边形”下的病名,存在“实体管癌”、“粘液癌”、“髄样癌”。作为“分叶形”下的病名,存在“叶状肿瘤”、“线维腺瘤”、“囊肿”。此时,当对“不规则形”评价难易度时,在“多边形”下含有也在“不规则形”下也存在的“实体管癌” 这样的病名,因此这些症状容易发生错误,因此评价为难易度较高。另一方面,“分叶形”不存在一致的病名,因此难以发生错误,因此评价为难易度较低。
(第二难易度模式根据项目分支数计算难易度)
此外,在步骤S43中,也可以根据与诊断项目相对的症状的种类数(项目分支数)来决定难易度。在与诊断项目相对的症状的种类较多时,诊断变得困难。因此,将症状的数量作为基准来评价难易度。此时,在症状的种类较多的情况下,评价为难易度较高,在较少的1情况下评价为难易度较低。换句话说,诊断项目的难易度被计算为,诊断树中的诊断项目的 症状的分支数越多、则难易度越高。换言之,诊断项目的难易度被计算为,能够判断为诊断 项目的症状的症状的数量越多、则难易度越高。以下,使用图18对步骤S43的详细内容进 行说明。在步骤S80中,相似诊断流程提取部42读入诊断树。在步骤S81中,相似诊断流程提取部42计算检索对象的流程。在步骤S82中,相似诊断流程提取部42对诊断树的项目分支数进行计数。在步骤S83中,相似诊断流程提取部42对项目分支数进行计数。在步骤S84中,相似诊断流程提取部42根据项目分支数来计算该诊断项目的难易 度。步骤S85是确认是否针对全部项目分支对诊断项目数进行了计数的分支,在全部 项目的计数完成的情况下,进入到结束,在未完成的情况下,进入到步骤S83并继续进行项 目分支数的计数。考虑在图3中根据项目分支数计算难易度的情况。此时,假设对于各个症状的种 类为相同的诊断难易度,仅根据个数来决定难易度。例如,在图3中,诊断项目“形状”下的 症状的种类存在“不规则形”、“多边形”、“分叶形”、“圆 椭圆”这4个种类。另一方面,诊 断项目“不清晰halo (_)”下的症状的种类仅存在“存在”、“不存在”两种。此时,与对诊断 项目为“存在”以及“不存在”的某一个进行判断相比,将对诊断项目为“不规则形”、“多边 形”、“分叶形”以及“圆 椭圆”的某一个进行判断的情况评价为难易度较高。此外,病名的难易度也可以与上述同样地计算。换句话说,病名的难易度也可以 被计算为,诊断树的从诊断项目的症状分支的病名的数量越多、则难易度越高。具体地说, 例如也可以计算为,在图3中,最下段的框内所记载的病名的数量越多,则病名的难易度越 闻。(第三难易度模式根据病名的出错容易度计算难易度)此外,在步骤S43中,也可以根据与诊断项目相对的病名的出错容易度,来决定难 易度。在诊断项目中病名的错误较多时,假定为诊断较难。因此,将病名的出错容易度作为 基准对难易度进行评价。具体地说,相似诊断流程提取部42以按照每个病名预先设定的 值、即表示病名的出错容易度的值越大、则难易度越高的方式进行计算。此时,在病名的错误较多的情况下评价为难易度较高,在较少的情况下评价为难 易度较低。以下,图19表示步骤S43的详细内容。在步骤S90中,相似诊断流程提取部42读入诊断树。在步骤S91中,相似诊断流程提取部42对检索对象的流程进行计算。在步骤S92中,相似诊断流程提取部42提取检索对象的病名。在步骤S93中,相似诊断流程提取部42读入与在步骤S93中提取的病名和诊断树 的病名相对的疾病数据。在步骤S94中,相似诊断流程提取部42对全部诊断流程数进行计数。在步骤S95中,相似诊断流程提取部42读入诊断流程。在步骤S96中,相似诊断流程提取部42基于疾病数据对各诊断流程的病名的难易 度进行评价。
步骤S97是确认是否对全部诊断流程对难易度进行了评价的分支步骤,在全部流程的评价完成的情况下,进入到结束,在未完成的情况下,进入到步骤S95,并继续进行难易度的评价。
此外,在步骤S43中,也可以根据与诊断结果相对的病理检查的正解率,来计算病名的出错容易度。在此,病理检查是指采取肿瘤组织的检查。不仅是读影的诊断结果,在治疗的阶段中也进行采取肿瘤组织的病理检查,根据对该组织进行分析的结果,来进行确定诊断。将该病理检查的结果与读影结果的一致率作为正解率。
此外,在步骤S43中,也可以将上述多个方法组合来计算难易度。
考虑在图3中根据病名的出错容易度计算难易度的情况。当关注于症状的种类 “多边形”时,其下的病名存在“实体管癌”、“粘液癌”、“髄样癌”这3个种类。
例如,“实体管癌”和“髄样癌”的诊断较难,“实体管癌”和“粘液癌”的诊断较容易。在以下,将想检索的病名为“实体管癌”时作为例子进行说明。首先,作为事前的处理, 相对于“实体管癌”等各病名,将与出错容易度相当的数值和病名组合存储作为疾病数据。 在检索时,对于“实体管癌”这个病名读出疾病数据(例如“粘液癌” O. 1、“髄样癌”0. 7等)。 将该疾病数据用为对于检索文字串的相似度计算的权重,在通过“实体管癌”这个文字串进行了检索的情况下,能够使不同文字串即“髄样癌”的相似度上升。
(第四的难易度模式从多个树中删除不可能的诊断流程)
在步骤S44中,相似诊断流程提取部42使用诊断树解析部41提取的多个诊断树, 对诊断树的组合进行评价,由此将不可能的相似诊断流程删除,提取有效的诊断流程,向相似病例检索部5发送。
以在多个诊断树中是否存在病名的组合作为指标,来进行从多个诊断树中的有效诊断流程的提取。以下,使用图20对步骤S44的详细内容进行说明。
在步骤SlOO中,相似诊断流程提取部42读入多个诊断树。
在步骤SlOl中,相似诊断流程提取部42从多个诊断树中提取与检索对象流程同一病名的流程。
在步骤S102中,相似诊断流程提取部42对于同一病名的流程,从多个诊断树中读入相似难易度的流程。
在步骤S103中,相似诊断流程提取部42对在步骤SlOl、S102中提取的流程的病名的种类数进行计数。
在步骤S104中,相似诊断流程提取部42按照不同病名、不同诊断树,对流程所含有的病名数进行计数。
在步骤S105中,相似诊断流程提取部42将在全部诊断树中进行了计数的病名采用为有效的诊断流程。
步骤S106是确认是否对全部病名进行了评价的分支步骤,在对全部病名完成了评价的情况下,进入到结束,在未完成的情况下,进入到步骤S103并继续进行评价。
(第五难易度模式使由多个树和读影报告显示的对象变化)
此外,在步骤S44中,也可以根据读影报告所记载的诊断项目,对使用的诊断树进行变更。在此,对基于之前所述的有效诊断流程的提取方法来使诊断树变更的例子进行说明。以下,使用图21对在步骤S44中使诊断树变更的详细流程进行说明。
在步骤SllO中,相似诊断流程提取部42读入读影报告所记载的诊断项目和病名。
在步骤Slll中,相似诊断流程提取部42选择并读入在步骤SllO中提取的诊断项目所包含的诊断树。
在步骤S112中,相似诊断流程提取部42从多个诊断树中提取与检索对象流程为同一病名的诊断流程。
在步骤S113中,相似诊断流程提取部42对于同一病名的流程从多个诊断树中读入相似诊断流程。
在步骤SI 14中,相似诊断流程提取部42对在步骤SI 12、SI 13中提取的流程的病名的种类数进行计数。
在步骤SI 15中,相似诊断流程提取部42按照不同病名、不同诊断树对流程所含有的病名数进行计数。
在步骤S116中,相似诊断流程提取部42将在全部诊断树中进行了计数的病名采用为有效的诊断流程。
步骤S117是确认是否对全部病名进行了评价的分支步骤,在对全部病名完成了评价的情况下,进入到结束,在未完成的情况下,进入到步骤S114并继续进行评价。例如, 在如图22那样存在多个诊断树的情况下,设为现在医师关于形状进行诊断,检索对象流程为“项目a-图案A-项目b-图案C-病名2”。此外,设为在形状的诊断树中病名1、2、3的诊断较困难,在形状的诊断树中病名2、3的诊断较困难。此时,在步骤Slll中,读入当前诊断中的诊断流程,在步骤S112将病名与当前正诊断的流程一致的诊断流程(在此从与颜色相关的诊断树中)读入为诊断流程“项目C-图案E-项目d-图案G-病名2”。在步骤S113 中,在各个诊断树中读入相似诊断流程即“项目a-图案A-项目b-图案C-病名1”、“项目 a-图案A-项目b_图案C-病名3”、“项目C-图案E-项目d_图案G-病名3”。总之,读入以下那样的诊断流程。诊断流程1:“项目1-图案A-项目b-图案C-病名1”(诊断树:形状)
诊断流程2 “项目图案A-项目b_图案C-病名2”(诊断树:形状)
诊断流程3 “项目图案A-项目b_图案C-病名3”(诊断树:形状)
诊断流程4 “项目图案E-项目d-图案G-病名2”(诊断树:颜色)
诊断流程5 “项目图案E-项目d-图案G-病名3”(诊断树:颜色)
换句话说,在提取至少2个对象诊断流程、且2个对象诊断流程包含于相互不同的诊断树的情况下,相似诊断流程提取部42按照每个诊断树提取相似诊断流程。
对于这种诊断流程,在步骤S114、S115中,对于形状树和颜色树对病名数进行计数。由此,例如,由于病名I仅存在于形状树侧,因此在使用与当前检索中的诊断流程不同的诊断流程来综合地进行了诊断的情况下,不作为相似,因此能够进行从显示对象排除这种变更。如以上那样,通过将多个树组合而进行的评价,能够减少显示对象。
(S45 :提取相似诊断流程)
在步骤S45中,相似诊断流程提取部42根据难易度,将难易度与检索对象相似的诊断流程作为相似诊断流程向相似病例检索部5发送。具体地说,相似诊断流程提取部42 以越是含有难易度较高的诊断项目或者病名的诊断流程、越提取为相似诊断流程的方式, 提取相似诊断流程。
(S13:检索相似病例)
在步骤S13中,相似病例检索部5从难易度评价部4接受相似诊断流程,对病例数据存储部9所存储的各病例数据的相似度进行计算,将相似度较高的病例数据优先向相似病例显示部6发送。以下,使用图23对步骤S13的详细内容进行说明。
在步骤S50中,相似病例检索部5读入从难易度评价部4接收的相似诊断流程。
在步骤S51中,检索病例控制部51从输入部2接收检索项目,并将对检索项目进行了加权的相似诊断流程向相似度评价部52发送。以下,图24表示步骤S51的详细情况。
在步骤S60中,检索病例控制部51接收相似诊断流程。
在步骤S61中,检索病例控制部51读入来自输入部2的用户输入。
步骤S62是判断在输入部2中是否存在用户的输入的分支步骤,在存在输入的情况下进入到步骤S63,在没有输入的情况下进入到步骤S52。
在步骤S63中,检索病例控制部51在相似诊断流程内检索用户输入的文字串的有无、位置。
在步骤S64中,检索病例控制部51对用户输入的诊断流程内项目进行加权。通过进行该加权,能够优先地检索用户想检索的项目。关于加权的计算方法的详细内容记载于后述的实施例。
在步骤S52中,相似度评价部52接收用户检索项目和相似诊断流程,并对其与病例数据存储部9所储存的读影报告的相似度进行评价。
在步骤S53中,相似度评价部52从病例数据存储部9读出在步骤S52中相似度评价结果为高位的病例数据所含有的读影报告和医用图像。
在步骤S54中,相似度评价部52将从病例数据存储部9读出的病例数据所含有的读影报告和医用图像向相似病例显示部6发送。
(S14:显示相似病例)
在步骤S14中,相似病例显示部6从相似病例检索部5接受病例数据,并向医师进行提示。相似病例显示部6例如为显示器、TV、监视器等。
如以上那样,根据本实施方式的相似病例检索系统100,能够使用根据难易度而提取的相似诊断流程,对病例数据进行检索。由此,能够着眼于难易度较高的诊断项目或者病名,而有效地对病例数据进行检索,因此能够检索适当的病例数据。
(实施例)
在以下,表示为了实验而制作简单的读影报告、并对相似度进行了评价的结果。图 25表示在本实施例中使用的诊断树。将症状作为图案而记载在四边的框内,诊断项目被记载为项目。使用了在多个诊断流程中存在相同的病名(例在图案D、E中存在病名N)的诊断树。此外,在这次实验中,在读影报告中记载有“项目a为图案B。项目c为图案G。怀疑为病名S。”,并提取了以下的关键词。
( I)诊断项目“项目a”、“项目c”
(2)症状“图案B”、“图案G”
(3)病名“病名 S”
表示在实验中使用2个难易度的评价方法(同一病名数、病名的出错容易度)而进行了难易度评价的结果。此外,对将文字串的一致数作为指标来计算相似度的以往方法与本实施例进行了比较。以下,表示方法和此时使用的评价式。在此,使用以下的式(I)来计算相似度Sim。
[数学式I]
在此,X表示文字串的比较结果,在一致的情况下取1,在不一致的情况下取O。此外,fk (W,X)为对是否进行加权进行辨别的函数。在X、W均为O时取0,此外取I。
(I)以往方法(无难易度评价,将文字串的一致数作为指标的方法)
(权重以往方法)
[数学式2]
Wk =1. O · 式(2)
(2)基于病名一致数的难易度
在本实验中,为了容易得知结果,作为在诊断项目下存在的病名的一致数,对于与病名最接近的诊断结果即图25的图案D L,使用了以下的式子。此外,该计算也可以返回诊断项目而用于图案A C。在此,nx为分支下存在的病名的一致数,na表示病名的总数。 例如,在对图案D和图案E进行比较的情况下,图案D下存在病名M、N、0,图案E下存在病名P、N、O。由此,由于N、O —致,因此nx为2、总数na为6,其权重Wk成为O. 33。
(权重病名一致数)
[数学式3]
(3)基于病名出错容易度的难易度
在本实验中,病名S最容易发生错误,接着病名T容易发生错误。此外,对于该出错容易度的数值使用了式(4)。该数值既可以按照每个病名预先决定,也可以根据数据库自动地决定。
(权重出错容易度)
[数学式4]
Wk =1. O (病名 S)
Wk = O. 7 (病名 T) · 式⑷
Wk = 0(病名 S、T 以外)
(相似度)使用式(3)
(4)难易度(2)和难易度(3)的组合
图26 图29表示实验结果。在图中对于相似度较高的10件记载了相似度和诊断流程。在此,诊断项目I是含有诊断项目a的阶层,症状I是对于项目a的症状,图案A、 B、C与此相应。诊断项目2是在其症状下存在的诊断项目,是指项目b、C、d。症状2表示项目b、c、d下的症状。在以下将诊断流程记载为“诊断项目1-症状1-诊断项目2-症状 2-病名”。在该记载方法中,成为检索对象的读影报告的诊断流程成为“a-B-c-G-S”。
(I)以往方法(无难易度评价,将文字串的一致数作为指标的方法)wkfk(w,x)(Zc = I,-’.Λ,) · 式⑴
Wt · 式⑶
图26表示以往方法的实验结果。由于文字串的一致数为相似度的指标,因此例如相对于这次的检索对象读影报告“a-B-c-G-S”,相似度最高的是文字串全部一致的 “a-B-c-G-S”,其相似度为I。此外,5个文字串中4个一致的“a-B-c-G-T”的相似度成为 O. 8。如此,在以往方法中能够对与检索的诊断流程相同的病例数据进行检索。
(2)基于病名一致数的难易度
图27表示基于病名一致数的难易度评价的实验结果。当将病名一致数作为指标来评价难易度时,在各诊断流程中对与检索读影报告的病名“病名S” 一致的病名数进行计算,因此含有病名S的诊断流程的相似度上升。例如,在图27中“a-B-c-H-S”、“a-B-c-I-S” 的相似度从O. 8上升到O. 9。因此,如果使用本方法,则能够优先检索到达所检索的病名的诊断流程。换句话说,含有难易度较高的病名即“病名S”的诊断流程被提取为相似诊断流程。
(3)基于病名出错容易度的难易度
图28表示基于病名出错容易度的难易度评价的实验结果。当将病名出错容易度作为指标来评价难易度时,在与含有检索读影报告的病名“病名S”的诊断流程相同的诊断项目、症状中含有“病名T”的诊断流程的相似度上升。因此,如果使用本方法,能够优先检索含有容易错误的病名的诊断流程。换句话说,包括有对象诊断流程所含有的病名和容易出错的病名的诊断流程被提取为相似诊断流程。
(4)难易度(2)和难易度(3)的组合
图29表示基于难易度(2)和难易度(3)的组合的难易度评价的实验结果。在将病名一致数和病名出错容易度组合了的情况下,存在虽然文字串的一致数较少、但相似度大幅上升的诊断流程。例如,“a-B-c-H-T”在以往的文字串的一致数中相似度为O. 6,但在这次提出的方法中相似度成为O. 9。由此,如果使用本方法,能够优先检索包括有容易到达检索的病名、容易发生错误的病名的诊断流程。
以上,根据说明的相似病例检索系统,不仅能够提示文字串相似这种病例数据,还能够提示容易与成为对象的读影报告发生错误的病例数据,能够提高医师对诊断的可靠度。
例如,在当前诊断中的读影报告中记载有“边界为清晰平滑,形状为多边形,因此怀疑为实体管癌”时,可以认为是存在图3那样的诊断树的情况。
此时,通过之前所述的关键词提取部,从报告记载内容中提取“边界”、“清晰平滑”、“形状”、“多边形”、“实体管癌”等项目,在诊断树内与该记载相匹配的诊断流程“边界-清晰平滑-形状-多边形-实体管癌”被选择为检索对象。
在此,设为“不规则形”、“多边形”容易发生错误。此外,设为“乳头腺管癌”和“实体管癌”的诊断较困难,“实体管癌”和“粘液癌”的诊断容易。此时,考虑在数据库内存在如下的过去病例的报告的情况过去病例I为“边界为清晰平滑,形状为多边形,因此怀疑为粘液癌”,过去病例2为“边界为清晰平滑,形状为不规则形,因此怀疑为乳头腺管癌”。医师容易进行“乳头腺管癌”和“粘液癌”的诊断,因此即使将过去病例I作为检索结果进行提示,也不会成为医师的参考。
但是,在以往方法中文字串一致到何种程度成为指标,因此当将过去病例I和过去病例2进行比较时,过去病例I的“边界”、“清晰平滑”、“形状”、“多边形”这4个文字串一致,相对于此过去病例I的“边界”、“清晰平滑”、“形状”的3个一致,将一致的文字串较多的过去病例I作为相似病例输出。
与此相对,在本发明中,不仅将文字串的一致数、还将难易度作为指标,因此对于检索对象的文字串未包含的“多边形”、“实体管癌”也计算权重,相似度上升。作为其结果, 过去病例2被提示为检索结果,因此医师能够在与容易出错的病例进行比较的同时进行诊断。
以上,基于实施方式对本发明一个方案的相似病例检索装置I进行了说明,但本发明不限定于这些实施方式。只要不脱离本发明的主旨,对本实施方式实施了本领域技术人员想到的各种变形的方式,或者将不同实施方式中的构成要素组合而构建的方式,都包含于本发明的范围内。
例如,输入部2也可以利用用于对预先准备的诊断项目以及症状进行选择的模板,来从医师受理输入。
此外,输入部2也可以根据病例数据存储部9的数据来制作上述模板。
此外,文字串解析部31也可以利用一般的关键词提取方法(例如基于形态元素解析的关键词提取、基于N-gram的关键词提取)。
此外,文字串比较部32也可以使用同义词字典来进行与关键词的比较。
此外,文字串比较部32不仅进行与关键词字典存储部7所存储的关键词的比较, 也可以进行使用同义词字典来将用于难易度评价的关键词统一那样的变换处理。
此外,与所输入的读影报告相对应的诊断树,不仅根据诊断项目,也可以根据患者的检查部位信息(胸部、腹部等)来决定。
此外,关键词字典存储部7所存储的关键词,也可以参照病例数据存储部所存储的读影报告来制作。
此外,关键词字典存储部7所存储的关键词例如也可以根据ICD10(国际疾病分类第10版)等的疾病分类表来制作。
此外,诊断树存储部8也可以参照病例DB内的读影报告来制作。
此外,也可以在诊断结束后在病例数据存储部9中增加当前的检索病例。
此外,在上述实施方式中,相似诊断流程提取部42对难易度进行了计算,但不一定需要计算难易度。例如,相似诊断流程提取部42也可以从诊断树存储部8读出按照每个诊断项目或者病名存储的难易度。
此外,上述实施方式的相似病例检索装置I所具备的构成要素的一部分或者全部也可以由一个系统LSI (Large Scale Integration :大规模集成电路)构成。
系统LSI是将多个构成部集成在一个芯片上而制造的超多功能LSI,具体地说,是含有微处理器、ROM (Read Only Memory :只读存储器)、RAM (Random Access Memory :随机存取存储器)等而构成的计算机系统。上述ROM中存储有计算机程序。上述微处理器根据上述计算机程序来进行动作,由此系统LSI实现其功能。
在此,使其成为LSI,但根据集成度的不同,有时还称为IC(Integrated Circuit 集成电路)、系统LSI、超级LSI、巨大LSI。此外,集成电路化的方法不限于LSI,也可以通过专用电路或者通用处理器来实现。在LSI制造后,也可以利用能够编程的FPGA (Field Programmable Gate Array :现场可编程门阵列)、或者能够重构LSI内部的电路单元的连接、设定的可配置处理器。
并且,如果由于半导体技术的进步或者派生的其他技术,而置换LSI的集成电路化的技术出现,当然也可以使用该技术来进行功能修补的集成化。还存在应用生物技术等的可能性。
此外,本发明不仅能够实现为具备这种特征性处理部的相似病例检索装置,还能够实现为将相似病例检索装置所包含的特征性处理部作为步骤的相似病例检索方法。此外,还能够实现为使计算机执行相似病例检索方法所包含的特征性各步骤的计算机程序。 然后,当然能够经由CD-ROM等的计算机能够读取的记录介质或者互联网等通信网络,使这种计算机程序流通。
此外,本发明不限定于上述实施方式。
工业可利用性
本发明,作为对病例数据存储部所储存的多个病例数据(诊断图像以及读影报告) 进行检索的相似病例检索装置是有用的。此外,在判断的结构能够树化那样的领域(机构设计、裁判判例检索、专利检索等)中,还能够广泛利用于从储存有与图像、图面建立关联的文本数据的数据库中检索相似数据的其他系统中。
附图标记的说明
I相似病例检索装置
2输入部
3关键词提取部4难易度评价部
5相似病例检索部
6相似病例显示部
7关键词字典存储部
8诊断树存储部
9病例数据存储部
10读影支援数据库
31文字串解析部
32文字串比较部
41诊断树解析部
42相似诊断流程提取部
51检索病例控制部
52相似度评价部
100相似病例检索系统
权利要求
1.一种相似病例检索装置,具备关键词提取部,从作为文本数据的读影报告中提取关键词,该文本数据记载了在对医用图像进行读影时成为诊断对象的诊断项目、和表示上述诊断项目的症状的诊断结果;诊断树解析部,参照存储有诊断树的诊断树存储部,根据上述关键词提取与上述读影报告对应的诊断流程即对象诊断流程,该诊断树以树结构表示包含到病名被决定为止的诊断项目和该诊断项目的症状的多个诊断流程;相似诊断流程提取部,根据对诊断项目的症状进行判断的困难度的程度即诊断项目的难易度、或者决定病名的困难度的程度即病名的难易度,从上述诊断树存储部所存储的诊断树所包含的多个诊断流程中,提取与上述对象诊断流程相似的相似诊断流程;以及相似病例检索部,从病例数据存储部所存储的多个病例数据中,检索与上述相似诊断流程对应的病例数据。
2.如权利要求I记载的相似病例检索装置,其中,上述病名的难易度被计算为,在上述诊断树中,含有同一病名的诊断流程的数量越多, 则该病名的难易度越高。
3.如权利要求I或者2记载的相似病例检索装置,其中,上述诊断项目的难易度被计算为,上述诊断树中的诊断项目的症状的分支数越多,则该诊断项目的难易度越高。
4.如权利要求I 3中任一项记载的相似病例检索装置,其中,上述病名的难易度被计算为,从上述诊断树中的诊断项目的症状分支出的病名的数量越多,则该病名的难易度越高。
5.如权利要求I 4中任一项记载的相似病例检索装置,其中,上述病名的难易度被计算为,对每个病名预先决定的值即表示病名的出错容易度的值越大,则该病名的难易度越高。
6.如权利要求I 5中任一项记载的相似病例检索装置,其中,在至少提取2个上述对象诊断流程、且上述2个对象诊断流程包含于相互不同的诊断树的情况下,上述相似诊断流程提取部对每个诊断树提取上述相似诊断流程。
7.如权利要求I 6中任一项记载的相似病例检索装置,其中,上述相似诊断流程提取部,从上述诊断树存储部所存储的诊断树中包含的多个诊断流程中提取相似诊断流程,以便将越是包含难易度高的诊断项目或者病名的诊断流程,越提取为相似诊断流程。
8.一种相似病例检索方法,包括关键词提取步骤,从作为文本数据的读影报告中提取关键词,该文本数据记载了在对医用图像进行读影时成为诊断对象的诊断项目、和表示上述诊断项目的症状的诊断结果;诊断树解析步骤,参照存储有诊断树的诊断树存储部,根据上述关键词提取与上述读影报告对应的诊断流程即对象诊断流程,该诊断树以树结构表示包含到病名被决定为止的诊断项目和该诊断项目的症状的多个诊断流程;相似诊断流程提取步骤,根据对诊断项目的症状进行判断的困难度的程度即诊断项目的难易度、或者决定病名的困难度的程度即病名的难易度,从上述诊断树存储部所存储的诊断树中包含的多个诊断流程中,提取与上述对象诊断流程相似的相似诊断流程;以及相似病例检索步骤,从病例数据存储部所存储的多个病例数据中,检索与上述相似诊断流程对应的病例数据。
9.一种程序,使计算机执行权利要求8记载的相似病例检索方法。
全文摘要
相似病例检索装置(1)具备关键词提取部(3),从读影报告中提取关键词;诊断树解析部(41),通过参照存储有诊断树的诊断树存储部(8),基于关键词提取与读影报告对应的对象诊断流程;相似诊断流程提取部(42),基于诊断项目的难易度或者病名的难易度,从诊断树存储部(8)所存储的诊断树所包含的多个诊断流程中提取与对象诊断流程相似的相似诊断流程;以及相似病例检索部(5),从病例数据存储部(9)所存储的多个病例数据中检索与相似诊断流程对应的病例数据。
文档编号G06F17/30GK102985924SQ20128000193
公开日2013年3月20日 申请日期2012年2月9日 优先权日2011年2月14日
发明者小塚和纪, 高田和丰, 续木贵史 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1