识别装置、识别方法以及程序存储介质与流程

文档序号:15519277发布日期:2018-09-25 19:02阅读:148来源:国知局
本发明涉及识别装置、识别方法以及程序。
背景技术
:已经开发了识别皮肤病变的图像的装置。例如,在日本特开2017-45341号公报中,公开了一种实现了提高通过集成识别器进行识别的精度的诊断装置等。技术实现要素:在日本特开2017-45341号公报中公开的诊断装置与现有技术相比可以进行高精度的识别。但是,还是存在错误识别的可能性,要求进一步提高识别精度。本发明是为了解决上述问题而完成的,其目的在于提供一种比现有的识别装置进一步提高了识别精度的识别装置、识别方法以及程序。为了达到上述目的,本发明的识别装置具备:第1一对其他识别器,其识别出第1类与其他类;第2一对其他识别器,其识别出与所述第1类不同的第2类和其他类;以及校正部,其使用所述第2一对其他识别器的识别结果,来校正所述第1一对其他识别器的识别结果。根据本发明,可以比现有的识别装置进一步提高识别的精度。附图说明图1是表示本发明的实施方式所涉及的识别装置的功能结构的图。图2是表示图像数据的一个例子的图。图3是表示标准化的图像数据的一个例子的图。图4是说明实施方式所涉及的基础识别器的图。图5是说明实施方式所涉及的识别装置的整体处理内容的图。图6是实施方式所涉及的识别装置的识别处理的流程图。具体实施方式以下,参照图表对本发明的实施方式所涉及的识别装置、识别方法以及程序进行说明。此外,对于图中相同或者相应的部分赋予相同符号。本发明的实施方式所涉及的识别装置100针对多个类的数据来识别是特定类还是其他类(该特定类以外的类)。进行像这样的识别的识别器被称为“一对其他识别器”、“一对其他分类器”、“1类vs其他类识别器”等。在这里,称为一对其他识别器。如图1所示,实施方式所涉及的识别装置100具备控制部10、存储部20、图像输入部31以及识别结果输出部32。控制部10由cpu(centralprocessingunit:中央处理器)等构成,通过执行存储在存储部20中的程序,来实现后述的各部(标准化部11、肤色减法部12、第1一对其他识别器13、第2一对其他识别器14、校正部15)的功能。存储部20由rom(readonlymemory:只读存储器)、ram(randomaccessmemory:随机存取存储器)等构成,并存储控制部10的cpu要执行的程序以及必要的数据。图像输入部31是用于向控制部10输入成为识别装置100的识别对象的图像数据的设备。控制部10经由图像输入部31获取图像数据。如果控制部10可以获取图像数据,则图像输入部31可以使用任意的设备。例如,在存储部20中预先存储图像数据,并且控制部10通过读出存储部20来获取图像数据时,存储部20兼作图像输入部31。此外,对于通过图像输入部31输入的图像数据,通过表示作为光的三原色的红、绿、蓝的各成分的强度的rgb值来表示各像素。识别结果输出部32是用于输出控制部10识别出从图像输入部31输入的图像的结果的设备。如果控制部10可以输出识别结果,则识别结果输出部32可以使用任意的设备。例如,当控制部10向存储部20输出识别结果时,存储部20兼作识别结果输出部32。接下来,针对控制部10的功能进行说明。控制部10实现标准化部11、肤色减法部12、第1一对其他识别器13、第2一对其他识别器14以及校正部15的功能。标准化部11将从图像输入部31输入的图像数据的颜色以及亮度的成分进行标准化。图2以及图3表示标准化前后的图像数据的具体例。但是,它们实际上是彩色图像(识别装置100处理的图像是彩色图像),但是为了形成申请文件而被转换为黑白图像。图2是标准化前的图像,被转换为黑白图像之前是浅蓝色的图像。图3是标准化后的图像,被转换为黑白图像之前是浅紫色的图像。肤色减法部12是从在标准化部11进行了标准化的图像数据的rgb值减去肤色成分(肤色的rgb值)。通过该肤色减法的处理,可以使人的皮肤的图像的rgb均匀正负地分布,并可以提高识别器进行识别的精度。第1一对其他识别器13和第2一对其他识别器14是针对多个类的数据,来识别是特定类还是其他类(该特定类以外的类)的识别器。识别装置100作为基础识别器,使用像这样的两个一对其他识别器,来提高识别精度。作为该基础识别器。例如可以使用神经网络、svm(supportvectormachine:支持向量机)等任意的识别器。在本实施例中,使用图4所示的基础识别器。图4所示的识别器将输入的图像本身和对该图像实施了几何变换处理(旋转、反转、移动、缩放等)的图像分别并行输入到卷积神经网络(convolutionalneuralnetork:cnn),对所获得的各输出进行相加平均,并输出识别结果(预测值)。将识别装置100希望识别的类(在这里设为第1类)与其他类识别出的基础识别器设为第1一对其他识别器13。然后,第2一对其他识别器14是识别出第1类以外的某类(在这里设为第2类)和其他类(也包括第1类)的基础识别器。在这里,第2一对其他识别器14的识别精度在一定条件下需要高于第1一对其他识别器13的识别精度。此外,该识别精度例如可以使用作为roc(receiveroperatingcharacteristic:受试者工作特征)曲线下的面积的auc(areaunderthereceiveroperatorcurve:受试者工作特征曲线面积)的值来进行表示(认为auc越接近1精度越高)。理想的是,作为第2一对其他识别器14,auc非常接近1。例如,理想的是,第2一对其他识别器14的auc比第1一对其他识别器13的auc更大。但是,除此以外,还存在对第2一对其他识别器14的选择条件。例如,对于本实施方式,对于第2一对其他识别器14的第2类的识别精度(灵敏度)高于对于第1一对其他识别器13的第2类(对于第1一对其他识别器13也包括其他类的类)的识别精度(特异性)的情况也是理想的。校正部15根据第2一对其他识别器14的识别结果来校正第1一对其他识别器13的识别结果。具体而言,根据以下的数学式来进行校正。数学式1在数学式(1)中,f(x)表示识别器针对输入图像的输出,c表示各识别器成为等价错误率(equalerrorrate:eer)的判定阈值,波浪线表示基础识别器。另外,α是用于使第1一对其他识别器13与第2一对其他识别器14的输出标度匹配的系数,也是用于调整第2一对其他识别器14的输出对识别装置100的识别结果产生多大影响的系数。例如,可以设α=1,也可以作为以下数学式:数学式2此外,作为数学式(1)的应用条件,设第2一对其他识别器14的输出(fsk(x)超过判定阈值csk,但是这是由于仅在第2一对其他识别器14的输出具有高可靠性的条件下应用校正。以上,针对识别装置100的功能结构进行了说明。接下来,针对识别装置100的整体处理的内容,参照图5进行说明。首先,在对图像进行了标准化以及肤色减法之后,分别输入至第1基础识别器(第1一对其他识别器)以及第2基础识别器(第2一对其他识别器)。具体而言,第1基础识别器识别皮肤病变是黑素瘤(恶性黑素瘤(malignantmelanoma:mm))还是其他疾病,第2基础识别器识别是脂溢性角化症(seborrheickeratosis:sk)还是其他疾病。一般来说,年轻人的脂溢性角化症很少,因此对第2基础识别器的识别结果进行基于年龄信息以及性别信息的校正(因此,在成为识别对象的各图像数据中,附加年龄信息以及性别信息)。例如,如果年龄未满30岁,则即使第2基础识别器的识别结果是脂溢性角化症,也将该识别结果校正为“非脂溢性角化症”。然后,如果该校正后的第2基础识别器的识别结果是脂溢性角化症,则即使第1基础识别器的识别结果是黑素瘤,也将识别装置100的识别结果校正为“非黑素瘤”。(更准确地说,根据上述的数学式(1)来计算识别结果。)接下来,针对识别装置100的识别处理,参照图6进行说明。该处理は、用户如果对识别装置100指示识别处理的开始,则开始该处理。首先,识别装置100的标准化部11对通过图像输入部31输入的图像进行标准化(步骤s101)。步骤s101也被称为标准化步骤。接下来,肤色减法部12从被标准化的图像的rgb值中减去肤色的rgb值(步骤s102)。步骤s102也被称为肤色减法步骤。然后,通过第1一对其他识别器13来识别减去了肤色的图像(步骤s103)。步骤s103也被称为第1一对其他识别步骤。还通过第2一对其他识别器14来识别减去了该肤色的图像(步骤s104)。步骤s104也被称为第2一对其他识别步骤。然后,校正部15根据上述数学式(1),使用由第2一对其他识别器14识别出的结果,来校正由第1一对其他识别器13识别出的结果(步骤s105)。步骤s105也被称为校正步骤。然后,控制部10经由识别结果输出部32输出由校正部15校正的识别结果(步骤s106),并结束识别处理。步骤s106也被称为识别结果输出步骤。如上,识别装置100使用第2一对其他识别器14的识别结果来校正第1一对其他识别器13的识别结果,因此可以获得更高精度的识别结果。以下表示评估识别装置100的精度的结果。这是使用给予isbi(internationalsymposiumonbiomedicalimagine:国际生物医学成像研讨会)挑战2017的参加者的验证数据(全部150个样本),评估出的结果。表1是识别装置100具备的基础识别器的auc的比较结果。中间一列是没有使用外部训练数据的情况。另外,右边一列是没有使用年龄/性别信息的情况。通过使用年龄/性别信息,在sk识别器(第2一对其他识别器)的学习数据的交差验证评估中auc从0.957上升至0.960,但是在测试数据中由于样本数量较少,并未看出差别。表1识别装置100无外部训练数据无年龄/性别mm识别器auc0.8990.8960.899sk识别器auc0.9920.9810.992平均值0.9450.9390.945isic-isbi挑战2017第三部分的验证集评分(暂时)表2总结了针对判别病变图像是恶性还是良性的两项识别的isbi挑战2016第三部分3的结果。针对该识别进行识别装置100的再训练。之后,在2016年公开的基于科代拉(codella)等(后述的参考文献1)的方法中,使用基于多层结构的神经网络进行的自动病变分割进程。此外,在识别装置100中不使用该进程。表2isic-isbi挑战赛2016第三部分测试集评分(暂时)尽管没有进行病变图像的分割(或者裁剪),识别装置100也示出了明显优于作为当前最新的数据的去年的结果(表2)的结果(在表2中,从左起第二列是后述的参考文献2中记载的2016年的最高值)。如参考文献1所述,如果使用具有可靠性的分割法,则可以期望能够进一步提高识别装置100的结果。另外,通过使用年龄/性别信息来校正脂溢性角化症的一对其他的别器的识别结果,观察到微小的效果。(参考文献)1.n.codella,q.b.nguyen,s.pankanti,d.gutman,b.helba,a.halpernandj.r.smith,"deeplearningensemblesformelanomarecognitionindermoscopyimages,"arxiv:1610.04662,2016.2.d.gutman,n.c.f.codella,e.celebi,b.helba,m.marchetti,n.mishraanda.halpern,"skinlesionanalysistowardsmelanomadetection:achallengeattheinternationalsymposiumonbiomedicalimaging(isbi)2016,hostedbytheinternationalskinimagingcollaboration(isic),"arxiv:1605.01397,2016.此外,也可以通过普通pc(personalcomputer:个人计算机)等计算机来实现识别装置100的各功能。具体而言,在上述实施方式中,将识别装置100进行的识别处理的程序作为预先存储在存储部20的rom中的程序来进行了说明。但是,可以通过在软盘、cd-rom(compactdiscreadonlymemory:光盘只读存储器)、dvd(digitalversatiledisc:数字多功能光盘)以及mo(magneto-opticaldisc:磁光盘)等计算机可读取的存储介质中存储来发布程序,并将该程序读入并安装在计算机中,来构成可以实现上述各功能的计算机。以上,针对本发明的优选的实施方式进行了说明,但是本发明并不限定于所涉及的特定的实施方式,在本发明中包括专利请求的范围中所记载的发明以及与其等效的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1