一种图像识别模型训练的方法、图像识别的方法及装置与流程

文档序号：19810647发布日期：2020-01-31 18:17阅读：382来源：国知局

本申请涉及人工智能领域，尤其涉及一种图像识别模型训练的方法、图像识别的方法及装置。

背景技术：

随着人口的不断增加，医疗系统的负荷与日俱增，对于医疗资源的需求度也越来越大。在实际应用中，医护人员可通过医学图像对患者的病情进行分析。为了能够帮助医护人员更快且更准确地诊断病情，还可以借助自动诊断设备对医学图像进行识别。

目前，在自动诊断的过程中需要采用大量的医学图像进行训练，其中，这些医学图像需要经过医护人员的标注，即医护人员可按照临床习惯对每个医学图像做出判断，例如，标注该医学图像是否存在疾病，以及标注该医学图像中病灶所在的位置等。

然而，随着医学图像的数量不断累积，病灶的复杂度越来越高，标注的难度也越来越大。而标注资源有限，导致模型训练过程中仅能够使用少部分已标注的医学图像。而且由于模型训练通常需要结合具体的任务来实现，针对不同的任务需要采用与该任务对应的训练集，导致已经标注好的医学图像并未得到有效的利用以及部分任务的训练集的数据不足，导致模型预测效果的准确度较低。

技术实现要素：

本申请实施例提供了一种图像识别模型训练的方法、图像识别的方法及装置，采用有标注的，且针对不同任务的医学图像和未标注的医学图像共同对模型进行训练，有效利用了已标注图像和未标注图像，不但降低了对图像标注的需求，还增加了训练的数据量，从而在节省标注资源的同时还能提升模型的预测效果。

有鉴于此，本申请第一方面提供一种图像识别模型训练的方法，包括：

获取待训练图像集合，其中，所述待训练图像集合至少包括第一图像集合、第二图像集合和第三图像集合，所述第一图像集合包括至少一个第一图像，所述第二图像集合包括至少一个第二图像以及至少一个干扰图像，所述第三图像集合包括至少一个第三图像，所述第一图像为第一任务所对应的已标注图像，所述第二图像为第一任务所对应的未标注图像，所述第三图像为第二任务所对应的已标注图像，所述第一任务与所述第二任务属于不同的任务；

基于所述待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，其中，所述第一预测概率为基于所述第一图像集合输出的一个预测结果，所述第二预测概率和所述第三预测概率为基于所述第二图像集合输出的一个预测结果，所述第四预测概率为基于所述第三图像集合输出的一个预测结果；

根据所述第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，其中，所述目标损失函数至少包括第一损失函数、第二损失函数以及第三损失函数，所述第一损失函数为根据所述第一预测概率确定的，所述第二损失函数为根据所述第二预测概率和所述第三预测概率确定的，所述第三损失函数为根据所述第四预测概率确定的；

基于所述目标损失函数训练所述待训练图像识别模型，得到图像识别模型。

本申请第二方面提供一种图像识别的方法，包括：

获取待识别图像；

通过图像识别模型获取所述待识别图像所对应的图像识别结果，其中，所述图像识别模型为上述第一方面提供的图像识别模型；

展示所述图像识别结果。

本申请第三方面提供一种图像识别模型训练装置，包括：

获取模块，用于获取待训练图像集合，其中，所述待训练图像集合至少包括第一图像集合、第二图像集合和第三图像集合，所述第一图像集合包括至少一个第一图像，所述第二图像集合包括至少一个第二图像以及至少一个干扰图像，所述第三图像集合包括至少一个第三图像，所述第一图像为第一任务所对应的已标注图像，所述第二图像为第一任务所对应的未标注图像，所述第三图像为第二任务所对应的已标注图像，所述第一任务与所述第二任务属于不同的任务；

所述获取模块，还用于基于所述待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，其中，所述第一预测概率为基于所述第一图像集合输出的一个预测结果，所述第二预测概率和所述第三预测概率为基于所述第二图像集合输出的一个预测结果，所述第四预测概率为基于所述第三图像集合输出的一个预测结果；

所述获取模块，还用于通过所述待训练图像识别模型获取所述第二图像集合所对应的第二预测结果集合，其中，所述第二预测结果集合包括至少一个第二预测概率以及至少一个第三预测概率，所述至少一个第二预测概率为所述待训练图像识别模型输出的一个预测结果，所述至少一个第三预测概率为所述待训练图像识别模型输出的另一个预测结果；

所述获取模块，还用于通过所述待训练图像识别模型获取所述第三图像集合所对应的第三预测结果集合，其中，所述第三预测结果集合包括至少一个第四预测概率，每个第四预测概率对应一个第三图像；

确定模块，用于根据所述第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，其中，所述目标损失函数至少包括第一损失函数、第二损失函数以及第三损失函数，所述第一损失函数为根据所述第一预测概率确定的，所述第二损失函数为根据所述第二预测概率和所述第三预测概率确定的，所述第三损失函数为根据所述第四预测概率确定的；

训练模块，用于根据所述确定模块确定的所述目标损失函数训练所述待训练图像识别模型，得到图像识别模型。

在一种可能的设计中，在本申请实施例的第三方面的第一种实现方式中，

所述获取模块，具体用于基于所述第一图像集合，通过所述待训练图像识别模型获取所述第一预测概率；

基于所述第二图像集合，通过所述待训练图像识别模型获取所述第二预测概率和所述第三预测概率；

基于所述第三图像集合，通过所述待训练图像识别模型获取所述第四预测概率。

在一种可能的设计中，在本申请实施例的第三方面的第二种实现方式中，

所述获取模块，具体用于基于所述至少一个第一图像，通过所述待训练图像识别模型所包括的全连接层获取第一预测值；

对所述第一预测值进行归一化处理，得到所述第一预测概率。

在一种可能的设计中，在本申请实施例的第三方面的第三种实现方式中，

所述获取模块，具体用于根据所述至少一个第二图像生成第一干扰图像集合，其中，所述第一干扰图像集合包括至少一个第一干扰图像，所述第一干扰图像与所述第二图像具有对应关系，所述第一干扰图像属于所述干扰图像；

根据所述至少一个第二图像生成第二干扰图像集合，其中，所述第二干扰图像集合包括至少一个第二干扰图像，所述第二干扰图像与所述第二图像具有对应关系，所述第二干扰图像属于所述干扰图像；

基于所述至少一个第二图像以及所述第一干扰图像集合，通过所述待训练图像识别模型获取所述第二预测概率；

基于所述至少一个第二图像以及所述第二干扰图像集合，通过所述待训练图像识别模型获取所述第三预测概率。

在一种可能的设计中，在本申请实施例的第三方面的第四种实现方式中，

所述获取模块，具体用于基于所述至少一个第三图像，通过所述待训练图像识别模型所包括的全连接层获取所述第四预测值；

对所述第四预测值进行归一化处理，得到所述第四预测概率。

在一种可能的设计中，在本申请实施例的第三方面的第五种实现方式中，

所述确定模块，具体用于根据所述第一预测概率与所述第一图像集合所对应的标注信息，计算所述第一损失函数；

根据所述第二预测概率以及所述第三预测概率，计算所述第二损失函数；

根据所述第四预测概率与所述第三图像集合所对应的标注信息，计算所述第三损失函数；

获取熵损失函数以及正则化损失函数；

根据所述第一损失函数、所述第二损失函数、所述第三损失函数、所述熵损失函数以及所述正则化损失函数，计算得到所述目标损失函数。

在一种可能的设计中，在本申请实施例的第三方面的第六种实现方式中，

所述确定模块，具体用于根据所述第一预测概率与所述第一图像集合所对应的标注信息，计算所述第一损失函数；

具体地，采用如下方式计算所述第一损失函数：

lce(p0,y0)＝-log(p0[y0])；

其中，所述lce表示所述第一损失函数，所述p0表示第一预测概率，所述y0表示所述第一图像集合所对应的标注信息。

在一种可能的设计中，在本申请实施例的第三方面的第七种实现方式中，

所述确定模块，具体用于根据所述第二预测概率以及所述第三预测概率，计算所述第二损失函数；

具体地，采用如下方式计算所述第二损失函数：

或，采用如下方式计算所述第二损失函数：

其中，所述lcon表示所述第二损失函数，所述c表示类型总数，所述k表示第k个类型，所述ps表示所述第二预测概率，所述pr表示所述第三预测概率。

在一种可能的设计中，在本申请实施例的第三方面的第八种实现方式中，

所述确定模块，具体用于根据所述第四预测概率与所述第三图像集合所对应的标注信息，计算所述第三损失函数；

可选地，采用如下方式计算所述第三损失函数：

lmtl(p1,y1)＝-log(p1[y1])；

其中，所述lmtl表示所述第三损失函数，所述p1表示所述第四预测概率，所述y1表示所述第三图像集合所对应的标注信息。

本申请第四方面提供一种图像识别装置，包括：

获取待识别图像；

通过图像识别模型获取所述待识别图像所对应的图像识别结果，其中，所述图像识别模型为上述第一方面提供的图像识别模型；

展示所述图像识别结果。

本申请第五方面提供一种电子设备，包括：存储器、收发器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，包括执行如上述第一方面或第二方面中任意一项所述的方法；

所述总线系统用于连接所述存储器以及所述处理器，以使所述存储器以及所述处理器进行通信。

本申请第六方面提供一种内窥镜医疗诊断系统，包括：探头、电路、处理器以及显示器；

所述电路，用于激励所述探头获取待识别图像；

所述处理器，用于处理所述待识别图像；

所述显示器，用于显示所述图像识别结果；

其中，所述处理器还执行如下步骤：

通过图像识别模型获取所述待识别图像所对应的图像识别结果，其中，所述图像识别模型为上述第一方面中任一项所述的图像识别模型；

展示所述图像识别结果。

本申请的第七方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例提供了一种图像识别模型训练的方法，首先获取待训练图像集合，然后基于待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，再根据第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，最后基于目标损失函数训练待训练图像识别模型，得到图像识别模型。通过上述方式，采用有标注的针对不同任务的医学图像和未标注的医学图像共同对模型进行训练，有效利用了已标注图像和未标注图像，不但降低了对图像标注的需求，还增加了训练的数据量，从而在节省标注资源的同时还能提升模型的预测效果。

附图说明

图1为本申请实施例中图像识别系统的一个架构示意图；

图2为本申请实施例中训练图像识别模型的一个整体结构示意图；

图3为本申请实施例中图像识别模型训练的方法一个实施例示意图；

图4为本申请实施例中基于半监督学习的一个实施例示意图；

图5为本申请实施例中基于多任务学习的一个实施例示意图；

图6为本申请实施例中图像识别的方法一个实施例示意图；

图7为本申请实施例中展示图像识别结果的一个界面示意图；

图8为本申请实施例中图像识别模型训练装置的一个实施例示意图；

图9为本申请实施例中图像识别装置的一个实施例示意图；

图10为本申请实施例中服务器的一个结构示意图；

图11为本申请实施例中终端设备的一个结构示意图；

图12为本申请实施例中内窥镜医疗诊断系统的一个结构示意图。

具体实施方式

本申请实施例提供了一种图像识别模型训练的方法、图像识别的方法及装置，采用有标注的针对不同任务的医学图像和未标注的医学图像共同对模型进行训练，有效利用了已标注图像和未标注图像，不但降低了对图像标注的需求，还增加了训练的数据量，从而在节省标注资源的同时还能提升模型的预测效果。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应理解，本申请提供的图像识别模型训练的方法以及图像识别的方法，应用于人工智能(artificialintelligence，ai)的医学领域，具体可以应用于基于计算机视觉技术(computervision，cv)的医学图像识别领域。ai是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

cv计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(opticalcharacterrecognition，ocr)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

随着科技的快速发展，ai在医疗行业的应用也越来越广泛，在医学领域中最常见的医学图像包含但不仅限于内窥镜图像、血管摄影图像、心血管造影图像、电子计算机断层扫描(computerizedtomography，ct)图像、b超图像以及病理图像。由于医学图像直接反映出组织内部所发生的病变，是医生进行疾病诊断的重要依据，甚至是进行某些疾病诊断的最终依据，例如在癌症诊断中，通过对病灶的放射影像学图像进行观察，包括观察是否有阴影、斑块或者血管扩张情况等。本申请可以针对内窥镜图像进行识别，应用在内窥镜图像的自动诊断，以辅助医生提高诊断效率和准确率，并在此基础上，进一步利用可获得的其他形式的数据辅助模型训练，提高模型准确率。

医学图像是医生对病人病情进行了解的重要信息入口，虽然目前高质量的医疗成像设备已经普及，但是对医学图像的准确解读往往需要医生具有专业的知识背景和长期的经验积累。考虑到人口数量大，医疗系统负荷重，有经验的医生数量不足，且主要集中在一线城市的大型三甲医院，从而导致医疗资源非常稀缺。本申请提供的方法能够在利用目标任务的有标数据的基础上，进一步利用该目标任务的无标数据(即半监督学习)，和其他相关任务的有标数据(即多任务学习)，最大化利用已有各种类型的数据中的信息辅助模型训练，从而提升模型效果。

为了便于理解，本申请提出了一种图像识别的方法，该方法应用于图1所示的图像识别系统，请参阅图1，图1为本申请实施例中图像识别系统的一个架构示意图，如图所示，图像识别系统可以包括医疗设备,医疗设备具体可以是内窥镜设备或者电子显微镜等，医疗设备在采集到待识别的医学图像之后，可以按照任务类型采用训练好的图像识别模型对医学图像进行识别，以内窥镜图像的自动诊断为例，可以按照不同的部位(如食管、胃、十二指肠或者结直肠)进行识别，也可以按照不同的目的(如区分良恶性，区分部位，区分图片是否合格)等任务进行识别，最后可得到一个可视化的结果，给医生提供一个重点关注的区域。可选地，医疗设备在采集到待识别的医学图像之后，可以将该医学图像发送至终端设备，由终端设备采用训练好的图像识别模型对该医学图像进行识别，可得到一个可视化的结果，给医生提供一个重点关注的区域，并展示在界面上。可选地，医疗设备在采集到待识别的医学图像之后，可以将该医学图像发送至服务器，由服务器采用训练好的图像识别模型对该医学图像进行识别，服务器在得到识别结果之后可以将该结果反馈给终端设备或者医疗设备，由终端设备或者医疗设备进行展示。

需要说明的是，终端设备包含但不仅限于平板电脑、笔记本电脑、掌上电脑、手机、语音交互设备及个人电脑(personalcomputer，pc)，此处不做限定。

本申请中所使用的图像识别模型可采用如图2所示的架构进行训练，请参阅图2，图2为本申请实施例中训练图像识别模型的一个整体结构示意图，如图所示，本申请的图像识别模型可以采用深度学习模型结构，例如残差网络(residualnetwork，resnet)结构或者密集卷积网络(densenet)结构。在训练的过程中可以对训练数据进行数据增强(dataaugmentation)以及数据预处理(preprocessing)，训练采用端到端的基于随机梯度下降方法。可以选择每个任务交替训练，对于交替训练而言，即依次输入目标任务的有标数据、多任务学习中辅助任务数据以及半监督学习中无标数据，调用对应的优化器降低对应的损失值，以此更新重叠部分的参数和该目标任务独有的参数。也可以选择混合训练，对于混合训练而言，即每次输入混合后目标任务的有标数据、多任务学习中辅助任务数据以及半监督学习中无标数据，将相应的损失值相加后调用优化器，从而降低总的损失值。

训练得到图像识别模型之后，使用如图2所示的在线推断(inference)部分既可以进行预测，在线推断部分包括数据预处理、网络模型以及全连接层，在实际应用中，还可以包括其他的网络层，此次仅为一个示意，不应理解为对本申请的限定。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。结合上述介绍，本申请实施例提供的方案涉及人工智能的图像识别等技术，具体通过如下实施例进行说明，请参阅图3，本申请实施例中图像识别模型训练的方法一个实施例包括：

101、获取待训练图像集合，其中，待训练图像集合至少包括第一图像集合、第二图像集合和第三图像集合，第一图像集合包括至少一个第一图像，第二图像集合包括至少一个第二图像以及至少一个干扰图像，第三图像集合包括至少一个第三图像，第一图像为第一任务所对应的已标注图像，第二图像为未标注图像，第三图像为第二任务所对应的已标注图像，第一任务与第二任务属于不同的任务；

在本实施例中，图像识别模型训练装置获取待训练图像集合，可以理解的是，图像识别训练装置可以部署于终端设备上，也可以部署于服务器上，由于训练的数据量往往比较大，因此可以采用服务器进行模型训练，然而这不应理解为对本申请的限定。

待训练图像集合中至少包括第一图像集合、第二图像集合和第三图像集合，第一图像集合、第二图像集合和第三图像集合均属于训练样本，第一图像集合包括至少一个第一图像(可以表示为x0)，第二图像集合包括至少一个第二图像(可以表示为xul)以及多个干扰图像(可以表示为xpert)，第三图像集合包括至少一个第三图像(可以表示为x1)，第一图像是第一任务所对应的携带标注信息的已标注图像，第二图像是第一任务所对应的未携带标注信息的未标注图像，第三图像为第二任务所对应的已标注图像，第一任务与第二任务属于不同的任务。干扰图像是第二图像经过随机加扰后得到的，因此，干扰图像的尺寸与第二图像的尺寸相同。随机加扰包含但不仅限于翻转、旋转以及平移。可以理解的是，一个第二图像需要进行两次随机加扰，即一个第二图像对应于两个干扰图像。此外，干扰图像通常是在训练过程中生成的。

102、基于待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，其中，第一预测概率为基于第一图像集合输出的一个预测结果，第二预测概率和第三预测概率为基于第二图像集合输出的一个预测结果，第四预测概率为基于第三图像集合输出的一个预测结果；

在本实施例中，采用了两种训练过程，分别是半监督学习(semi-supervisedlearning)和多任务学习(multitasklearning，mtl)，其中，第一图像集合以及第二图像集合用于半监督学习，第二预测概率和第三预测概率为半监督学习的输出结果，第三图像集合用于多任务学习，第四预测概率为多任务学习的输出结果。

半监督学习利用同一任务的无标数据来辅助训练提升模型效果。标注的意义在于判断当前模型预测的结果是否正确，从而作为评判模型好坏的指标，即设立一个目标损失函数,当前待训练图像识别模型越准确，目标损失函数的值越小，模型训练的过程是使得目标损失函数获得最小值的优化过程。需要说明的是，对于已标注的图像数据可以采用交叉熵损失函数(crossentropyloss)，而对于未标注的图像数据无法采用标签来评价模型好坏，因此，可以使同一图片经过两次随机扰动输入网络，采用一致性约束损失函数(consistencyloss)来判断两次预测结果之间的差异，模型训练的目的就是减少两次预测结果之间的差异。

多任务学习利用其它相关已标注的数据集辅助训练，从而提升模型效果，传统的机器学习方法对每个任务独立训练一个模型，而多任务学习的方法可以用一个网络模型同时训练多个相关任务，网络模型的一部分参数为各个任务共享，网络模型的另一部分参数为每个任务独有。

103、根据第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，其中，目标损失函数至少包括第一损失函数、第二损失函数以及第三损失函数，第一损失函数为根据第一预测概率确定的，第二损失函数为根据第二预测概率和第三预测概率确定的，第三损失函数为根据第四预测概率确定的；

本实施例中，图像识别模型训练装置根据第一预测概率与第一图像集合所对应的标注信息确定第一损失函数，其中，第一预测概率集合属于预测值，而第一图像集合所对应的标注信息属于真实值，基于预测值和真实值计算出第一损失函数。图像识别模型训练装置根据第二预测概率以及第三预测概率确定第二损失函数，其中，第二预测概率以及第三预测概率均为预测值。图像识别模型训练装置根据第四预测结果集合与第三图像集合所对应的标注信息确定第三损失函数，第四预测结果集合属于预测值，而第三图像集合所对应的标注信息属于真实值，基于预测值和真实值计算出第三损失函数。结合第一损失函数、第二损失函数和第三损失函数，可以得到目标损失函数。

104、基于目标损失函数训练待训练图像识别模型，得到图像识别模型。

本实施例中，当目标损失函数收敛时，表示待训练图像识别模型已训练完成，此时，该待训练图像识别模型即为图像识别模型。可以理解的是，在实际应用中，当训练达到次数门限时也可以认为目标损失函数已收敛。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第一个可选实施例中，基于待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，可以包括：

基于第一图像集合，通过待训练图像识别模型获取第一预测概率；

基于第二图像集合，通过待训练图像识别模型获取第二预测概率以及第三预测概率；

基于第三图像集合，通过待训练图像识别模型获取第四预测概率。

本实施例中，图像识别模型训练装置将第二图像集合输入至待训练图像识别模型，具体地，第二图像集合包括第二图像以及干扰图像。假设第二图像a经过第一次随机加扰得到干扰图像a，第二图像a经过第二次随机加扰得到干扰图像b，于是，图像识别模型训练装置先将第二图像a和干扰图像a输入至待训练图像识别模型，由该待训练图像识别模型输出第二预测概率，然后，图像识别模型训练装置再将第二图像a和干扰图像b输入至待训练图像识别模型，由该待训练图像识别模型输出第三预测概率，经过两次预测分别得到两个预测概率。在实际应用中，可以对每个第二图像均进行两次随机加扰处理。

为了便于理解，请参阅图4，图4为本申请实施例中基于无标注样本进行训练的一个实施例示意图，如图所示，第二图像的样本集包括至少一个第二图像，先对第二图像的样本集中的各个第二图像进行一次随机加扰，得到干扰图像a的样本集。再对第二图像的样本集中的各个第二图像进行一次随机加扰，得到干扰图像b的样本集。将第一图像的样本集、第二图像的样本集和干扰图像a的样本集都输入至待训练图像识别模型，从而得到每个样本所对应的第一预测概率。再将第一图像的样本集、第二图像的样本集和干扰图像b的样本集都输入至待训练图像识别模型，从而得到各个样本所对应的第二预测概率。

在本实施例中，图像识别模训练装置还将第一图像集合输入至待训练图像识别模型，具体地，第一图像集合包括第一图像，第一图像是已标注图像，类似地，图像识别模训练装置还将第三图像集合输入至待训练图像识别模型，具体地，第三图像集合包括第三图像，而且第三图像和第一图像类似，也是已标注图像，不同的是，第一图像所在的第一图像集合和第三图像所在的第三图像集合对应于不同的学习任务。例如，第一图像集合是针对病灶定位任务进行标注的，即第一图像标注的内容是病灶所在的位置，如病灶位置在食管、胃部、十二指肠或者结直肠等。而第三图像集合是针对肿瘤性质任务进行标注的，即第三图像标注的内容是肿瘤性质，如恶性肿瘤或者良性肿瘤。可以理解的是，在实际应用中，还可以根据需求设置其他不同的任务，此处仅为一个示意，不应理解为对本申请的限定。

为了便于介绍，请参阅图5，图5为本申请实施例中基于多任务学习的一个实施例示意图，如图所示，多任务学习(multitasklearning，mtl)利用其它相关已标注的数据集辅助训练，从而提升模型效果，传统的机器学习方法对每个任务独立训练一个模型，而多任务学习的方法可以用一个网络模型同时训练多个相关任务，网络模型的一部分参数为各个任务共享，网络模型的另一部分参数为每个任务独有。如图5所示，对于输入的训练数据而言，通过待训练图像识别模型输出4个不同任务下的预测结果，且不同任务之间共享参数，且利用所有任务的全部数据集，因此增大了训练的数据量。

多任务学习有多种形式，包含但不仅限于联合学习(jointlearning)、自主学习(learningtolearn)和带有辅助任务的学习(learningwithauxiliarytask)。通常情况下，优化多个损失函数就等同于进行多任务学习。即使只优化一个损失函数也有可能借助辅助任务来改善原任务模型。本申请提供的多任务学习可以是基于参数硬共享来实现，也可以是基于参数软共享实现。参数硬共享通常通过在所有任务之间共享隐藏层，同时保留几个特定任务的输出层来实现。在软参数共享中，每个任务都有单独的模型，每个模型包含各自的参数。

其次，本申请实施例中，提供了一种获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率的方法，利用半监督学习基于第二图像集合获得第二预测概率和第三预测概率，并且利用多任务学习获基于第三图像集合获得第四预测概率。通过上述方式，有效地利用了无标注数据进行训练，从而提升模型效果，在获得更好效果的同时，降低了对已标注数据的需求，从而降低了产品开发的成本，加快了产品开发周期。同时，还能够用一个图像识别模型同时训练多个相关任务，图像识别模型一部分参数为各个任务共享，另一部分参数为每个任务独有。而共享参数利用所有任务的全部数据集，不但增大了训练的数据量，同时还抵消了每个训练集独有的噪声，从而提高了模型泛化能力，降低模型过拟合。而独立的输出层可以在共享部分中选择对于该任务最相关的特征，学习每个任务特有的分类界限，使得模型有足够大的灵活度，在图像识别任务中可以获取较高准确度。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第二个可选实施例中，基于第一图像集合，通过待训练图像识别模型获取第一预测概率，可以包括：

基于至少一个第一图像，通过待训练图像识别模型所包括的全连接层获取第一预测值；

对第一预测值进行归一化处理，得到第一预测概率。

本实施例中，介绍了一种生成第一预测概率的方法，为了便于说明，下面将以第一图像集合中的一个第一图像为例进行说明，可以理解的是，第一图像集合中其他的第一图像也采用相似的方式进行处理，此处不做赘述。

具体地，假设第一图像表示为x0，第一图像的标注信息为y0，标注信息用于表示分类任务下的分类标签，比如，分类任务为病灶定位的任务，那么分类标签可以是不同的部位，如标签1表示食管部位，标签2表示胃部，标签3表示十二指肠部位，标签4表示结直肠部位，标签5表示无类型。又比如，分类任务为区分肿瘤性质的任务，那么分类标签可以是不同的肿瘤恶化程度，如标签1表示良性肿瘤，标签2表示恶性肿瘤，标签3表示无肿瘤。又比如，分类任务为区分图片合格情况的任务，那么分类标签可以是不同的图片合成情况，如标签1表示图片合格，标签2表示图片不合格。

属于第二任务的第一图像x0通过全连接(fullyconnection，fc)层后，输出第一预测值，第一预测值表示为z0，第一预测值z0经过softmax之后即实现归一化处理，从而得到第一图像的第一预测概率p0。采用如下方式算得到第一预测概率：

其中，p0表示第一预测概率，p0[i]表示第一预测概率中的第i个单元，c表示类型总数，k表示第k个类型，i的取值为大于或等于0，且小于或等于c-1的整数。

待训练图像识别模型的最后一层可以是全连接层+softmax层，全连接层将权重矩阵与输入向量相乘再加上偏置，将n个的实数映射为k个分数，softmax层将k个实数映射为k个(0，1)范围内的概率，同时保证k个实数之和为1。

其次，本申请实施例中，提供了一种生成第一预测概率的方法，即首先通过待训练图像识别模型所包括的全连接层获取第一图像的第一预测值，然后对第一图像的第一预测值进行归一化处理，得到第一图像的第一预测概率。通过上述方式，对预测值进行归一化处理后能够更直观地体现样本的预测类别，从而有利于提升训练样本分类的准确性，提升模型训练的效率和准确度。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第三个可选实施例中，基于第一图像集合以及第二图像集合，通过待训练图像识别模型获取第二预测概率，可以包括：

根据至少一个第二图像生成第一干扰图像集合，其中，第一干扰图像集合包括至少一个第一干扰图像，第一干扰图像与第二图像具有对应关系，第一干扰图像属于干扰图像；

根据至少一个第二图像生成第二干扰图像集合，其中，第二干扰图像集合包括至少一个第二干扰图像，第二干扰图像与第二图像具有对应关系，第二干扰图像属于干扰图像；

基于至少一个第二图像以及第一干扰图像集合，通过待训练图像识别模型获取第二预测概率；

基于至少一个第二图像以及第二干扰图像集合，通过待训练图像识别模型获取第三预测概率。

本实施例中，介绍了一种基于半监督学习的数据处理方式，首先图像识别模型训练装置获取至少一个第二图像，这里的第二图像是未标注图像。然后对每个第二图像进行两次随机加扰处理，第一次加扰后得到第一干扰图像集合，第一干扰图像集合包括至少一个第一干扰图像，即每个第一干扰图像对应一个第二图像。类似地，第二次加扰后得到第二干扰图像集合，第二干扰图像集合包括至少一个第二干扰图像，即每个第二干扰图像对应一个第二图像，且第二干扰图像的数量通常与第一干扰图像的数量相同。将至少一个第二图像以及第一干扰图像集合输入至待训练图像识别模型，从而得到第二预测概率。例如，可以将1000个第二图像以及1000个第一干扰图像输入至待训练图像识别模型，也可以将100个第二图像以及100个第一干扰图像输入至待训练图像识别模型，此次不对第二图像的数量进行限定。类似地，将至少一个第二图像以及第二干扰图像集合输入至待训练图像识别模型，从而得到第三预测概率。第二预测概率与第三预测概率可能相同，也可能不同。

可以理解的是，在实际应用中，待训练图像识别模型输出的结果可以是一个预测值，将该预测值进行归一化处理后即可得到预测概率。

需要说明的是，随机加扰的过程中需要对第二图像进行数据增强处理，除了可以对第二图像进行翻转、旋转以及平移处理，还可以更改第二图像的方向、位置、比例和亮度等。在可以在待训练图像识别模型中增加随机失活(dropout)等随机因素，dropout是对具有深度结构的人工神经网络进行优化的方法，在学习过程中通过将隐含层的部分权重或输出随机归零，降低节点间的相互依赖性从而实现神经网络的正则化。若干扰图像为随机噪音时，则随机加扰的过程可以称为pi模型(pi-model)。若干扰图像为对抗干扰(adversarialperturbation)，则随机加扰的过程可以称为虚拟对抗训练(virtualadversarialtraining，vat)。

其次，本申请实施例中，提供了一种基于半监督学习的数据处理方式，即需要对第二图像进行两次随机加扰的处理，得到第一干扰图像和第二干扰图像，然后再将第二图像分别和第一干扰图像以及第二干扰图像组成模型输入的两个训练样本，由此得到两个预测概率。通过上述方式，能够有效地无标注图像进行随机加扰处理，得到具有不同干扰度的图像作为模型训练的样本，随机加扰的过程无需人为干预，提升了模型训练的效率，同时，随机化的处理能够提升样本的泛化能力，从而提升模型的训练效果。半监督学习避免了数据和资源的浪费，同时解决了全监督学习的模型泛化能力不强和无监督学习的模型不精确问题。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第四个可选实施例中，基于第三图像集合，通过待训练图像识别模型获取第四预测概率，可以包括：

基于至少一个第三图像，通过待训练图像识别模型所包括的全连接层获取第四预测值；

对第四预测值进行归一化处理，得到第四预测概率。

本实施例中，介绍了一种生成第四预测概率的方法，为了便于说明，下面将以第三图像集合中的一个第三图像为例进行说明，可以理解的是，第三图像集合中其他的第三图像也采用相似的方式进行处理，此处不做赘述。

具体地，假设第三图像表示为x1，第三图像的标注信息为y1，标注信息用于表示分类任务下的分类标签，比如，分类任务为病灶定位的任务，那么分类标签可以是不同的部位，如标签1表示食管部位，标签2表示胃部，标签3表示十二指肠部位，标签4表示结直肠部位，标签5表示无类型。又比如，分类任务为区分肿瘤性质的任务，那么分类标签可以是不同的肿瘤恶化程度，如标签1表示良性肿瘤，标签2表示恶性肿瘤，标签3表示无肿瘤。又比如，分类任务为区分图片合格情况的任务，那么分类标签可以是不同的图片合成情况，如标签1表示图片合格，标签2表示图片不合格。需要说明的是，第三图像的标注信息属于第一任务，而第一图像的标注信息属于第二任务，两个任务是不同的。

属于第一任务的第三图像x1通过全连接层后，输出第二预测值，第二预测值表示为z1，第二预测值z1经过softmax之后即实现归一化处理，从而得到第三图像的第四预测概率p1。采用如下方式算得到第四预测概率：

其中，p1表示第四预测概率，p1[i]表示第四预测概率中的第i个单元，c表示类型总数，k表示第k个类型，i的取值为大于或等于0，且小于或等于c-1的整数。

再次，本申请实施例中，提供了一种生成第四预测概率的方法，即首先通过待训练图像识别模型所包括的全连接层获取第三图像的第二预测值，然后对第三图像的第二预测值进行归一化处理，得到第三图像的第四预测概率。通过上述方式，对预测值进行归一化处理后能够更直观地体现样本的预测类别，从而有利于提升训练样本分类的准确性，提升模型训练的效率和准确度。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第五个可选实施例中，根据第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，可以包括：

根据第一预测概率与第一图像集合所对应的标注信息，计算第一损失函数；

根据第二预测概率以及第三预测概率，计算第二损失函数；

根据第四预测概率与第三图像集合所对应的标注信息，计算第三损失函数；

获取熵损失函数以及正则化损失函数；

根据第一损失函数、第二损失函数、第三损失函数、熵损失函数以及正则化损失函数，计算得到目标损失函数。

本实施例中，介绍了目标损失函数具体内容，图像识别模型训练装置通过根据第一预测结果集合与第一图像集合所对应的标注信息，计算第一损失函数lce。图像识别模型训练装置根据至少一个第二预测概率以及至少一个第三预测概率，计算第二损失函数lcon。图像识别模型训练装置根据第三预测结果集合与第三图像集合所对应的标注信息，计算第三损失函数lmtl。此外，目标损失函数还包括熵损失函数lent以及正则化损失函数lreg。

下面将介绍熵损失函数lent以及正则化损失函数lreg。

最小化熵损失函数可以使得模型更加确定地预测为某一个任务下的具体类别，而不是认为几种类别都有可能，熵表示对各分类的信息量期望。

熵损失函数的计算方式如下：

其中，lent表示熵损失函数，c表示类型总数，k表示第k个类型，p表示预测概率。

为防止模型过拟合，提高模型的泛化能力，可以在目标损失函数中添加一个正则化损失函数，可以理解的是，正则化损失函数包含但不仅限于l1正则化损失函数和l2正则化损失函数。正则化损失函数可以作为目标损失函数的惩罚项。

基于上述介绍，本申请中的目标损失函数可以表示为：

ltotal＝w0·lce+w1·lmtl+w2·lcon+w3·lent+w4·lreg；

其中，ltotal表示目标损失函数，lce表示第一损失函数，lcon表示第二损失函数，lmtl表示第三损失函数，lent表示熵损失函数，lreg表示正则化损失函数，w0表示第一权重，w1表示第二权重，w2表示第三权重，w3表示第四权重，w4表示第五权重。叠加时每一项可以有不同权重(即权重可以恒定值或者动态变化的)，通常情况下，依据不同任务以及不同数据集，需要调节各个权重。

再次，本申请实施例中，提供了目标损失函数具体内容，即目标损失函数包括第一损失函数、第二损失函数、第三损失函数、熵损失函数以及正则化损失函数。通过上述方式，利用不同类型的损失函数在不同维度上对模型进行训练，从而提升模型训练的准确度。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第六个可选实施例中，根据第一预测概率与第一图像集合所对应的标注信息，计算第一损失函数，可以包括：

根据第一预测概率与第一图像集合所对应的标注信息，计算第一损失函数；

根据第一预测概率与第一图像集合所对应的标注信息，计算第一损失函数，可以包括：

采用如下方式计算第一损失函数：

lce(p0,y0)＝-log(p0[y0])；

其中，lce表示第一损失函数，p0表示第一预测概率，y0表示第一图像集合所对应的标注信息。

本实施例中，介绍了一种第一损失函数的计算方式，图像识别模型训练装置根据预测得到的第一预测概率与真实的标注信息，可以计算出第一损失函数，该第一损失函数可以是交叉熵损失函数，可以理解的是，在实际应用中，还可以是其他类型的损失函数，这里以交叉熵损失函数为例进行说明。

采用如下方式计算第一损失函数：

lce(p0,y0)＝-log(p0[y0])；

p0表示第一预测概率，假设第一预测概率是针对肿瘤恶化程度标注任务生成的概率，标签1表示良性肿瘤，标签2表示恶性肿瘤，标签3表示无肿瘤。假设第一图像的第一预测概率为(0.1,0.2，0.7)，即得到第一图像的预测标签为标签3，即为无肿瘤的标签。而对于第一图像而言已经进行标注处理，从而可以得到标注信息y0，即真实标签。假设真实标签为标签3，那么该标签3对应的概率为(0,0,1)。利用交叉熵损失函数描述了两个概率分布之间的距离，交叉熵越小说明两者之间越接近。模型训练的目标就是希望预测概率与真实概率的分布更接近。

其次，本申请实施例中，提供了一种第一损失函数的计算方式，通过上述方式，为第一损失函数的生成提供了具体的实现依据，从而提升模型训练的可行性和可操作性。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法的第七个可选实施例中，根据第二预测概率以及第三预测概率，计算第二损失函数，可以包括：

根据第二预测概率以及第三预测概率，计算第二损失函数；

根据第二预测概率以及第三预测概率，计算第二损失函数，可以包括：

采用如下方式计算第二损失函数：

或，采用如下方式计算第二损失函数：

其中，lcon表示第二损失函数，c表示类型总数，k表示第k个类型，ps表示第二预测概率，pr表示第三预测概率。

本实施例中，介绍了一种第二损失函数的计算方式，图像识别模型训练装置根据预测得到的第二预测概率与第三预测概率，可以计算出第二损失函数。该第二损失函数可以是均方误差(mean-squareerror，mse)损失函数，也可以是kl散度(kullback-leiblerdivergence)损失函数，可以理解的是，在实际应用中，还可以是其他类型的损失函数，这里以mse损失函数以及kl散度损失函数为例进行说明。

当第二损失函数为mse损失函数时，采用如下方式计算第二损失函数：

当第二损失函数为kl散度损失函数时，采用如下方式计算第二损失函数：

第二预测概率ps的计算方式如下：

其中，ps表示第二预测概率，ps[i]表示第二预测概率中的第i个单元，c表示类型总数，k表示第k个类型，i的取值为大于或等于0，且小于或等于c-1的整数。

第三预测概率pr的计算方式如下：

其中，pr表示第三预测概率，pr[i]表示第三预测概率中的第i个单元，c表示类型总数，k表示第k个类型，i的取值为大于或等于0，且小于或等于c-1的整数。

可以理解的是，第二预测概率与第一预测概率可以在同一次训练中输出，因此，第二预测概率也可以表示为p0，pr表示第三预测概率，类似地，第三预测概率pr是预测值zr经过归一化处理之后得到的。第二预测概率与第三预测概率是在不同次的训练中输出的。第二损失函数具体可以是一致性损失函数(consistencyloss)，第二损失函数越小，表示两次预测的结果越接近，即模型训练的效果也越好，最小化该第二损失函数即使得两次预测值一致。

其次，本申请实施例中，提供了一种第二损失函数的计算方式，通过上述方式，为第二损失函数的生成提供了具体的实现依据，从而提升模型训练的可行性和可操作性。此外，还可以根据需求选择合适的第二损失函数进行计算，进而提升了方案的灵活性。

可选地，在上述图3对应的各个实施例的基础上，本申请实施例提供的图像识别模型训练的方法第八个可选实施例中，根据第四预测概率第三图像集合所对应的标注信息，计第三损失函数，包括：

根据第四预测概率与第三图像集合所对应的标注信息，计算第三损失函数；

根据第四预测概率与第三图像集合所对应的标注信息，计算第三损失函数，可以包括：

采用如下方式计算第三损失函数：

lmtl(p1,y1)＝-log(p1[y1])；

其中，lmtl表示第三损失函数，p1表示第四预测概率，y1表示第三图像集合所对应的标注信息。

本实施例中，介绍了一种第三损失函数的计算方式，图像识别模型训练装置根据预测得到的第三预测概率与真实的标注信息，可以计算出第三损失函数，该第三损失函数可以是交叉熵损失函数，可以理解的是，在实际应用中，还可以是其他类型的损失函数，这里以交叉熵损失函数为例进行说明。

采用如下方式计算第三损失函数：

lmtl(p1,y1)＝-log(p1[y1])；

p1表示第四预测概率，假设第四预测概率是针对图片合格情况标注任务生成的概率，标签1表示图片合格，标签2表示图片不合格。假设第三图像的第四预测概率为(0.2，0.8)，即得到第三图像的预测标签为标签2，即为图片不合格的标签。而对于第三图像而言已经进行标注处理，从而可以得到标注信息y1，即真实标签。假设真实标签为标签1，那么该标签1对应的概率为(1,0)。利用交叉熵损失函数描述了两个概率分布之间的距离，交叉熵越小说明两者之间越接近。模型训练的目标就是希望预测概率与真实概率的分布更接近。

再次，本申请实施例中，提供了一种第三损失函数的计算方式，通过上述方式，为第三损失函数的生成提供了具体的实现依据，从而提升模型训练的可行性和可操作性。

结合上述介绍，本申请还提供了一种图像识别的方法，请参阅图6，本申请实施例中图像识别的方法一个实施例包括：

201、获取待识别图像；

本实施例中，图像识别装置获取待识别图像，该待识别图像可以是内窥镜图像，也可以是其他类型的医学图像，此处不做限定。其中，图像识别装置可以部署于服务器，也可以部署于终端设备，这里以部署在终端设备为例进行说明，但不应理解为对本申请的限定。

202、通过图像识别模型获取待识别图像所对应的图像识别结果，其中，图像识别模型为上述实施例所描述的图像识别模型；

本实施例中，图像识别装置将待识别图像输入至上述实施例所描述的图像识别模型中，由该图像识别模型输出对应的图像识别结果。

203、展示图像识别结果。

本实施例中，图像识别装置可以展示该图像识别结果。为了便于理解，请参阅图7，图7为本申请实施例中展示图像识别结果的一个界面示意图，如图所示，以输入的一张医学图像为例，医生可以根据需求选择相应的任务。假设选择任务a，即定位病灶部位的任务，基于医生选择的任务a输出相应的结果，例如定位的病灶部位为“胃部”。假设选择任务b，即检测肿瘤性质的任务，基于医生选择的任务b输出相应的结果，例如检测肿瘤性质为“良性”。假设选择任务c，即图像合格请求的任务，基于医生选择的任务c输出相应的结果，例如图像合格情况为“合格”。

本申请实施例中，提供了一种图像识别的方法，即先获取待识别图像，然后将该输入至已经训练好的图像识别模型，由图像识别模型输出图像识别结果，最后展示该图像识别结果。通过上述方式，当使用本申请提供的图像识别模型进行自动诊断时，可以根据需求展示相应任务下的识别结果，辅助医生进行诊断，从而更有效的帮助医生减少检查中的误诊和漏诊，尤其是对于缺乏相关临床经验的医生。

下面对本申请中的图像识别模型训练装置进行详细描述，请参阅图8，图8为本申请实施例中图像识别模型训练装置一个实施例示意图，图像识别模型训练装置30包括：

获取模块301，用于获取待训练图像集合，其中，所述待训练图像集合至少包括第一图像集合、第二图像集合和第三图像集合，所述第一图像集合包括至少一个第一图像，所述第二图像集合包括至少一个第二图像以及至少一个干扰图像，所述第三图像集合包括至少一个第三图像，所述第一图像为第一任务所对应的已标注图像，所述第二图像为第一任务所对应的未标注图像，所述第三图像为第二任务所对应的已标注图像，所述第一任务与所述第二任务属于不同的任务；

所述获取模块301，还用于基于所述待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，其中，所述第一预测概率为基于所述第一图像集合输出的一个预测结果，所述第二预测概率和所述第三预测概率为基于所述第二图像集合输出的一个预测结果，所述第四预测概率为基于所述第三图像集合输出的一个预测结果；

所述获取模块301，还用于通过所述待训练图像识别模型获取所述第二图像集合所对应的第二预测结果集合，其中，所述第二预测结果集合包括至少一个第二预测概率以及至少一个第三预测概率，所述至少一个第二预测概率为所述待训练图像识别模型输出的一个预测结果，所述至少一个第三预测概率为所述待训练图像识别模型输出的另一个预测结果；

所述获取模块301，还用于通过所述待训练图像识别模型获取所述第三图像集合所对应的第三预测结果集合，其中，所述第三预测结果集合包括至少一个第四预测概率，每个第四预测概率对应一个第三图像；

确定模块302，用于根据所述获取模块301获取的所述第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，其中，所述目标损失函数至少包括第一损失函数、第二损失函数以及第三损失函数，所述第一损失函数为根据所述第一预测概率确定的，所述第二损失函数为根据所述第二预测概率和所述第三预测概率确定的，所述第三损失函数为根据所述第四预测概率确定的；

训练模块303，用于根据所述确定模块302确定的所述目标损失函数训练所述待训练图像识别模型，得到图像识别模型。

本申请实施例提供了一种图像识别模型训练装置，首先获取待训练图像集合，然后基于待训练图像集合，通过待训练图像识别模型获取第一预测概率、第二预测概率、第三预测概率以及第四预测概率，再根据第一预测概率、第二预测概率、第三预测概率以及第四预测概率，确定目标损失函数，最后基于目标损失函数训练待训练图像识别模型，得到图像识别模型。通过上述方式，采用有标注的针对不同任务的医学图像和未标注的医学图像共同对模型进行训练，有效利用了已标注图像和未标注图像，不但降低了对图像标注的需求，还增加了训练的数据量，从而在节省标注资源的同时还能提升模型的预测效果。