一种图像识别方法、装置和存储介质与流程

文档序号:16266145发布日期:2018-12-14 21:55阅读:215来源:国知局
一种图像识别方法、装置和存储介质与流程

本发明涉及通信技术领域,具体涉及一种图像识别方法、装置和存储介质。

背景技术

随着人工智能(ai,artificialintelligence)的发展,ai在医疗领域上的应用也越来越为广泛。以辨别区域(也称为诊断区域)如宫颈转化区类型识别为例,现有在采集到大量的阴道镜宫颈口样本图像后,一般会对这些样本图像进行三型标注,比如标注为转化区ⅰ型、转化区ⅱ型或转化区ⅲ型等(转化区ⅰ型、转化区ⅱ型和转化区ⅲ型均为宫颈转化区的类型,不同类型的宫颈转化区对于癌前和癌变诊断具有不同的参考价值),然后,基于这些标注的样本图像进行深度学习,以建立宫颈转化区类型识别模型,此后,便可以利用该训练好的宫颈转化区类型识别模型对待识别的阴道镜宫颈口图像进行宫颈转化区类型识别。

在对现有技术的研究和实践过程中,本发明的发明人发现,在现有方案中,由于宫颈转化区的划分较为复杂,因此,很难对宫颈转化区类型进行全面标注,导致其训练出来的模型的精度并不高,而且,在识别时,由于阴道镜宫颈口图像中具有过多的干扰区域,所以,识别的准确率也不高。



技术实现要素:

本发明实施例提供一种图像识别方法、装置和存储介质,可以提高识别准确率,改善识别效果。

本发明实施例提供一种图像识别方法,包括:

采集待检测的生命体组织图像;

采用预设区域检测模型对所述生命体组织图像进行关键特征检测,得到至少一个辨别区域,所述区域检测模型由多个标注了关键特征的生命体组织样本图像训练而成;

采用预设区域分类模型对所述辨别区域的类型进行识别,所述预设区域分类模型由多个标注了区域类型特征的区域样本图像训练而成;

根据识别结果在所述生命体组织图像上标注辨别区域的位置和类型。

相应的,本发明实施例还提供一种图像识别装置,包括采集单元、检测单元、识别单元和标注单元,如下:

采集单元,用于采集待检测的生命体组织图像;

检测单元,用于采用预设区域检测模型对所述生命体组织图像进行关键特征检测,得到至少一个辨别区域,所述区域检测模型由多个标注了关键特征的生命体组织样本图像训练而成;

识别单元,用于采用预设区域分类模型对所述辨别区域的类型进行识别,所述预设区域分类模型由多个标注了区域类型特征的区域样本图像训练而成;

标注单元,用于根据识别结果在所述生命体组织图像上标注辨别区域的位置和类型。

可选的,在一些实施例中,所述标注单元包括获取子单元和标注子单元,如下:

获取子单元,可以用于根据识别结果确定辨别区域的类型,并获取辨别区域的坐标;

标注子单元,可以用于根据所述坐标在所述生命体组织图像上标注辨别区域的位置,并在所述位置上标注辨别区域的类型。

可选的,在一些实施例中,所述获取子单元,具体可以用于根据识别结果确定辨别区域中预设范围内各个识别框的类型、以及类型的置信度,通过非极大值抑制算法对所述预设范围内各个识别框的类型的置信度进行计算,得到所述预设范围的置信度,选择置信度最大的预设范围的类型作为辨别区域的类型,以及获取辨别区域的坐标。

可选的,在一些实施例中,所述图像识别装置还可以包括预处理单元,如下:

所述预处理单元,用于按照预测策略对所述生命体组织图像进行预处理,所述预处理包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整;

所述检测单元,具体用于采用预设区域检测模型对预处理后的生命体组织图像进行关键特征检测。

可选的,在一些实施例中,所述图像识别装置还可以包括第一训练单元,如下:

所述采集单元,还可以用于采集多个标注了关键特征的生命体组织样本图像;

所述第一训练单元,可以用于根据所述生命体组织样本图像对预设目标检测模型进行训练,得到区域检测模型。

可选的,在一些实施例中,所述采集单元,具体可以用于采集多个生命体组织样本图像,采用邻域局部典型区域标注法对采集到的多个生命体组织样本图像进行标注,得到多个标注了关键特征的生命体组织样本图像。

可选的,在一些实施例中,所述第一训练单元,具体可以用于从采集到的多个生命体组织样本图像中确定当前需要进行训练的生命体组织样本图像,得到当前生命体组织样本图像;将所述当前生命体组织样本图像导入预设目标检测模型中进行训练,得到当前生命体组织样本图像对应的区域预测值;将当前生命体组织样本图像对应的区域预测值与当前生命体组织样本图像的标注的关键特征进行收敛,以对所述目标检测模型的参数进行调整;返回执行采集到的多个生命体组织样本图像中确定当前需要进行训练的生命体组织样本图像的步骤,直至所述多个生命体组织样本图像均训练完毕。

可选的,在一些实施例中,所述目标检测模型包括深度残差网络和区域推荐网络,所述第一训练单元,具体可以用于将所述当前生命体组织样本图像导入预设的深度残差网络中进行计算,得到当前生命体组织样本图像对应的输出特征;将所述输出特征导入区域推荐网络中进行检测,得到当前生命体组织样本图像对应的区域预测值。

可选的,在一些实施例中,所述图像识别装置还可以包括第二训练单元,如下:

所述采集单元,还可以用于获取多个标注了区域类型特征的区域样本图像;

所述第二训练单元,可以用于根据所述区域样本图像对预设分类模型进行训练,得到区域分类模型。

可选的,在一些实施例中,所述采集单元,具体可以用于采集多个标注了关键特征的生命体组织样本图像,根据标注从所述生命体组织样本图像中截取辨别区域,得到辨别区域样本,对辨别区域样本进行区域类型特征标注,得到区域样本图像。

可选的,在一些实施例中,所述采集单元,具体可以用于采集多个生命体组织样本图像,采用预设区域检测模型对所述生命体组织样本图像进行关键特征检测,得到至少一个辨别区域样本,对辨别区域样本进行区域类型特征标注,得到区域样本图像。

此外,本发明实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种图像识别方法中的步骤。

本发明实施例可以采集待检测的生命体组织图像,然后,采用预设区域检测模型对该生命体组织图像进行关键特征检测,并采用预设区域分类模型对检测得到的至少一个辨别区域的类型进行识别,再然后,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型,以供医疗人员进行参考;由于该方案可以利用训练好的区域检测模型准确地划分出辨别区域,再通过区域分类模型有针对性地对辨别区域的类型进行识别,因此,可以避免其他区域(即非辨别区域)对类型识别的干扰,提高识别的准确率;此外,由于区域检测模型是由多个标注了关键特征的生命体组织样本图像训练而成的,而无需全面标注,因此,相对于现有方案而言,也大大降低了标注的难度,提高了标注的准确性,进而提高所训练模型的精度;总而言之,该方案可以大大提高模型的精度和识别准确率,改善识别效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的图像识别方法的场景示意图;

图1b是本发明实施例提供的图像识别方法的流程图;

图2a是本发明实施例提供的图像识别方法的另一流程图;

图2b是本发明实施例提供的关于宫颈转化区类型的图像识别的架构示意图;

图3a是本发明实施例提供的图像识别装置的结构示意图;

图3b是本发明实施例提供的图像识别装置的另一结构示意图;

图4是本发明实施例提供的网络设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供一种图像识别方法、装置和存储介质。

其中,该活检区域预测装置具体可以集成在网络设备中,该网络设备可以是终端或服务器等设备。

例如,如图1a所示,网络设备可以采集待检测的生命体组织图像,比如,具体可以接收一些图像采集设备,如阴道镜或内窥镜等发送的生命体组织图像,如阴道镜宫颈图像或内窥镜图像等,然后,采用预设区域检测模型对该生命体组织图像进行关键特征检测,得到至少一个辨别区域,再然后,采用预设区域分类模型对该辨别区域的类型进行识别,比如是宫颈转化区ⅰ型、宫颈转化区ⅱ型、还是宫颈转化区ⅲ型,等等,并根据识别结果在该生命体组织图像上标注辨别区域的位置和类型。此后,便可以将该标注了辨别区域的位置和类型的生命体组织图像提供给医护人员进行参考,以便作进一步检查和诊断。

其中,该区域检测模型由多个标注了关键特征的生命体组织样本图像训练而成,而预设区域分类模型则是由多个标注了区域类型特征的区域样本图像训练而成。

以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。

实施例一、

本实施例将从图像识别装置的角度进行描述,该图像识别装置具体可以集成在网络设备中,该网络设备可以是终端或服务器等设备,其中,该终端可以包括平板电脑、笔记本电脑或个人计算机(pc,personalcomputer)等。

本发明实施例提供一种图像识别方法,包括:采集待检测的生命体组织图像,采用预设区域检测模型对该生命体组织图像进行关键特征检测,得到至少一个辨别区域,采用预设区域分类模型对该辨别区域的类型进行识别,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型。

如图1b所示,该图像识别方法的具体流程可以如下:

101、采集待检测的生命体组织图像。

例如,具体可以接收图像采集设备发送的待检测的生命体组织图像,其中,该图像采集设备可以包括医疗检测设备,比如阴道镜或内窥镜等,或者,也可以包括医疗监控设备,等等。

其中,待检测的生命体组织图像意为需要进行检测的生命体组织图像,所谓生命体组织图像,指的是生命体(有生命形态的独立个体就是生命体,能对外界刺激做出相应反映)的某组成部分的图像,比如人体的肠胃、心脏、喉咙和阴道等的图像,又比如狗的肠胃、甚至口腔或皮肤等的图像。

102、采用预设区域检测模型对该生命体组织图像进行关键特征检测,得到至少一个辨别区域。

例如,具体可以将该生命体组织图像导入该区域检测模型中进行检测,若某个区域的关键特征与辨别区域的特征相符,则该区域检测模型预测该区域为辨别区域,并输出相应的预测概率(即辨别区域的预测概率)。

其中,关键特征指的是辨别区域(或称为诊断区域)与其他区域相比,所特有的显著性特征,比如,一般将生理性鳞柱交界(位于子宫颈内的柱状上皮和位于宫颈口外围的鳞状上皮,两种上皮的结合处成为鳞柱交界;阴道镜下清晰可见的称为生理性鳞柱交界)和原始鳞柱交界(生理性鳞柱交界向鳞状上皮扩展的外沿,称为原始鳞柱交界)围成的区域称为宫颈转化区,所以,若需要检测出的辨别区域为“宫颈转化区”,则可以将“生理性鳞柱交界”和“原始鳞柱交界”围成的这部分区域作为关键特征,该关键特征可以通过典型局部矩形框来表现,具体信息比如包括该典型局部矩形框的x偏移量(即横坐标偏移量)、y偏移量(即纵坐标偏移量)、宽和高等参数值。

需说明的,不同类型的辨别区域,其关键特征也不同,而通过设置不同的关键特征,也可以找出符合不同应用场景或需求的辨别区域,比如,在宫颈癌前和癌变诊断的场景下,可以将宫颈转化区作为辨别区域,等等。

当然,由于所采集的生命体组织图像的规格,如尺寸、像素和/或颜色通道等可能有所差异,因此,为了便于区域检测模型进行检测,改善检测效果,可以对采集到的生命体组织图像进行预处理,使得图像规格化。即可选的,在步骤“采用预设区域检测模型对该生命体组织图像进行关键特征检测”之前,该图像识别方法还可以包括:

按照预测策略对该生命体组织图像进行预处理,其中,该预处理可以包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理,具体可以如下:

①图像尺寸缩放:将生命体组织图像的尺寸缩放至预设大小;比如,具体可以在将生命体组织图像保持宽高比的同时,将宽缩放至预设大小,如将宽缩放至600像素,等等;

②颜色通道顺序调整:将生命体组织图像的颜色通道顺序调整为预设顺序;比如,可以将生命体组织图像的三通道改为红(r,red)、绿(g,green)和蓝(b,blue)的通道顺序,当然,如果生命体组织图像原通道顺序已经为r、g和b,则无需进行该操作;

③像素调整:按照预设策略对生命体组织图像中的像素进行处理,比如,可以将生命体组织图像中每个像素减去全图像素均值,等等;

④图像归一化:对生命体组织图像的每个通道值除以预设的系数,如255.0;

⑤图像数据排列:将生命体组织图像的图像数据排列设置为预设模式,比如,将图像数据排列改为通道优先,等等。

在生命体组织图像进行预处理后,预设区域检测模型便可以对预处理后的生命体组织图像进行关键特征检测,即此时,步骤“采用预设区域检测模型对该生命体组织图像进行关键特征检测”可以包括:采用预设区域检测模型对预处理后的生命体组织图像进行关键特征检测。

此外,需说明的是,区域检测模型可以由多个标注了关键特征的生命体组织样本图像训练而成(只需局部标注即可);比如,具体可以由其他设备进行训练后,提供给该图像识别装置,或者,也可以由该图像识别装置自行进行训练,训练可以采用在线训练,也可以采用离线训练;即可选的,在步骤“采用预设区域检测模型对该生命体组织图像进行关键特征检测”之前,该图像识别方法还可以包括:

(1)采集多个标注了关键特征的生命体组织样本图像。

例如,具体可以采集多个生命体组织样本图像,然后,采用邻域局部典型区域标注法对采集到的多个生命体组织样本图像进行标注,得到多个标注了关键特征的生命体组织样本图像。

其中,采集的途径可以有多种,比如,可以从互联网、指定数据库和/或医疗记录中进行获取,具体可以根据实际应用的需求而定;同理,标注方式也可以根据实际应用的需求进行选择,比如,可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注,等等,在此不作赘述。

(2)根据该生命体组织样本图像对预设目标检测模型进行训练,得到区域检测模型。

例如,可以从采集到的多个生命体组织样本图像中确定当前需要进行训练的生命体组织样本图像,得到当前生命体组织样本图像,然后,将该当前生命体组织样本图像导入预设目标检测模型中进行训练,得到当前生命体组织样本图像对应的区域预测值,此后,将当前生命体组织样本图像对应的区域预测值与当前生命体组织样本图像的标注的关键特征进行收敛(即使得预测的矩形框参数无限接近于标注的矩形框参数),以对该目标检测模型的参数进行调整(每调整一次即对该目标检测模型训练一次),并返回执行采集到的多个生命体组织样本图像中确定当前需要进行训练的生命体组织样本图像的步骤,直至该多个生命体组织样本图像均训练完毕,便可以得到所需的区域检测模型。

其中,该目标检测模型可以根据实际应用的需求进行设置,比如,该目标检测模型可以包括深度残差网络(resnet)和区域推荐网络(rpn,regionalproposalnetworks),等等。

当该目标检测模型包括深度残差网络和区域推荐网络时,步骤“将该当前生命体组织样本图像导入预设目标检测模型中进行训练,得到当前生命体组织样本图像对应的区域预测值”可以包括:

将该当前生命体组织样本图像导入预设的深度残差网络中进行计算,得到当前生命体组织样本图像对应的输出特征,将该输出特征导入区域推荐网络中进行检测,得到当前生命体组织样本图像对应的区域预测值。

需说明的是,与对生命体组织图像进行辨别区域检测同理,由于所采集的生命体组织样本图像的规格,如尺寸、像素和/或颜色通道等可能有所差异,因此,为了便于区域检测模型进行检测,改善检测效果,可以对采集到的生命体组织样本图像进行预处理,使得图像规格化。即可选的,在步骤“根据该生命体组织样本图像对预设目标检测模型进行训练”之前,该图像识别方法还可以包括:

按照预测策略对该生命体组织样本图像进行预处理,其中,该预处理可以包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理,具体可以如下:

①图像尺寸缩放:将生命体组织样本图像的尺寸缩放至预设大小;比如,具体可以在将生命体组织样本图像保持宽高比的同时,将宽缩放至预设大小,如将宽缩放至600像素,等等;

②颜色通道顺序调整:将生命体组织样本图像的颜色通道顺序调整为预设顺序;比如,可以将生命体组织样本图像的三通道改为r、g和b的通道顺序,当然,如果生命体组织图像原通道顺序已经为r、g和b,则无需进行该操作;

③像素调整:按照预设策略对生命体组织样本图像中的像素进行处理,比如,可以将生命体组织样本图像中每个像素减去全图像素均值,等等;

④图像归一化:对生命体组织样本图像的每个通道值除以预设的系数,如255.0;

⑤图像数据排列:将生命体组织样本图像的图像数据排列设置为预设模式,比如,将图像数据排列改为通道优先,等等。

此时,步骤“根据该生命体组织样本图像对预设目标检测模型进行训练”可以包括:根据预处理后的生命体组织样本图像对预设目标检测模型进行训练。

103、采用预设区域分类模型对该辨别区域的类型进行识别。

例如,具体可以将包含了该辨别区域的图像导入该区域分类模型中进行识别,由该区域分类模型输出关于该辨别区域的识别结果。

比如,以宫颈转化区的类型识别为例,将包含了宫颈转化区的图像导入该区域分类模型后,区域分类模型会对宫颈转化区的区域类型特征进行识别,并输出宫颈转化区的三维概率,即转化区ⅰ型的概率、转化区ⅱ型的概率和转化区ⅲ型的概率,譬如,若经过识别,预测某个宫颈转化区为“转化区ⅰ型”的概率为80%,为“转化区ⅱ型”的概率为15%,为“转化区ⅲ型”的概率为5%,则此时,区域分类模型可以输出识别结果:“转化区ⅰ型,80%”、“转化区ⅱ型,15%”和“转化区ⅲ型,5%”。

其中,该预设区域分类模型可以由多个标注了区域类型特征的区域样本图像训练而成,具体可以由其他设备进行训练后,提供给该图像识别装置,或者,也可以由该图像识别装置自行进行在线或离线的训练;即在步骤“采用预设区域分类模型对该辨别区域的类型进行识别”之前,该图像识别方法还可以包括:

(1)获取多个标注了区域类型特征的区域样本图像。

其中,获取标注了区域类型特征的区域样本图像的方式可以有多种,比如,可以采用如下任意一种方式:

方式一(样本图像已经标注了关键特征):

采集多个标注了关键特征的生命体组织样本图像,根据标注(即关键特征的标注)从该生命体组织样本图像中截取辨别区域,得到辨别区域样本,对辨别区域样本进行区域类型特征标注,得到区域样本图像。

方式二(样本图像已标注了关键特征或未标注关键特征均可):

采集多个生命体组织样本图像(该生命体组织样本图像可以是标注关键特征,也可以未标注关键特征),采用预设区域检测模型对该生命体组织样本图像进行关键特征检测,得到至少一个辨别区域样本,对辨别区域样本进行区域类型特征标注,得到区域样本图像。

其中,区域类型特征的标注可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注,等等;区域类型特征的标注规则可根据实际应用的需求而定,比如,可用矩形框来标注类型辨别区域的区域类型特征,并给出该辨别区域的二维坐标和区域大小,等等。

比如,以宫颈转化区为例,转化区ⅰ型主要指的是位于子宫颈阴道部,可见完整的宫颈转化区,因此,转化区ⅰ型的区域类型特征为“宫颈阴道部”,且“可见完整”等特征;转化区ⅱ型指的是位于宫颈管内,通过颈管扩张器等辅助工具可见完整的宫颈转化区,因此,转化区ⅱ型的区域类型特征为“宫颈管内”,且“通过颈管扩张器等辅助工具可见完整”等特征;而转化区ⅲ型指的是借助工具,仍无法看到生理性鳞柱交界的宫颈转化区,所以,转化区ⅲ型的区域类型特征为“借助工具,仍无法看到生理性鳞柱交界”等特征。

(2)根据该区域样本图像对预设分类模型进行训练,得到区域分类模型。

例如,具体可以将区域样本图像输入至预设分类模型中进行分类,得到预测的分类结果,比如转化区ⅰ型、转化区ⅱ型或转化区ⅲ型,将该预测的分类结果的区域类型特征和标注的区域类型特征进行收敛,即可完成一次训练,以此类推进行多次训练,直至所有区域样本图像训练完毕,便可得到最终所需的区域分类模型。

104、根据识别结果在该生命体组织图像上标注辨别区域的位置和类型;例如,具体可以如下:

(1)根据识别结果确定辨别区域的类型,并获取辨别区域的坐标。

例如,具体可以根据识别结果确定辨别区域中预设范围内各个识别框的类型、以及类型的置信度,通过非极大值抑制算法(non-maximumsuppression)对该预设范围内各个识别框的类型的置信度进行计算,得到该预设范围的置信度,选择置信度最大的预设范围的类型作为辨别区域的类型。

由于识别结果中可以会存在多个识别框,每个识别框对应有多个类型及类型的预测概率,因此,可以从每个识别框的多个类型中选择预测概率最大的类型作为该识别框的类型、并将该最大的预测概率作为该识别框的置信度。

在得到各个识别框的类型、以及类型的置信度之后,便可以通过非极大值抑制算法对该预设范围内各个识别框的类型的置信度进行计算,比如,可以对该预设范围内各个识别框的类型的置信度进行比较,保留其中极大值的原数值,并将其他非极大值设置为极小值,比如(0.0),最终得到该预设范围的置信度,然后,对各个预设范围的置信度进行排序,根据排序选择置信度最大的预设范围的类型作为辨别区域的类型。

(2)根据该坐标在该生命体组织图像上标注辨别区域的位置,并在该位置上标注辨别区域的类型。

例如,还是以宫颈转化区的类型识别为例,若某辨别区域被识别为“转化区ⅰ型”,则此时可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅰ型”;若某辨别区域被识别为“转化区ⅱ型”,则此时可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅱ型”;同理,若某辨别区域被识别为“转化区ⅲ型”,则此时可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅲ型”,以此类推,等等。

可选的,在标注时,还可以标注出该辨别区域的具体坐标,进一步的,还可以标注出识别结果的预测概率,当然,也可以标注出辨别区域的预测概率。

由上可知,本实施例可以采集待检测的生命体组织图像,然后,采用预设区域检测模型对该生命体组织图像进行关键特征检测,并采用预设区域分类模型对检测得到的至少一个辨别区域的类型进行识别,再然后,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型,以供医疗人员进行参考;由于该方案可以利用训练好的区域检测模型准确地划分出辨别区域,再通过区域分类模型有针对性地对辨别区域的类型进行识别,因此,可以避免其他区域(即非辨别区域)对类型识别的干扰,提高识别的准确率;此外,由于区域检测模型是由多个标注了关键特征的生命体组织样本图像训练而成的,而无需全面标注,因此,相对于现有方案而言,也大大降低了标注的难度,提高了标注的准确性,进而提高所训练模型的精度;总而言之,该方案可以大大提高模型的精度和识别准确率,改善识别效果。

实施例二、

根据前面实施例所描述的方法,以下将以该图像识别装置具体集成在网络设备举例作进一步详细说明。

首先,可以分别对区域检测模型和区域分类模型进行训练,其次,通过该训练好的区域检测模型和区域分类模型,便可对待检测生命体组织图像进行辨别区域类型的识别,以下将分别进行详细说明。

(一)区域检测模型的训练。

网络设备采集多个标注了关键特征的生命体组织样本图像,然后,根据该生命体组织样本图像对预设目标检测模型进行训练,得到区域检测模型。例如,具体可以如下:

(1)网络设备从互联网、指定数据库和/或医疗记录中采集多个生命体组织样本图像。

比如,该区域检测模型具体为宫颈转化区的区域检测模型为例,则网络设备可以互联网、指定数据库和/或医疗记录中采集多个阴道镜宫颈样本图像。

(2)网络设备采用邻域局部典型区域标注法对采集到的多个生命体组织样本图像进行标注。

例如,可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注等,进而得到多个标注了关键特征的生命体组织样本图像。

比如,还是以区域检测模型具体为宫颈转化区的区域检测模型为例,则此时,具体可以在阴道镜宫颈样本图像中标注宫颈口附近的典型区域,并给出相应的识别框如矩形框、以及类型等信息。

其中,该典型区域相应的识别框在本发明实施例中称为典型局部识别框,为了描述方便,在本发明实施例中,将均以该识别框具体为矩形框为例进行说明,即该典型局部识别框具体可以为典型局部矩形框,其至少可以包括阴道镜宫颈图像的x坐标(横轴坐标)、y坐标(纵轴坐标)、宽和高。

(3)网络设备按照预测策略对该生命体组织样本图像,如阴道镜宫颈样本图像进行预处理,具体可以如下:

①图像尺寸缩放:将生命体组织样本图像的尺寸缩放至预设大小;比如,具体可以在将阴道镜宫颈样本图像保持宽高比的同时,将宽缩放至预设大小,如将宽缩放至600像素,等等;

②颜色通道顺序调整:将生命体组织样本图像的颜色通道顺序调整为预设顺序;比如,可以将阴道镜宫颈样本图像的三通道改为r、g和b的通道顺序,当然,如果生命体组织图像原通道顺序已经为r、g和b,则无需进行该操作;

③像素调整:按照预设策略对生命体组织样本图像中的像素进行处理,比如,可以将阴道镜宫颈样本图像中每个像素减去全图像素均值,等等;

④图像归一化:对生命体组织样本图像的每个通道值除以预设的系数,如255.0;

⑤图像数据排列:将生命体组织样本图像的图像数据排列设置为预设模式,比如,将阴道镜宫颈样本图像的图像数据排列改为通道优先,等等。

(4)网络设备采用预处理后的生命体组织样本图像训练区域检测模型。

例如,还是以区域检测模型具体为宫颈转化区的区域检测模型为例,则训练过程具体可以如下:

网络设备从预处理后的多个阴道镜宫颈样本图像中确定当前需要进行训练的阴道镜宫颈样本图像,得到当前阴道镜宫颈样本图像,然后,将该当前阴道镜宫颈样本图像导入预设目标检测模型中进行训练,得到当前阴道镜宫颈样本图像对应的区域预测值,此后,将当前阴道镜宫颈样本图像对应的区域预测值与当前阴道镜宫颈样本图像的标注的关键特征进行收敛,以对该目标检测模型的参数进行调整,并返回执行采集到的多个阴道镜宫颈样本图像中确定当前需要进行训练的阴道镜宫颈样本图像的步骤,直至该多个阴道镜宫颈样本图像均训练完毕,便可以得到所需的宫颈转化区的区域检测模型。

其中,该目标检测模型可以根据实际应用的需求进行设置,比如,该目标检测模型可以包括深度残差网络(resnet)和区域推荐网络(rpn),等等。

当该目标检测模型包括深度残差网络和区域推荐网络时,步骤“将该当前阴道镜宫颈样本图像导入预设目标检测模型中进行训练,得到当前阴道镜宫颈样本图像对应的区域预测值”可以包括:

①构建深度残差网络,将该当前阴道镜宫颈样本图像导入该深度残差网络中进行计算,得到当前阴道镜宫颈样本图像对应的输出特征(以卷积特征作为深度残差网络的输出,即该输出特征为一卷积特征)。

②构建区域推荐网络,将该当前阴道镜宫颈样本图像对应的输出特征导入区域推荐网络中进行检测,得到当前阴道镜宫颈样本图像对应的区域预测值(也称为推荐区域),其中,该区域预测值的具体表现可以为“预设的矩形框的尺寸数量*宽高比数量*矩形框参数数量”的维度向量。

其中矩形框参数可以包括x偏移量(即横坐标偏移量)、y偏移量(即纵坐标偏移量)、宽和高等参数。

(二)区域分类模型的训练。

网络设备获取多个标注了区域类型特征的区域样本图像,比如,具体可以采集多个标注了关键特征的生命体组织样本图像(如阴道镜宫颈样本图像),根据标注从该生命体组织样本图像中截取辨别区域,得到辨别区域样本,或者,也可以采集多个生命体组织样本图像,采用(一)中训练好的区域检测模型对该生命体组织样本图像进行关键特征检测,得到至少一个辨别区域样本,又或者,还可以直接采用在区域检测模型训练过程中所得到的深度残差网络的输出特征和区域推荐网络输出的区域预测值,来作为辨别区域样本,然后,对上述任意一种方式所得到的辨别区域样本进行区域类型特征标注,得到区域样本图像。

在得到区域样本之后,便可以根据区域样本图像对预设分类模型进行训练,得到区域分类模型,比如,具体可以将区域样本图像输入至预设分类模型中进行分类,得到预测的分类结果,然后,将该预测的分类结果的区域类型特征和标注的区域类型特征进行收敛,即可完成一次训练,以此类推进行多次训练,直至所有区域样本图像训练完毕,便可得到最终所需的区域分类模型,比如得到宫颈转化区的区域分类模型。

其中,区域类型特征的标注可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注,等等;区域类型特征的标注规则可根据实际应用的需求而定,比如,可用矩形框来标注类型辨别区域的区域类型特征,并给出该辨别区域的二维坐标和区域大小,等等。

比如,以宫颈转化区为例,转化区ⅰ型主要指的是位于子宫颈阴道部,可见完整的宫颈转化区,因此,转化区ⅰ型的区域类型特征为“宫颈阴道部”,且“可见完整”等特征;转化区ⅱ型指的是位于宫颈管内,通过颈管扩张器等辅助工具可见完整的宫颈转化区,因此,转化区ⅱ型的区域类型特征为“宫颈管内”,且“通过颈管扩张器等辅助工具可见完整”等特征;而转化区ⅲ型指的是借助工具,仍无法看到生理性鳞柱交界的宫颈转化区,所以,转化区ⅲ型的区域类型特征为“借助工具,仍无法看到生理性鳞柱交界”等特征。

需说明的是,在根据区域样本图像对预设分类模型进行训练之前,为了进一步提高处理效果,还可以按照预测策略对区域样本图像进行规格化(当然,如果区域样本图像已符合预设规格,则该步骤可以省略),然后,才根据规格化后的区域样本图像对预设分类模型进行训练,规格化的具体的策略可以根据实际应用的需求而定在此不做作赘述。

(三)辨别区域类型的识别。

在区域检测模型和区域分类模型训练完毕之后,便可以采用区域检测模型和区域分类模型来对辨别区域类型进行识别,如图2a所示,具体的识别流程可以如下:

201、网络设备采集待检测的生命体组织图像。

例如,网络设备具体可以接收图像采集设备发送的待检测的生命体组织图像,其中,该图像采集设备可以包括医疗监控设备或医疗检测设,如阴道镜或内窥镜等。

其中,生命体组织图像,指的是生命体的某组成部分的图像,比如人体的肠胃、心脏、喉咙和阴道等的图像,又比如狗的肠胃、甚至口腔或皮肤等的图像。了描述方便,在本实施例中,将以该生命体组织图像具体为阴道镜宫颈图像为例进行说明

202、网络设备按照预测策略对该生命体组织图像进行预处理。

其中,该预处理可以包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理,例如,图2b所示,以该生命体组织图像具体为阴道镜宫颈图像为例,如该预处理具体可以如下:

(1)图像尺寸缩放:将阴道镜宫颈图像的尺寸缩放至预设大小;比如,可以在保持图像宽高比的同时,将宽缩放至预设大小,如将宽缩放至600像素,等等;

(2)颜色通道顺序调整:将阴道镜宫颈图像的颜色通道顺序调整为预设顺序,如依次为r、g和b,当然,如果生命体组织图像原通道顺序已经为r、g和b,则无需进行该操作;

(3)像素调整:按照预设策略对阴道镜宫颈图像中的像素进行处理,比如,可以将图像中每个像素减去全图像素均值,等等;

(4)图像归一化:对每个通道值除以预设的系数,如255.0;

(5)图像数据排列:将图像数据排列设置为预设模式,比如,修改为通道优先,等等。

203、网络设备采用训练好的区域检测模型对预处理后的生命体组织图像进行关键特征检测。

例如,网络设备具体可以将预处理后的生命体组织图像导入区域检测模型中进行检测,若生命体组织图像中某个区域的关键特征与辨别区域的关键特征相符,则该区域检测模型预测该区域为辨别区域,并输出相应的预测概率。

比如,一般将生理性鳞柱交界和原始鳞柱交界围成的区域称为宫颈转化区,所以,若需要检测出的某个区域为“宫颈转化区”,则可以将“生理性鳞柱交界”和“原始鳞柱交界”围成的这部分区域作为关键特征,该关键特征可以通过典型局部矩形框来表现,具体信息比如包括该典型局部矩形框的x偏移量(即横坐标偏移量)、y偏移量(即纵坐标偏移量)、宽和高等参数值。

例如,以该生命体组织图像为阴道镜宫颈图像,且该区域检测模型包括深度残差网络(resnet)和区域推荐网络(rpn)为例,如图2b所示,网络设备可以将预处理后的阴道镜宫颈图像导入宫颈转化区的区域检测模型中进行区域检测,比如,可以将该预处理后的阴道镜宫颈图像作为深度残差网络的输入,并以卷积特征作为该深度残差网络的输出,得到该预处理后的阴道镜宫颈图像对应的输出特征,然后,将该输出特征作为区域推荐模型的输入,以“预设的矩形框的尺寸数量*宽高比数量*矩形框参数数量”的维度向量作为输出,得到预测的宫颈转化区,可选的,还可以输出相应的预测概率。

204、网络设备采用训练好的区域分类模型对该辨别区域的类型进行识别。

例如,还是以宫颈转化区的类型识别为例,如图2b所示,若在步骤203中,已经得到了预测的宫颈转化区,以及相应的特征(深度残差网络的输出特征),则此时,可以将该宫颈转化区和特征作为区域分类模型的输入进行训练,得到宫颈转化区的三维概率,即转化区ⅰ型的概率、转化区ⅱ型的概率和转化区ⅲ型的概率。

譬如,若经过识别,预测某个宫颈转化区为“转化区ⅰ型”的概率为80%,为“转化区ⅱ型”的概率为15%,为“转化区ⅲ型”的概率为5%,则此时,区域分类模型可以输出识别结果:“转化区ⅰ型,80%”、“转化区ⅱ型,15%”和“转化区ⅲ型,5%”,还可以输出各个类型相应的识别框如回归矩形框。

205、网络设备根据识别结果确定辨别区域的类型,并获取辨别区域的坐标。

例如,网络设备具体可以根据识别结果确定辨别区域中预设范围内各个识别框的类型、以及类型的置信度,通过非极大值抑制算法对该预设范围内各个识别框的类型的置信度进行计算,得到该预设范围的置信度,然后,选择置信度最大的预设范围的类型作为辨别区域的类型。

由于识别结果中可以会存在多个识别框(比如回归矩形框),且每个识别框对应有多个类型及类型的预测概率,因此,可以从每个识别框的多个类型中选择预测概率最大的类型作为该识别框的类型、并将该最大的预测概率作为该识别框的置信度。比如,还是以宫颈转化区为例,若某个识别框a属于“转化区ⅰ型”为70%,属于“转化区ⅱ型”为30%,属于“转化区ⅲ型”为0%,则可以将“转化区ⅰ型”作为识别框a的类型、并将70%作为该识别框a的置信度。

在得到各个识别框的类型、以及类型的置信度之后,便可以通过非极大值抑制算法对该预设范围内各个识别框的类型的置信度进行计算,比如,可以对该预设范围内各个识别框的类型的置信度进行比较,保留其中极大值的原数值,并将其他非极大值设置为极小值,比如(0.0),最终得到该预设范围的置信度,然后,对各个预设范围的置信度进行排序,根据排序选择置信度最大的预设范围的类型作为辨别区域的类型。

比如,以宫颈转化区为例,若某宫颈转化区的某预设范围k1包括识别框a和识别框b,识别框a的类型为“转化区ⅰ型”,置信度为70%,识别框b的类型为“转化区ⅱ型”,置信度为80%,则此时,可以确定该预设范围k1的类型为“转化区ⅱ型”,且置信度为80%;类似的,若该宫颈转化区的某预设范围k2包括识别框c和识别框d,识别框c的类型为“转化区ⅰ型”,置信度为60%,识别框d的类型为“转化区ⅱ型”,置信度为40%,则此时,可以确定该预设范围k2的类型为“转化区ⅰ型”,且置信度为60%;将预设范围k1和预设范围k2的置信度进行排序,由于k1的置信度大于k2,因此,选择预设范围k1的类型“转化区ⅱ型”作为该宫颈转化区的类型。

206、网络设备根据该坐标在该生命体组织图像上标注辨别区域的位置,并在该位置上标注辨别区域的类型。

例如,还是以宫颈转化区的类型识别为例,若某辨别区域被识别为“转化区ⅰ型”,则此时可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅰ型”;若某辨别区域被识别为“转化区ⅱ型”,则此时可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅱ型”;同理,若某辨别区域被识别为“转化区ⅲ型”,则此时可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅲ型”,以此类推,等等。

可选的,在标注时,还可以标注出该辨别区域的具体坐标,进一步的,还可以标注出识别结果的预测概率,当然,也可以标注出辨别区域的预测概率。

由上可知,本实施例可以采集待检测的生命体组织图像如阴道镜宫颈图像,然后,采用预设区域检测模型对该生命体组织图像进行关键特征检测,并采用预设区域分类模型对检测得到的至少一个辨别区域如宫颈转化区的类型进行识别,再然后,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型,以供医疗人员进行参考;由于该方案可以利用训练好的区域检测模型准确地划分出辨别区域,再通过区域分类模型有针对性地对辨别区域的类型进行识别,因此,可以避免其他区域(即非辨别区域)对类型识别的干扰,提高识别的准确率;此外,由于区域检测模型是由多个标注了关键特征的生命体组织样本图像训练而成的,而无需全面标注,因此,相对于现有方案而言,也大大降低了标注的难度,提高了标注的准确性,进而提高所训练模型的精度;总而言之,该方案可以大大提高模型的精度和识别准确率,改善识别效果。

实施例三、

为了更好地实施以上方法,本发明实施例还可以提供一种图像识别装置,该图像识别装置具体可以集成在网络设备中,该网络设备可以是终端或服务器等设备。

例如,如图3a所示,该图像识别装置可以包括采集单元301、检测单元302、识别单元303和标注单元304,如下:

(1)采集单元301;

采集单元301,用于采集待检测的生命体组织图像。

例如,采集单元301,具体可以用于接收图像采集设备发送的待检测的生命体组织图像,其中,该图像采集设备可以包括医疗检测设备,比如阴道镜或内窥镜等,或者,也可以包括医疗监控设备,等等。

其中,待检测的生命体组织图像意为需要进行检测的生命体组织图像,所谓生命体组织图像,指的是生命体的某组成部分的图像,比如人体的肠胃、心脏、喉咙和阴道等的图像。

(2)检测单元302;

检测单元302,用于采用预设区域检测模型对该生命体组织图像进行关键特征检测,得到至少一个辨别区域。

例如,检测单元302,具体可以用于将该生命体组织图像导入该区域检测模型中进行检测,若某个区域的关键特征与辨别区域的特征相符,则该区域检测模型预测该区域为辨别区域,并输出相应的预测概率。

其中,不同类型的辨别区域,其关键特征不同,而通过设置不同的关键特征,也可以找出符合不同应用场景或需求的辨别区域,比如,在宫颈癌前和癌变诊断的场景下,可以将宫颈转化区作为辨别区域,等等。

可选的,由于所采集的生命体组织图像的规格,如尺寸、像素和/或颜色通道等可能有所差异,因此,为了便于区域检测模型进行检测,改善检测效果,可以对采集到的生命体组织图像进行预处理,使得图像规格化。即如图3b所示,该图像识别装置还可以包括预处理单元305,如下:

该预处理单元,用于按照预测策略对该生命体组织图像进行预处理,该预处理包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理,具体可参见前面的实施例,在此不作赘述。

则此时,检测单元302,具体可以用于采用预设区域检测模型对预处理后的生命体组织图像进行关键特征检测。

(3)识别单元303;

识别单元303,用于采用预设区域分类模型对该辨别区域的类型进行识别,该预设区域分类模型由多个标注了区域类型特征的区域样本图像训练而成。

例如,识别单元303,具体可以用于将包含了该辨别区域的图像导入该区域分类模型中进行识别,由该区域分类模型输出关于该辨别区域的识别结果。

比如,以宫颈转化区的类型识别为例,将包含了宫颈转化区的图像导入该区域分类模型后,区域分类模型会对宫颈转化区的区域类型特征进行识别,并输出宫颈转化区的三维概率,即转化区ⅰ型的概率、转化区ⅱ型的概率和转化区ⅲ型的概率。

(4)标注单元304;

标注单元304,用于根据识别结果在该生命体组织图像上标注辨别区域的位置和类型。

例如,该标注单元可包括获取子单元和标注子单元,如下:

获取子单元,可以用于根据识别结果确定辨别区域的类型,并获取辨别区域的坐标。

比如,该获取子单元,具体可以用于根据识别结果确定辨别区域中预设范围内各个识别框的类型、以及类型的置信度,通过非极大值抑制算法对该预设范围内各个识别框的类型的置信度进行计算,得到该预设范围的置信度,选择置信度最大的预设范围的类型作为辨别区域的类型,以及获取辨别区域的坐标。

标注子单元,可以用于根据该坐标在该生命体组织图像上标注辨别区域的位置,并在该位置上标注辨别区域的类型。

例如,还是以宫颈转化区的类型识别为例,若某辨别区域被识别为“转化区ⅰ型”,则此时标注子单元可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅰ型”;若某辨别区域被识别为“转化区ⅱ型”,则标注子单元可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅱ型”;同理,若某辨别区域被识别为“转化区ⅲ型”,则标注子单元可以在阴道镜宫颈图像上标注该宫颈转化区的位置,并标注为“转化区ⅲ型”,以此类推,等等。

可选的,在标注时,标注子单元还可以标注出该辨别区域的具体坐标,进一步的,还可以标注出识别结果的预测概率,当然,也可以标注出辨别区域的预测概率。

需说明的是,其中,区域检测模型可以由多个标注了关键特征的生命体组织样本图像训练而成;比如,具体可以由其他设备进行训练后,提供给该图像识别装置,或者,也可以由该图像识别装置自行进行在线或离线训练,即如图3b所示,该图像识别装置还可以包括第一训练单元306,如下:

该采集单元301,还可以用于采集多个标注了关键特征的生命体组织样本图像。

例如,该采集单元301,具体可以用于采集多个生命体组织样本图像,采用邻域局部典型区域标注法对采集到的多个生命体组织样本图像进行标注,得到多个标注了关键特征的生命体组织样本图像。

其中,采集的途径可以有多种,比如,可以从互联网、指定数据库和/或医疗记录中进行获取,具体可以根据实际应用的需求而定;同理,标注方式也可以根据实际应用的需求进行选择,比如,可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注,等等,在此不作赘述。

第一训练单元306,可以用于根据该生命体组织样本图像对预设目标检测模型进行训练,得到区域检测模型。

例如,该第一训练单元306,具体可以用于从采集到的多个生命体组织样本图像中确定当前需要进行训练的生命体组织样本图像,得到当前生命体组织样本图像,将该当前生命体组织样本图像导入预设目标检测模型中进行训练,得到当前生命体组织样本图像对应的区域预测值,将当前生命体组织样本图像对应的区域预测值与当前生命体组织样本图像的标注的关键特征进行收敛,以对该目标检测模型的参数进行调整,返回执行采集到的多个生命体组织样本图像中确定当前需要进行训练的生命体组织样本图像的步骤,直至该多个生命体组织样本图像均训练完毕。

其中,该目标检测模型可以根据实际应用的需求进行设置,比如,该目标检测模型可以包括深度残差网络和区域推荐网络,等等。

当该目标检测模型包括深度残差网络和区域推荐网络时,该第一训练单元,具体可以用于将该当前生命体组织样本图像导入预设的深度残差网络中进行计算,得到当前生命体组织样本图像对应的输出特征;将该输出特征导入区域推荐网络中进行检测,得到当前生命体组织样本图像对应的区域预测值。

需说明的是,与对生命体组织图像进行辨别区域检测同理,由于所采集的生命体组织样本图像的规格,如尺寸、像素和/或颜色通道等可能有所差异,因此,为了便于区域检测模型进行检测,改善检测效果,可以对采集到的生命体组织样本图像进行预处理,使得图像规格化。即:

预处理单元,还可以用于按照预测策略对该生命体组织样本图像进行预处理,其中,该预处理可以包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理,具体可参见前面的实施例,在此不作赘述。

类似的,该预设区域分类模型可以由多个标注了区域类型特征的区域样本图像训练而成,具体可以由其他设备进行训练后,提供给该图像识别装置,或者,也可以由该图像识别装置自行进行在线或离线的训练,即可选的,如图3b所示,该图像识别装置还可以包括第二训练单元307,如下:

该采集单元301,还可以用于获取多个标注了区域类型特征的区域样本图像。

该第二训练单元307,可以用于根据该区域样本图像对预设分类模型进行训练,得到区域分类模型。

其中,获取标注了区域类型特征的区域样本图像的方式可以有多种,比如,可以采用如下任意一种方式:

该采集单元301,具体可以用于采集多个标注了关键特征的生命体组织样本图像,根据标注从该生命体组织样本图像中截取辨别区域,得到辨别区域样本,对辨别区域样本进行区域类型特征标注,得到区域样本图像。

或者,该采集单元301,具体可以用于采集多个生命体组织样本图像,采用预设区域检测模型对该生命体组织样本图像进行关键特征检测,得到至少一个辨别区域样本,对辨别区域样本进行区域类型特征标注,得到区域样本图像。

其中,区域类型特征的标注可以在专业医生的指点下,由标注审核人员进行人工标注,或者,也可以通过训练标注模型来实现自动标注,等等;区域类型特征的标注规则可根据实际应用的需求而定,比如,可用矩形框来标注类型辨别区域的区域类型特征,并给出该辨别区域的二维坐标和区域大小,等等。

具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。

由上可知,本实施例中图像识别装置的采集单元301可以采集待检测的生命体组织图像,然后,由检测单元302采用预设区域检测模型对该生命体组织图像进行关键特征检测,并由识别单元303采用预设区域分类模型对检测得到的至少一个辨别区域的类型进行识别,再然后,由标注单元304根据识别结果在该生命体组织图像上标注辨别区域的位置和类型,以供医疗人员进行参考;由于该方案可以利用训练好的区域检测模型准确地划分出辨别区域,再通过区域分类模型有针对性地对辨别区域的类型进行识别,因此,可以避免其他区域(即非辨别区域)对类型识别的干扰,提高识别的准确率;此外,由于区域检测模型是由多个标注了关键特征的生命体组织样本图像训练而成的,而无需全面标注,因此,相对于现有方案而言,也大大降低了标注的难度,提高了标注的准确性,进而提高所训练模型的精度;总而言之,该方案可以大大提高模型的精度和识别准确率,改善识别效果。

实施例四、

本发明实施例还提供一种网络设备,具体可以为终端,也可以为服务器,该网络设备可以集成本发明实施例所提供的任一种图像识别装置。

例如,如图4所示,其示出了本发明实施例所涉及的网络设备的结构示意图,具体来讲:

该网络设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的网络设备结构并不构成对网络设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器401是该网络设备的控制中心,利用各种接口和线路连接整个网络设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行网络设备的各种功能和处理数据,从而对网络设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据网络设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。

网络设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该网络设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出,网络设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,网络设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:

采集待检测的生命体组织图像,采用预设区域检测模型对该生命体组织图像进行关键特征检测,得到至少一个辨别区域,采用预设区域分类模型对该辨别区域的类型进行识别,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型。

例如,具体可以根据识别结果确定辨别区域的类型,并获取辨别区域的坐标,根据该坐标在该生命体组织图像上标注辨别区域的位置,并在该位置上标注辨别区域的类型。

其中,区域检测模型可以由多个标注了关键特征的生命体组织样本图像训练而成,具体可以由其他设备进行训练后,提供给该网络设备,或者,也可以由该网络设备自行进行在线或离线的训练,即处理器401还可以运行存储在存储器402中的应用程序,从而实现如下功能:

采集多个标注了关键特征的生命体组织样本图像,根据该生命体组织样本图像对预设目标检测模型进行训练,得到区域检测模型。

其中,该目标检测模型可以根据实际应用的需求进行设置,比如,该目标检测模型可以包括深度残差网络和区域推荐网络,等等。当该目标检测模型包括深度残差网络和区域推荐网络时,在训练时,具体可以将该当前生命体组织样本图像导入预设的深度残差网络中进行计算,得到当前生命体组织样本图像对应的输出特征,然后,将该输出特征导入区域推荐网络中进行检测,得到当前生命体组织样本图像对应的区域预测值。

其中,该预设区域分类模型可以由多个标注了区域类型特征的区域样本图像训练而成,具体可以由其他设备进行训练后,提供给该网络设备,或者,也可以由该网络设备自行进行在线或离线的训练,即处理器401还可以运行存储在存储器402中的应用程序,从而实现如下功能:

获取多个标注了区域类型特征的区域样本图像,根据该区域样本图像对预设分类模型进行训练,得到区域分类模型。

可选的,由于所采集的生命体组织图像或生命体组织样本图像的规格,如尺寸、像素和/或颜色通道等可能有所差异,因此,为了便于区域检测模型进行检测,改善检测效果,可以对采集到的生命体组织图像和生命体组织样本图像进行预处理,使得图像规格化,即处理器401还可以运行存储在存储器402中的应用程序,从而实现如下功能:

按照预测策略对该生命体组织图像进行预处理。

和/或,按照预测策略对该生命体组织样本图像进行预处理

其中,该预处理可以包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

由上可知,本实施例的网络设备可以采集待检测的生命体组织图像,然后,采用预设区域检测模型对该生命体组织图像进行关键特征检测,并采用预设区域分类模型对检测得到的至少一个辨别区域的类型进行识别,再然后,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型,以供医疗人员进行参考;由于该方案可以利用训练好的区域检测模型准确地划分出辨别区域,再通过区域分类模型有针对性地对辨别区域的类型进行识别,因此,可以避免其他区域(即非辨别区域)对类型识别的干扰,提高识别的准确率;此外,由于区域检测模型是由多个标注了关键特征的生命体组织样本图像训练而成的,而无需全面标注,因此,相对于现有方案而言,也大大降低了标注的难度,提高了标注的准确性,进而提高所训练模型的精度;总而言之,该方案可以大大提高模型的精度和识别准确率,改善识别效果。

实施例五、

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种图像识别方法中的步骤。例如,该指令可以执行如下步骤:

采集待检测的生命体组织图像,采用预设区域检测模型对该生命体组织图像进行关键特征检测,得到至少一个辨别区域,采用预设区域分类模型对该辨别区域的类型进行识别,根据识别结果在该生命体组织图像上标注辨别区域的位置和类型。

例如,具体可以根据识别结果确定辨别区域的类型,并获取辨别区域的坐标,根据该坐标在该生命体组织图像上标注辨别区域的位置,并在该位置上标注辨别区域的类型。

其中,区域检测模型可以由多个标注了关键特征的生命体组织样本图像训练而成,具体可以由其他设备进行训练后,提供给该网络设备,或者,也可以由该网络设备自行进行在线或离线的训练,即该指令还可以执行如下步骤:

采集多个标注了关键特征的生命体组织样本图像,根据该生命体组织样本图像对预设目标检测模型进行训练,得到区域检测模型。

其中,该目标检测模型可以根据实际应用的需求进行设置,比如,该目标检测模型可以包括深度残差网络和区域推荐网络,等等。当该目标检测模型包括深度残差网络和区域推荐网络时,在训练时,具体可以将该当前生命体组织样本图像导入预设的深度残差网络中进行计算,得到当前生命体组织样本图像对应的输出特征,然后,将该输出特征导入区域推荐网络中进行检测,得到当前生命体组织样本图像对应的区域预测值。

其中,该预设区域分类模型可以由多个标注了区域类型特征的区域样本图像训练而成,具体可以由其他设备进行训练后,提供给该网络设备,或者,也可以由该网络设备自行进行在线或离线的训练,即该指令还可以执行如下步骤:

获取多个标注了区域类型特征的区域样本图像,根据该区域样本图像对预设分类模型进行训练,得到区域分类模型。

可选的,由于所采集的生命体组织图像或生命体组织样本图像的规格,如尺寸、像素和/或颜色通道等可能有所差异,因此,为了便于区域检测模型进行检测,改善检测效果,可以对采集到的生命体组织图像和生命体组织样本图像进行预处理,使得图像规格化,即该指令还可以执行如下步骤:

按照预测策略对该生命体组织图像进行预处理。

和/或,按照预测策略对该生命体组织样本图像进行预处理

其中,该预处理可以包括图像尺寸缩放、颜色通道顺序调整、像素调整、图像归一化和/或图像数据排列调整等处理。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

其中,该存储介质可以包括:只读存储器(rom,readonlymemory)、随机存取记忆体(ram,randomaccessmemory)、磁盘或光盘等。

由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种图像识别方法中的步骤,因此,可以实现本发明实施例所提供的任一种图像识别方法所能实现的有益效果,详见前面的实施例,在此不再赘述。

以上对本发明实施例所提供的一种图像识别方法、装置和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1