一种图像分类方法、装置、终端设备和存储介质

文档序号:24622921发布日期:2021-04-09 20:28阅读:45来源:国知局
一种图像分类方法、装置、终端设备和存储介质

本申请涉及图像处理技术领域,尤其涉及一种图像分类方法、装置、终端设备和存储介质。



背景技术:

胶囊内窥镜是一种做成胶囊形状的内窥镜,用于窥探人体肠胃和食道等部位的健康状态,帮助医生对患者进行精确的病患诊断。

目前,针对胶囊内窥镜图像的处理,通常是采用一个神经网络结构的图像分类模型对图像进行分类处理,以辨别正常图像或者病变图像。

然而,由于现有的胶囊内窥镜数据集图像数量有限,以及病变区域特征和正常区域特征之间较难区分等原因,导致对胶囊内窥镜图像分类的准确性较低。



技术实现要素:

有鉴于此,本申请实施例提供了一种图像分类方法、装置、终端设备和存储介质,能够提高图像分类的准确性。

本申请实施例的第一方面提供了一种图像分类方法,包括:

获取待分类图像;

将所述待分类图像输入第一分类网络,得到所述待分类图像的第一类别预测结果以及所述待分类图像的显著图,所述显著图包含所述待分类图像中各个位置的显著值;

根据所述显著图对所述待分类图像执行图像变形处理,得到将所述待分类图像中的目标位置放大的变形图像,其中,所述目标位置为所述待分类图像中显著值大于指定数值的位置;

将所述变形图像输入第二分类网络,得到所述待分类图像的第二类别预测结果;

根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果。

本申请实施例在获取待分类图像后,会将该待分类图像输入一个分类网络以获得对应的显著性图像以及一个类别预测结果,该显著性图像标注出待分类图像中各个位置的显著值。然后,根据该显著图对该待分类图像进行图像变形处理,从而获得将图像中的目标位置放大的变形图像。接着,采用另一个分类网络对该变形图像进行识别,得到另一个类别预测结果,最后结合两个类别预测结果获得最终的图像分类结果。以病变图像的识别为例,由于病变图像中病变区域的显著值较大,因此会获得将图像中的病变区域放大的变形图像,而通过将病变区域放大,图像中的病变特征也会相应的对整幅图像的特征产生更大的贡献,故能够提高对病变图像识别的准确性。

在本申请的一个实施例中,所述第一分类网络具有多个卷积模块,将所述待分类图像输入第一分类网络,得到所述待分类图像的显著图,可以包括:

在将所述待分类图像输入所述第一分类网络后,通过所述多个卷积模块提取所述待分类图像的图像特征;

根据所述图像特征在所述待分类图像的各个位置对应的特征值,构建得到所述待分类图像的显著图。

采用卷积模块可以提取图像特征,而根据图像特征在图像中各个位置的特征值,则可以确定图像中各个位置的显著值,从而获得图像的显著图。

在本申请的一个实施例中,根据所述显著图对所述待分类图像执行图像变形处理,得到将所述待分类图像中的目标位置放大的变形图像,可以包括:

根据所述显著图构建所述待分类图像的采样点分布图像,其中,所述采样点分布图像记录在所述待分类图像中分布的各个采样点,所述待分类图像中每个位置的采样点分布密度和该位置的显著值成正比;

根据所述采样点分布图像对所述待分类图像进行采样,得到所述变形图像。

在对待分类图像进行变形时,根据图像中不同位置的显著值确定该位置的采样密度,显著值越大的目标区域,采样越密集;反之在显著值越小的一般区域,采样会非常稀疏。经过变形得到的图像会将目标区域放大,而将一般区域压缩。

进一步的,根据所述显著图构建所述待分类图像的采样点分布图像,可以包括:

根据所述待分类图像的尺寸生成采样点均匀分布的初始图像;

基于所述显著图包含的所述待分类图像中各个位置的显著值,采用高斯分布的卷积核对所述初始图像进行卷积处理,得到所述采样点分布图像。

在根据显著图构建该采样点分布图像时,首先可以根据该待分类图像的尺寸生成采样点均匀分布的一个初始图像,也即初始采样场;然后,采用高斯分布的卷积核对该均价分布的初始采样场进行卷积,其中的每个采样点会以一个和其显著值成正比的力牵引周围的采样点,因此高显著值的目标区域会以较大的力吸引周围的采样点,从而产生密集分布的采样点。反之,低显著值的区域对周围采样点的牵引力比较小,因此产生的采样点分布比较稀疏。

在本申请的一个实施例中,所述图像分类方法还可以包括:

根据所述第二类别预测结果计算所述第二分类网络的损失函数;

根据所述第二分类网络的损失函数对所述第一分类网络的参数进行优化。

两个分类网络的参数都是可以训练和优化的,可以采用端到端的方式进行训练。如果第一分类网络生成的显著图不准确,则会到至第二分类网络输入的图像达不到期望的形变,从而导致第二分类网络的识别精度低,产生较大的损失函数,该损失函数会产生梯度反向传播到第一分类网络,对第一分类网络的参数进行纠正和优化。

在本申请的一个实施例中,所述图像分类方法还可以包括:

根据所述第一类别预测结果计算所述第一分类网络的损失函数;

根据所述第一分类网络的损失函数对所述第二分类网络的参数进行优化。

在获得第一类别预测结果后,可以根据该第一类别预测结果计算得到该第一分类网络的损失函数,然后采用梯度反向传播的方式,结合第一分类网络的损失函数对第二分类网络的参数进行纠正和优化,从而提升第二分类网络的性能。

在本申请的一个实施例中,所述第一类别预测结果包含预设的多个图像类别中每个图像类别的概率预测值,所述第二类别预测结果同样包含所述多个图像类别中每个图像类别的概率预测值,根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果,可以包括:

对于所述多个图像类别中的每个图像类别,分别计算该图像类别在所述第一类别预测结果中的概率预测值和该图像类别在所述第二类别预测结果中的概率预测值的平均值,得到所述多个图像类别中每个图像类别的目标概率预测值;

将所述多个图像类别中所述目标概率预测值最大的图像类别确定为所述待分类图像的分类结果。

例如一共有k个图像类别,则会输出k维的分布,也即k个图像类别分别对应的概率预测值,第一分类网络和第二分类网络各自获得k维概率分布的输出。然后,对于每个图像类别,分别计算其在第一分类网络中获得的概率预测值和在第二分类网络中获得的概率预测值的平均值,从而得到每个图像类别对应的目标概率预测值,最后将这些图像类别中该目标概率预测值最大的图像类别确定为该待分类图像的最终分类结果。

本申请实施例的第二方面提供了一种图像分类装置,包括:

图像获取模块,用于获取待分类图像;

第一图像分类模块,用于将所述待分类图像输入第一分类网络,得到所述待分类图像的第一类别预测结果以及所述待分类图像的显著图,所述显著图包含所述待分类图像中各个位置的显著值;

图像变形处理模块,用于根据所述显著图对所述待分类图像执行图像变形处理,得到将所述待分类图像中的目标位置放大的变形图像,其中,所述目标位置为所述待分类图像中显著值大于指定数值的位置;

第二图像分类模块,用于将所述变形图像输入第二分类网络,得到所述待分类图像的第二类别预测结果;

分类结果确定模块,用于根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果。

本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例的第一方面提供的图像分类方法的步骤。

本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请实施例的第一方面提供的图像分类方法的步骤。

本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行本申请实施例的第一方面所述的图像分类方法的步骤。

可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种图像分类方法的一个实施例的流程图;

图2是本申请实施例提供的一种图像分类方法的另一个实施例的流程图;

图3是本申请实施例提出的图像分类方法在一个实际应用场景下的操作示意图;

图4是本申请实施例提供的一种图像分类装置的一个实施例的结构图;

图5是本申请实施例提供的一种终端设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

针对现有技术中对胶囊内窥镜图像分类的准确性较低的问题,本申请实施例提出一种图像分类方法、装置、终端设备和存储介质,能够提高图像分类的准确性。应当理解,本申请各个方法实施例的执行主体可以为各种类型的终端设备或服务器,比如手机、平板电脑、笔记本电脑、台式电脑、可穿戴设备和各类医疗图像分析设备等。

请参阅图1,示出了本申请实施例提出的一种图像分类方法,包括:

101、获取待分类图像;

首先,获取待分类图像,待分类图像可以是任意类型和主题的需要进行分类的图像。例如,待分类图像可以是一幅人体器官内部的胶囊内窥镜图像,需要对其进行分类,以确定其为正常图像或者为病变图像。

102、将所述待分类图像输入第一分类网络,得到所述待分类图像的第一类别预测结果以及所述待分类图像的显著图;

在获取到该待分类图像之后,将其输入某个预先训练完成的第一分类网络,得到一个针对该待分类图像的初步分类结果以及该待分类图像的显著图。具体的,该第一分类网络可以是各种结构的神经网络模型,通过带有类别标签的样本图像集训练获得。将一幅图像输入第一分类网络后,通过网络的卷积层提取图像特征,然后采用全连接层对图像特征进行处理,得到该图像的类别预测结果,也即该图像属于预设的多个类别中每个类别的概率分布。

另一方面,通过将该待分类图像输入第一分类网络,还能够获得该待分类图像的显著图(也称作注意力图)。显著图是显示每个图像像素独特性的图像,是图像分区的一部分,通常用于定位图像中的物体和边界,图像显著性是图像中重要的视觉特征,体现出人眼对图像各区域的重视程度。具体的,该显著图可以包含该待分类图像中各个位置的显著值(也称作注意力值),用于标注出图像中哪个位置更为显著,显著值越高则表示对应的图像位置在整体图像中的显著性越高。采用显著图,对图像的分类结果有很大的作用,例如在病变图像中,病变区域由于具有更大的显著值而被标注出来,在后续的图像分类过程中则可以提高该病变区域图像特征的权重,从而提高病变图像识别的准确性。

在本申请的一个实施例中,所述第一分类网络具有多个卷积模块,将所述待分类图像输入第一分类网络,得到所述待分类图像的显著图,可以包括:

(1)在将所述待分类图像输入所述第一分类网络后,通过所述多个卷积模块提取所述待分类图像的图像特征;

(2)根据所述图像特征在所述待分类图像的各个位置对应的特征值,构建得到所述待分类图像的显著图。

采用卷积模块可以提取图像特征,而根据图像特征在图像中各个位置的特征值,则可以确定图像中各个位置的显著值,从而获得图像的显著图。例如,一幅大小为224*224的待分类图像输入第一网络后,经过多个稠密卷积模块提取特征(如最后一层的特征图像大小为7*7*c,c为特征图像的通道数),然后通过全连接层预测类别概率分布,预测结果由类别标签监督,并通过交叉熵损失函数进行优化。而第一网络经过训练之后,大小为7*7*c的特征图像会在类别相关的区域(例如病变图像中的人体组织病变区域)产生较高的响应,即具有较高的图像特征值,对应的图像显著值也越高,通过对各个图像通道求平均等方式,可以得到该待分类图像的显著图(注意力图)。

103、根据所述显著图对所述待分类图像执行图像变形处理,得到将所述待分类图像中的目标位置放大的变形图像;

在获得待分类图像的显著图后,会根据该显著图对该待分类图像执行图像变形的处理,从而得到将该待分类图像中的目标位置放大的变形图像,其中,所述目标位置为所述待分类图像中显著值大于指定数值的位置。根据该显著图可以获知图像中各个位置的显著值大小,从而能够将图像中显著值较大的目标位置进行放大,获得变形的图像,具体的图像变形处理方法,可以参照本申请的下一个实施例。

104、将所述变形图像输入第二分类网络,得到所述待分类图像的第二类别预测结果;

在获得变形图像之后,会将该变形图像输入某个预先训练完成的第二分类网络,得到一个针对该变形图像的分类结果。具体的,该第二分类网络的结构和类型可以和该第一分类网络相同,也可以和该第一分类网络不同。将一幅变形图像输入该第二分类网络后,经过多个稠密连接的卷积块提取变形图像的特征图,然后由全连接层对特征图进行处理,得到该待变形图像的类别预测结果,可视作该待分类图像的类别预测结果。

105、根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果。

最后,综合两个分类网络对该待分类图像的类别预测结果,从而获得该待分类图像最终的分类结果。例如,可以通过计算两个类别预测结果的平均值等方式获得最终分类结果。

在本申请的一个实施例中,所述图像分类方法还可以包括:

根据所述第二类别预测结果计算所述第二分类网络的损失函数;

根据所述第二分类网络的损失函数对所述第一分类网络的参数进行优化。

在本申请实施例中,两个分类网络是相互联系的,通过第一分类网络获得的显著图,能够将待分类图像中的目标区域放大,从而提升第二分类网络进行图像识别的精度。而且,两个分类网络的参数都是可以训练和优化的,可以采用端到端的方式进行训练。如果第一分类网络生成的显著图不准确,则会到至第二分类网络输入的图像达不到期望的形变,从而导致第二分类网络的识别精度低,产生较大的损失函数,该损失函数会产生梯度反向传播到第一分类网络,对第一分类网络的参数进行纠正和优化。总的来说,在获得第二类别预测结果后,可以根据该第二类别预测结果计算得到该第二分类网络的损失函数,然后采用梯度反向传播的方式,结合第二分类网络的损失函数对第一分类网络的参数进行纠正和优化,从而提升第一分类网络的性能。

在本申请的一个实施例中,所述图像分类方法还可以包括:

根据所述第一类别预测结果计算所述第一分类网络的损失函数;

根据所述第一分类网络的损失函数对所述第二分类网络的参数进行优化。

由于两个分类网络是相互联系的,因此采用第一分类网络的损失函数也可以对第二分类网络的参数进行训练和优化。在获得第一类别预测结果后,可以根据该第一类别预测结果计算得到该第一分类网络的损失函数,然后采用梯度反向传播的方式,结合第一分类网络的损失函数对第二分类网络的参数进行纠正和优化,从而提升第二分类网络的性能。

在本申请的一个实施例中,所述第一类别预测结果包含预设的多个图像类别中每个图像类别的概率预测值,所述第二类别预测结果同样包含所述多个图像类别中每个图像类别的概率预测值,根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果,可以包括:

(1)对于所述多个图像类别中的每个图像类别,分别计算该图像类别在所述第一类别预测结果中的概率预测值和该图像类别在所述第二类别预测结果中的概率预测值的平均值,得到所述多个图像类别中每个图像类别的目标概率预测值;

(2)将所述多个图像类别中所述目标概率预测值最大的图像类别确定为所述待分类图像的分类结果。

将图像输入第一分类网络后,会通过多个稠密连接的卷积块提取图像特征图,然后由全连接层对图像特征图进行处理,得到预设的多个图像类别中每个类别的概率预测值,第二分类网络输出的同样为该多个图像类别中每个类别的概率预测值。例如一共有k个图像类别,则会输出k维的分布,也即k个图像类别分别对应的概率预测值,第一分类网络和第二分类网络各自获得k维概率分布的输出。然后,对于每个图像类别,分别计算其在第一分类网络中获得的概率预测值和在第二分类网络中获得的概率预测值的平均值,从而得到每个图像类别对应的目标概率预测值,最后将这些图像类别中该目标概率预测值最大的图像类别确定为该待分类图像的最终分类结果。

本申请实施例在获取待分类图像后,会将该待分类图像输入一个分类网络以获得对应的显著性图像以及一个类别预测结果,该显著性图像标注出待分类图像中各个位置的显著值。然后,根据该显著图对该待分类图像进行图像变形处理,从而获得将图像中的目标位置放大的变形图像。接着,采用另一个分类网络对该变形图像进行识别,得到另一个类别预测结果,最后结合两个类别预测结果获得最终的图像分类结果。以病变图像的识别为例,由于病变图像中病变区域的显著值较大,因此会获得将图像中的病变区域放大的变形图像,而通过将病变区域放大,图像中的病变特征也会相应的对整幅图像的特征产生更大的贡献,故能够提高对病变图像识别的准确性。

请参阅图2,示出了本申请实施例提出的另一种图像分类方法,包括:

201、获取待分类图像;

202、将所述待分类图像输入第一分类网络,得到所述待分类图像的第一类别预测结果以及所述待分类图像的显著图;

步骤201-202与步骤101-102相同,具体可参照步骤101-102的相关描述。

203、根据所述显著图构建所述待分类图像的采样点分布图像;

在获得待分类图像的显著图后,可以根据该显著图构建该待分类图像的采样点分布图像。其中,该采样点分布图像记录在该待分类图像中分布的各个采样点,该待分类图像中每个位置的采样点分布密度和该位置的显著值成正比。采样点分布图像也可以称作变形采样场,其中,显著值越大的区域,采样点分布越密集,显著值越小的区域,采样点分布越稀少。该采样点分布图像本质上是一些不规则分布的采样点,例如,由于胶囊内窥镜图像的原始大小为576*576或者360*360,为了减小分类网络的计算量,需要在将图像送入分类网络前对其进行降采样。对于普通的降采样,是通过对原始图像进行均匀采样实现的。而采用该变形采样场,在降采样的过程中会对原始图像进行不规则采样,比如在病变区域会分配更多的采样点,那么采样后的图像会对病变区域进行放大。

进一步的,根据所述显著图构建所述待分类图像的采样点分布图像,可以包括:

(1)根据所述待分类图像的尺寸生成采样点均匀分布的初始图像;

(2)基于所述显著图包含的所述待分类图像中各个位置的显著值,采用高斯分布的卷积核对所述初始图像进行卷积处理,得到所述采样点分布图像。

在根据显著图构建该采样点分布图像时,首先可以根据该待分类图像的尺寸生成采样点均匀分布的一个初始图像,也即初始采样场;然后,采用高斯分布的卷积核对该均价分布的初始采样场进行卷积,其中的每个采样点会以一个和其显著值成正比的力牵引周围的采样点,因此高显著值的目标区域会以较大的力吸引周围的采样点,从而产生密集分布的采样点。反之,低显著值的区域对周围采样点的牵引力比较小,因此产生的采样点分布比较稀疏。

204、根据所述采样点分布图像对所述待分类图像进行采样,得到将所述待分类图像中的目标位置放大的变形图像;

在获得不规则分布的采样点分布图像后,根据该采样点分布图像对该待分类图像进行采样,能够得到将该待分类图像中的目标位置放大的变形图像。具体的,在对待分类图像进行变形时,根据图像中不同位置的显著值确定该位置的采样密度,显著值越大的目标区域,采样越密集;反之在显著值越小的一般区域,采样会非常稀疏。经过此采样场变形得到的图像会将目标区域放大,而将一般区域压缩。例如,对于病变图像来说,经过该采样场变形会将病变区域放大,而将正常的非病变区域压缩。

205、将所述变形图像输入第二分类网络,得到所述待分类图像的第二类别预测结果;

206、根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果。

步骤205-206与步骤104-105相同,具体可参照步骤104-105的相关说明。

本申请实施例在获取待分类图像后,会将该待分类图像输入一个分类网络以获得对应的显著性图像以及一个类别预测结果,该显著性图像标注出待分类图像中各个位置的显著值。然后,根据该显著图构建对应的采样点分布图像,并基于该采样点分布图像对待分类图像进行采样,得到将待分类图像中的目标位置放大的变形图像。接着,采用另一个分类网络对该变形图像进行识别,得到另一个类别预测结果,最后结合两个类别预测结果获得最终的图像分类结果。与本申请的第一个实施例相比,本实施例提出了一种根据显著图获得待分类图像对应变形图像的具体实施方式。

为便于理解,下面以实际的应用场景来说明本申请提出的图像分类方法。

如图3所示,为本申请实施例提出的图像分类方法在一个实际应用场景下的操作示意图。

在图3中,待分类图像是一幅原始的胶囊内窥镜图像,需要识别该图像是否为病变图像,采用的分类网络1和分类网络2均为同一结构的densenet网络。首先,将该胶囊内窥镜图像输入已训练的分类网络1,在图像标签的监督下,该分类网络1会输出该胶囊内窥镜图像所属的类别(记为诊断结果1),并且自动学习出注意力图(显著图),在此注意力图中,输入图像的病变区域的注意力值较大,而背景的非病变区域的注意力值较小。由此可见,注意力图可以在一定程度上实现病变位置标注的作用,以自动学习的方式指示图像中病变区域的大致位置。然后,根据该注意力图上各个图像位置点的注意力值的分布,构建得到一个变形采样场,其中,注意力值较大的病变区域对应的采样点分布越密集,反之注意力值较小的非病变区域对应的采样点分布越稀疏。接着,采用该变形采样场对该原始的胶囊内窥镜图像进行采样,能够得到将图像中的病变区域放大以及将非病变区域压缩的变形图像。在这之后,将该变形图像输入分类网络2,由于病变区域被放大,病变特征也会相应的对整幅图像的特征产生更大的贡献,因此分类网络2能够获得更为准确的图像分类结果,从而提高病变图像诊断结果的准确性。采用分类网络2获得的图像分类结果记为诊断结果2,最后结合诊断结果1和诊断结果2,可以获得该胶囊内窥镜图像的最终诊断结果(最终分类结果),具体可以采用计算诊断结果1和诊断结果2的平均值等方式得到最终的诊断结果。

另外,在分类网络的训练阶段中,两个网络都是由图像标签和预测值计算出的损失函数监督进行优化,可以起到相互促进的作用。具体的,若分类网络1的注意力图能够准确地标示病变的区域,则能够使病变区域得到放大,从而提升分类网络2的精度。最后,通过两个网络集成的方式,能够综合两个网络的优势,得到更加准确的病变图像诊断结果。

根据以上内容可以获知,本申请可用于胶囊内窥镜图像的疾病诊断,尤其适用于带有小面积疾病区域的病变图像的识别,例如人体组织小面积的出血、溃疡以及息肉等病变图像的识别。需要说明的是,本申请并不限定待分类图像的类别,可适用于在图像标签下对任意类型小物体的检测以及分类的问题。

应理解,上述各个实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

上面主要描述了一种图像分类方法,下面将对一种图像分类装置进行描述。

请参阅图4,本申请实施例中一种图像分类装置的一个实施例包括:

图像获取模块401,用于获取待分类图像;

第一图像分类模块402,用于将所述待分类图像输入第一分类网络,得到所述待分类图像的第一类别预测结果以及所述待分类图像的显著图,所述显著图包含所述待分类图像中各个位置的显著值;

图像变形处理模块403,用于根据所述显著图对所述待分类图像执行图像变形处理,得到将所述待分类图像中的目标位置放大的变形图像,其中,所述目标位置为所述待分类图像中显著值大于指定数值的位置;

第二图像分类模块404,用于将所述变形图像输入第二分类网络,得到所述待分类图像的第二类别预测结果;

分类结果确定模块405,用于根据所述第一类别预测结果和所述第二类别预测结果确定所述待分类图像的分类结果。

在本申请的一个实施例中,所述第一图像分类模块可以包括:

图像特征提取单元,用于在将所述待分类图像输入所述第一分类网络后,通过所述多个卷积模块提取所述待分类图像的图像特征;

显著图构建单元,用于根据所述图像特征在所述待分类图像的各个位置对应的特征值,构建得到所述待分类图像的显著图。

在本申请的一个实施例中,所述图像变形处理模块可以包括:

采样点分布图像构建单元,用于根据所述显著图构建所述待分类图像的采样点分布图像,其中,所述采样点分布图像记录在所述待分类图像中分布的各个采样点,所述待分类图像中每个位置的采样点分布密度和该位置的显著值成正比;

图像采样单元,用于根据所述采样点分布图像对所述待分类图像进行采样,得到所述变形图像。

进一步的,所述采样点分布图像构建单元可以包括:

初始图像生成子单元,用于根据所述待分类图像的尺寸生成采样点均匀分布的初始图像;

卷积处理子单元,用于基于所述显著图包含的所述待分类图像中各个位置的显著值,采用高斯分布的卷积核对所述初始图像进行卷积处理,得到所述采样点分布图像。

在本申请的一个实施例中,所述图像分类装置还可以包括:

第二损失函数计算模块,用于根据所述第二类别预测结果计算所述第二分类网络的损失函数;

第一分类网络优化模块,用于根据所述第二分类网络的损失函数对所述第一分类网络的参数进行优化。

在本申请的一个实施例中,所述图像分类装置还可以包括:

第一损失函数计算模块,用于根据所述第一类别预测结果计算所述第一分类网络的损失函数;

第二分类网络优化模块,用于根据所述第一分类网络的损失函数对所述第二分类网络的参数进行优化。

在本申请的一个实施例中,所述第一类别预测结果包含预设的多个图像类别中每个图像类别的概率预测值,所述第二类别预测结果同样包含所述多个图像类别中每个图像类别的概率预测值,所述分类结果确定模块可以包括:

概率预测值计算单元,用于对于所述多个图像类别中的每个图像类别,分别计算该图像类别在所述第一类别预测结果中的概率预测值和该图像类别在所述第二类别预测结果中的概率预测值的平均值,得到所述多个图像类别中每个图像类别的目标概率预测值;

分类结果确定单元,用于将所述多个图像类别中所述目标概率预测值最大的图像类别确定为所述待分类图像的分类结果。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如图1或图2表示的任意一种图像分类方法的步骤。

本申请实施例还提供一种计算机程序产品,当该计算机程序产品在终端设备上运行时,使得终端设备执行实现如图1或图2表示的任意一种图像分类方法的步骤。

图5是本申请一实施例提供的终端设备的示意图。如图5所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述各个图像分类方法的实施例中的步骤,例如图2所示的步骤201至205。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块401至405的功能。

所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。

所称处理器50可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1