图像识别方法及云端系统与流程

文档序号:14796253发布日期:2018-06-29 05:33阅读:267来源:国知局

本申请涉及图像识别技术领域,特别涉及图像识别方法及云端系统。



背景技术:

人工神经网络(ANN:Artificial Neural Network)适用于特征分类等应用场景,通常利用线性分类器对特征进行分类。目前最广泛使用的线性分类器是Softmax分类器,即对于一个类别为n的分类任务,ANN提取的特征向量xi(i=1,…,m)属于第j(j=1,…,n)类的概率Pij为:

训练过程中,损失函数定义如下:

其中,w、b均为神经网络参数,w为连接权值,b为偏移量,1{·}为示性函数,当表达式为真时,1{表达式}=1,当表达式为假时,1{表达式}=0。

Softmax分类器的分类结果依赖于特征向量和表示类中心向量的内积,通过Softmax分类器与交叉熵定义的损失函数对ANN提取的特征向量进行优化时,仅能够保证特征向量是线性可分的,但是仅线性可分的特征向量在实际应用中存在以下问题:

1)对于靠近类别边界的特征向量,易受到微小扰动造成误分类,系统的鲁棒性较低;

2)对于非分类任务(例如,人脸识别),所提取的特征向量无法保证良好的类内聚集度和类间区分度。



技术实现要素:

本申请实施例提出了图像识别方法及云端系统,以解决现有分类器对于靠近类别边界的特征向量的识别度较低,以及所提取的特征向量无法保证良好的类内聚集度和类间区分度的技术问题。

在一个方面,本申请实施例提供了一种图像识别方法,包括:

利用预设的特征提取网络获取待识别图像的特征向量;

利用预设的分类器,根据所述待识别图像的特征向量与其对应的类中心点的欧式距离得到待识别图像的识别结果。

在另一个方面,本申请实施例提供了一种图像识别云端系统,包括:

特征提取网络,用于利用预设的特征提取网络获取待识别图像的特征向量;

分类器,用于利用预设的分类器,根据所述待识别图像的特征向量与其对应的类中心点的欧式距离得到待识别图像的识别结果。

在另一个方面,本申请实施例提供了一种电子设备,所述电子设备包括:

收发设备,存储器,一个或多个处理器;以及

一个或多个模块,所述一个或多个模块被存储在所述存储器中,并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括用于执行上述方法中各个步骤的指令。

在另一个方面,本申请实施例提供了一种与电子设备结合使用的计算机程序产品,所述计算机程序产品包括计算机可读的存储介质和内嵌于其中的计算机程序机制,所述计算机程序机制包括用于执行上述方法中各个步骤的指令。

有益效果如下:

本实施例中,利用训练好的特征提取网络获取待识别图像的特征向量,以及利用训练好的分类器,根据所述待识别图像的特征向量与其对应的类中心点的欧式距离得到待识别图像的识别结果。通过对现有的分类器进行改进,增加了类内特征向量的聚集度,扩大了类间特征向量的可区分性,同时提高了云端系统的鲁棒性。

附图说明

下面将参照附图描述本申请的具体实施例,其中:

图1为本申请实施例一中图像识别的方法原理图;

图2为本申请实施例一中图像识别方法中的分类器分类示意图;

图3为本申请实施例二中图像识别的云端系统架构图;

图4为本申请实施例三中电子设备的结构示意图。

具体实施方式

以下通过具体示例,进一步阐明本发明实施例技术方案的实质。

为了使本申请的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。并且在不冲突的情况下,本说明中的实施例及实施例中的特征可以互相结合。

发明人在发明过程中注意到:

现有Softmax分类器基于特征向量的内积来度量相似度,直观性较差。对于仅线性可分,且靠近类别边界的特征向量,现有Softmax分类器极易受到微小扰动造成误分类,鲁棒性较低;对于非分类任务,所提取的特征向量也无法保证良好的类内聚集度和类间区分度。

针对上述不足/基于此,本申请实施例提出了将分类器度量相似度的方式由通过内积计算的方式改进为通过欧式距离计算的方式来实现,即,将现有的Softmax分类器中基于类中心向量的损失函数改进为基于类中心点的损失函数,从而达到增加类内特征向量聚集度,以及扩大类间特征向量可区分性的技术效果。

为了便于本申请的实施,下面实例进行说明。

实施例1

图1示出了本申请实施例一中图像识别的方法原理图,如图1所示,该方法包括:

步骤101:利用预设的特征提取网络获取待识别图像的特征向量。

步骤102:利用预设的分类器,根据所述待识别图像的特征向量与其对应的类中心点的欧式距离得到待识别图像的识别结果。

实施中,上述步骤的执行主体可以为云端服务器,云端服务器中的训练器基于图像样本,图像标签,以及初始化的修正的Softmax分类器的损失函数对ANN进行训练,在训练优化的过程中,将损失函数对ANN各层参数求偏导,并利用后向传导算法实现对ANN各层参数的优化,以使训练好的ANN能够通过提取网络获取待识别图像的特征向量,以及利用修正的Softmax分类器对待识别图像的特征向量识别,得到待识别图像的识别结果。

在本实施例中,利用第一损失函数对初始化的特征提取网络和分类器进行训练,得到预设的特征提取网络和分类器,所述第一损失函数L为:

所述

其中,Li为图像样本的特征向量xi(i=1,…,m)的损失函数,其对应的真实类别为yi,为xi的真实类别yi对应的中心点,M为预设的第一神经网络参数。

在本实施例中,所述预设的神经网络参数M的取值条件为:

所述图像样本的特征向量xi与其对应的第yi个图像类别的类中心点的欧式距离的M倍小于等于所述图像样本的特征向量xi与其它任一图像类别的类中心点的欧式距离;或者,

所述图像样本的特征向量xi属于第yi个图像类别的概率大于等于所述图像样本的特征向量xi属于其它任一图像类别的概率与预设的第二神经网络参数δ的和。

实施中,初始化的修正的Softmax分类器的损失函数的设定具体包括:

将现有Softmax分类器基于类中心向量度量相似度的方式改进为基于类中心点度量相似度的方式,即基于特征向量xi与其对应的类中心点的欧式距离实现相似度的度量,特征向量xi(i=1,…,m)属于第j类的概率为:

训练过程中,损失函数定义如下:

其中,Cj为第j(j=1,2,…,n)类的中心点,此时的损失函数无法有效提高特征向量的聚集程度,为上述损失函数引入新的参数M,改进后的损失函数为:

其中,M的取值应满足的条件为,特征向量xi与其对应的类中心点的欧式距离的M倍小于等于特征向量xi与其它任一类中心点的欧式距离,或者特征向量xi属于第yi类的概率大于等于特征向量xi属于第l类的概率与神经网络参数δ的和,即

或者

图2为本申请实施例一中图像识别方法中的分类器分类示意图,如图2所示,修正的Softmax分类器中引入新的参数M,令M=2,可见,通过在损失函数中引入新的参数M,能够进一步增加类内特征向量的聚集度,以及扩大类间特征向量的可区分性。

在本实施例中,还包括:

利用第一损失函数对初始化的特征提取网络和分类器进行训练,得到第一特征提取网络和预设的分类器;

利用预设的第二损失函数对所述第一特征提取网络进行训练,得到预设的特征提取网络。

在本实施例中,所述预设的第二损失函数LC为:

其中,为图像样本的特征向量xi(i=1,…,m)对应的第yi个图像类别的类中心点,所述第二损失函数的类中心点与所述第一损失函数的类中心点相同。

实施中,若修正的Softmax分类器的损失函数中引入的新的参数M为1时,修正的Softmax分类器的损失函数未考虑到图像类别边界的“安全范围”,则可以通过分步训练的方式实现对ANN各层参数的优化,从而达到增加类内特征向量聚集度,以及扩大类间特征向量可区分性的技术效果,训练过程具体包括:

1)对初始化的ANN特征提取网络和修正的Softmax分类器进行第一阶段训练。根据利用ANN特征提取网络提取的图像样本的特征向量和预设的图像标签,利用前向传导算法,以及修正的Softmax分类器的损失函数计算损失值,并将第一损失函数对ANN各层参数求偏导,利用后向传导算法对初始化的ANN特征提取网络和修正的Softmax分类器进行第一阶段训练,通过对ANN各层参数的优化得到训练好的第一ANN特征提取网络和修正的Softmax分类器。

2)对第一ANN特征提取网络进行第二阶段训练。固定修正的Softmax分类器,即保持ANN分类任务中各类别的类中心C不变,利用设定的第二损失函数对第一ANN特征提取网络进行训练,得到训练好的ANN特征提取网络。具体为,设定第二损失函数LC为:

将第二损失函数LC对图像样本的特征向量xi和ANN特征提取网络层参数求偏导,并利用后向传导算法实现对ANN特征提取网络层参数的优化,以使训练好的ANN特征提取网络在提取待识别图像的特征向量时精确度更高,即提取的同类特征向量的聚集度更高。

本申请以具体场景为例,对本申请实施例1进行详细描述。

本申请实施例应用范围包括但不限于基于ANN的人脸图像识别,以基于ANN的人脸图像识别为例,具体流程如下:

ANN特征提取网络和修正的Softmax分类器的训练过程:

步骤201:通过对初始化的ANN特征提取网络和修正的Softmax分类器进行第一阶段训练。根据利用ANN特征提取网络提取的图像样本的特征向量和预设的图像标签,利用前向传导算法,以及修正的Softmax分类器的损失函数计算损失值,并将第一损失函数对ANN各层参数求偏导,利用后向传导算法对ANN各层参数进行优化,得到第一特征提取网络和修正的Softmax分类器,第一损失函数定义如下:

其中,Li为图像样本的特征向量xi(i=1,…,m)的损失函数,其对应的真实类别为yi,为xi的真实类别yi对应的中心点,M为预设的第一神经网络参数。

步骤202:若修正的Softmax分类器的损失函数中引入的新的参数M为1,则对第一ANN特征提取网络进行第二阶段训练。具体包括:

保持ANN分类任务中各类别的类中心C不变,利用设定的第二损失函数对第一ANN特征提取网络进行训练,得到训练好的ANN特征提取网络,即对修正的Softmax分类器不做训练,仅对ANN特征提取网络层参数进行第二阶段优化,第二损失函数定义如下:

将第二损失函数LC对图像样本的特征向量xi和ANN特征提取网络层参数求偏导,并利用后向传导算法实现对ANN特征提取网络层参数的优化,得到训练好的ANN特征提取网络。

基于训练好的ANN特征提取网络和修正的Softmax分类器的识别过程:

步骤203:获取待识别图像,利用训练好的ANN特征提取网络提取待识别图像的特征向量,以及利用修正的Softmax分类器对待识别图像的特征向量进行识别,得到待识别图像的识别结果。

实施例2

基于同一发明构思,本申请实施例中还提供了一种图像识别云端系统,由于这些设备解决问题的原理与一种图像识别方法相似,因此这些设备的实施可以参见方法的实施,重复之处不再赘述。

图3示出了本申请实施例二中图像识别的云端系统架构图,如图3所示,图像识别云端系统300可以包括:

特征提取网络301,用于利用预设的特征提取网络获取待识别图像的特征向量;

分类器302,用于利用预设的分类器,根据所述待识别图像的特征向量与其对应的类中心点的欧式距离得到待识别图像的识别结果。

训练器303,用于利用第一损失函数对初始化的特征提取网络和分类器进行训练,得到预设的特征提取网络和分类器,所述第一损失函数L为:

所述

其中,Li为图像样本的特征向量xi(i=1,…,m)的损失函数,其对应的真实类别为yi,为xi的真实类别yi对应的中心点,M为预设的第一神经网络参数。

在本实施例中,所述预设的神经网络参数M的取值条件为:

所述图像样本的特征向量xi与其对应的第yi个图像类别的类中心点的欧式距离的M倍小于等于所述图像样本的特征向量xi与其它任一图像类别的类中心点的欧式距离;或者,

所述图像样本的特征向量xi属于第yi个图像类别的概率大于等于所述图像样本的特征向量xi属于其它任一图像类别的概率与预设的第二神经网络参数δ的和。

在本实施例中,所述训练器303,还用于利用第一损失函数对初始化的特征提取网络和分类器进行训练,得到第一特征提取网络和预设的分类器;以及,

利用预设的第二损失函数对所述第一特征提取网络进行训练,得到预设的特征提取网络。

在本实施例中,所述预设的第二损失函数LC为:

其中,为图像样本的特征向量xi(i=1,…,m)对应的第yi个图像类别的类中心点,所述第二损失函数的类中心点与所述第一损失函数的类中心点相同。

实施例3

基于同一发明构思,本申请实施例中还提供了一种电子设备,由于其原理与一种图像识别方法相似,因此其实施可以参见方法的实施,重复之处不再赘述。

图4示出了本申请实施例三中电子设备的结构示意图,如图4所示,所述电子设备包括:收发设备401,存储器402,一个或多个处理器403;以及一个或多个模块,所述一个或多个模块被存储在所述存储器中,并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括用于执行任一上述方法中各个步骤的指令。

实施例4

基于同一发明构思,本申请实施例还提供了一种与电子设备结合使用的计算机程序产品,由于其原理与一种图像识别方法相似,因此其实施可以参见方法的实施,重复之处不再赘述。所述计算机程序产品包括计算机可读的存储介质和内嵌于其中的计算机程序机制,所述计算机程序机制包括用于执行任一上述方法中各个步骤的指令。

为了描述的方便,以上所述装置的各部分以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块或单元的功能在同一个或多个软件或硬件中实现。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1