一种基于卷积神经网络的图像分类方法和装置制造方法

文档序号：6515300阅读：307来源：国知局

一种基于卷积神经网络的图像分类方法和装置制造方法
【专利摘要】本发明公开了一种基于卷积神经网络的图像分类方法和装置，所述方法通过接收输入的多个类别的图像样本，计算出每一个类别的图像对应的神经网络权值；采用分层结构对多个类别图像的对应神经网络权值进行分布，每一层形成对应的学习库；对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中；通过分层分布的结构解决了传统卷积神经网络在分类数量上的局限性，防止了卷积神经网络的过学习问题，扩大了卷积神经网络本身的分类能力，并提高了分类的精确性，使得图像分类算法在新的环境中具有更高的鲁棒性。
【专利说明】一种基于卷积神经网络的图像分类方法和装置
【技术领域】
[0001]本发明涉及图像分类方法【技术领域】，尤其涉及的是一种基于卷积神经网络的图像分类方法和装置。
【背景技术】
[0002]现有的图像分类方法，常用的分类方法有监督学习方法譬如神经网络和支持向量机等、非监督学习方法譬如K均值聚类和近邻法等。传统神经网络属于监督学习方法，是通过对已有样本学习的基础上获取到所学对象的神经网络权值特征描述，并根据所学到的知识对外界环境中已学习的库的类别进行区分判断，但由于所学习的对象特征知识的有限性，对于外界变化环境中的测试对象，有可能会超出原来已有的学习知识范围，使得对所学对象在新的复杂环境下的识别分类效果不好。
[0003]进一步地，由于现有方式采用的非对称映射矩阵，该矩阵的维数决定了基于该结构的卷积神经网络所能进行分类的数量，当在对于较多图像类别进行分类的过程中往往会造成神经网络本身因为数据过多、对所学的某些类别无法进行学习和识别，导致出现神经网络学习过程中常见的“over fitting”问题，即过学习问题。
[0004]因此，现有技术还有待于改进和发展。

【发明内容】

[0005]本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种基于卷积神经网络的图像分类方法和装置，旨在解决现有的神经网络图像分类方法分类效果不好、容易产生过学习现象的问题。
[0006]本发明解决技术问题所采用的技术方案如下:
一种基于卷积神经网络的图像分类方法，其中，包括以下步骤:
A、接收输入的多个类别的图像样本，对输入的每一个类别的图像样本数据进行归一化，将归一化后的图像样本数据进行卷积，再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射，并将映射后的图像样本数据进行排列得到对应的一维特征描述，根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值；
B、采用分层结构对多个类别图像的对应神经网络权值进行分布，且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目，将多个类别图像在多层中依次分布，每一层形成对应的学习库；
C、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中。
[0007]所述的基于卷积神经网络的图像分类方法，其中，所述步骤A具体包括:
Al、接收输入的多个类别的图像样本，将输入的每一个类别的图像样本数据进行归一
化；A2、对归一化的图像样本数据进行卷积，得到相应的多个卷积结果；
A3、对多个卷积结果进行一半的降采样；
A4、对降采样后的卷积结果进行再次卷积，并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射；
A5、对映射后的图像样本数据进行一半的降采样，并对降采样的结果进行排列得到该图像的一维特征描述；
A6、对所述一维特征描述进行预订的降采样得到缩减后的特征向量；
A7、将所述特征向量输入神经网络，进入神经网络的学习过程，进行前馈学习和BP反馈方式调节，得到相应的神经网络权值。[0008]所述的基于卷积神经网络的图像分类方法，其中，所述步骤B具体包括:
B1、对N个类别的图像样本，根据所述非对称映射矩阵确定的最大区分类别数目M ；
B2、建立NUM层学习类别，NUM为(N/(M-1))且为(N/(M-1))取向上的整数；
B3、对于每一层，采用最大区分类别数目M个类别来构建，依次在NUM层中来完成N个类别的分布；
B4、通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
[0009]所述的基于卷积神经网络的图像分类方法，其中，所述步骤B还包括:
B5、当有新的类别加入时，放入最后一组分层中并对该层重新进行学习形成新的学习库。
[0010]所述的基于卷积神经网络的图像分类方法，其中，所述步骤C具体包括:
Cl、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述；
C2、进入第i层，其中i=l，2，3……NUM，i初始化为1，即将测试类别图像样本数据对应的一维特征描述与所述第i层对应的学习库中的神经网络权值进行前馈学习，若能区分出类别出来则给出结果，并退出该层；若不能分类，则认为所述测试类别是该层中未学习的类别；
C3、进入下一层，即第i+Ι层，重复进行前馈学习，若能区分出类别出来则给出结果，并退出该层；若不能分类，则认为所述测试类别是该层中未学习的类别；直至第NUM层，若在最后也没有被识别出来，则所测试的类别不在所学习的类别当中。
[0011]一种基于卷积神经网络的图像分类装置，其中，包括:
神经网络权值获取模块，用于接收输入的多个类别的图像样本，对输入的每一个类别的图像样本数据进行归一化，将归一化后的图像样本数据进行卷积，再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射，并将映射后的图像样本数据进行排列得到对应的一维特征描述，根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值；
分层模块，用于采用分层结构对多个类别图像的对应神经网络权值进行分布，且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目，将多个类别图像在多层中依次分布，每一层形成对应的学习库；
分类判断模块，用于对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中。[0012]所述的基于卷积神经网络的图像分类装置，其中，所述神经网络权值获取模块具体包括:
归一化单元，用于接收输入的多个类别的图像样本，将输入的每一个类别的图像样本数据进行归一化；
第一卷积单元，用于对归一化的图像样本数据进行卷积，得到相应的多个卷积结果；
第一降采样单元，用于对多个卷积结果进行一半的降采样；
第二卷积单元，用于对降采样后的卷积结果进行再次卷积；
映射单元，用于采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射；
第二降采样单元，用于对映射后的图像样本数据进行一半的降采样；
一维特征描述获取单元，用于对降采样的结果进行排列得到该图像的一维特征描述；第三降采样单元，用于对所述一维特征描述进行预订的降采样得到缩减后的特征向
量;
学习单元，用于将所述特征向量输入神经网络，进入神经网络的学习过程，进行前馈学习和BP反馈方式调节，得到相应的神经网络权值。
[0013]所述的基于卷积神经网络的图像分类装置，其中，所述分层模块具体包括:
层数确定单元，用于对N个类别的图像样本，根据所述非对称映射矩阵确定的最大区
分类别数目M ;建立NUM层学习类别，NUM为(N/ (M-1))且为(N/ (M-1))取向上的整数；分层分布单元，用于对于每一层，采用最大区分类别数目M个类别来构建，依次在NUM层中来完成N个类别的分布；
学习库生成单元，用于通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
[0014]所述的基于卷积神经网络的图像分类装置，其中，所述分层模块还包括:
更新单元，用于当有新的类别加入时，放入最后一组分层中并对该层重新进行学习形成新的学习库。
[0015]本发明所提供的一种基于卷积神经网络的图像分类方法和装置，有效地解决了现有的神经网络图像分类方法分类效果不好、容易产生过学习的问题，其方法通过接收输入的多个类别的图像样本，计算出每一个类别的图像对应的神经网络权值；采用分层结构对多个类别图像的对应神经网络权值进行分布；对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中，通过对卷积神经网络本身结构进行改进设计，提升了其原有的分类能力，使得所分类的类别远远大于传统的卷积神经网络本身分类能力，使得卷积神经网络对于外界的变化适应能力更好，很好的解决了因新的未知环境变化造成图像分类识别的能力下降的问题及对于卷积神经网络在大量类别样本学习过程中所产生的过学习问题，其实现方法简单，通过软件实现，成本较低。
【专利附图】

【附图说明】
[0016]图1为本发明提供的基于卷积神经网络的图像分类方法较佳实施例的流程图。
[0017]图2为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中获取神经网络权值的神经网络结构示意图。
[0018]图3为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中分层结构的结构示意图。
[0019]图4为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中测试类别的流程图。
[0020]图5为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中增加学习类别的结构示意图。
[0021]图6为本发明提供的基于卷积神经网络的图像分类方法应用实施例中分层结构的结构示意图。
[0022]图7为本发明提供的基于卷积神经网络的图像分类装置较佳实施例的结构框图。【具体实施方式】
[0023]本发明提供一种基于卷积神经网络的图像分类方法和装置，为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0024]请参阅图1，图1为本发明提供的基于卷积神经网络的图像分类方法较佳实施例的流程图，所述图像分类方法包括以下步骤:
步骤S100、接收输入的多个类别的图像样本，对输入的每一个类别的图像样本数据进行归一化，将归一化后的图像样本数据进行卷积，再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射，并将映射后的图像样本数据进行排列得到对应的一维特征描述，根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值；
步骤S200、采用分层结构对多个类别图像的对应神经网络权值进行分布，且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目，将多个类别图像在多层中依次分布，每一层形成对应的学习库；
步骤S300、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中。
[0025]以下结合具体的实施例对上述步骤进行详细的描述。
[0026]在步骤SlOO中，对多个类别的图像样本进行神经学习，从而得出每一个类别的图像对应的神经网络权值。具体来说，所述步骤SlOO包括:S110、接收输入的多个类别的图像样本，将输入的每一个类别的图像样本数据进行归一化；S120、对归一化的图像样本数据进行卷积，得到相应的多个卷积结果；S130、对多个卷积结果进行一半的降采样；S140、对降采样后的卷积结果进行再次卷积，并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射；S150、对映射后的图像样本数据进行一半的降采样，并对降采样的结果进行排列得到该图像的一维特征描述；S160、对所述一维特征描述进行预订的降采样得到缩减后的特征向量；S170、将所述特征向量输入神经网络，进入神经网络的学习过程，进行前馈学习和BP反馈方式调节，得到相应的神经网络权值。
[0027]在实际应用时，请参阅图2，图2为本发明提供的基于卷积神经网络的图像分类方法较佳实施例中获取神经网络权值的神经网络结构示意图，如图2所示，对输入的某一类的图像样本数据，也就是对实际情况获取到对应的学习图像表示为:
【权利要求】
1.一种基于卷积神经网络的图像分类方法，其特征在于，包括以下步骤: A、接收输入的多个类别的图像样本，对输入的每一个类别的图像样本数据进行归一化，将归一化后的图像样本数据进行卷积，再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射，并将映射后的图像样本数据进行排列得到对应的一维特征描述，根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值； B、采用分层结构对多个类别图像的对应神经网络权值进行分布，且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目，将多个类别图像在多层中依次分布，每一层形成对应的学习库； C、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中。
2.根据权利要求1所述的基于卷积神经网络的图像分类方法，其特征在于，所述步骤A具体包括: Al、接收输入的多个类别的图像样本，将输入的每一个类别的图像样本数据进行归一化； A2、对归一化的图像样本数据进行卷积，得到相应的多个卷积结果； A3、对多个卷积结果进行一半的降采样； A4、对降采样后的卷积结果进行再次卷积，并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射； A5、对映射后的图像样本数据进行一半的降采样，并对降采样的结果进行排列得到该图像的一维特征描述； A6、对所述一维特征描述进行预订的降采样得到缩减后的特征向量； A7、将所述特征向量输入神经网络，进入神经网络的学习过程，进行前馈学习和BP反馈方式调节，得到相应的神经网络权值。
3.根据权利要求1所述的基于卷积神经网络的图像分类方法，其特征在于，所述步骤B具体包括: B1、对N个类别的图像样本，根据所述非对称映射矩阵确定的最大区分类别数目M ； B2、建立NUM层学习类别，NUM为(N/(M-1))且为(N/(M-1))取向上的整数； B3、对于每一层，采用最大区分类别数目M个类别来构建，依次在NUM层中来完成N个类别的分布； B4、通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
4.根据权利要求1所述的基于卷积神经网络的图像分类方法，其特征在于，所述步骤B还包括: B5、当有新的类别加入时，放入最后一组分层中并对该层重新进行学习形成新的学习库。
5.根据权利要求3所述的基于卷积神经网络的图像分类方法，其特征在于，所述步骤C具体包括: Cl、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述； C2、进入第i层，其中i=l，2，3……NUM，i初始化为1，即将测试类别图像样本数据对应的一维特征描述与所述第i层对应的学习库中的神经网络权值进行前馈学习，若能区分出类别出来则给出结果，并退出该层；若不能分类，则认为所述测试类别是该层中未学习的类别； C3、进入下一层，即第i+Ι层，重复进行前馈学习，若能区分出类别出来则给出结果，并退出该层；若不能分类，则认为所述测试类别是该层中未学习的类别；直至第NUM层，若在最后也没有被识别出来，则所测试的类别不在所学习的类别当中。
6.一种基于卷积神经网络的图像分类装置，其特征在于，包括: 神经网络权值获取模块，用于接收输入的多个类别的图像样本，对输入的每一个类别的图像样本数据进行归一化，将归一化后的图像样本数据进行卷积，再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射，并将映射后的图像样本数据进行排列得到对应的一维特征描述，根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值；分层模块，用于采用分层结构对多个类别图像的对应神经网络权值进行分布，且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目，将多个类别图像在多层中依次分布，每一层形成对应的学习库；分类判断模块，用于对输入的测试类别图像样本数据进行处理得到对应的一维特征描述，将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习，从而判断出所述测试类别是否在所学习的类别图像中。
7.根据权利要求6所述的基于卷积神经网络的图像分类装置，其特征在于，所述神经网络权值获取模块具体包括: 归一化单元，用于接收输入的多个类别的图像样本，将输入的每一个类别的图像样本数据进行归一化；第一卷积单元，用于对归一化的图像样本数据进行卷积，得到相应的多个卷积结果；第一降采样单元，用于对多个卷积结果进行一半的降采样；第二卷积单元，用于对降采样后的卷积结果进行再次卷积；映射单元，用于采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射；第二降采样单元，用于对映射后的图像样本数据进行一半的降采样；一维特征描述获取单元，用于对降采样的结果进行排列得到该图像的一维特征描述；第三降采样单元，用于对所述一维特征描述进行预订的降采样得到缩减后的特征向量; 学习单元，用于将所述特征向量输入神经网络，进入神经网络的学习过程，进行前馈学习和BP反馈方式调节，得到相应的神经网络权值。
8.根据权利要求6所述的基于卷积神经网络的图像分类装置，其特征在于，所述分层模块具体包括: 层数确定单元，用于对N个类别的图像样本，根据所述非对称映射矩阵确定的最大区分类别数目M ;建立NUM层学习类别，NUM为(N/ (M-1))且为(N/ (M-1))取向上的整数；分层分布单元，用于对于每一层，采用最大区分类别数目M个类别来构建，依次在NUM层中来完成N个类别的分布；学习库生成单元，用于通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
9.根据权利要求6所述的基于卷积神经网络的图像分类装置，其特征在于，所述分层模块还包括: 更新单元，用于当有新的类别加入时，放入最后一组分层中并对该层重新进行学习形成新的学习库。
【文档编号】G06N3/02GK103544506SQ201310477564
【公开日】2014年1月29日申请日期:2013年10月12日优先权日:2013年10月12日
【发明者】周龙沙, 邵诗强申请人:Tcl集团股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周龙沙;邵诗强
技术所有人：TCL集团股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。