一种基于神经网络的通用图像分类识别系统及方法与流程

文档序号:13760830阅读:3163来源:国知局
一种基于神经网络的通用图像分类识别系统及方法与流程

本发明涉及模式识别,特别涉及一种基于神经网络的通用图像分类识别系统及方法。



背景技术:

图像目标识别(Image Classification)一直是计算机视觉领域的一个核心课题,图像识别技术经过60年多来的发展,基于神经网络的方法在图像识别领域已经发展到了一个崭新的高度。然而,训练模型依然需要很多人工的干预,尤其是像CNN这种复杂的系统,如何选择合适的特征,如何设计卷积核,如何设计特征聚合,隐藏层里到底需要多少计算层,很多时候还是基于经验。而且基于神经网络,尤其是深度神经网络,在设计和使用上还是很复杂的,需要很强的专业知识,需要研究人员具有较高的专业水平,不利于技术普及。



技术实现要素:

针对现有技术的问题,本发明提出一种基于神经网络的通用图像分类识别系统及方法,基于内置的神经网络设计模板,根据用户的具体应用,自动产生合适的神经网络类型和对应的一整套算法,再通过学习和检验,来自动探索参数空间,并调整参数来获得最佳的成果。本发明可以大大降低神经网络的设计难度,用户不需要很复杂的专业背景,就可以直接使用。

本发明为解决上述技术问题所采用的技术方案是:

一种基于神经网络的通用图像分类识别系统,包括参数采集模块,专家系统数据库,算法生成模块和参数调节模块。

参数采集模块用于采集目标问题的问题参数,系统通过参数采集模块采集到的问题参数来确定图像识别的问题规模和复杂程度;采集的问题参数包括:图像识别的类别数量、样本图像的数量、样本图像的规格尺寸、是否为摄像影像以及采用监督法或者非监督法;图像识别的问题规模主要指分类的类别和学习的训练数据量;所述复杂程度是指进行图像识别所需要的特征种类。

专家系统数据库是根据长期追踪最新的图像识别算法的成果并融合在车辆识别,车牌识别,人脸识别等领域积累的技术,建立的一个专门针对神经网络的专家数据库。它根据一些典型图像识别问题,存储了多种神经网络结构,特征提取方法以及聚类方法等。问题参数采集的数据输入到专家系统数据库,系统会自动选择符合条件的神经网络结构,特征提取方法和聚类方法。举个具体的例子,手写数字识别问题,只需要识别0到9一共十个数字,只需要10个输入神经元,问题规模较小,系统会选择采用反向传递(Backward Propagation)的单一隐藏层的神经网络。

算法生成模块根据系统选择的神经网络结构、特征提取方法及聚类方法生成适用于处理目标问题的神经网络算法模型,同时根据问题规模确定算法深度;用户如果对算法模型不满意,可以自行调整算法模型。算法模型确定之后,就可以开始学习训练数据,并计算模型中的参数。

参数调节模块根据参数采集模块采集到的问题参数的性质初步建立神经网络算法模型的关键参数的搜索范围,并根据系统训练及测试结果,进一步调整关键参数的变换范围,找出正确分类的最佳参数组合和范围,以期在新数据上获得较为稳定和正确的分类结果。关键参数就是那些对分类结果有直接影响的参数。

本模块的核心思想是把参数视为一个随机变量,其取值范围是有一定的统计意义的。通过训练数据来找出所有参数的一个变化范围,然后再通过测试数据进一步调整这些参数范围,以期获得较为稳定和正确的分类结果。这样做的目的是把靠经验试出来的参数范围,通过训练,测试的步骤找出最优的参数组合。这可以大大提高优化神经网络训练的速度。

一种基于神经网络的通用图像分类识别方法,包括以下步骤:

步骤1,用户根据图像识别的目标问题,通过参数采集模块向系统输入具体的问题参数;

步骤2,系统根据上述问题参数从专家系统数据库中选取相应的神经网络结构、特征提取方法和特征聚类方法,初步建立用于分析目标问题的神经网络算法模型,并自动确定算法深度;

步骤3,学习训练数据,通过图像输入到分类信息的映射关系,确定神经网络算法模型中的一系列算法参数;

步骤4,根据输入的问题参数的性质,建立算法模型中算法参数的搜索范围,包括神经网络的深度,卷积核的大小,特征提取的参数;

步骤5,用测试数据对神经网络算法模型进行测试,测试中需要用到所有关键参数变化范围内的参数,并找出最佳的参数组合范围。在分类结果正确的前提下,保留参数组合及其变化范围。

本发明的有益效果是:可以根据用户的具体应用,基于专家系统中所保存的类似问题的神经网络模型,自动产生合适的神经网络类型和对应的一整套算法,再通过学习和检验,来自动探索参数空间,并调整参数来获得最佳的成果,减少人工干预。本系统可以大大降低神经网络的设计难度,用户不需要很复杂的专业背景,就可以直接使用。

附图说明

图1为本发明提供的一种基于神经网络的通用图像识别系统结构框图

图2为本发明一种基于神经网络的通用图像识别方法流程图

具体实施方式

下面结合附图及实施例对本发明作进一步说明。

如图1所示,本发明提供了一种基于神经网络的通用图像分类识别系统,包括参数采集模块,专家系统数据库,算法生成模块和参数调节模块。参数采集模块用于采集目标问题的问题参数,系统通过参数采集模块采集到的问题参数来确定图像识别的问题规模和复杂程度;采集的问题参数包括:图像识别的类别数量、样本图像的数量、样本图像的规格尺寸、是否为摄像影像以及采用监督法或者非监督法;图像识别的问题规模主要指分类的类别和学习的训练数据量;所述复杂程度是指进行图像识别所需要的特征种类。

专家系统数据库是根据长期追踪最新的图像识别算法的成果并融合在车辆识别,车牌识别,人脸识别等领域积累的技术,建立的一个专门针对神经网络的专家数据库。它根据一些典型图像识别问题,存储了多种神经网络结构,特征提取方法以及聚类方法等。问题参数采集的数据输入到专家系统数据库,系统会自动选择符合条件的神经网络结构,特征提取方法和聚类方法。举个具体的例子,手写数字识别问题,只需要识别0到9一共十个数字,只需要10个输入神经元,问题规模较小,系统会选择采用反向传递(Backward Propagation)的单一隐藏层的神经网络。

算法生成模块根据系统选择的神经网络结构、特征提取方法及聚类方法生成适用于处理目标问题的神经网络算法模型,同时根据问题规模确定算法深度;用户如果对算法模型不满意,可以自行调整算法模型。算法模型确定之后,就可以开始学习训练数据,并计算模型中的参数。

参数调节模块根据参数采集模块采集到的问题参数的性质初步建立神经网络算法模型的关键参数的搜索范围,并根据系统训练及测试结果,进一步调整关键参数的变换范围,找出正确分类的最佳参数组合和范围,以期在新数据上获得较为稳定和正确的分类结果。关键参数就是那些对分类结果比较敏感的参数。

本发明还提供一种基于神经网络的通用图像分类识别方法,如图2所示,包括以下步骤:

步骤1,用户根据图像识别的目标问题,通过参数采集模块向系统输入具体的问题参数;

步骤2,系统根据上述问题参数从专家系统数据库中选取相应的神经网络结构、特征提取方法和特征聚类方法,初步建立用于分析目标问题的神经网络算法模型,并自动确定算法深度;

步骤3,学习训练数据,通过图像输入到分类信息的映射关系,确定神经网络算法模型中的一系列算法参数;

步骤4,根据输入的问题参数的性质,建立算法模型中算法参数的搜索范围,包括神经网络的深度,卷积核的大小,特征提取的参数;

步骤5,用测试数据对神经网络算法模型进行测试,测试中需要用到所有关键参数变化范围内的参数,并找出最佳的参数组合范围。在分类结果正确的前提下,保留参数组合及其变化范围。

下面以轿车识别的具体案例对本发明做进一步说明:

本案例中的轿车识别是通过学习一段拍摄了各种轿车的影像,通过监督法训练模型理解轿车在图像中的规律,然后从新的图像中识别出轿车。

首先,对影像资料中标记车的轮廓范围,然后提取这个车图像,把所有的车图像都规划到统一的大小,比如64像素乘64像素。

由于学习的影像数据量较大,采用卷积神经网络的模板,建立一个隐藏层包含6层的CNN。这里选择6层是基于该专家系统中已经包括了一个类似的识别应用,即影像中的行人识别。这6层依次是卷积层1(提取特征),池化层2(聚类特征),卷积层3,池化层4,全连接层5和分类层6。

接下来,就是通过学习训练数据来建立车辆特征和分类信息的映射关系。也就是通过学习这段影像,让模型学习到这种车在影像上的规律。具体来说,车图像输入到卷积层1,对其进行大小为7X7像素卷积核和步长为1像素的卷积操作,采用16个不同的卷积核(特征),获得16张58X58像素大小的特征图。把这些特征图输入到池化层2,对其做最大池化操作,采用池化核为2X2像素,步长为1个像素。这个步骤就是对特征做进一步的聚合,即原先的4个像素合并为1个像素,并取最大特征值像素,得到16张29X29像素大小的特征图。然后,输入到卷积层3,采用7X7像素卷积核和步长为1像素的卷积操作,总共用到32个卷积核,这样就得到了32张23X23像素的特征图。输入到池化层4,采用2X2像素池化核和步长1的像素,得到32张11X11像素的特征图。输入到全连接层,并向量化为3872维特征向量。将这个特征向量输入到分类层。分类层采用SoftMax分类函数,输出为该车类型的分类概率。

在监督法下,我们可以认为只要输出概率大于50%,即正确判断。那么我们可以给参数一个变化范围,在本例中的参数主要是卷积核(特征)的种类和大小,池化核的种类和大小。因为池化核的种类和大小是相对固定的,主要是考虑卷积核的种类和大小。卷积核的大小可以考虑使用5X5-13X13的范围。学习测试数据,如果识别的分类正确率在50%以上,则可以保留。同时,构建一个分类结果与参数变化范围的对应关系,从中找出分类正确率较高的参数组合和范围。通过学习训练数据和测试数据,我们就可以获得一个带有参数变化范围的神经网络模型。把新的图像输入到这个带有参数变化范围的神经网络模型中,除了获得分类的概率以外,还可以获得一个对这个概率正确率的估计。这样以来,就提高了分类正确率。整个参数调节的过程都是自动完成。

说明书中未阐述的部分均为现有技术或公知常识。本实施例仅用于说明该发明,而不用于限制本发明的范围,本领域技术人员对于本发明所做的等价置换等修改均认为是落入该发明权利要求书所保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1