一种基于集成卷积神经网络的民族识别方法与流程

文档序号:12471091阅读:282来源:国知局
一种基于集成卷积神经网络的民族识别方法与流程

本发明涉及图像处理技术领域,特别涉及一种基于集成卷积神经网络的民族识别方法。



背景技术:

人脸民族识别是指通过对人脸图像进行分析,使计算机能够判断出人脸属于哪个民族。由于我们国家有56个不同民族,每个民族都有自己独特的民族特征、文化和风俗,因此民族识别有很重要的意义,比如用在餐饮业,能够帮助商家自动判断出客人的民族类别,从而推荐合适的饮食。而且,每个民族有不同的文化风俗和娱乐习惯,一旦识别出客人的民族类别后,商家就可以推荐相应的娱乐节目或商品。在产品的人机互动界面设计上,也可以安装民族识别功能,比如可根据识别出的民族类别,自动现实相应的民族语言,比如蒙语,增加互动的友好性。在我国是一个多民族的国家,制定了一系列民族政策,一旦识别出民族类别为少数民族后,将按国家的民族政策提供公共服务。

民族识别问题主要依靠机器学习算法来实现,目前主流的机器学习算法大致包括K最近邻、支持向量机、朴素贝叶斯、Adaboosting、SoftMax等。国内外学者在解决人脸民族分类问题时,大都采用这些分类算法,但是这些分类算法极大地依赖于对人脸的特征表达,而目前采用的特征抽取方法是人工设计的,依赖人工专家的经验和反复实验完成的,不仅工作量大,而且很难找到一种最优的民族特征表达。另外,目前民族识别主要是国外的种族识别,中国在这方面的研究还很少,特别是国内至今还没有可供研究的民族识别标准数据库,使得民族识别的进展缓慢,这也说明了人脸民族识别的困难性,识别的准确率急待提高。



技术实现要素:

本发明的目的在于克服现有技术的缺点与不足,提供一种基于集成卷积神经网络的民族识别方法。该方法适合在大数据中使用,并且具有识别准确率高的优点。

本发明的目的通过下述技术方案实现:一种基于集成卷积神经网络的民族识别方法,其特征在于,步骤如下:

S1、选取出M个经过民族人脸数据库中训练集训练得到的卷积神经网络分类器作为基分类器,包括M个基分类器;

S2、获取待测人脸图片;

S3、在测试时,将待测人脸图片分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的民族类别,获得最终的一个民族类别。

优选的,所述步骤S2中获取待测人脸图片的过程如下:首先从摄像头获取的视频中截取获取到图片,然后将其按照H264标准解码后先转换为YUV格式再进行JPEG压缩保存为JPG格式的图片,最后采用人脸检测算法判断此图片是否包含人脸,保留包含人脸的图片,丢弃不包含人脸的图片;

所述人脸检测方法为Viola人脸检测方法;在人脸检测方法后通过CamShift(Continuously Apative Mean-Shift)目标跟踪算法进行局部人脸跟踪。

优选的,所述步骤S1中基分类器获取过程具体如下:

S11、构建民族人脸数据库,其中该民族人脸数据库包括人脸图片以及各人脸图片对应民族类别;

S12、从民族人脸数据库中抽取其中一部分数据作为验证集,剩余的数据作为训练集;

S13、随机生成一定数量的卷积神经网络模型;

S14、利用训练集训练随机生成的各卷积神经网络模型,获得对应的各卷积神经网络分类器;

S15、将验证集中的人脸图片输入至步骤S14中生成的各卷积神经网络分类器,将各卷积神经网络分类器的输出与验证集中各人脸图片对应民族类别进行对比,验证各卷积神经网络分类器的识别准确率;

S16、将识别准确率排名前M的各卷积神经网络分类器选取出来作为基分类器。

更进一步的,所述步骤S11中采用网络爬虫和视频截图的方式采集各民族人脸图片,以构建得到民族人脸数据库。

更进一步的,所述步骤S14中随机生成的卷积神经网络模型包括三层卷积层的卷积神经网络模型T_CNNS、四层卷积层的卷积神经网络模型F_CNNS和五层卷积层的卷积神经网络模型FV_CNNS。

更进一步的,所述三层卷积层的卷积神经网络模型T_CNNS、四层卷积层的卷积神经网络模型F_CNNS和五层卷积层的卷积神经网络模型FV_CNNS均包括输入层、卷积层、下采样层、全连接层和输出层;

其中三层卷积层的卷积神经网络模型T_CNNS的输入层至输出层之间依次为卷积层conv11、下采样层pool11、卷积层conv12、下采样层pool12、卷积层conv13、下采样层pool15、全连接层fc16和全连接层fc17;

四层卷积层的卷积神经网络模型的输入层至输出层之间依次为卷积层conv21、下采样层pool21、卷积层conv22、下采样层pool22、卷积层conv23、卷积层conv24、下采样层pool25、全连接层fc26和全连接层fc27;

五层卷积层的卷积神经网络模型FV_CNNS的输入层至输出层之间依次为卷积层conv31、下采样层pool31、卷积层conv32、下采样层pool32、卷积层conv33、卷积层conv34、卷积层conv35、下采样层pool35、全连接层fc36和全连接层fc37。

更进一步的,所述M=5,即步骤S16中将识别准确率排名前5的卷积神经网络分类器选取出来作为基分类器,其中包括5个基分类器。

更进一步的,5个基分类器分别为3个四层卷积层的卷积神经网络模型F_CNNS训练得到的基分类器和2个五层卷积层的卷积神经网络模型FV_CNNS训练得到的基分类器。

更进一步的,3个四层卷积层的卷积神经网络模型F_CNNS训练得到的基分类器分别为第一基分类器、第二基分类器和第三基分类器;

第一基分类器为四层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为7*7以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接下采样层pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的256张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool22层后,在卷积层conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对conv24层后的图片进行下采样映射,产生384张大小为7*7的特征图;

经过下采样层pool25层后,在全连接层fc26和全连接层fc27将下采样层pool25后的特征图变成512维的列向量;然后输入至输出层;

第二基分类器为四层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为9*9以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接下采样层pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的256张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool22层后,在conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对conv24层后的图片进行下采样映射,产生384张大小为7*7的特征图;

经过下采样层poo25层后,在全连接层fc26和全连接层fc27将下采样层pool25后的特征图变成512维的列向量;然后输入至输出层;

第三基分类器为四层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为11*11以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool1层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的158张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到128张大小为14*14的特征图;

经过下采样层pool22层后,在卷积层conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生256张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对卷积层conv24层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool25层后,在全连接层fc26和全连接层fc27将pool25后的特征图变成512维的列向量;然后输入至输出层;

2个五层卷积层的卷积神经网络模型FV_CNNS训练得到的基分类器分别为第四基分类器和第五基分类器;

第四基分类器为五层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv31层中采用大小为11*11以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv31层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv31层后,连接下采样层pool31层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool31层后,在卷积层conv32层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool31层后的图片进行卷积,经过conv32层卷积后产生大小为28*28的256张特征图;

经过卷积层conv32层后,下采样层pool32层采用大小为3*3以及步长为2的核进行下采样映射,得到128张大小为14*14的特征图;

经过下采样层pool32层后,在卷积层conv33层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool32层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv33层后,在卷积层conv34层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv33层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv34层后,在卷积层conv35层采用大小3*3以及步长为2的卷积核对conv34层后的图片进行卷积,产生256张大小为7*7的特征图;

经过卷积层conv35层后,在下采样层pool35层采用大小3*3以及步长为2的核对卷积层conv35层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool35层后,在全连接层fc36和全连接层fc37将下采样层pool35后的特征图变成512维的列向量;然后输入至输出层;

第五基分类器为五层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在conv31层中采用大小为7*7以及步长为4的卷积核对输入层的图片进行卷积,通过conv31层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv31层后,连接下采样层pool31层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool31层后,在conv32层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool31层后的图片进行卷积,经过conv32层卷积后产生大小为28*28的256张特征图;

经过卷积层conv32层后,下采样层pool32层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool32层后,在conv33层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool32层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv33层后,在卷积层conv34层采用大小3*3、步长为1以及扩展长为1的卷积核对conv33层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv34层后,在conv35层采用大小3*3以及步长为2的卷积核对conv34层后的图片进行卷积,产生512张大小为7*7的特征图;

经过卷积层conv35层后,在下采样层pool35层采用大小3*3以及步长为2的核对卷积层conv35层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool35层后,在全连接层fc36和全连接层fc37将pool35后的特征图变成512维的列向量;然后输入至输出层。

优选的,所述步骤S3中采用简单投票融合方法融合M个基分类器输出的民族类别,获得最终的一个民族类别。

本发明相对于现有技术具有如下的优点及效果:

(1)本发明方法首先选取出M个经过民族人脸数据库中训练集训练得到的卷积神经网络分类器作为基分类器,然后将待测人脸图片输入选取出的M个基分类器中,最后融合M个基分类器输出的民族类别,获得最终的一个民族类别。具有民族识别准确率高、能够识别多民族以及应用广泛的优点。

(2)本发明方法随机生成一定数量的卷积神经网络模型,利用民族人脸数据库中的训练集训练随机生成的大量卷积神经网络模型,以获取到对应的卷积神经网络分类器,然后利用民族人脸数据库中的验证集验证各卷积神经网络分类器民族识别的准确率,最后选取出民族识别准确率排名前M的卷积神经网络分类器作为基分类器。可见本发明方法中选取的M个基分类器是民族识别准确率最高的基分类器,能够大大提高本发明方法民族识别准确率。

(3)本发明方法在获取人脸图片时采用Viola人脸检测方法,并且结合CamShift目标跟踪算法在短时间范围内进行局部人脸跟踪,能够获取到更好人脸图像质量的同时具有较好的实时性和鲁棒性。

(4)本发明方法中选取出的基分类器可为多个结构不同的卷积神经网络模型训练得到的,本发明方法利用多个结构差异化的卷积神经网络模型集成测试,能够获得更好的人脸民族识别性能,进一步提高民族识别的准确率。

附图说明

图1是本发明方法中所使用的四层卷积层的卷积神经网络模型F_CNNS的结构框图。

图2是本发明方法中所使用的第一基分类器结构参数图。

图3是本发明方法中所使用的第二基分类器结构参数图。

图4是本发明方法中所使用的第三基分类器结构参数图。

图5是本发明方法中所使用的第四基分类器结构参数图。

图6是本发明方法中所使用的第五基分类器结构参数图。

图7是本发明方法中民族识别阶段示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

实施例

本实施例公开了一种基于集成卷积神经网络的民族识别方法,步骤如下:

S1、选取出M个经过民族人脸数据库中训练集训练得到的卷积神经网络分类器作为基分类器,包括M个基分类器,分别为第一基分类器、第二基分类器,…,第M基分类器;其中本步骤中这M个基分类器获取的具体过程如下:

S11、构建民族人脸数据库,其中该民族人脸数据库包括人脸图片以及各人脸图片对应民族类别;在本实施例中采用网络爬虫和视频截图的方式采集各民族人脸图片,以构建得到民族人脸数据库。

S12、从民族人脸数据库中抽取其中一部分数据作为验证集,剩余的数据作为训练集;

S13、在限定参数范围内随机生成一定数量的卷积神经网络模型;

S14、利用训练集训练随机生成的各卷积神经网络模型,获得对应的各卷积神经网络分类器;

S15、将验证集中的人脸图片输入至步骤S14中生成的各卷积神经网络分类器,将各卷积神经网络分类器的输出与验证集中各人脸图片对应民族类别进行对比,验证各卷积神经网络分类器的识别准确率;

S16、将识别准确率排名前M的各卷积神经网络分类器选取出来作为基分类器。

S2、获取待测人脸图片;本实施例中待测人脸图片的获取过程如下:首先从摄像头获取的视频中截取获取到图片,然后将其按照H264标准解码后先转换为YUV格式再进行JPEG压缩保存为JPG格式的图片,最后采用人脸检测算法判断此图片是否包含人脸,保留包含人脸的图片,丢弃不包含人脸的图片;其中人脸检测方法为Viola人脸检测方法,它是一种基于积分图、级联检测器和AdaBoost算法的集成方法;在人脸检测方法后通过CamShift目标跟踪算法进行局部人脸跟踪。

S3、在测试时,将待测人脸图片作为分别输入步骤S1获取到的M个基分类器,得到M个基分类器输出的类别,分别为类别X1、类别X2,…,类别XM,然后融合M个基分类器输出的民族类别,获得最终的一个民族类别。本实施例中采用简单投票融合方法融合M个卷积神经网络分类器输出的民族类别,以获得最终的一个民族类别。

卷积神经网络识别民族的必要条件是有高质量的海量民族人脸数据库。国内关于民族人脸方面的研究十分稀少,更没有公开的标准民族人脸数据库。CAS-PEAL(Pose Expression Accessory Lighting)数据库是目前公认的最好用来进行人脸研究的中国人人脸数据库,但该数据库中目前并没有中国民族标签,其中几乎都是汉族。CUN数据库包括中国56个民族,其中考虑了人脸表情,光照,拍摄背景,装饰物等变量,但这个数据集目前仍然还在创建中,还没有对外开放。因此,本实施例方法中采用网络爬虫和视频截图进行不同民族人脸图片的采集,构建步骤S1民族人脸数据库。该数据库中包括海量的各个民族的人脸图片,例如汉族、蒙古族、藏族和维吾尔族等。

本实施例方法中选取Caffe作为开发框架,实现卷积神经网络民族识别。Caffe框架支持GPU和CPU之间随意切换,在GPU模式下迭代速度很快便于加速学习;本实施上述方法的步骤S14中随机生成的卷积神经网络模型包括三层卷积层的卷积神经网络模型T_CNNS、四层卷积层的卷积神经网络模型F_CNNS和五层卷积层的卷积神经网络模型FV_CNNS。其中三层卷积层的卷积神经网络模型T_CNNS、四层卷积层的卷积神经网络模型F_CNNS和五层卷积层的卷积神经网络模型FV_CNNS均包括输入层、卷积层、下采样层、全连接层和输出层;

其中三层卷积层的卷积神经网络模型T_CNNS的输入层至输出层之间依次为卷积层conv11、下采样层pool11、卷积层conv12、下采样层pool12、卷积层conv13、下采样层pool15、全连接层fc16和全连接层fc17;

四层卷积层的卷积神经网络模型的输入层至输出层之间依次为卷积层conv21、下采样层pool21、卷积层conv22、下采样层pool22、卷积层conv23、卷积层conv24、下采样层pool25、全连接层fc26和全连接层fc27;

五层卷积层的卷积神经网络模型FV_CNNS的输入层至输出层之间依次为卷积层conv31、下采样层pool31、卷积层conv32、下采样层pool32、卷积层conv33、卷积层conv34、卷积层conv35、下采样层pool35、全连接层fc36和全连接层fc37。

其中四层卷积层的卷积神经网络模型F_CNNS的结构如图1所示,三层卷积层的卷积神经网络模型T_CNNS相对四层卷积层的卷积神经网络模型F_CNNS只是少了一个卷积层,其余网络结构与四层卷积层的卷积神经网络模型F_CNNS相同,五层卷积层的卷积神经网络模型FV_CNNS只是相对于四层卷积层的卷积神经网络模型F_CNNS多了一个卷积层,其余网络结构同四层卷积层的卷积神经网络模型F_CNNS也相同。

在本实施例中M=5,即步骤S16中将识别准确率排名前5的卷积神经网络分类器选取出来作为基分类器,即包括5个基分类器。本实施例步骤S13中随机生成的卷积神经网络模型的数量可以为5~500个;

本实施例方法中5个基分类器分别为3个四层卷积层的卷积神经网络模型F_CNNS训练得到的基分类器和2个五层卷积层的卷积神经网络模型FV_CNNS训练得到的基分类器。

3个四层卷积层的卷积神经网络模型F_CNNS训练得到的基分类器分别为第一基分类器、第二基分类器和第三基分类器;

第一基分类器为四层卷积层的卷积神经网络模型训练得到,结构参数如图2所示,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为7*7以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接下采样层pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的256张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool22层后,在卷积层conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对conv24层后的图片进行下采样映射,产生384张大小为7*7的特征图;

经过下采样层pool25层后,在全连接层fc26和全连接层fc27将下采样层pool25后的特征图变成512维的列向量;然后输入至输出层;

第二基分类器为四层卷积层的卷积神经网络模型训练得到,结构参数如图3所示,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为9*9以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接下采样层pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的256张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool22层后,在conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对conv4层后的图片进行下采样映射,产生384张大小为7*7的特征图;

经过下采样层poo25层后,在全连接层fc26和全连接层fc27将下采样层pool25后的特征图变成512维的列向量;然后输入至输出层;

第三基分类器为四层卷积层的卷积神经网络模型训练得到,结构参数如图4所示,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为11*11以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的158张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到128张大小为14*14的特征图;

经过下采样层pool22层后,在卷积层conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生256张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对卷积层conv24层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool25层后,在全连接层fc26和全连接层fc27将pool25后的特征图变成512维的列向量;然后输入至输出层;

2个五层卷积层的卷积神经网络模型FV_CNNS训练得到的基分类器分别为第四基分类器和第五基分类器;

第四基分类器为五层卷积层的卷积神经网络模型训练得到,结构参数如图5所示,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv31层中采用大小为11*11以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv31层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv31层后,连接下采样层pool31层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool31层后,在卷积层conv32层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool31层后的图片进行卷积,经过conv2层卷积后产生大小为28*28的256张特征图;

经过卷积层conv32层后,下采样层pool32层采用大小为3*3以及步长为2的核进行下采样映射,得到128张大小为14*14的特征图;

经过下采样层pool32层后,在卷积层conv33层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool32层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv33层后,在卷积层conv34层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv33层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv34层后,在卷积层conv35层采用大小3*3以及步长为2的卷积核对conv34层后的图片进行卷积,产生256张大小为7*7的特征图;

经过卷积层conv35层后,在下采样层pool35层采用大小3*3以及步长为2的核对卷积层conv35层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool35层后,在全连接层fc36和全连接层fc37将下采样层pool35后的特征图变成512维的列向量;然后输入至输出层;

第五基分类器为五层卷积层的卷积神经网络模型训练得到,结构参数如图6所示,其工作过程如下:

在输入层输入大小为227*227的图片;在conv31层中采用大小为7*7以及步长为4的卷积核对输入层的图片进行卷积,通过conv31层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv31层后,连接下采样层pool31层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool31层后,在conv32层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool31层后的图片进行卷积,经过conv32层卷积后产生大小为28*28的256张特征图;

经过卷积层conv32层后,下采样层pool32层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool32层后,在conv33层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool32层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv33层后,在卷积层conv34层采用大小3*3、步长为1以及扩展长为1的卷积核对conv33层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv34层后,在conv35层采用大小3*3以及步长为2的卷积核对conv34层后的图片进行卷积,产生512张大小为7*7的特征图;

经过卷积层conv35层后,在下采样层pool35层采用大小3*3以及步长为2的核对卷积层conv35层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool35层后,在全连接层fc36和全连接层fc37将pool35后的特征图变成512维的列向量;然后输入至输出层。

如图7所示,在本实施例中步骤S3中,将测试样本分别输入上述得到的第一基分类器、第二基分类器、第三基分类器、第四基分类器和第五基分类器中,然后采用简单投票融合方法融合这5个基分类器输出的民族类别,实现对这5个基分类器输出的识别结果进行投票表决,获得最终的一个民族类别。本实施例方法集成卷积神经网络就是利用多个结构差异化的卷积神经网络构成的分类器进行集成测试,以获得更好的人脸民族识别性能。

在本实施例方法中随机生成的各卷积神经网络模型网络调优参数配置可以如下表表1所示;

表1

当民族人脸数据库训练集的训练样本分别为1000、5525、7606、11616和19612张人脸图片时,采用本实施例融合五个基分类器的方法和单一第一基分类器、第二基分类器、第三基分类器、第四基分类器和第五基分类器进行民族识别时,它们识别的准确率如下表2所示:

表2

其中F_CNNS_1、F_CNNS_2、F_CNNS_3、FV_CNNS_4和FV_CNNS_5所在行分别对应第一基分类器、第二基分类器、第三基分类器、第四基分类器和第五基分类器单独对民族进行识别时的准确率,FF_CNNS所在行为本实施例方法进行民族识别时的准确率,通过上表1可以发现,本实施例集成五个基分类器进行识别的准确率相比单个分类器进行识别时,本发明的识别准确率更高,并且训练样本越多,识别的准确性越高,因此本实施例方法可以通过构造更大的训练集来进一步提高准确率。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1