一种基于集成卷积神经网络的民族识别方法与流程

文档序号:12471091阅读:来源:国知局

技术特征:

1.一种基于集成卷积神经网络的民族识别方法,其特征在于,步骤如下:

S1、选取出M个经过民族人脸数据库中训练集训练得到的卷积神经网络分类器作为基分类器,包括M个基分类器;

S2、获取待测人脸图片;

S3、在测试时,将待测人脸图片分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的民族类别,获得最终的一个民族类别。

2.根据权利要求1所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述步骤S2中获取待测人脸图片的过程如下:首先从摄像头获取的视频中截取获取到图片,然后将其按照H264标准解码后先转换为YUV格式再进行JPEG压缩保存为JPG格式的图片,最后采用人脸检测算法判断此图片是否包含人脸,保留包含人脸的图片,丢弃不包含人脸的图片;

所述人脸检测方法为Viola人脸检测方法;在人脸检测方法后通过CamShift目标跟踪算法进行局部人脸跟踪。

3.根据权利要求1所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述步骤S1中基分类器获取过程具体如下:

S11、构建民族人脸数据库,其中该民族人脸数据库包括人脸图片以及各人脸图片对应民族类别;

S12、从民族人脸数据库中抽取其中一部分数据作为验证集,剩余的数据作为训练集;

S13、随机生成一定数量的卷积神经网络模型;

S14、利用训练集训练随机生成的各卷积神经网络模型,获得对应的各卷积神经网络分类器;

S15、将验证集中的人脸图片输入至步骤S14中生成的各卷积神经网络分类器,将各卷积神经网络分类器的输出与验证集中各人脸图片对应民族类别进行对比,验证各卷积神经网络分类器的识别准确率;

S16、将识别准确率排名前M的各卷积神经网络分类器选取出来作为基分类器。

4.根据权利要求3所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述步骤S11中采用网络爬虫和视频截图的方式采集各民族人脸图片,以构建得到民族人脸数据库。

5.根据权利要求3所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述步骤S14中随机生成的卷积神经网络模型包括三层卷积层的卷积神经网络模型T_CNNS、四层卷积层的卷积神经网络模型F_CNNS和五层卷积层的卷积神经网络模型FV_CNNS。

6.根据权利要求5所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述三层卷积层的卷积神经网络模型T_CNNS、四层卷积层的卷积神经网络模型F_CNNS和五层卷积层的卷积神经网络模型FV_CNNS均包括输入层、卷积层、下采样层、全连接层和输出层;

其中三层卷积层的卷积神经网络模型T_CNNS的输入层至输出层之间依次为卷积层conv11、下采样层pool11、卷积层conv12、下采样层pool12、卷积层conv13、下采样层pool15、全连接层fc16和全连接层fc17;

四层卷积层的卷积神经网络模型的输入层至输出层之间依次为卷积层conv21、下采样层pool21、卷积层conv22、下采样层pool22、卷积层conv23、卷积层conv24、下采样层pool25、全连接层fc26和全连接层fc27;

五层卷积层的卷积神经网络模型FV_CNNS的输入层至输出层之间依次为卷积层conv31、下采样层pool31、卷积层conv32、下采样层pool32、卷积层conv33、卷积层conv34、卷积层conv35、下采样层pool35、全连接层fc36和全连接层fc37。

7.根据权利要求6所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述M=5,即步骤S16中将识别准确率排名前5的卷积神经网络分类器选取出来作为基分类器,其中包括5个基分类器。

8.根据权利要求7所述的基于集成卷积神经网络的民族识别方法,其特征在于,5个基分类器分别为3个四层卷积层的卷积神经网络模型F_CNNS训练得到的基分类器和2个五层卷积层的卷积神经网络模型FV_CNNS训练得到的基分类器。

9.根据权利要求8所述的基于集成卷积神经网络的民族识别方法,其特征在于,3个四层卷积层的卷积神经网络模型F_CNNS训练得到的基分类器分别为第一基分类器、第二基分类器和第三基分类器;

第一基分类器为四层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为7*7以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接下采样层pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的256张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool22层后,在卷积层conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对conv24层后的图片进行下采样映射,产生384张大小为7*7的特征图;

经过下采样层pool25层后,在全连接层fc26和全连接层fc27将下采样层pool25后的特征图变成512维的列向量;然后输入至输出层;

第二基分类器为四层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为9*9以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接下采样层pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool21层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的256张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool22层后,在conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对conv24层后的图片进行下采样映射,产生384张大小为7*7的特征图;

经过下采样层poo25层后,在全连接层fc26和全连接层fc27将下采样层pool25后的特征图变成512维的列向量;然后输入至输出层;

第三基分类器为四层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv21层中采用大小为11*11以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv21层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv21层后,连接pool21层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool1层后,在卷积层conv22层中采用大小为5*5、步长为1以及扩展长为2的卷积核对pool21层后的图片进行卷积,经过卷积层conv22层卷积后产生大小为28*28的158张特征图;

经过卷积层conv22层后,下采样层pool22层采用大小为3*3以及步长为2的核进行下采样映射,得到128张大小为14*14的特征图;

经过下采样层pool22层后,在卷积层conv23层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool22层后的图片进行卷积,产生256张大小为14*14的特征图;

经过卷积层conv23层后,在卷积层conv24层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv23层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv24层后,在下采样层pool25层采用大小3*3以及步长为2的核对卷积层conv24层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool25层后,在全连接层fc26和全连接层fc27将pool25后的特征图变成512维的列向量;然后输入至输出层;

2个五层卷积层的卷积神经网络模型FV_CNNS训练得到的基分类器分别为第四基分类器和第五基分类器;

第四基分类器为五层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在卷积层conv31层中采用大小为11*11以及步长为4的卷积核对输入层的图片进行卷积,通过卷积层conv31层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv31层后,连接下采样层pool31层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool31层后,在卷积层conv32层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool31层后的图片进行卷积,经过conv32层卷积后产生大小为28*28的256张特征图;

经过卷积层conv32层后,下采样层pool32层采用大小为3*3以及步长为2的核进行下采样映射,得到128张大小为14*14的特征图;

经过下采样层pool32层后,在卷积层conv33层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool32层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv33层后,在卷积层conv34层采用大小3*3、步长为1以及扩展长为1的卷积核对卷积层conv33层后的图片进行卷积,产生384张大小为14*14的特征图;

经过卷积层conv34层后,在卷积层conv35层采用大小3*3以及步长为2的卷积核对conv34层后的图片进行卷积,产生256张大小为7*7的特征图;

经过卷积层conv35层后,在下采样层pool35层采用大小3*3以及步长为2的核对卷积层conv35层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool35层后,在全连接层fc36和全连接层fc37将下采样层pool35后的特征图变成512维的列向量;然后输入至输出层;

第五基分类器为五层卷积层的卷积神经网络模型训练得到,其工作过程如下:

在输入层输入大小为227*227的图片;在conv31层中采用大小为7*7以及步长为4的卷积核对输入层的图片进行卷积,通过conv31层卷积之后产生96张大小变为56*56的特征图;

经过卷积层conv31层后,连接下采样层pool31层进行降维,具体为采用大小为3*3以及步长为2的核进行下采样映射,96张特征图的大小变成28*28;

经过下采样层pool31层后,在conv32层中采用大小为5*5、步长为1以及扩展长为2的卷积核对下采样层pool31层后的图片进行卷积,经过conv32层卷积后产生大小为28*28的256张特征图;

经过卷积层conv32层后,下采样层pool32层采用大小为3*3以及步长为2的核进行下采样映射,得到256张大小为14*14的特征图;

经过下采样层pool32层后,在conv33层采用大小为3*3、步长为1以及扩展长为1的卷积核对下采样层pool32层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv33层后,在卷积层conv34层采用大小3*3、步长为1以及扩展长为1的卷积核对conv33层后的图片进行卷积,产生512张大小为14*14的特征图;

经过卷积层conv34层后,在conv35层采用大小3*3以及步长为2的卷积核对conv34层后的图片进行卷积,产生512张大小为7*7的特征图;

经过卷积层conv35层后,在下采样层pool35层采用大小3*3以及步长为2的核对卷积层conv35层后的图片进行下采样映射,产生512张大小为7*7的特征图;

经过下采样层pool35层后,在全连接层fc36和全连接层fc37将pool35后的特征图变成512维的列向量;然后输入至输出层。

10.根据权利要求1至9中任一项所述的基于集成卷积神经网络的民族识别方法,其特征在于,所述步骤S3中采用简单投票融合方法融合M个基分类器输出的民族类别,获得最终的一个民族类别。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1