基于卷积神经网络的书法风格识别方法与流程

文档序号:16250776发布日期:2018-12-12 00:01阅读:761来源:国知局
基于卷积神经网络的书法风格识别方法与流程

本发明属于图像分类识别方法技术领域,具体涉及一种基于卷积神经网络的书法风格识别方法。

背景技术

中国书法是中华传统文化的重要组成部分,不仅历史悠久,沉淀浓厚,而且还传播广泛,对民族文化影响巨大,和其他优秀文化诸如绘画堪当中国文化和艺术瑰宝,对中国书法的研究有着极其重要的实际意义。

利用现代的计算机技术来指导研究和学习书法,传承、传播传统文化有着的极其重要的作用。目前,现有的方法大都是应用一些传统的模式识别算法进行书法风格的识别,是面对大量不同的书法作品时,会导致识别难度的增加,效率的降低,而且得到的效果也不是很理想。因此,如何高效、准确的识别书法风格识迫切需要解决的问题。



技术实现要素:

本发明的目的是提供一种基于卷积神经网络的书法风格识别方法,解决了现有识别方法效率低下、准确率低的问题。

本发明所采用的技术方案是,基于卷积神经网络的书法风格识别方法,包括以下步骤:

步骤1,获得并预处理书法作品,得到书法样本;

步骤2,将步骤1的书法样本分成训练样本集和验证样本集;

步骤3,将步骤2中的训练样本集输入模型分类器并不断迭代训练,同时使用验证样本集不断验证模型分类器;

步骤4,将步骤1的书法样本输入步骤3训练后的模型分类器中,完成书法风格识别。

本发明的特征还在于,

步骤1具体为:

步骤1.1,将每幅书法作品处理成图像格式,随后应用最小包围将每幅书法作品切割成无畸变的单个书法字图像;

步骤1.2,通过中心填充归一化,将步骤1.1得到的单个书法字图像归一化成大小统一的正方形单字图像;

步骤1.3,将步骤1.2的正方形单字图像统一压缩至分辨率为64×64的单个书法字图像,得到书法样本。

步骤2具体为:

将步骤1得到的书法样本按照9:1的比例随机分为训练数据集和验证数据集。

步骤3具体为:

将步骤2中的训练样本集批量输入模型分类器中,首次迭代时,模型分类器权重参数为随机初始化参数,通过前向传播算法不断向前传递特征,并计算残差,随后通过反向传播算法将残差不断向后传递,修正权重参数,不断迭代直至收敛;

当模型分类器中每迭代10次,将验证样本集输入模型分类器中识别准确率:当识别准确率出现两极分化,则需要重新训练模型分类器;如未出现两极分化,继续训练。

收敛的条件为:迭代次数不大于在10000且达到残差值最小。

模型分类器中网络模型包含11层,输入是通道为1的灰度图像,分辨率大小64×64;

第一层是32个感受野大小为5×5的卷积层,步长为1,边缘填充为2,参数量为5×5×1×32+32,即832,输出为32个通道、大小为64×64的特征;

第二层采用重叠的最大池化层,即感受野大小为3×3,步长为2,边缘填充为1,输出为32个通道,图像大小为64×64的特征;

第三层至第六层是两组与第一层和第二层相类似的卷积层和最大池化层:第三层的卷积核数量是32,大小5×5,边缘填充为2,步长为1,参数量为5×5×32×32+32,即26624;第五层是64个卷积核大小为5×5卷积层,步长为1,边缘填充是2,该卷积层的参数量为5×5×32×64+64,即53248;第四层和第六层均为最大池化层;

第七层为卷积层,即128个大小为5×5的卷积核,步长为1,边缘填充为2,参数量为5×5×64×128+128,即212992;

第八层为平均池化层,感受野大小为3×3,步长为2,边缘填充为1,输出为128个通道,图像大小为4×4的特征,可以有效降低前面两层重叠池化带来的噪音;

第九层为concat(avg,std)层,在第七层的卷积和第八层放平均池化层之后的输出为128×4×4,即128个通道大小为4×4的特征作为concat(avg,std)层的输入;

第十层为全连接层,全连接层的输入为128个4×4的特征,输出为256个特征,则参数量为4×4×128×256+256,即524288;

第十一层为softmax分类层,用于计算输出属于每一类的概率。

本发明的有益效果是:

(1)本发明的识别方法将书法风格识别的过程实现了处理流程的简化,将书法图像特征提取及风格识别融为一体,识别速度快,而且识别准确率高;

(2)本发明的识别方法所训练的模型分类器参数量比较少,训练用时少,收敛速度快,识别准确率高;

(3)本发明的识别方法能够不断增加风格类别,具有较好的鲁棒性、扩展性。

附图说明

图1是本发明基于卷积神经网络的书法风格识别方法中模型分类器训练流程图;

图2是本发明基于卷积神经网络的书法风格识别方法中模型分类器网络结构图;

图3是本发明基于卷积神经网络的书法风格识别方法中模型分类器网络结构中的concat结构图;

图4是基于卷积神经网络的书法风格识别方法中模型提取不同级别的抽象特征;

图4中(a)表示第一层组成卷积层提取的抽象特征,图4中(b)表示第三层组成卷积层提取的抽象特征,图4中(c)表示第五层组成卷积层提取的抽象特征,图4中(d)表示第七层组成卷积层提取的抽象特征。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明基于卷积神经网络的书法风格识别方法,包括以下步骤:

步骤1,获得并预处理书法作品,得到书法样本;

将每幅书法作品处理成图像格式,随后应用最小包围将每幅书法作品切割成无畸变的单个书法字图像;通过中心填充归一化,将得到的单个书法字图像归一化成大小统一的正方形单字图像;将正方形单字图像统一压缩至分辨率为64×64的单个书法字图像,得到书法样本。

步骤2,将步骤1的书法样本分成训练样本集和验证样本集;

将步骤1得到的书法样本按照9:1的比例随机分为训练数据集和验证数据集。

为了防止在训练模型分类器过程中出现过拟合,抽出一小部分数据作为验证数据集,检验模型分类器是否出现过拟合(在不断迭代的过程中,当训练数据集的识别准确率很高而验证集的识别准确率却很低时,即出现了过拟合现象)。

步骤3,将步骤2中的训练样本集输入模型分类器并不断迭代训练,同时使用验证样本集不断验证模型分类器;

将步骤2中的训练样本集批量输入模型分类器中,首次迭代时,模型分类器权重参数为随机初始化参数,通过前向传播算法不断向前传递特征,并计算残差,随后通过反向传播算法将残差不断向后传递,修正权重参数,如此不断迭代以使得残差值最小或者残差值保持相对稳定,一般迭代在10000以内都能够达到残差值最小,即收敛,具体流程如图1所示。

同时为了验证模型是否出现过拟合,当模型分类器中每迭代10次,将验证样本集输入模型分类器中识别准确率:当识别准确率出现两极分化,则需要重新训练模型分类器;如未出现两极分化,继续训练。

如图2和图3所示,模型分类器中网络模型包含11层,输入是通道为1的灰度图像,分辨率大小64×64;

第一层是32个感受野大小为5×5的卷积层,步长为1,边缘填充为2,参数量为5×5×1×32+32,即832,经过第一层的卷积运算得到的输出为32个通道、图像大小为64×64的特征;

第二层采用重叠的最大池化层,即感受野大小为3×3,步长为2,边缘填充为1,输出为32个通道,图像大小为64×64的特征;最大池化能够避免平均池化的模糊化的影响,重叠和覆盖提高了特征提取的丰富性,并且池化能有效降低特征的映射的维度;池化层的计算简单,故没有权重参数;在池化层之后增加bn(batchnormalization)层来防止函数损失反向传播过程中的梯度弥散并加速训练模型的收敛;在bn之后连接了非线性激活函数relu来进一步增加非线性变换的特征;

第三层至第六层是两组与第一层和第二层相类似的卷积层和最大池化层:第三层的卷积核数量是32,大小5×5,边缘填充为2,步长为1,参数量为5×5×32×32+32,即26624;第五层是64个卷积核大小为5×5卷积层,步长为1,边缘填充是2,该卷积层的参数量为5×5×32×64+64,即53248;第四层和第六层均为最大池化层,并在池化之后进行批量归一化(bn)以及relu激活函数的映射;

第七层为卷积层,即128个大小为5×5的卷积核,步长为1,边缘填充为2,参数量为5×5×64×128+128,即212992;

第八层为平均池化层,感受野大小为3×3,步长为2,边缘填充为1,输出为128个通道,图像大小为4×4的特征,可有效降低前面重叠池化带来的噪音;

第九层为concat(avg,std)层,在第七层的卷积和第八层放平均池化层之后的输出为128×4×4,即128个通道大小为4×4的特征作为concat(avg,std)层的输入,在该层中依照公式(1)、(2)分别计算均值μ和标准方差σ,对于128个通道的输入,分别计算得到128个均值和方差的值,然后将均值和方差重新连接成一个256维的向量特征作为该层的输出,然后输出到下一层全连接层中;

其中,参数i(i,j)表示二维矩阵且大小为4×4,参数i表示横坐标,参数j表示纵坐标;

第十层为全连接层,全连接层的输入为128个4×4的特征,输出为256个特征,则参数量为4×4×128×256+256,即524288;

第十一层为softmax分类层,softmax是logistic回归模型对于多分类问题的推广,即类的数量可以是两个以上,softmax可以计算输出属于每一类的概率。故整个网络结构权重参数量为817984。

步骤4,将步骤1的书法样本输入步骤3训练后的模型分类器中,完成书法风格识别。由于模型分类内部是不断提取抽象特征并分类识别的过程,因而也可将提取的抽象特征可视化,如图4所示,为第一、三、五、七层组成的四组卷积层提取的抽象特征。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1