一种基于形变方法进行数据扩展的脱机手写汉字识别方法与流程

文档序号:11134769阅读:来源:国知局

技术特征:

1.一种基于形变方法进行数据扩展的脱机手写汉字识别方法,其特征在于包括如下步骤:

在linux系统上搭建卷积神经网络的caffe深度学习框架平台;

准备数据集:数据集通过弹性形变,错切变换,小角度范围旋转方法扩展后得训练数据集;测试集为带有标签的脱机手写汉字;

利用训练数据集在caffe平台上训练卷积神经网络模型,得到测试结果,实现对脱机手写汉字的识别。

2.根据权利要求1所述的一种基于形变方法进行数据扩展的脱机手写汉字识别方法,其特征在于:在步骤2)中,训练数据集从HCL2000一级手写汉字数据集中处理后所得,处理方法为分类通过弹性形变,错切,小角度范围旋转获得设定数量的样本,将样本输入到模型中,在训练过程中,通过弹性形变模型学习到更多的字体笔画、骨架特征;通过错切,小角度范围旋转模仿出人写字偏斜的情况,从而学习到一些歪斜、旋转的汉字特征;测试集为随机从HCL2000数据集中取出的未使用过的样本,并带有标签。

3.根据权利要求1所述的一种基于形变方法进行数据扩展的脱机手写汉字识别方法,其特征在于:步骤3)卷积神经网络模型的卷积神经网络由输入层、隐含层和输出层组成,隐含层包括卷积层、最大化池采样层和全连接层;在网络训练参数调整上,为提高网络的鲁棒性和加快网络收敛,设定以下网络参数:

(1)学习率;学习率将随着迭代次数的增加逐渐减小,采用以下更新策略:

其中,为基础学习速率,为设定的参数,iter为迭代次数,取

(2)神经网络激活函数;采用RELU非线性激励函数代替以往的sigmoid函数;

(3)误差函数增加了动量项和规则化项;动量项是基于物理学中的牛顿定律,当误差曲面进入了“平坦区”后,网络可以更快地收敛;正则项则是为避免网络过拟合而引进的一个正则化系数,也称为权重衰减系数;

网络的最后一层,即全连接层,其与网络的分类任务相关联;输出层的神经元数量被设为所需分类的类别数目。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1