手写满文字母识别装置的制作方法

文档序号:12748494阅读:265来源:国知局
手写满文字母识别装置的制作方法

本发明涉及模式识别技术领域,尤其涉及一种手写满文字母识别方法及装置。



背景技术:

满语作为一种古老的语言之一,是一种极具代表的少数民族文字,研究少数民族文字识别方法是保护和传承少数民族文化遗产的重要技术手段,具有重要的社会价值和历史意义。目前汉字的手写识别已满足实用化需求,英文和数字的脱机手写识别产品也已经很成熟,但圈点满文的手写文字识别仍是一块空白的领域,尚待研究。

授权公告号CN 205451106 U的实用新型专利公开了一种手写满文字母采集系统,即基于该专利,可以实现对手写满文字母采集工作,依此建立满文字母库,获得满文字母数据样本,得到训练样本。

传统的文字识别方法提取的特征通常为单一特征,但对于满文字母,因其文字的特殊性,仅提取单一特征不具备一定的噪声抗干扰能力。因此,当噪声干扰较大时,会导致满文字母的识别率较低。



技术实现要素:

为克服现有技术中存在的问题,本发明公开一种手写满文字母识别方法及装置。

根据本公开实施例的第一方面,提供一种手写满文字母识别方法,包括:

对待识别的满文字母图像进行预处理;

分别采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值;

采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。

在一实例例中,所述方法还包括:

利用满文字母数据样本进行模型训练。

在一实施例中,所述利用满文字母数据样本进行模型训练,包括:

LDA降维矩阵计算,得到线性空间中最佳投影向量;

设定不同的K值反复训练,调整K-近邻的参数值。

在一实施例中,所述LDA降维矩阵计算,得到线性空间中最佳投影向量,包括:

对待识别的满文字母图像样本进行预处理;

分别采用方向特征提取方法和粗网络特征提取方法对所述待识别的满文字母图像样本提取特征,得到满文字母特征值;

分配数据空间存储满文字母特征值和标签;

计算各类样本期望以及总样本期望;

计算类间协方差矩阵Sb及类内协方差矩阵Sw;

求矩阵Sw-1Sb的特征向量,得到投影向量。

在一实施例中,所述设定不同的K值反复训练,调整K-近邻的参数值,包括:

对待识别的满文字母图像样本进行预处理;

分别采用方向特征提取方法和粗网络特征提取方法对所述待识别的满文字母图像样本提取特征,得到满文字母特征值;

采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

分配数据空间分别存储训练数据和测试元组,预设参数K;

维护一个大小为k的按距离由大到小的优先级队列,用于存储待识别元组。随机从待识别元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将待识别元组标号和距离存入优先级队列;

遍历训练元组集,计算当前待识别元组与测试元组的距离,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列;

遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。

测试元组集测试完毕后计算误差率,继续设定不同的K值重新训练,最后取误差率最小的K值。

在一实施例中,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列,包括:

当所述所得距离L大于优先级队列中的最大距离Lmax时,则舍弃该元组,遍历下一个元组。

当所述所得距离L小于优先级队列中的最大距离Lmax时,则删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列。

在一实施例中,所述对满文字母图像进行预处理,包括:

对满文字母图像进行字符大小的线性归一化、加虚拟笔划、字符的非线性归一化、笔划上的点的重采样、笔划上的点的平滑等等。

在一实施例中,分别采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值,包括:

对待识别的满文字母图像进行8方向特征提取,得到满文字母的方向特征值;

对待识别的满文字母图像进行粗网络特征提取,得到满文字母的网格特征值;

将满文字母的方向特征值和网格特征值组合为一列,得到满文字母特征值。

在一实施例中,采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母,包括:

维护一个大小为k的按距离由大到小的优先级队列,用于存储待识别元组。随机从待识别元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将待识别元组标号和距离存入优先级队列;

遍历训练元组集,计算当前待识别元组与测试元组的距离,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列;

遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。

根据本公开实施例的第二方面,提供一种手写满文字母识别装置,包括:

提取模块,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值;

降维模块,被配置为采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

分类模块,被配置为采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。

在一实施例中,所述装置还包括:

预处理模块,被配置为对待识别的满文字母图像进行预处理。

在一实施例中,所述装置还包括:

训练模块,被配置为利用满文字母数据样本进行模型训练。

在一实施例中,所述训练模块包括:

第一处理子模块,被配置为LDA降维矩阵计算,得到线性空间中最佳投影向量;

第二处理子模块,被配置为设定不同的K值反复训练,调整K-近邻的参数值。

在一实施例中,所述第一处理子模块包括:

预处理模块,被配置为对所述待识别的满文字母图像样本进行预处理。

提取模块,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像样本提取特征,得到满文字母特征值;

LDA降维矩阵计算模块,被配置为对LDA降维矩阵进行计算,得到线性空间中最佳投影向量。

在一实施例中,所述第二处理子模块包括:

预处理模块,被配置为对所述待识别的满文字母图像样本进行预处理。

提取模块,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像样本提取特征,得到满文字母特征值;

降维模块,被配置为采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

KNN训练模块,被配置为设定不同的K值反复训练,调整K-近邻的参数值。

在一实施例中,所述提取模块包括:

方向特征提取子模块,被配置为对待识别的满文字母图像进行8方向特征提取,或者对待识别的满文字母图像样本进行8方向特征提取,得到满文字母的方向特征值。

粗网络特征提取子模块,被配置为对待识别的满文字母图像进行粗网络特征提取,或者对待识别的满文字母图像样本进行粗网络特征提取,得到满文字母的网格特征值。

在一实施例中,所述分类模块包括:

距离计算单元,被配置为计算当前待识别元组与测试元组的距离。

比较选择单元,被配置为比较所得距离与优先级队列中的最大距离,得到最终的优先级队列。等待遍历结束后选择优先级队列中K个元组的多数类,将其作为测试元组的类别。

根据本公开实施例的第三方面,提供一种手写满文字母识别装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,处理器被配置为:

对待识别的满文字母图像进行预处理;

分别采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值;

采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。

本公开的实施例提供的技术方案可以包括以下有益效果:

采用方向特征提取和粗网络特征提取相结合的方法对待识别的满文字母图像提取特征,使得得到的满文字母特征值更精确,具有较好的噪声抗干扰能力,从而使得后续降维后采用KNN分类器根据该满文字母特征值识别出满文字母准确率较高。

通过对满文字母特征值进行LDA降维处理,从而减少了处理器的计算次数,提高了处理效率。另外待识别的满文字母特征数据在投影后具有最大的类间散度和最小的类内散度,为后期采用K-近邻方法进行分类提供了条件。

由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于像手写满文字母这种类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合,能够获得较高的识别率。此外,采用K-近邻方法易于编程,且不需要优化,提高了识别的效率。

通过对K-近邻分类器进行训练,得到了合适的模型参数,使得降维后的待识别的满文字母图像特征值进入分类器后,具有精确的分类效果。

通过对待识别满文字母图像进行预处理的操作,能够很好地减少类内变异对识别过程中的干扰,有利于提高满文字母图像的识别效率。

本发明实施例,采用方向特征和粗网络特征相结合的方法对待识别的满文字母图像提取特征,使得得到的满文字母特征值更精确;进一步的,采用LDA线性判决分析方法对满文字母特征值进行降维,一方面减少了维数提高了分类计算效率,另一方面使得降维后的满文字母特征值更加容易区分,具有较好的噪声抗干扰能力,从而使得采用K-近邻方法根据该降维后的满文字母特征值识别出的满文字母准确率较高。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1A是根据一示例性实施例示出的一种手写满文字母识别方法的流程图。

图1B是根据一示例性实施例示出的一种获得满文字母特征值的方法流程图。

图1C是根据一示例性实施例示出的一种满文字母特征值分类的方法流程图。

图2是根据一示例性实施例示出的另一种手写满文字母识别方法的流程图。

图2A是根据一示例性实施例示出的一种对满文字母样本进行模型训练的方法流程图。

图3是根据一示例性实施例示出的一种获得LDA降维矩阵的方法流程图。

图4是根据一示例性实施例示出的一种调整K-近邻参数的方法流程图。

图5是根据一示例性实施例示出的一种手写满文字母识别装置的框图。

图6是根据一示例性实施例示出的另一种手写满文字母识别装置的框图。

图7是根据一示例性实施例示出的另一种手写满文字母识别装置的框图。

图8A是根据一示例性实施例示出的另一种手写满文字母识别装置的框图。

图8B是根据一示例性实施例示出的另一种手写满文字母识别装置的框图。

图9是根据一示例性实施例示出的另一种手写满文字母识别装置的框图。

图10是根据一示例性实施例示出的另一种手续诶满文字母识别装置的框图。

图11是根据一示例性实施例示出的另一种手写满文字母识别装置的框图。

图12是根据一示例性实施例示出的一种适用于手写满文字母识别装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1A是根据一示例性实施例示出的一种手写满文字母识别方法的流程图,如图1A所示,该手写满文字母识别方法可用于各种终端设备上,该方法包括以下步骤:

在步骤S101中,分别采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值。

方向特征提取是指把每个满文字符图像分成M×M的格子,再在每个方格中提取与空间位置相关的N(4、8)方向特征,这N(4、8)个方向分别可以定义为上、下、左、右或者上、下、左、右、左上、左下、右上、右下。这种特征提取方法使得手写笔划上的点的方向特征与空间相关,而不是与时间相关。能够很好的解决由于笔划顺序和笔划数目变化带来的识别率下降问题。同时这种方法能够从每个满文字母样本中得到具有单一物理意义的固定维数的特征向量。

粗网络特征是属于统计特征中局部特征的一种,体现了满文字母的整体形状的分布。该方法把样本字母分成M×M个网格,然后依次统计每个网格中的像素数量,在识别阶段可以通过把每个网格统计的特征组合起来作为字符的统计特征并依次实现对字符的识别。该算法的每个网格中的像素都能反映字母的一部分特征,并且算法简单,易于实现。

在实际特征提取时需要对满文字母图像分别进行方向特征提取和粗网络特征提取,故如图1B所示,步骤S101包括如下步骤:

在步骤S1011中,对待识别的满文字母图像进行8方向特征提取,得到满文字母的方向特征值。

在该实施例中,所述对待识别的满文字母图像进行8方向特征提取方法如下:在对满文字母图像进行预处理后,得到了新的手写满文字母和满文字母轨迹点在非线性变化前后的点的映射关系,之后把字母分成8×8的方格,取每个小方格的中心为采样中心,得到8×8的采样点,然后对这些采样中心用Gabor包络提取8-方向特征。

在步骤S1012中,对待识别的满文字母图像进行粗网络特征提取,得到满文字母的网格特征值。

在该实施例中,所述对待识别的满文字母图像进行粗网络特征提取方法如下:求出经过预处理后得到的最终满文字母图像的外边框;然后将加框后的满文字母图像分割成8×8个网格;依次统计每一个网格内的黑像素比例;最后把统计后的8×8黑像素排成一列形成64维的网格特征向量。

在步骤S1013中,将满文字母的方向特征值和网格特征值组合为一列,得到满文字母特征值。

方向特征提取方法使得手写笔划上的点的方向特征与空间相关,体现的是方格中笔划在方向上的不同,该方法抗干扰能力强,但实现过程复杂度较高,在应用中较为复杂;粗网络特征提取利用每个网格中的像素来反映字母的一部分特征,该方法实现简单,区分相似字母的能力强,但是网格特征抗笔划位置干扰能力较差。因此,由于满文字母构成的特殊性,不能采用传统的单一特征提取,而采用所述两种方法相结合的特征提取方法。

采用方向特征提取和粗网络特征提取相结合的方法对待识别的满文字母图像提取特征,使得得到的满文字母特征值更精确,具有较好的噪声抗干扰能力,从而使得后续降维后采用KNN分类器根据该满文字母特征值识别出满文字母准确率较高。

在步骤S102中,采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值。

线性判别式分析(LinearDiscriminantAnalysis,LDA),也叫做Fisher线性判别(FisherLinearDiscrininant,FLD),是模式识别的经典算法。线性判别式分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间(即投影后)具有最大的类间距离和最小的类内距离,即样本在该空间上有最佳的可分离性。LDA是一种有监督的线性降维算法,与PCA保持数据信息不同,LDA是为了使得降维后的数据点尽可能地容易被区分。所以这里采用LDA方法对满文字母特征值进行降维操作。

在该实施例中,采用LDA线性判决分析的方法对所述满文字母特征值进行降维,首先需要在训练过程中计算降维矩阵,得到线性空间中最佳投影向量,即新的子空间的基矩阵。然后在识别过程中将待识别的满文字母特征向量投影到该子空间来实现对满文字母特征值的降维。

在该实施例中,LDA线性判别式分析的目的是对满文字母特征值进行降维处理,以提高后续的处理效率;另外待识别的满文字母特征数据在通过LDA之后,类内离散度矩阵汇总的数值较小,类间离散度矩阵中的数值较大,使得所分得的类间耦合度较低,类内的聚合度较高,为后期采用K-近邻方法进行分类提供了条件。

在步骤S103中,采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。

K近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

KNN算法本身简单有效,它是一种lazy-learning算法。在该实施例中,算法使用的模型实际上对应于对满文字母特征空间的划分。K值的选择,距离度量和分类决策规则是所述该实施例中KNN算法的三个基本要素:

1.K值的选择会对算法的结果产生重大影响。K值较小意味着只有与输入实例较近的训练实例才会对预测结果起作用,但容易发生过拟合;如果K值较大,优点是可以减少学习的估计误差,但缺点是学习的近似误差增大,这时与输入实例较远的训练实例也会对预测起作用,导致预测发生错误。在该实施例应用中,通过使用训练集进行训练,调整参数K最终得到分类效果最为合适的K值,参数训练过程在后面进行详细介绍。

2.该算法中的分类决策规则是多数表决,即由输入实例的K个最临近的训练实例中的多数类决定输入实例的类别。

3.距离度量采用Lp距离(p=2),即欧氏距离。由于在该实施例中进行了预处理操作,使得在度量之前每个属性的值都是规范化之后的,避免了具有较大初始值域的属性和具有较小初始值域的属性的权重不同问题。

在采用K-近邻算法进行分类时需要进行计算和比较,故如图1C所示,步骤S103包括如下步骤:

在步骤S1031中,维护一个大小为k的按距离由大到小的优先级队列,用于存储待识别元组。随机从待识别元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将待识别元组标号和距离存入优先级队列。

在步骤S1032中,遍历训练元组集,计算当前待识别元组与测试元组的距离,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列。

在该实施例中,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列,包括:

当所述所得距离L大于优先级队列中的最大距离Lmax时,则舍弃该元组,遍历下一个元组。

当所述所得距离L小于优先级队列中的最大距离Lmax时,则删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列。

在步骤S1033中,遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。

KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于像手写满文字母这种类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。

在该实施例中,采用K-近邻方法易于编程,且不需要优化;

在该实施例中,待识别的手写满文字母样本容量大,K值大小合适,K-近邻分类误差小,识别率较高。

另外,如图1A所示,在步骤S101之前,还包括:

在步骤S100中,对待识别的满文字母图像进行预处理操作。

预处理的主要目的是减少同一个满文字母类内不同样本之间的变异,即增强类内聚合度。

在该实施例中,对待识别的满文字母图像进行预处理操作主要包括对待识别的满文字母图像进行字符大小的线性归一化、加虚拟笔划、字符的非线性归一化、笔划上的点的重采样、笔划上的点的平滑等操作。

通过对待识别满文字母图像进行预处理的操作,能够很好地减少类内变异对识别过程中的干扰,有利于提高满文字母图像的识别效率。

图2是根据一示例性实施例示出的另一种手写满文字母识别方法的流程图,如图2示,在步骤S101之前,还可以包括如下步骤:

在步骤S104中,利用满文字母数据样本进行模型训练。

在该实施例中,如图2A所示,步骤S104包括如下步骤:

在步骤S1041中,进行LDA降维矩阵计算,得到线性空间中最佳投影向量。

在该实施例中,进行LDA降维矩阵计算的目的是:通过计算得到最佳投影向量,并使得投影后的样本具有最大的类间散度和最小的类内散度。

图3是根据一示例性实施例示出的一种进行LDA降维矩阵计算的方法流程图,包括如下步骤:

在步骤S201中,对待识别的满文字母图像样本进行预处理;

在步骤S202中,分别采用方向特征提取方法和粗网络特征提取方法对满文字母样本提取特征,得到满文字母特征值;

在步骤S203中,分配数据空间存储满文字母特征值和标签;

在步骤S204中,计算各类样本期望以及总样本期望;

在步骤S205中,计算类间协方差矩阵Sb及类内协方差矩阵Sw;

在该实施例中,步骤S205是将所有满文字母特征值样本中各个样本根据自己所属的满文字母类计算出样本与总体的协方差矩阵的总和,这从宏观上描述了所有类和总体之间的离散冗余程度。然后计算每个满文字母类内各个样本和所属类之间的协方差矩阵之和,这个矩阵所刻画的是从总体来看类内各个样本与该类之间的离散度,在该实施例中所刻画的类特性是由类内各个样本的平均值矩阵构成的。

在步骤S206中,求矩阵Sw-1Sb的特征向量,得到投影向量。

在该实施例中,步骤S206主要是利用Fisher准则计算特征值和特征向量,Fisher鉴别准则函数将样本在投影矢量上的类间散度和类内散度结合在一起,为确定最优投影方向提供了一个准则。当准则函数达到最大的矢量时,所确定的投影方向就是最佳投影向量。具体方法为:在得到特征值和特征向量之后,保留d个最大的特征值,及这d个特征值所对应的特征向量,并将这些特征向量正交标准化,从而构成新的子空间的基矩阵,也就是投影向量。

在步骤S1042中,通过设定不同的K值反复训练,调整K-近邻的参数值。

在该实施例中,对K-近邻分类器进行训练的目的是调整分类器的参数K,以使得降维后的待识别的满文字母图像特征值进入分类器后,具有精确的分类效果。

图4是根据一示例性实施例示出的一种对K-近邻分类器进行训练的方法流程图,包括如下步骤:

在步骤S301中,对待识别的满文字母图像样本进行预处理;

在步骤S302中,分别采用方向特征提取方法和粗网络特征提取方法对所述待识别的满文字母图像样本提取特征,得到满文字母特征值;

在步骤S303中,采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

在步骤S304中,分配数据空间分别存储训练数据和测试元组,预设参数K;

在步骤S305中,维护一个大小为k的按距离由大到小的优先级队列,用于存储待识别元组。随机从待识别元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将待识别元组标号和距离存入优先级队列;

在步骤S306中,遍历训练元组集,计算当前待识别元组与测试元组的距离,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列;

在一实施例中,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列,包括:

当所述所得距离L大于优先级队列中的最大距离Lmax时,则舍弃该元组,遍历下一个元组。

当所述所得距离L小于优先级队列中的最大距离Lmax时,则删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列。

在步骤S307中,遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。

在步骤S308中,测试元组集测试完毕后计算误差率,继续设定不同的K值重新训练,最后取误差率最小的K值。

由此可见,上述利用手写满文字母数据样本进行训练的方式简单、有效、易于实现。

上述实施例,通过对样本进行模型训练,可以获得较好的模型参数,从而为识别提供条件。

与前述手写满文字母识别方法实施例相对应,本公开还提供了手写满文字母识别装置实施例。

图6是根据一示例性实施例示出的一种手写满文字母识别装置的框图,如图6所示,手写满文字母识别装置包括:提取模块51、降维模块52和分类模块53。

提取模块51,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值;

降维模块52,被配置为采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

分类模块53,被配置为采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。

在一实施例中,所述装置还包括:

预处理模块54,被配置为待识别的满文字母图像进行预处理。

预处理的主要目的是减少同一个满文字母类内不同样本之间的变异,即增强类内聚合度。

在该实施例中,对待识别的满文字母图像进行预处理操作主要包括对待识别的满文字母图像进行字符大小的线性归一化、加虚拟笔划、字符的非线性归一化、笔划上的点的重采样、笔划上的点的平滑等操作。

在一实施例中,所述装置还包括:

训练模块50,被配置为利用满文字母数据样本进行模型训练。

在一实施例中,所述训练模块包括:

第一处理子模块501,被配置为LDA降维矩阵计算,得到线性空间中最佳投影向量;

第二处理子模块502,被配置为设定不同的K值反复训练,调整K-近邻的参数值。

在一实施例中,所述第一处理子模块501包括:

预处理模块5011,被配置为对所述待识别的满文字母图像样本进行预处理。

提取模块5012,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像样本提取特征,得到满文字母特征值;

LDA降维矩阵计算模块5013,被配置为对LDA降维矩阵进行计算,得到线性空间中最佳投影向量。

在该实施例中,进行LDA降维矩阵计算的目的是:通过计算得到最佳投影向量,并使得投影后的样本具有最大的类间散度和最小的类内散度。

在一实施例中,所述第二处理子模块502包括:

预处理模块5021,被配置为对所述待识别的满文字母图像样本进行预处理。

提取模块5022,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像样本提取特征,得到满文字母特征值;

降维模块5023,被配置为采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;

KNN训练模块5024,被配置为设定不同的K值反复训练,调整K-近邻的参数值。

在该实施例中,对K-近邻分类器进行训练的目的是调整分类器的参数K,以使得降维后的满文字母图像特征值进入分类器后,具有精确的分类效果。

在一实施例中,所述提取模块51被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值。提取模块51包括:

方向特征提取子模块511,被配置为对待识别的满文字母图像进行8方向特征提取,或者对待识别的满文字母图像样本进行8方向特征提取,得到满文字母的方向特征值。

在该实施例中,所述对待识别的满文字母图像进行8方向特征提取,或者对待识别的满文字母图像样本进行8方向特征提取方法如下:在对满文字母图像进行预处理后,得到了新的手写满文字母和满文字母轨迹点在非线性变化前后的点的映射关系,之后把字母分成8×8的方格,取每个小方格的中心为采样中心,得到8×8的采样点,然后对这些采样中心用Gabor包络提取8-方向特征。

粗网络特征提取子模块512,被配置为对待识别的满文字母图像进行粗网络特征提取,或者对待识别的满文字母图像样本进行粗网络特征提取,得到满文字母的网格特征值。

在该实施例中,所述对待识别的满文字母图像进行粗网络特征提取,或者对待识别的满文字母图像样本进行粗网络特征提取方法如下:求出经过预处理后得到的最终满文字母图像的外边框;然后将加框后的满文字母图像分割成8×8个网格;依次统计每一个网格内的黑像素比例;最后把统计后的8×8黑像素排成一列形成64维的网格特征向量。

在一实施例中,所述分类模块53被配置为采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。K-近邻方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

在一实施例中,所述分类模块53包括:

距离计算单元531,被配置为计算当前待识别元组与测试元组的距离。

距离度量采用Lp距离(p=2),即欧氏距离。由于在该实施例中进行了预处理操作,使得在度量之前每个属性的值都是规范化之后的,避免了具有较大初始值域的属性和具有较小初始值域的属性的权重不同问题。

比较选择单元532,被配置为比较所得距离与优先级队列中的最大距离,得到最终的优先级队列。等待遍历结束后选择优先级队列中K个元组的多数类,将其作为测试元组的类别。

在该实施例中,比较所得距离L与优先级队列中的最大距离Lmax,得到最终的优先级队列,包括:

当所述所得距离L大于优先级队列中的最大距离Lmax时,则舍弃该元组,遍历下一个元组。

当所述所得距离L小于优先级队列中的最大距离Lmax时,则删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列。

关于上述实施例中的装置,其中各个模块、子模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图12是根据一示例性实施例示出的一种适用于满文字母识别装置的框图。例如,装置1200可以是ARM,移动电话,消息收发设备,平板设备等嵌入式设备。

参照图12,装置1200可以包括以下一个或多个组件:处理组件1202,存储器1204,电源组件1206,多媒体组件1208,音频组件1210,输入/输出(I/O)的接口1212,以及通信组件1214。

处理组件1202通常控制装置1200的整体操作,诸如与显示,数据计算,数据通信和记录操作相关联的操作。处理元件1202可以包括一个或多个处理器1220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1202可以包括一个或多个模块,便于处理组件1202和其他组件之间的交互。例如,处理组件1202可以包括多媒体模块,以方便多媒体组件1208和处理组件1202之间的交互。

存储器1204被配置为存储各种类型的数据以支持在设备1200的操作。这些数据的示例包括用于在装置1200上操作的任何应用程序或方法的指令,文本数据,消息,图片,视频等。存储器1204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器等。

电力组件1206为装置1200的各种组件提供电力。电力组件1206可以包括电源管理系统,一个或多个电源,及其他与为装置1200生成、管理和分配电力相关联的组件。

多媒体组件1208包括在所述装置1200和用户之间的提供一个输出接口的屏幕。该屏幕包括液晶显示器(LCD)和触摸面板(TP),以接收来自用户的输入信号。在一些实施例中,多媒体组件1208包括一个或多个摄像头。当设备1200处于操作模式,如拍照模式或录像模式时,摄像头可以接收外部的多媒体数据。

音频组件1210被配置为输出和/或输入音频信号。例如,音频组件1210包括一个麦克风(MIC),当装置1200处于操作模式,如录音模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1204或经由通信组件1214发送。在一些实施例中,音频组件1210还包括一个扬声器,用于输出音频信号。

I/O接口1212为处理组件1202和外围接口模块之间提供接口,上述外围接口模块可以是按键,触摸按键等。这些按键可以包括但不限于:音量按钮、复位按钮。

通信组件1214被配置为便于装置1200和其他设备之间有线或无线方式的通信。装置1200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,所述通信部件1214还包括串行通信模块,以完成与上位机的通信。

在示例性实施例中,装置1200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现成可编程门阵列(FPGA)控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其他实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1