一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法

文档序号:6553847阅读:313来源:国知局
专利名称:一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法
技术领域
本发明属于利用计算机处理设备识别手写文字图像的技术领域,特别是涉及一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法。
背景技术
手写汉字识别一般是指用户通过手写输入设备(比如手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来, 对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。 但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。

发明内容
本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应特定用户书写风格从而提高识别率的方法。本发明采用的技术方案为
一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法,其步骤如下
(1)、选取少量的特定用户的增量样本;
(2)、对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型;
(3)、利用更新后的线性鉴别分析(LDA)模型,计算增量样本在新的线性鉴别分析 (LDA)特征空间中每个类的均值向量和协方差矩阵;
(4)、利用更新后的线性鉴别分析(LDA)模型,计算原始样本在新的线性鉴别分析 (LDA)特征空间中每个类的均值向量和协方差矩阵;
(5)、计算合并后总样本在新的线性鉴别分析(LDA)特征空间中每个类别的均值向量和协方差矩阵;
(6)、根据合并后总样本在新的线性鉴别分析(LDA)特征空间中每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数(MQDF)分类器。所述步骤(1)为选择特定用户少量的样本,用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为ι 二 (i=i,…,对,#为样本数, 并设其类别数是#;设增量样本为/ 二 {yj 二人…,Z入Z为增量样本数,并设其类别数是 P。则合并后的总的样本可表示为Z=IU 7二 {zj …,Z^V入样本总数为Ζ+Λ/,类别总数为G且C夕K夕P。不失一般性,我们假设对于合并后的总样本中的第Gii 二人...,C) 类,分别在原始样本#和增量样本Z中有/和人.个样本。因此,对于合并后新的样本,属于 W^a=I,…,C)类的样本数为$尸/ ζλ。所述步骤(2)对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型,其步骤包括
(Α)、增量样本特征提取,对于每一个增量样本,都采用八方向特征提取方法提取其方向特征;
(B)、令原始线性鉴别分析变换(LDA)矩阵为
,设经过八方向特征提取后,增量样本中类别i(i=l,…,C)的特征向量为、则
可根据增量线性鉴别分析(ILDA)技术并结合增量样本的特征向量Ji将原始线性鉴别分析
变换矩阵更新为WLife。所述步骤(3)利用更新后的线性鉴别分析变换(LDA)模型,计算增量样本在新的线性鉴别分析变换(LDA)特征空间中每个类的均值向量和协方差矩阵,其步骤包括
(Α)、设增量样本中类别i G二人…,C)经过八方向特征提取后的均值向量为力,样本个数为则通过以下公式求得Λ
权利要求
1.一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法,其特征在于包括如下步骤(1)、选取用于更新模板及识别引擎的特定用户的增量样本;(2)、对增量样本提取特征,并利用增量线性鉴别分析方法对原始的线性鉴别分析模型进行更新生成新的线性鉴别分析模型;(3)、利用更新后的线性鉴别分析模型,计算增量样本在新的线性鉴别分析特征空间中每个类的均值向量和协方差矩阵;(4)、利用更新后的线性鉴别分析模型,计算原始样本在新的线性鉴别分析特征空间中每个类的均值向量和协方差矩阵;(5)、计算合并后总样本在新的线性鉴别分析特征空间中每个类别的均值向量和协方差矩阵;(6)、根据合并后总样本在新的线性鉴别分析特征空间中每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数分类器。
2.根据权利要求1所述的基于鉴别子空间的增量二次鉴别函数的书写者自适应方法, 其特征在于所述步骤(1)的具体操作如下设定原始样本为I 二红^ (i=l,…,对,#为样本数,并设其类别数是设增量样本为7 二 {yj 二人…,Z入Z为增量样本数,并设其类别数是Λ则合并后的总的样本表示为 Z=XU V = {zj …,Z^V入样本总数为Ζ+Λ/,类别总数为C,且对于合并后的总样本中的第Gii 二人…’ C)类,分别在原始样本#和增量样本Z中有&和厶个样本, 合并后新的样本,属于第Gii=A…,C)类的样本数为力二&Wi。
3.根据权利要求2所述的基于鉴别子空间的增量二次鉴别函数的书写者自适应方法, 其特征在于所述步骤(2)具体更新步骤如下(21)、增量样本特征提取,对于每一个增量样本,都采用八方向特征提取方法提取其方向特征;(22)、设定原始线性鉴别分析变换矩阵为巧_,经过八方向特征提取后,增量样本中类别i「i二人…,以的特征向量为ι则根据增量线性鉴别分析技术并结合增量样本的特征向量M将原始线性鉴别分析变换矩阵更新为巧碰。
4.根据权利要求3所述的基于鉴别子空间的增量二次鉴别函数的书写者自适应方法, 其特征在于所述步骤(3)具体更新步骤如下(31)、设定增量样本中类别i「i二人...,C)经过八方向特征提取后的均值向量为力,样本个数力则通过以下公式求得力(32)、设定增量样本中类别iG二人...,C)在新的线性鉴别分析特征空间中的均值向量为八―碰,样本个数力根据步骤(31)的处 结果,ilil以下公式求得
5.根据权利要求4所述的基于鉴别子空间的增量二次鉴别函数的书写者自适应方法, 其特征在于所述步骤(4)具体更新步骤如下(41)、设定原始样本中类别i「i二人…,C)经过八方向特征提取后的均值向量为&,样本个数为巧,则通过以下公式求得
6.根据权利要求5所述的基于鉴别子空间的增量二次鉴别函数的书写者自适应方法,其特征在于所述步骤(5)具体更新步骤如下(51)、设定合并后总样本中类别i「i二人...,C)在新的线性鉴别分析特征空间中的均值向量为ζ;,通过以下公式求得^
7.根据权利要求6所述的基于鉴别子空间的增量二次鉴别函数的书写者自适应方法, 其特征在于所述步骤(6)具体更新步骤如下(61)、令Cj代表第i个类别(i=l,…,以,。和&分别表示根据步骤(5)得到的合并后总样本在新的线性鉴别分析特征空间中每个类的均值向量和协方差矩阵,并设每个类别的先验概率相等,则原始的二次鉴别函数由以下公式求得
全文摘要
本发明提供一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法,利用具有特定用户书写风格的增量样本动态更新MQDF识别模型,使更新后的MQDF识别模型能适应特定用户的书写风格,从而达到提高该特定用户的识别率的效果。本发明创新性的将增量学习算法与汉字识别中的MQDF分类算法以及ILDA算法相结合提出了一种ILDAIMQDF算法,并把ILDAIMQDF应用于基于手写汉字识别的书写者自适应领域,解决了手写汉字识别引擎对特定用户识别率不高的问题。利用本发明提供的方法,手写汉字识别引擎能自适应特定用户的手写风格,提高识别准确度。
文档编号G06K9/68GK102184425SQ20111010877
公开日2011年9月14日 申请日期2011年4月28日 优先权日2011年4月28日
发明者丁凯, 刘岗, 金连文 申请人:华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1