一种基于方向向量的文字识别方法和识别装置的制作方法

文档序号:6605545阅读:140来源:国知局
专利名称:一种基于方向向量的文字识别方法和识别装置的制作方法
技术领域
本发明涉及手写识别技术领域,特别是涉及一种基于方向向量的文字识别方法和 识别装置。
背景技术
手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的手写轨 迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射 过程,是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等移动信息工具的 普及,手写识别技术也进入了规模应用时代。手写识别能够使用户按照最自然、最方便的输 入方式进行文字输入,易学易用,可取代键盘或者鼠标。实际应用中,用于手写输入的设备 有许多种,比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。在手写识别中,不同的人的书写习惯不同,例如写0是大多数人是逆时针的,但 也有人是顺时针的。目前,对于反方向书写习惯的文字,所采用基于方向向量的文字识别方 法往往会出现一些错误,识别出的文字与输入笔迹信息不符。因此,目前需要本领域技术人员迫切解决的一个技术问题就是如何能够创新地 提出一种基于方向向量的文字识别方法和识别装置,以解决现有技术中存在的不足,提高 文字识别的准确性和体验度。

发明内容
本发明所要解决的技术问题是提供一种基于方向向量的文字识别方法和识别装 置,用以有效提高文字识别的准确性、可靠性以及体验度。为了解决上述问题,本发明公开了一种基于方向向量的文字识别方法,所述方法 包括接收输入笔迹信息;求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;用所求取的方向向量和所统计的方向向量的个数构建矩阵Al,求取其特征向量 Tl ;将所述矩阵Al中各方向向量调整180度得到矩阵A2,求取其特征向量T2 ;分别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。优选的,所述方向向量的取值范围为为0°到360°。优选的,所述调整180度具体指加上或减去180度。优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270° 和 315° 8 个方向的向量。优选的,所述方法还包括在识别引擎中创建每一文字的文字模型。
4
优选的,所述创建每一文字的文字模型具体包括以下子步骤采集文字的输入样本;提取各输入样本的方向向量,并统计各方向向量的个数;分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向 量;对所求取的各特征向量进行聚类;存储聚类结果到识别引擎作为当前文字的文字模型。本发明还提供了一种基于方向向量的文字识别装置,所述装置包括接收模块,用于接收输入笔迹信息;处理模块,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;第一求取模块,用于用所求取的方向向量和所统计的方向向量的个数构建矩阵 Al,求取其特征向量Tl ;第二求取模块,用于将所述矩阵Al中各方向向量调整180度得到矩阵A2,求取其 特征向量T2;匹配模块,用于分别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹配, 获取匹配度;输出模块,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量 的文字。优选的,所述装置还包括创建模块,在识别引擎中创建每一文字的文字模型。优选的,所述创建模块包括以下子模块采集子模块,用于采集文字的输入样本;提取子模块,用于提取各输入样本的方向向量,并统计各方向向量的个数;构建子模块,用于分别用所求取的方向向量和所统计的方向向量的个数构建矩 阵,求取其特征向量;聚类子模块,用于对所求取的各特征向量进行聚类;存储子模块,用于存储聚类结果到识别引擎作为当前文字的文字模型。优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270° 和 315° 8 个方向的向量。与现有技术相比,本发明具有以下优点本发明通过接收输入笔迹信息,求取所接收的笔迹信息的方向向量,并统计各方 向向量的个数,用所求取的方向向量和所统计的方向向量的个数构建矩阵Al,求取其特征 向量Tl,将所述矩阵Al中各方向向量调整180度得到矩阵A2,求取其特征向量T2,分别用 特征向量Tl和T2与预建的识别引擎的文字模型进行匹配,获取匹配度,将所获取的匹配度 进行排序,按照匹配度从高到低输出预设数量的文字,当输入的笔迹信息与常规习惯不同, 为相反方向时,通过对方向向量进行旋转调整,保证了文字识别的准确性。


图1是本发明实施例一所述的一种基于方向向量的文字识别方法的流程图2是本发明实施例二所述的一种基于方向向量的文字识别装置的结构图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。随着数字时代的到来,各种数字产品纷纷问世,便携式掌上电脑、个人数字助理 (PDA, Personal Digital Assistant)、智能手机、导航设备、学习机、电子书等移动信息工 具逐日普及,手写输入成为越来越多用户的需要。如果能够提出一种有效识别文字的方法, 那么将会给数字产品的发展提供强有力的帮助。因此,本专利发明人创造性地提出了本发明实施例的核心构思之一,即提供一种 基于方向向量的文字识别方法和识别装置,通过接收输入笔迹信息,求取所接收的笔迹信 息的方向向量,并统计各方向向量的个数,用所求取的方向向量和所统计的方向向量的个 数构建矩阵Al,求取其特征向量Tl,将所述矩阵Al中各方向向量调整180度得到矩阵A2, 求取其特征向量T2,分别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹配,获取 匹配度,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。实施例一参照图1,示出了本发明的一种基于方向向量的文字识别方法的流程图,所述方法 具体包括S101,接收输入笔迹信息;笔迹,是人在书写的过程中留下的痕迹,是书写者的主观因素和客观条件之间相 互作用、相互矛盾的产物。本实施例中所述的笔迹信息简单的来说,是指用户在使用电子设 备时,手写输入所产生的痕迹。其中,手写所输入的痕迹,也即这里所要接收的输入笔迹信 肩、οS102,求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;优选的,所述方向向量的取值范围为0°到360°。优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270° 和 315° 8 个方向的向量。S103,用所求取的方向向量和所统计的方向向量的个数构建矩阵Al,求取其特征 向量Tl ;对于不同的文字,其书写的笔迹信息是不相同的,接收到输入笔迹信息时,提取其 笔迹信息的方向向量并统计各方向向量的个数。具体的来说,提取输入笔迹信息在0°、 45°、90°、135°、180°、225°、270°和315° 8个方向的向量。为更为直观的介绍所述的 方法,以输入0的笔迹信息为例进行介绍,假设所提取笔迹信息在所述8个方向上的方向向 量的个数分别为10,20,30,15,25,5,35,40。用所求取的方向向量和所统计的方向向量的个 数构建矩阵Al,求取其特征向量Tl,具体求取过程这里不做详细介绍。S104,将所述矩阵Al中各方向向量调整180度得到矩阵A2,求取其特征向量T2 ;优选的,所述调整180度具体指加上或减去180度。实际应用中,人们书写习惯的不同,以书写“8”和“0”为例来说明,最为常见的书 写习惯都是从上而下,从左而右的,是逆时针方向书写的,也有一部分人会采用顺时针的方向进行书写。显然,这两种常见的书写习惯下所产生的笔迹信息是不同的,相应的其方向向 量也会存在差异,针对这种情况,对各方向向量进行180度的调整,对应到前面的介绍进行 说明,具体为0°、45°、90°、135°、180°、225°、270°和315°分别加上或减去180度, 调整后的方向向量值落在0°到360°,调整后对应8个方向的方向向量分别为180°、 225°、270、315°、° 0°、45°、90°和135°,用调整后的方向向量替换矩阵Al中对应的 方向向量,得到新的矩阵A2,求取新矩阵A2的特征向量T2。S105,分别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹配,获取匹配 度;所述识别引擎中包含有各文字的文字模型。优选的,所述方法还包括S100,在识别引擎中创建每一文字的文字模型。识别方法中所涉及到的识别引擎,是之前所创建的,因此,所述的方法优选的包括 在识别引擎中创建每一文字的文字模型。更为优选的,所述SlOO具体包括以下子步骤Si,采集文字的输入样本;输入样本的采集,实际中针对各个文字可以采集100个不同背景人书写的文字样 本,也即收集100个输入笔迹信息作为输入样本。S2,提取各输入样本的方向向量,并统计各方向向量的个数;S3,分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征
向量;通过提取各个输入样本的方向向量,并且统计各方向向量的个数,并用各个输入 样本所统计的方向向量和方向向量的个数构建矩阵,求取其特征向量。各个输入样本对应 各自的特征向量。S4,对所求取的各特征向量进行聚类;每一个文字,其多个输入样本会相应的求取的多个特征向量,对所求取的多个特 征向量进行聚类处理。具体实现中可以聚为一类或多类。S5,存储聚类结果到识别引擎作为当前文字的文字模型。存储聚类处理的聚类结果到识别引擎作为当前文字的文字模型。在实际的识别中,按照前面所介绍的方法,求取其对应的特征向量Tl和T2后,分 别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹配,具体匹配中,同一文字所 对应的多个类,叫做类内匹配;不同文字对应的类称为类间匹配,通过匹配获取相应的匹配 度。S106,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。将所获取的匹配度进行排序,可采用从高到低的顺序进行排序,也可采用从低到 高的顺序进行排序,需要具体介绍的是,对于类内匹配的匹配度选取匹配度最高的一个与 其他类间的进行排序,完成排序后,按照所排的顺序从高到低输出所需数量的文字,具体应 用中输出的文字数量可以进行设定,如输出前五个或前十个等等。这里所述的匹配度亦可 以是相似度或者是匹配概率,同时还可以采用距离进行度量匹配度。本实施例所述的方法,借助方向向量高效准确的完成了文字的识别,尤其保证了
7对于笔迹信息与常规习惯不同,为相反方向时,其文字识别的准确性。实施例二 参照图2,示出了本发明的一种基于方向向量的文字识别装置的结构图,所述装置 包括接收模块201,用于接收输入笔迹信息;处理模块202,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个 数;第一求取模块203,用于用所求取的方向向量和所统计的方向向量的个数构建矩 阵Al,求取其特征向量Tl ;第二求取模块204,用于将所述矩阵Al中各方向向量调整180度得到矩阵A2,求 取其特征向量T2;匹配模块205,用于分别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹 配,获取匹配度;输出模块206,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数
量的文字。优选的,所述装置还包括创建模块200,在识别引擎中创建每一文字的文字模型。优选的,所述创建模块200包括以下子模块采集子模块2001,用于采集文字的输入样本;提取子模块2002,用于提取各输入样本的方向向量,并统计各方向向量的个数;构建子模块2003,用于分别用所求取的方向向量和所统计的方向向量的个数构建 矩阵,求取其特征向量;聚类子模块2004,用于对所求取的各特征向量进行聚类;存储子模块2005,用于存储聚类结果到识别引擎作为当前文字的文字模型。优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270° 和 315° 8 个方向的向量。本发明可以应用于各种具有手写输入功能的移动信息工具,如便携式掌上电脑、 PDA、智能手机、导航设备、学习机、电子书等,用以准确可靠的完成文字的识别。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例 而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部 分说明即可。以上对本发明所提供的一种基于方向向量的文字识别方法和识别装置进行了详 细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说 明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据 本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不 应理解为对本发明的限制。
权利要求
一种基于方向向量的文字识别方法,其特征在于,所述方法包括接收输入笔迹信息;求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
2.如权利要求1所述的识别方法,其特征在于 所述方向向量的取值范围为为0°到360°。
3.如权利要求2所述的识别方法,其特征在于 所述调整180度具体指加上或减去180度。
4.如权利要求3所述的识别方法,其特征在于所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315° 8个方向的向量。
5.如权利要求1所述的识别方法,其特征在于,所述方法还包括 在识别引擎中创建每一文字的文字模型。
6.如权利要求5所述的识别方法,其特征在于,所述创建每一文字的文字模型具体包 括以下子步骤采集文字的输入样本;提取各输入样本的方向向量,并统计各方向向量的个数;分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;对所求取的各特征向量进行聚类;存储聚类结果到识别引擎作为当前文字的文字模型。
7.一种基于方向向量的文字识别装置,其中特征在于,所述装置包括 接收模块,用于接收输入笔迹信息;处理模块,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个数; 第一求取模块,用于用所求取的方向向量和所统计的方向向量的个数构建矩阵Al,求 取其特征向量Tl ;第二求取模块,用于将所述矩阵Al中各方向向量调整180度得到矩阵A2,求取其特征 向量T2 ;匹配模块,用于分别用特征向量Tl和T2与预建的识别引擎的文字模型进行匹配,获取 匹配度;输出模块,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
8.如权利要求7所述的识别装置,其特征在于,所述装置还包括 创建模块,在识别引擎中创建每一文字的文字模型。
9.如权利要求8所述的识别装置,其特征在于,所述创建模块包括以下子模块 采集子模块,用于采集文字的输入样本;提取子模块,用于提取各输入样本的方向向量,并统计各方向向量的个数;构建子模块,用于分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求 取其特征向量;聚类子模块,用于对所求取的各特征向量进行聚类; 存储子模块,用于存储聚类结果到识别引擎作为当前文字的文字模型。
10.如权利要求9所述的识别装置,其特征在于所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315° 8个方向的向
全文摘要
本发明提供了一种基于方向向量的文字识别方法和识别装置,通过接收输入笔迹信息,求取所接收的笔迹信息的方向向量,并统计各方向向量的个数,用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1,将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2,分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字,当输入的笔迹信息与常规习惯不同,为相反方向时,通过对方向向量进行旋转调整,保证了文字识别的准确性。
文档编号G06F3/041GK101893960SQ201010221048
公开日2010年11月24日 申请日期2010年6月28日 优先权日2010年6月28日
发明者张连毅, 李健, 武卫东 申请人:北京捷通华声语音技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1