以直线段为主的手写体字符的预处理方法和微处理器的制作方法

文档序号:6411087阅读:193来源:国知局
专利名称:以直线段为主的手写体字符的预处理方法和微处理器的制作方法
技术领域
本发明一般涉及手写体识别,尤其涉及手写体输入的直线段笔画的识别方法。
人类手写体的机器识别是一项非常困难的问题,而且近年来随着基于笔式计算机设备的剧增,它成为待解决的重要研究问题。对于这个问题的解决已有许多不同的方法,但一种有效的方法是将手写体划分为一序列的基本移动或“笔画”,并使用这种笔画(用某些方法参数化)输入到基于笔画的字符识别器中。
在基于笔画的识别器中的一项关键要求是同一字符类的多个实例(如不同时候和不同书写者所写的字母“A”)应该每次都被划分到相似的笔画集中,这将有助于确保识别不会太难,因为字符实例的描述将“看起来”象字符识别器中的描述。在理想情况下,一个给定字符的所有实例应该总是包含着同样的笔画数,这些笔画都应该在同样的相关位置,并且它们的特征描述在所有的实例中都应非常相似。这种理想情况在实际中是不可达到的,但在某中程度上是可以接近的,识别精度也可以提高。
在现有技术中,笔画边界设置在笔的移动速度在垂直(或“Y”)方向为零的点处,即在书写开始向上移动、或向下移动的点处。于是笔画的结果集被称为“向上笔画”和“向下笔画”。这种方法在Mermelstein & Eden,“手写体连写词的计算机识别实验”,信息和控制第7卷255-270页,1964中有所讨论。此方法存在的一个问题是对垂直方向的变化完全敏感,而对水平方向的变化一点也不敏感。然而许多字符是由水平段组成的例如在字母“t”的交叉和字母“E”的三叉处,水平段比垂直段多,即使在斜体书写时也是如此。一个基于Y速度的笔画分段方法应该将一个水平段划分为一画,但仅仅因为在垂直方向的微小跳动,水平段经常被划分为二画,三画,甚至更多画,这就导致了较低的识别精度,因为同一字符的多个实例将经常被划分为看起来不同的笔画集。修正这种方法不精确性的尝试虽然取得了一些成功,包括在创建一个新笔画之前设定一个最小的垂直方向变化量,但是许多同样的基本问题仍未解决。
相应地,笔画划分技术要求更精确一些,并且它不受在以上讨论方法中问题的影响,象Y-速度(Y-velocity)法。


图1是根据本发明的实施方案的识别笔画边界操作的流程图。
图2展示了根据本发明的一个实施方案在图1中110步之后,产生的手写体输入分割点。
图3展示了根据本发明的一个实施方案在图1中112步之后产生的手写体输入分割点。
图4展示了一序列表示图2中手写体输入的直线段(笔画)。
图5展示了确定一序列表示手写体输入的直线段(笔画),其中要抬起输入笔(阴影线)。
图6是在确定角度过程中说明角度变化的分解图。
图7图示性地展示了为图6中每点计算的角度变化值。
图8是根据本发明用于识别直线段为主的手写体字符的手写识别微处理器/设备的框图。
一般来说,手写体字符输入是从用户那里以独立连续段的形式收集的。一个独立连续段由一个或多个笔段组成,一个笔段是指在笔与输入设备象数字输入板或纸接触期间由笔留下的标志。
在本发明中,一个或多个独立连续段是被划分为笔画的手写体输入的基本单元。一个笔画是实际手写体输入的直线段近似,手写体输入是电子捕捉方式的输入,它包括但不局限于以下方式手写体输入;电子化输入;压力捕捉方式输入;象印模(stamped)输入;电子接受方式输入,象传真;寻呼机,或其它设备。
一个段可表示为一序列的点,这些点通过输入设备以几乎规则的间隔取样,每个点至少需一个X坐标,一个Y坐标和一个笔状态来描述。笔状态表示笔是否与输入板接触,而且只能取两个值中的一个值(抬笔和落笔)。段可通过使用数字化输入板来获得或者通过对图象进行线监测处理从扫描图象或传真图象中获得。象这种电子获取方法在技术上是可以理解的。在本发明的优选方法中,某些设备,象个人数字辅助器(PDA)或其它设备可以接收手写体输入。具有接收手写体输入功能的其它设备包括但不局限于下列各设备计算机,调制解调器,寻呼机,电话,数字化电视,交互式电视,具有数字化输入板的设备,传真设备,扫描设备及其它可以获得手写体输入的设备。一般来说,当手写体输入被电子捕捉后,每个点可表示为一个象素点,因此,一个段就可表示为设备上一系列象素点。
根据本发明,手写体输入的字符可以是字母,表意字符或者用于书面联系的其它形式字符或符号。
在本技术中,笔画边界设在角度变化值局部极大值处,且该值超过了预定的、反映书写中形状弯曲程度的阈值。由于形状弯曲总会发生,而不考虑笔的移动方向,因此这种方法就会导致对手写体输入的不同部分,如单词或字符不灵敏。参照图1,图1展示了本发明方法的流程图。来自数字化装置或其它装置的手写体输入以X,Y坐标和抬笔,落笔状态(102)的形式被接收。一般来说,这些点以象素点表示。被选择的这些象素点的X,Y输入坐标需经过比例变换(104),以便变换后的坐标值在预先规定的限度内,经过比例变换的X,Y坐标还要经过平滑处理以消除由数字化输入装置引起的高频躁声。平滑处理是通过计算某一点及其相邻的点的坐标(X,Y)的平均值而得到的,(将该点与离它最近的较高的点加权),并用该平均值代替该点的(X,Y)坐标值。理想情况下,平滑处理的窗口大小是固定不变的。如果相互分离的落笔状态的两条线段交叉时,就不进行平滑处理。连结前面的点到当前点就形成了第一个矢量,连结当前点到当下一个点就形成了第二个矢量。第一个矢量与第二个矢量之间的夹角就确定下来(108),其为当前点的角度变化值(见图6)。位于角度变化值极大值处且超过了预定的阈值(110)(见图7)的潜在分割点被认为是落笔点。可通过选择阈值来使真分割点尽可能多,使伪分割点尽可能少(如由颤动产生的分割点),这样就消除了伪分割点(112),例如钩,也就是,先消除在落笔段首/尾处的小距离笔移动,并且当第一个分割点处的角度变化值小于第二个分割点处的角度变化值且该点位于离第一个分割点的预定的范围内,就删除第一个分割点,这样从有用的分割点内就可确定一序列直线段笔画(114)。当两个分割点之间是抬笔状态时,也在它们之间引入一条直线段。
每个直线段笔画一般用四个参数描述直线段中点的X坐标,直线段中点的Y坐标,直线段的长度及它相对于预定参考系的角度。
参见图2和图3,图2展示了图1中110步之后,由本发明的实施方案产生的手写体输入分割点。这些分割点来自于局部角度变化值极大值处且该值超过了预定阈值,还来自落笔段的首尾处。因此在图2中就确定了段(201,202,204,206,208,210,212,214,216,218)。每条线段的边界由两个分割点来确定。
图3展示了图1中112步之后,由本发明的实施方案产生的手写体输入分割点(302)。注意,图1中的分割点220在图3中消除了。即线段201表示一个“钩”,即人为现象(artifact),就消除分割点220。决定分割点220是伪分割点的规则是该点到分割点222的距离小于预定的距离,分割点222同分割点220相比有较大的角度变化值。
图4展示了图2中手写体输入的一连串直线段笔画(402),图3中的任意两个连续分割点之间的点的序列用图4中的直线来代替。
有时笔需要从输入设备上抬起(抬笔段)并在一个新位置放下以继续进行手写输入,在图5中展示了这个例子。虚线(502)表示笔在该处笔抬起的线段。在预处理末期,抬笔笔画与落笔笔画是不可分辨的。
图6是说明角度变化的分解图。第一个矢量(602)连结前一点K-1(来自原始输入数据)与当前点K,第二个矢量(604)连结当前点K与下一点K+1,两个矢量之间夹角就是K点的角度变化值。在落笔段的开始点处及结束点处,角度变化值赋为零。
图7图示性地展示了为图6中各点计算的角度变化值与原始点K之间的关系,图6中的各点用序号K标志。该图显示了角度变化的三个极大值(702,704,706),极大值702和704超过了预定阈值708,因此被选为潜在分割点。然而极大值706小于阈值708,因此不作为分割点。由于702和704表示的点之间的距离小于预定的距离阈值,因此两个表示极大值的点中仅有一个是有用分割点,另一个是伪分割点。既然极大值702大于极大值704,那么极大值702表示的点是有用分割点,而极大值704表示的点则是伪分割点。
两个阈值必须估计。为了选择潜在分割点,第一个阈值用于在角度变化曲线(图7)局部极大值处比较角度变化值。第二个阈值用于比较两个分割点之间的距离,以便区分有用分割点和伪分割点。当本发明的预处理方法用于手写体字符识别器上后,只要使用了容错字符识别器,那么以上两个阈值的精确值就不重要了。在为建立当本发明的一个具体实施方案而进行这些或其它参数的实验性调整时,追求的目标是在典型字符类的多个实例中尽可能获得一致的分割点。这完全可以通过检查生成的段如何随着被识别的手写体的实际样本变化来实现。
根据本发明,分割点的集合定义了一套相应的直线段笔画。这些笔画发送给基于笔画的字符识别器以进行手写体输入识别。
如图8所示,手写体识别微处理器/设备也可以使用本发明。它接收到如(X,Y,PEN)点序列的手写体字符输入时,就识别由大量(X,Y,PEN)值组成的手写体字符,其中X和Y是二维坐标系中的坐标且PEN是表示抬笔/落笔状态的二进制数值。该设备/手写体识别微处理器包括一个角度变化确定器(806),一个潜在分割点识别器(808),一个仿真消除器(810)和一个笔画确定器(812)。所述的设备/微处理器可以选择地至少包括下列之一一个比例转换器(802)和一个平滑处理器(804)。比例转换器(802)用于对X,Y坐标进行比例转换,以便转换后的值在预定的范围内。平滑处理器在角度变化确定器(806)之前,或与比例转换器一起运行(这里比例转换器被使用),它对比例转换后的X,Y坐标值进行平滑处理以消除高频噪声。角度变化确定器(806)接收(X,Y,PEN)点序列,并确定每个(X,Y,PEN)点的角度变化值。角度变化确定器也可以接收比例转换器(802)和平滑处理器(804)二者之一的输出。潜在分割点识别器(808)与角度变化确定器相连,识别角度变化值超过阈值的落笔点为潜在分割点。仿真消除器(810)与潜在分割点识别器(808)相连,用于消除伪分割点以提供有用的分割点。笔画确定器(812)与仿真消除器(810)相连,用于从有用分割点中确定一系列直线段笔画来表示手写体输入。
在另一个实施方案中,设备/手写体识别微处理器可能包括A>一个角度变化确定器(806),用于接收(X,Y,PEN)点,并确定每个(X,Y,PEN)点的角度变化值。B>与角度变化确定器相连的点-笔画描述器,用于确定有用分割点,并从这些有用点中生成一系列直线段笔画来表示手写体输入。可以选择性地包括一个数值调整器(814),它连接在角度变化确定器(806)之前,用于接收一系列(X,Y,PEN)值,并调整所述值以利处理,并向角度变化确定器(806)提供调整后的值。
例如,数值调整器(814)可以选择性地包括A>比例转换器(802),用于比例转换X,Y坐标以使转换后的值在预定范围内。B>平滑处理器(804),与比例转换器相连,用于对转换后的X,Y坐标值进行平滑处理以消除高频噪声。
在一种实施方案中,点-笔画描述器(816)可以包括A>一个潜在分割点识别器(808),与角度变化确定器(806)相连,用于将角度变化极大值超过了阈值的落笔点识别为潜在分割点。B>一个仿真消除器(810),与潜在分割点识别器(808)相连,用于消除伪分割点以提供有用的分割点。C>笔画确定器(812),与仿真消除器(810)相连,用于从有用分割点中确定一系列直线段笔画来表示手写体输入。
显然,本发明的方法可以在可见介质/计算机上实现,例如可见介质可能是计算机磁盘,或计算机存储单元。
本发明及其优选实施方案涉及新颖的、更精确的以直线段为主的字符的笔画分割方法(例如,汉字)。根据本发明,在手写体输入的多个实例中,输入的字符每次都被重复地划分为相似的直线段笔画集,通过一个基于笔画的字符识别器,这种笔画分割方法可提供更精确的说明。
熟练的技术人员会发现本发明的许多实施方案是很用的。一个明显的用处是使印刷体和写出的草书更相似,因此使识别更容易;另一个实施例是可将扫描的或“非在线”的手写段分割为笔画。对这种情况来说,采用本发明的直接方法是对手写体进行细化以得到定宽点曲线,由于缺少暂时信息使得交叉点和接触弯曲点很相似,因此笔画边界可设定在角度变化极大值处和交叉点处。
对熟练的技术人员来说,本公开发明可以进行种种修改,除了特别提出及描述的实施例外,还可以有更多的实施例。因此附加的权利要求书包含了属于本发明精神和范围内的所有修改及与其等价物。
权利要求
1.一种方法,包括下列步骤将从手写体输入采集的样点送入手写体识别器中,其中在点之间形成矢量;为每一个点确定连接于该点的两个矢量的角度变化值;将每个点的角度变化值同预定阈值比较,如果每个点的角度变化值大于预定阈值,就识别该点为潜在分割点;消除伪分割点,伪分割点是指角度变化值大于阈值的潜在分割点,但其与另一个角度变化值大于阈值的潜在分割点的距离小于预定的距离;在每个点的潜在分割点之间确定一系列直线段笔画。
2.根据权利要求1所述的方法,其中方法还包括在确定每点的角度变化值之前对点进行平滑处理。
3.根据权利要求2所述的方法,其中对点进行平滑处理步骤包括将第一个点与距第一个点最近的点进行加权计算平均值,并用该平均值代替第一个点。
4.根据权利要求1所述的方法,其中为每点确定角度变化值的步骤包括连接第一点到前一点,形成第一个矢量;连接第一点到下一点,形成第二个矢量;第一个矢量和第二个矢量之间的夹角就是角度变化值。
5.一种手写体识别器,包括角度变化确定器,其中将从手写体输入采样的点集的每个点送入手写体识别器中,其中在点集的每个点之间形成矢量;与角度变化确定器相连的潜在分割点识别器,它将点集的每个点的角度变化值同预定阈值比较,当某点的角度变化值大于预定阈值时就将该点作为潜在分割点;与潜在分割点识别器相连的仿真消除器,它消除角度变化值大于阈值但到另一个潜在分割点的距离小于预定距离的伪分割点;与仿真消除器相连的笔画确定器,它确定点集的每个点的潜在分割点之间的一系列直线段笔画。
6.根据权利要求5所述的手写体识别器,其中手写体识别器进一步包括平滑处理器,它与角度变化确定器相连,以在角度变化确定器确定点集中每个点的角度变化值之前进行点集的平滑处理
全文摘要
本发明的方法和微处理器包括计算手写体输入(108)中的角度变化值,选择角度变化值大于阈值(110)的潜在分割点,并用这些分割点确定一系列直线段笔画供识别器解释手写体输入。
文档编号G06K9/22GK1187256SQ96194490
公开日1998年7月8日 申请日期1996年4月26日 优先权日1995年6月5日
发明者凯恩南·帕塞萨尔泰, 约翰L·C·西博尔德 申请人:摩托罗拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1