手写字体或任一迹线的数字化的制作方法

文档序号:93672阅读:909来源:国知局
专利名称:手写字体或任一迹线的数字化的制作方法
本发明涉及一种将手写字体或任何一种迹线数字化的方法。
本方法是通过一些简单的数字数据来确定一条迹线的。不管迹线是手写的或不是手写的,这些数字数据在迹线与其数学表达之间形成了一个一对一关系的集合。
在现有技术中,迹线的数字化,为的是识别它们,一般采用-提供一条迹线不同点之特征的采集装置;
-如此采集的数据的“成形”软件;
-数据比较软件将要识别的迹线的数据与一个用语的预先记录的那些数据进行比较;
-处理数据用的一般所说的高效能数据处理机。
因此,在1973年12月第5卷第4期“模式识别”(PATTENRECOGNITION)中发表的一篇题为“字符识别中的笔向顺序”(Pen Direcfion Sequences in Character recognition)描述了一种文字符号的识别方法,其连续点取样和这些点中的每个点斜率计算都是在笔与书写面接触时连续进行的。按这种方法,具有同一正切值的诸点都被忽略不理。在字符迹线诸点的每一点,将代表8个可能的斜率中各种不同斜率的数字序列进行比较。这些序列由与笔在垂直方向上的移动相对应的迹线开头及末尾的标识符予以限定。
如果这些已知技术的采集装置的性能质量可以收集某些有关迹线的信息的话,旨在自动化处理的有关信息的数学表示还存在下面一或几个不足之处删除了有关整个或部分迹线的数据,这些数据被认为是多余的或者反过来是没有描述价值的;
-以复杂的数学形式表示,例如二项式和“分隔符”序列,积分,相对重量计算系……;
-没有利用“空白”,也就是说没有利用采集装置在位移时占用的点,确切地说,在分析迹线时,不需用迹线。
这些方法的缺点说明识别不足(特别是0与6或7与2),和/或所采用的硬件及软件设备的数量大因而也就是它们的成本费用高。
为了补偿这些不足,采用本发明的方法的目的就是保持数据的完整并把它们变成易于进行信息化处理的形式。
为此,本发明推荐一种手写字体或任何一般迹线的数字化方法,把书写符号记录板、“笔”和用来计算“笔”位移的软件结合起来,这种方法的主要之点是-把笔在划线时的整个位移当作包括“空白”的一连续串;
-规定迹线每个基本点有两个标引,一个标识迹线的“空白”或“充满”符号,另一个标识紧接着下面点的位置。
本发明的一种较佳实施方案是使用-一个带有探针的数字化板,此探针可以获得迹线所有各个点的坐标、它们写好的状态或没有写好的状态、探针的移动速度(通过测量从一个点到紧接着的下一个点探针所用的时间);
-一种数据“成形”软件;
-一种数据比较软件。
此外,本发明具有简易的特点,可以使用一种简单的微处理机。
另外,本发明的一些特点和优越性还可以通过后面紧跟着的说明显示出来,并引用一些附图作为例子,在附图中。
-图1a描述了所有各点相切的图系中点的分布情况;
-图1b描述了规格化正交坐标图系中点的分布情况;
-图2描述了在1a型图系中“t”的基本点分解情况,将没有写出来的位移考虑在内(用虚线表示)。
-图3示出在压缩数据之后,用数字形式表示的同样符号;
-图4采用数字形式的图形表达形式;
-图5a和5b将长度比例为N的迹线与图2和3中所表示的迹线进行比较。
本发明的数字化方法把迹线看成是一种连续现象,这是因为按年月次序考虑到在划线过程中没有写出的位移。
对每种类型的数据(点的位置,写出或没有写出的字母符号、瞬时速度…)都规定一种数字串。在每一串中,迹线的每一点都按获得的顺序用一个值来表示。
因而迹线就用一些数串表示,一个数串代表一种类型的数据a)写出或没写出的字母符号可用两个值(例如1和0)来描述,整个迹线标准的表示是一串N个0或1数,N是迹线点的数目;
b)不同点的座标可用一个点相对前一点(或相对后一个点,这是一回事)的相对位置表示。
实际上,不管图系是什么样,迹线都可分解成一些连续点,这些点的大小和分布情况都是由所使用的系来确定。结果,连接一个点和下一点的直线就与初始点切线混同起来了;因此,在给出的已知一点上的可能的正切值的数目是由下面点可能的位置数来确定。
这些可能的位置是限定数的。一般说来,它们(位置)总共为8,有时仅仅是6(图1a和1b)。
从迹线第一个点开始(必要时可保持其绝对座标),全部位移用一串N个数值来描述,N个数值每个都表示迹线一点上的正切(图2和3)。
c)同样,知道两个连续点间的位移时间,人们就能计算每个点表示位移速度的标引。于是就能建立另一个数字串,这一数字串逐点指明了迹线的速度。
要注意到在此阶段没有任何数据被删除,并且要注意到所描述的那些串都同迹线建立一对一关系,事实上由这些数据就可能再建立原迹线,同时,保持其所有动态的和静态的特性。
这样获得的数据是大量的,为了加速它们的处理时间,重要的是把它们压缩。只要选定某些值得注意的数值,这是可能作到的。
因此,如果人们选定1和0值来描述一个点写出或没有写出的状态,并且选出所有偶数(或所有的奇数)的一些连续值来描述那些正切的可能值,只要给同一点补充这两个标引的值,就能得到仅仅一个标引,这个标引通过唯一的一个数串来描述迹线的全部静态信息。
这种进行方式大大地简便了比较过程并节约了数据储存所必需的地方。这种紧缩能随着采集的过程进行或者在此采集终了时实现。
本发明的这一方法适用于一般迹线的比较,特别适用于字体或签字的识别。这时就必需进行象前面所描述的不同迹线的数字化,然后再进行它们的比较。如果两个迹线是相同的,则表示它们的那些数字串也是一样的,它们越是不同组成它们的值相差越大。因而只须逐点计算两个迹线数值间的差,求这些差值的和并将此和加在迹线的点数上(如果此和是针对一些短的或长的迹线,则无关紧要)便可得出一个相似标引值,这一标引值越小,相似性越大。
一个迹线与几个别的迹线相比较后,就给每一个迹线提供一个标引,其最小的就指示最相似的迹线。
可指定一个值,超过这个值,迹线之间就有足够的相似性,因此,不能把诸迹线看成具有同一描述值。
此方法尤其适用于字体及签字的识别。
如果迹线最后一点的一致性不是含糊不清,问题是相当简单的,因为组成迹线的诸点的数是已知的了。对于签字或某些语言(希伯来语、中文……)总是用一空白彼此分开的图形字符,就是这种情况。
如果诸迹线是连接的,首先要进行每个基本图形符号的数字化并组成这些符号的一个用语。
从几个符号中分离及识别一连接迹线中某些符号,包括几个级段首先把组成它们当中每一个的N个点与要识别的迹线的N个最先点进行比较。(N是一个数,它使一个符号区别于另一个符号)。在标引值相等的情况下,含有最大点数N的迹线对应于要识别的迹线的N个最先点。于是,比较从下一点继续进行。不同尺寸的迹线的比较也是可能的。其实两个迹线中的一个只是另一个按1到N的比例放大,这两个迹线都可用诸数串来表示,这些数串之间的差别只表现在其中一个数串的每个值在另一个数串中接连N次重复。
为了比较两个其各自长度按1与N之此的迹线,只须将一迹线的R行的点与另一迹线的R×N行的点进行比较。图5a和5b表示出字母“t”及其数字表示(与图2上的数字表示比较),字母“t”与图2的字母“t”一致,但大1.5倍。
可以把任何一个迹线与一个参照用语的诸迹线比较,此参照用语可能是指定的使用者所特有的或者能够容纳一个较多方面的取样。
本发明的迹线数字化方法的实施方案允许有一个数字采集装置,此装置还包括-装有它的笔的数字化板;
-一个光学笔;
-一个“小鼠”(光标)。
当然本发明并不局限在刚刚作为例子考虑的那些具体实施方式

事实上,这种装置可以是任何一种别的装置,但这种另外的装置可以把迹线确定为一连串的点,根据所使用的座标系类型极座标系、规格化正交座标系或任何别的几何表示;根据迹线类型(这些迹线可以是签字、字母、表意文字字体或别的符号,手写的迹线或者用机械方法、工业方法或科学方法得到的迹线,或者任何其它类型的迹线);并且根据迹线的采集时间(可能是其产生的时间或延迟),人们可以知道这些点的位置、写出或未写出的符号、瞬时速度等等。迹线用一个,比如,光学装置进行分析,这种光学装置的“位移”是数字化的。
权利要求
1.手写字体或任何一般迹线的数字化方法,它把书写符号用的台板、“笔”和用来计算“笔”位移的软件结合起来,此方法的特征主要在于-把“笔”在划线时的整个位移看作包括“空白”的一连续串;-给迹线的每一个基本点规定两个标引,一个用来标识迹线的“空白”或“充满”符号,另一个则用来标识紧接的下一点的位置。
2.按照权利要求
1,这一方法的特征在于在数学平面上,用起始点正切值精确地确定一迹线中、紧接的下一点的位置。
3.按照权利要求
2,此方法的特征在于一点的切线同连接此点与紧接的下一点的直线混同。
4.按照权利要求
1,此方法的特征在于迹线分解成一些基本点,这些点在书写符号记录台板上的分布根据所使用的图系而变化。
5.按照权利要求
2,此方法的特征在于可能的正切值的数目是由图系的点的分布类型决定的。
6.按照权利要求
1,此方法的特征在于给迹线的每个基本点规定第三个标引,用来指明迹线的这一点上的瞬时速度。
7.根据权利要求
1,此方法的特征在于它可以选择某些值得注意的数值,仅用一个数串来描述关于一个迹线的全部信息。
8.根据权利要求
7,此方法的特征在于信息的紧缩能够随着采集进行或在采集终了时实现。
9.根据权利要求
1,此方法的特征在于它可以比较迹线,方式是通过逐点计算同一类型数串值间之差加在迹线诸点的总数上的和。
10.根据权利要求
9,此方法的特征在于可以根据迹线的N个最前面的点反复进行比较从几个图形符号中分离和识别迹线中的一个连接迹线的图形符号,N是一个变数,它依次等于要辨认的每个图形符号的点数。
11.根据权利要求
9和10中任何一项,此方法的特征在于它可以比较其尺寸按1与N之比的迹线,只要将一个迹线的R行和另一个迹线的(N×R)行的诸点进行比较。
12.按照权利要求
1,此方法的特征在于把被采集的连续串与予先存储的字母或迹线一用语进行比较。
13.按照权利要求
12,此方法的特征在于把存储的每个字母或迹线与使用者的个人字体组成的一个参照用语进行比较。
14.根据权利要求
1,此方法的特征在于它能够用来使予先印好的原文或图形数字化,其特征还在于人们可用一个光学阅读系统跟随迹线,光学阅读系统的全部位移将被看成一个连续串;每个基本位移就被存储起来。
专利摘要
本发明申请所述的数字化方法,主要是把任一迹线看成是一连串的点,再计算位移过程中所有的点;不管这些点是写出的或未写出的,均把它们按其取得的顺序重现为数字串,每一数字串表示一种类型的数据。
文档编号G06K9/62GK85106366SQ85106366
公开日1987年3月18日 申请日期1985年8月24日
发明者阿兰·伯克里斯 申请人:阿兰·伯克里斯导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1