实现连续手写识别输入的方法及系统的制作方法

文档序号:6356965阅读:197来源:国知局
专利名称:实现连续手写识别输入的方法及系统的制作方法
技术领域
本发明涉及手写输入技术领域,特别涉及一种实现连续手写识别输入的方法及系统。
背景技术
近年来,随着手持电子设备的热销,其功能正逐步从最为简单的电子地址信息簿转向带有触摸显示的微型电脑并支持无限网络的多媒体终端设备。随着这些小型设备上的文本输入需求从简短的信息,如电子地址簿等转向更长的笔记或电子邮件消息,自然高效而连续的输入需求正受到越来越多的重视。大屏幕设备由于书写区域比较宽泛,用户得以延续日常的连续输入的书写习惯。 然而在便携性小型触摸屏设备上,由于触摸屏尺寸的限制,导致单次输入的笔迹有限,连续手写输入能力受到了限制,输入效率较低。针对这种情况,目前这类小屏幕设备上支持的手写大部分是基于单字符模式,也就是说。用户在确定的书写区内(如预置的书写框或全屏)逐字输入,在单字结束后提笔等待系统反馈,然后清空书写屏幕继续下个字符的输入。这种单字符输入模式避免了连续手写识别的字符切分难题,往往具有较高的识别率。然而这样的输入方式不符合人们日常的书写习惯,而且提笔轮候和等待识别影响了输入效率。显然基于小屏幕设备的手写模式有待提高,迫切需要在功能化、人性化、智能化方面取得突破,作为一种真正可用、易用、实用的技术,更广泛地应用于人们的日常生活和商务工作领域中。为此,现有技术中提出了一种解决方案,该方案允许用户在预先设定的书写区域内以叠加覆盖的方式连续输入多个字符,实现在有限书写区域内的连续输入需求。但该方案在用户书写体验和识别性能方面依然存在以下缺点首先,该方案采用了无切分的连续识别技术,在用户完成所有字符输入后才启动后端识别,由于需要等待识别,因此输入效率受到一定的影响。而且,由于现有技术叠加覆盖输入方式是直接在原始的空间叠加笔迹上提取特征,为了避免空间重叠信息对字符识别的影响,提取的都是与位置无关的笔画方向特征。而根据传统手写识别技术,位置特征对字符特别是某些易混淆字的区分能力较强,位置特征的缺失会影响对输入字符的识别率。

发明内容
本发明实施例提供一种实现连续手写识别输入的方法及系统,以解决现有技术中通过叠加覆盖方式实现连续输入时,输入效率及识别率低的问题。为此,本发明实施例提供如下技术方案一种实现连续手写识别输入的方法,包括跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;否则,将新输入笔画存储到第一缓存区;对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识另Ij,得到完整字符;显示识别得到的完整字符。一种实现连续手写识别输入的系统,包括数据采集模块,用于跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;断点分析模块,用于确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;笔画整理模块,用于在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于不同字符时,清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;并在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于同一字符时,将新输入笔画存储到第一缓存区;字符识别模块,用于对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;字符显示模块,用于显示所述字符识别模块识别得到的完整字符。本发明实施例提供的实现连续手写识别输入的方法及系统,针对现有技术中通过叠加覆盖方式实现连续输入时,采用无切分的连续识别技术输入效率低的问题,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识另O。由于断点分析和字符识别的处理是与用户输入同步进行的,即在用户输入过程中,确定新输入笔画和缓存区中历史笔画隶属于不同字符时即该对历史笔画进行字符识别,从而避免了现有叠加覆盖输入方式下的轮候等待时间,提高了输入效率。而且,由于通过断点分析,可以对判断为独立字符的历史笔画集合进行识别,因此,可以有效地提高识别率。进一步地,通过对历史笔画的淡化处理,可以使用户清晰地区分历史笔迹和当前输入的笔画,将用户输入的内容清楚地展现给用户。


为了更清楚地说明本发明实施的技术方案,下面将对实施例中所需要使用的附图作简 单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例实现连续手写识别输入的方法的流程图;图2是本发明实施例中跟踪用户笔画输入笔迹的流程图;图3是本发明实施例实现连续手写识别输入的系统的一种结构示意图;图4是本发明实施例实现连续手写识别输入的系统的另一种结构示意图;图5是本发明实施例中用户书写笔画示例;图6是本发明实施例中在书写区对书写笔画的显示效果示例。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例实现连续手写识别输入的方法,针对现有技术中通过叠加覆盖方式实现连续输入时,采用无切分的连续识别技术输入效率低的问题,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。如图1所示,是本发明实施例实现连续手写识别输入的方法的流程图,包括以下步骤步骤101,跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列。其中,每个笔画是指从落笔点至抬笔点之间的连续笔触轨迹。步骤102,确定新输入笔画与第一缓存区存储的历史笔画的隶属关系。前后书写的两个笔画可能属于同一字符也可能属于不同的两个字符,在本发明实施例中,可以根据笔画书写特性及前后笔画的相关性来确定不同笔画间的隶属关系。具体地,可以根据新输入笔画和第一缓存区中存储的历史笔画的位置关系确定新输入笔画与第一缓存区存储的历史笔画的隶属关系。首先,根据记录的笔画的二维坐标点列,计算新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置,有以下几种情况(1)所述起点位置与所述终点位置的距离小于第一距离阈值,比如,可以将第一距离阈值设为0.2倍的字框长度。这里字框大小可以是自适应于用户书写习惯的,在系统初始化没有输入时将其设置为相当于书写区大小的数值,随后根据用户输入的多笔画可以重新计算字框大小,则确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;(2)所述起点位置与所述终点位置的距离大于第二距离阈值,比如,可以将第一距离阈值设为0. 35倍的字框长度,则确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;(3)所述起点位置与所述终点位置的距离大于等于第一距离阈值、并且小于等于第二距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,也就是说,仅根据新输入笔画和第一缓存区中存储的历史笔画的位置关系还不能准确判断新输入笔画与历史笔画是否属于同一字符。对于这种隶属关系属于模糊状态的情况,可以做进一步地辅助判断,具体地,可以按以下方式处理A.根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响来判断如果新输入笔画使得累计笔画的均衡度增加值超过某个预定值,则可确定新输入笔画和第一缓存区中的历史笔画隶属于同一字符;否则确定新输入笔画和第一缓存区中的历史笔画隶属于不同字符。
所述笔画分布均衡度用于衡量笔画的所有笔段(指采样点之间的直线距离)在书写框各个区间内的分布。在此,需要分别计算历史笔画的分布均衡度以及添加新笔画后所有笔画的分布均衡度。比如,首先计算待考察笔画集合(即第一缓存区中的所有笔画)的字框,并将该字框划分成四个字框,分别为左上部,左下部,右上部以及右下部。随后计算待考察笔画在这四个空间上的累积笔段长度和。最后计算笔画集合在四个子空间上笔段方差, 将该方差作为笔画分布均衡度,可见方差越小则笔段分布越均衡。如果新输入笔画加入到第一缓存区中的历史笔画集合后,计算得到的笔画分布均衡度比未添加新输入笔画之前第一缓存区中的历史笔画的比笔画分布均衡度增加值超过某个预先设定的阈值,比如原来的 0. 15倍,则确定新输入笔画和第一缓存区中的历史笔画隶属于同一字符。 B.考虑到新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况,一般来说,字符内部笔画间重叠有一定规律,比如新输入笔画和历史笔画相交点的个数较少。因此,若新输入笔画和历史笔画的重叠度很高且较为杂乱没有规律,则很大程度上其为一个新的字符笔画,也就是说,新输入笔画和第一缓存区中的历史笔画隶属于不同字符。比如,算新输入笔画和第一缓存区中的历史笔画两两相交的夹角大小,若平均夹角小于预先设定的域值,比如20度,则确定新笔画和历史笔画为不同字符当然,本发明实施例并不仅限于上述判断方式,还可以采用其他判断方式,在此不再一一举例。步骤103,如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;否则,将新输入笔画存储到第一缓存区。对于可以明确判断属于不同字符的情况,可以认为第一缓存区中的历史笔画已经是一个完整字符的所有笔画,因此,需要首先将第一缓存区中的历史笔画转存到第二缓存区,以等待后台相应的识别模块对其进行识别;对于可以明确判断属于同一字符的情况,由于与第一缓存区中的历史笔画属于同一字符,因此,可以直接将该新输入笔画存储到第一缓存区中。步骤104,对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;在本发明实施例中,对第二缓存区中的历史笔画进行字符的识别是实时进行的, 也就是说,一旦确定新输入笔画与第一缓存区中的历史笔画隶属于不同字符时,即触发后台字符识别模块对第二缓存区中的已判定为完整字符的历史笔画的集合进行识别处理。当然,字符识别模块也可以实时地读取第二缓存区中的历史笔画的集合,进行识别处理。步骤105,显示识别得到的完整字符。对于每个判定为完整字符的历史笔画集合进行识别时,可能会得到多个识别结果。在显示时,可以将生成的识别结果中的首选字符置于文本编辑区,而其他候选字符可以通过缓存或其他方式保存,比如在候选区内排列显示或在编辑状态下通过菜单的方式显示,用于后续用户对识别结果的编辑更正。由此可见,本发明实施例实现连续手写识别输入的方法,针对现有技术中通过叠加覆盖方式实现连续输入时,采用无切分的连续识别技术输入效率低的问题,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。由于断点分析和字符识别的处理是与用户输入同步进行的,即在用户输入过程中,确定新输入笔画和缓存区中历史笔画隶属于不同字符时即该对历史笔画进行字符识别,从而避免了现有叠加覆盖输入方式下的轮候等待时间,提高了输入效率。在本发明实施例中,跟踪用户笔画输入笔迹的流程如图2所示,包括以下步骤步骤201,清空各计数器和缓存区,并设置相邻笔画停顿时间计算器T = 0 ;步骤202,清空书写区,以给用户后续输入提供空间;步骤203,等待输入;步骤204,判断笔触是否落笔;如果是,则执行步骤205 ;否则,执行步骤207 ;步骤205,跟踪用户笔画输入笔迹,将笔画记录为一个二维坐标点列,直至笔触离开触摸屏;然后将相邻笔画停顿时间计数器T重置为0 ;步骤206,将记录的一系列二维坐标点列输入到后端处理系统;步骤207,将相邻笔画停顿时间计数器T加1 ;步骤208,相邻笔画停顿时间计数器T的值是否大于预设的停顿时间阈值Tr ;如果是,则执行步骤209 ;否则,返回步骤203 ;步骤209,确定已输入一完整历史字符,启动后端处理系统对第二缓存区中的历史笔画集合进行字符识别。所述后端处理系统是一个集成化的对用户输入笔迹进行实时分析处理的系统,其主要功能是对用户输入的历史笔迹进行断点分析、字符识别等处理,即图1中步骤102至步骤104的过程。也就是说,在本发明实施例实现连续手写识别输入的方法的实际应用时,可以分别应用于一个系统的前端和后端两个层面。在前端实时监测并采集用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列,在后端对采集到的用户笔画输入笔迹进行整理、识别等处理,从而可以提高输入及识别效率。另外,需要说明的是,在本发明实施例中,在进行字符识别时,由于是对判定为完整字符的历史笔画集合进行识别,而不是如前面提到的现有技术那样直接在原始的空间叠加笔迹上提取特征,因此可以集成各种经典的识别算法,有效地提高了识别率。比如利用具有很高区分度的八方向特征进行字符识别,主要过程如下(1)预处理首先,进行归一化,即将字符外框归整到系统预设大小,比如512*512 ;然后将远离字符主要笔迹的采样点去除,并进行平滑处理,一般是用采样点前后N个点的均值替代当前采样点位置坐标;然后通过重采样等方式减少采集到的笔迹信号中的噪音。所述重采样是指将原时间均等的采样点序列重采样为空间均等的采样点序列。(2)特征提取比如,定义八方向为相应于汉字笔画特点的横竖撇捺八个方向。系统首先将字符外框划分为N*N个字框(通常N取8)。随后通过计算相邻采样点间的笔段在八方向上的投影并累加计算N*N个子框笔迹的投影矢量和,得到N*N*8维的特征向量。在计算相邻采样点间笔段在八方向投影时可以仅将其投影在最近的两个方向上,而将其他方向上的投影矢量计为0。(3)特征变换
对步骤(2)中得到的N*N*8维的原始特征矢量作区分性特征变换,以降低维数并提高识别率。具体可以采用模式识别领域常用的LDA(LinearDiSCriminant Analysis,线性判别分析)特征变换方法,利用系统预置的LDA变换矩阵将原始N*N*8的特征矢量降为 M维的特征矢量(N*N*8)M)。(4)根据语言模型及字符模型进行模式匹配计算给定的M维特征矢量和字库中每个字符模型的相似度,并将具有最大相似度的字符作为首选识别结果。

(5)生成候选字符序列按照步骤(4)中模型相似度得分排序,将得分最高的几个(比如4个)字符作为候选字符集展示给用户。通过上述字符识别处理过程,可以将用户原始输入的书写笔迹映射为一组可能的 ASCII候选字符,也就是说,对于每个判定为完整字符的历史笔画集合进行识别时,可能会得到多个识别结果。在显示时,可以将生成的识别结果中的首选字符置于文本编辑区,而其他候选字符可以通过缓存或其他方式保存,比如在候选区内排列显示或在编辑状态下通过菜单的方式显示,用于后续用户对识别结果的编辑更正。由于本发明实施例实现连续手写识别输入的方法支持的是连续手写识别,在用户不断输入的过程中得到的语义信息会不断丰富,因此,在进行字符识别时,还可以结合语言模型信息,根据后续识别结果对历史识别结果进行实时自动更正,进一步提高识别率。在现有技术叠加覆盖输入方式中,由于用户是在设定的书写空间内以叠加覆盖方式输入多个字符,随着字符的增多,字符的笔画之间相互混杂,很难区分历史笔迹和当前输入的笔画。输入的字迹难以清晰展现,从而不能将用户输入的内容清楚地展现给用户。针对这种问题,本发明实施例进一步采取了笔迹淡化处理的方式,使用户可以清晰地甄别输入字符,提高用户的书写体验,下面对此进行详细说明。在本发明实施例中,进一步对第一缓存区中的历史笔画进行淡化处理,并在屏幕书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。具体地,对历史笔画进行淡化处理的方式有多种,比如(1)按照第一缓存区中各笔画的生成时间先后顺序对各笔画进行勻速的渐进淡化,即生成时间越久的笔画越先淡化。(2)根据断点分析的结果对第一缓存区中的笔画进行淡化处理,具体包括如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失,在这种情况下,可以将历史笔画的淡化值设为0 ;如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显示,在这种情况下,可以将历史笔画的淡化值设为1 ;如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示,在这种情况下,可以将历史笔画的淡化值设为0. 5。需要说明的是,不论在上述哪种淡化处理方式下,均可将新输入笔画进行正常显
7J\ ο上述第⑵种方式可以自适应于用户输入的速度,避免了恒定淡化时间引起的可能等待问题。
可见,本发明实施例实现连续手写识别输入的方法,不仅可以有效地提高输入及识别效率,而且,通过对历史笔画的淡化处理,可以在小屏幕设备上采用叠加输入的方式, 也可以使用户清晰地甄别输入的字符,在实现连续输入的同时,提高了用户的书写体验。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。相应地,本发明实施例还提供一种实现连续手写识别输入的系统,如图3所示,是本发明实施例实现连续手写识别输入的系统的一种结构示意图。在该实施例中,所述系统包括数据采集模块301,用于跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;

断点分析模块302,用于确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;笔画整理模块303,用于在所述断点分析模块302确定新输入笔画与第一缓存区存储的历史笔画隶属于不同字符时,清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;并在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于同一字符时,将新输入笔画存储到第一缓存区;字符识别模块304,用于对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;字符显示模块305,用于显示所述字符识别模块识别得到的完整字符。需要说明的是,在字符识别模块304对于每个判定为完整字符的历史笔画集合进行识别时,可能会得到多个识别结果。在字符显示模块305对识别结果显示时,可以将其中的首选字符置于文本编辑区,而其他候选字符可以通过缓存或其他方式保存,比如在候选区内排列显示或在编辑状态下通过菜单的方式显示,用于后续用户对识别结果的编辑更正。在本发明实施例中,所述断点分析模块302,具体用于根据新输入笔画和第一缓存区中存储的历史笔画的位置关系确定新输入笔画与第一缓存区存储的历史笔画的隶属关系,具体可以包括位置确定单元、计算单元、第一判断单元和第二判断单元,其中所述位置确定单元,用于确定新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置;所述计算单元,用于计算所述起点位置与所述终点位置的距离;所述第一判断单元,用于根据所述计算单元的计算结果,在所述起点位置与所述终点位置的距离大于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;在所述起点位置与所述终点位置的距离小于第二距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;在所述起点位置与所述终点位置的距离大于等于第二距离阈值、并且小于等于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态;所述第二判断单元,用于在所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态时,根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系,或者根据新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系。由此可见,本发明实施例实现连续手写识别输入的系统,通过跟踪用户笔画输入笔迹,将每个笔画各自记录为一个二维坐标点列,在跟踪用户输入过程中,通过断点分析方式将原始书写空间叠加的字符切分为独立的字串,并对该字串进行同步识别。由于断点分析和字符识别的处理是与用户输入同步进行的,即在用户输入过程中,确定新输入笔画和缓存区中历史笔画隶属于不同字符时即该对历史笔画进行字符识别,从而避免了现有叠加覆盖输入方式下的轮候等待时间,提高了输入效率。 如图4所示,是本发明实施例实现连续手写识别输入的系统的另一种结构示意图。与图3所示实施例不同的是,在该实施例中,所述系统进一步包括淡化处理模块401,用于对第一缓存区中的历史笔画进行淡化处理;书写显示模块402,用于在书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。在具体应用时,所述淡化处理模块401可以有多种实现方式。比如,淡化处理模块401可以按照第一缓存区中各笔画的生成时间先后顺序对所述历史笔画进行勻速的渐进淡化。再比如,淡化处理模块401还可以按照以下方式对第一缓存区中的历史笔画进行淡化处理如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失;如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显示;如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示。本发明实施例的系统可以应用于小型触摸屏设备,满足用户连续手写识别输入的需求,在有限的书写区内进行叠加输入,通过对历史笔画的淡化处理,可以使用户清晰地区分历史笔迹和当前输入的笔画,将用户输入的内容清楚地展现给用户,提高用户的书写体验。本发明实施例实现连续手写识别输入的方法及系统,至少可以适用于以下两种情形1)智能设备安装有触摸板(一般为设备的外围设施,例如手写板等),用户在触摸板上的固定区域反复书写;2)智能设备安装有触摸屏(通常为系统集成的设备),但用户可以在触摸屏的某个固定区域反复书写。 下面通过举例进一步详细说明本发明实施例。假设用户在触摸屏设备上连续输入“大人”两个汉字,即图5所示的自左向右的笔画,则利用本发明实施例,输入笔迹在屏幕书写区的显示如图6所示。下面对图5到图6的过程进行详细说明,主要包括1.当用户从左至右输入第一笔时,由于是第一笔,所以断点分析模块判断其与历史笔画隶属于同一字符,淡化处理模块设定其为正常显示。2.当用户输入第二笔时,断点分析模块确定第二笔和第一笔的隶属关系。确定第二笔和第一笔隶属于同一个字符,因此淡化处理模块将第二笔也设定为正常显示。3.当用户输入第三笔时,断点分析模块确定第三笔和前二笔的隶属关系,并判断为模糊状态情况,这时将前面输入过的笔迹淡化显示,如图6所示。4.当用户输入第四笔时,断点分析模块确定第三笔和第四笔分别属于两个字符, 因此将第一笔到第三笔从屏幕中清除或以水印方式显示。图6中给出了以水印方式显示的例子。5.当用户输入第五笔时,断点分析模块判断第四笔和第五笔隶属于同一字符,因此笔迹正常显示。在上述过程中,如果抬笔时间过长,如超过0.5秒,则认为接下来要写的笔画和已经输入的笔画分别属于不同的字符。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的模块及单元可以是或者也可以不是物理上分开的,比如,可以将系统中的数据采集模块部署在设备的前端,而将系统中的其他模块部署在设备的后端,使其同步运行,实现连续手写识别输入。另外,还可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
权利要求
1.一种实现连续手写识别输入的方法,其特征在于,包括跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列; 确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;否则,将新输入笔画存储到第一缓存区;对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;显示识别得到的完整字符。
2.如权利要求1所述的方法,其特征在于,所述确定新输入笔画与第一缓存区存储的历史笔画的隶属关系包括根据新输入笔画和第一缓存区中存储的历史笔画的位置关系确定新输入笔画与第一缓存区存储的历史笔画的隶属关系,具体包括确定新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置;如果所述起点位置与所述终点位置的距离大于第一距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;如果所述起点位置与所述终点位置的距离小于第二距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;如果所述起点位置与所述终点位置的距离大于等于第二距离阈值、并且小于等于第一距离阈值,则确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态;如果所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系,或者根据新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系。
3.如权利要求2所述的方法,其特征在于,所述方法还包括 对第一缓存区中的历史笔画进行淡化处理;在书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。
4.如权利要求3所述的方法,其特征在于,所述对第一缓存区中的历史笔画进行淡化处理包括按照第一缓存区中各笔画的生成时间先后顺序对所述历史笔画进行勻速的渐进淡化。
5.如权利要求3所述的方法,其特征在于,所述对第一缓存区中的历史笔画进行淡化处理包括如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失;如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显不;如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示。
6.一种实现连续手写识别输入的系统,其特征在于,包括数据采集模块,用于跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;断点分析模块,用于确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;笔画整理模块,用于在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于不同字符时,清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;并在所述断点分析模块确定新输入笔画与第一缓存区存储的历史笔画隶属于同一字符时,将新输入笔画存储到第一缓存区;字符识别模块,用于对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;字符显示模块,用于显示所述字符识别模块识别得到的完整字符。
7.如权利要求6所述的系统,其特征在于,所述断点分析模块,具体用于根据新输入笔画和第一缓存区中存储的历史笔画的位置关系确定新输入笔画与第一缓存区存储的历史笔画的隶属关系,包括位置确定单元,用于确定新输入笔画的起点位置,以及第一缓存区存储的历史笔画集合中最新笔画的终点位置;计算单元,用于计算所述起点位置与所述终点位置的距离;第一判断单元,用于根据所述计算单元的计算结果,在所述起点位置与所述终点位置的距离大于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画隶属于不同字符;在所述起点位置与所述终点位置的距离小于第二距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画是隶属于同一字符;在所述起点位置与所述终点位置的距离大于等于第二距离阈值、并且小于等于第一距离阈值时,确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态;第二判断单元,用于在所述新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态时,根据新输入笔画加入到第一缓存区中的历史笔画集合后对字符笔画在空间分布上的均衡度的影响确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系,或者根据新输入笔画和第一缓存区中的历史笔画之间的叠加重合情况确定所述新输入笔画与第一缓存区存储的历史笔画的隶属关系。
8.如权利要求7所述的系统,其特征在于,所述系统还包括淡化处理模块,用于对第一缓存区中的历史笔画进行淡化处理;书写显示模块,用于在书写区实时显示第一缓存区中的新输入笔画和淡化处理后的历史笔画。
9.如权利要求8所述的系统,其特征在于,所述淡化处理模块,具体用于按照第一缓存区中各笔画的生成时间先后顺序对所述历史笔画进行勻速的渐进淡化。
10.如权利要求8所述的系统,其特征在于,所述淡化处理模块,具体用于按照以下方式对第一缓存区中的历史笔画进行淡化处理如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则将所述历史笔画向背景靠近消失;如果新输入笔画与第一缓存区存储的历史笔画隶属于同一字符,则将所述历史笔画正常显不;如果新输入笔画与第一缓存区存储的历史笔画的隶属关系为模糊状态,则将所述历史笔画以水印方式淡化显示。
全文摘要
本发明涉及手写输入技术领域,公开了一种实现连续手写识别输入的方法及系统。该方法包括跟踪用户笔画输入笔迹,并将每个笔画各自记录为一个二维坐标点列;确定新输入笔画与第一缓存区存储的历史笔画的隶属关系;如果新输入笔画与第一缓存区存储的历史笔画隶属于不同字符,则清空第二缓存区并将第一缓存区存储的历史笔画存储到第二缓存区,然后,清空第一缓存区并将新输入笔画存储到第一缓存区;否则,将新输入笔画存储到第一缓存区;对所述第二缓存区中的历史笔画根据记录的该历史笔画的二维坐标点列进行识别,得到完整字符;显示识别得到的完整字符。利用本发明,可以有效地提高输入效率及识别率。
文档编号G06F3/041GK102156577SQ20111007600
公开日2011年8月17日 申请日期2011年3月28日 优先权日2011年3月28日
发明者何婷婷, 刘庆峰, 王智国, 翟吉博, 胡国平, 胡郁, 葛勇 申请人:安徽科大讯飞信息科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1