改进的手写汉字输入识别方法

文档序号:6420743阅读:293来源:国知局
专利名称:改进的手写汉字输入识别方法
技术领域
本发明涉及手写汉字输入识别,特别涉及一种改进的用于电子装置的手写汉字输入识别方法,它能容忍超时甚至不受超时影响,并且能允许对已输入的字进行部分修改。
背景技术
手写汉字输入是具有触摸屏或触摸板(写字板)的计算机及其它电子设备常用的输入方法。随着笔记本电脑、移动电话和个人数据助理(PDA)等的广泛应用,快速、高效和准确的手写汉字输入识别已成为许多人的愿望。
对于书写汉字来说,不同的人有不同的书写风格和书写习惯。手写汉字输入识别的一个难题就是如何确定用户是否已经写完一个字。因此,阻碍快速而准确识别的一个障碍就是所谓的超时,即最后一笔之后的等待时间,因为超时是检测用户是否已经写完一个字的最有效的办法。为了使手写汉字输入识别能够实际使用,超时实际上是很短的,通常在0.2-0.8秒之间,一般可以由系统或用户在0.2-2.0秒之间调节。
然而,利用超时来确定输入是否完成有时会有问题。首先,很难设定一个最佳超时,因为超时随用户的不同有很大的不同,也就是说,书写速度以及笔画和字之间的中断在很大程度上取决与用户。其次,随字的不同超时有所不同。对于某些字,用户要在两个笔画之间移动很长一段距离。当距离过长时,就需要比普通的笔画到笔画所需的时间更长的时间。在这种情况下,在用户写完一个字之前出现超时,就会发生在超时前和超时后写的笔画被识别成两个字的情况。
为了解决这种由于超时而导致的问题,通常的解决办法是以笔迹的形式为用户提供视觉反馈,以使其能在识别时进行确认。另外,大多数的手写汉字输入识别软件都允许用户人工设定超时的长短。有些解决方案给用户提供两个或更多的手写输入区,以迫使用户在一个输入区只写一个字。
事实上,笔迹反馈必须设置在笔迹的下方,否则,用户不会注意到正在进行的识别。这种办法不能用在没有触摸屏的装置上,例如那些只有手写板的装置上。让用户自己设定超时可以提供一个比较灵活的等待时间(超时),但也不能解决问题。因为对所有的字来说,只有一个相同的超时。实际上,要求得到一个适合每个字和一个字中不同笔画的真正灵活的超时是不现实的。对于那些只有一个相对小的屏幕的便携式电子设备来说,只有一个相对有限的书写区,因此,无法提供多个书写区。
另外,由于手写识别并非100%的准确,用户有时可能会重写一个字,以确保字能被正确识别。由于汉字需要复杂的书写过程,对用户来说,反复写一个字不论从体力上还是心理上都是一个负担。而且,这样会妨碍快速而有效的识别。除此之外,如果首要候选字中只有部分(例如,一个部分)正确,而且系统提供有候选字表的话,用户也可能要浏览所有的候选字(通常是8-10个字),这使得选择过程更困难。而如果用户认为识别错误,他必须重写整个字。
为了减少重写并有利于输入和识别,人们已经提出了各种各样的解决方案,例如按照偏旁部首等将字分类或分解(如五笔字型和苍颉码等)。美国专利5,923,778公开了一种利用部首信息进行识别的方法,并提出了一种基于部首信息分级构造字信息的数据库。美国专利6,272,243公开了一种用于向手写记事薄进行输入的方法和装置,它有一个预先定义的子输入区。然而,它只适于输入日文。
发明概述本发明的目的在于提供一种改进的手写汉字输入识别方法,它基本上不受超时的影响,并且能容忍超时甚至完全不受超时影响。
本发明的目的还在于提供一种改进的手写汉字输入识别方法,它能减少在手写汉字输入识别中的重写,增加输入的速度并允许对一个字的部分修改。
根据本发明的一个方面,提供了一种改进的用于电子装置的手写汉字输入识别方法,包括下列步骤根据预定的规则识别用户在所述电子装置的一个书写区书写的汉字,产生一个在上述识别步骤识别的候选字表,以及在所述电子装置的一个显示区显示所述候选字表;其中所述的候选字表至少包括刚被识别的当前字和该当前字与在此当前字之前被识别和显示的候选字的组合。
根据本发明的另一个方面,提供了一种改进的用于电子装置的手写汉字输入识别方法,包括识别用户在所述电子装置的一个书写区书写的汉字的步骤,其中所述的汉字识别只有在满足下列条件时才完成前一个笔画的起始点或中间点不在一个预定的开始区,前几个笔画构成一个完成的字,且当前笔画的始点或中间点在所述的开始区内。
根据本发明的再一个方面,提供了一种改进的用于电子装置的手写汉字输入识别方法,它包括识别用户在所述电子装置的一个书写区书写的汉字的步骤,和在所述书写区显示在所述识别步骤识别的主要候选字表的步骤;其中所述的显示包括在背景部分提示该首要候选字的字型的不同部分,并且所述提示部分构成一个独立的书写区,在该书写区内,可以独立地进行识别。


下面参照附图举例说明本发明的实施例。
图1A和1B示意性地说明了利用超时进行识别的现有技术的手写汉字输入识别方法可能出现的误识别;图2示出了根据本发明方法的一个实施例;图3是图2所述实施例的流程图;图4是根据本发明方法的另一个实施例;
图5是图4所述实施例的流程图;图6A和6B是根据本发明方法的再一个实施例。
图7是图6所述实施例的流程图。
具体实施例方式
由于手写汉字输入识别可以利用本领域熟知的各种方式实现,而且可以使用常规的系统或软件进行识别,为简单起见,在此不对识别过程本身做详细描述。
首先参照图1,其中图1A示意性地说明了利用超时进行识别的现有技术的手写汉字输入识别方法可能出现的误识别。如图1A所示,用户打算写一个左右型的由两部分构成的字“明”。他通常先写左边的“日”,再写右边的“月”。由于“明”是由能独立成字的偏旁“日”和一个“月”两部分构成,他需要从左半部分“日”的最后一笔(输入/书写区的中间靠下部分)移动较长一段距离到右半部分“月”的第一笔(输入/书写区的中间靠上部分),这花费比较长的时间并可能在两部分之间出现短暂的停顿。如果停顿的时间比预定的超时长,系统会将左边的部分识别为“日”或“月”字,并在候选字表中显示“日”和“月”。
而后,系统将右边的部分识别为“月”或“日”并在候选字表中显示识别的“月”和“日”。换句话说,由于超时,系统将两个部分识别为两个独立的字。
同样的问题也会出现在上下型的两部分构成的字的识别。如图1B所示,汉字“幸”是由部首“土”和不构成完整字的下半部分构成。由于超时,系统可能会将“幸”字识别成两个字,即“土”字和看起来像下半部分的“羊”字。
在实际应用时,调整等待时间(超时)没有什么帮助,因为超时随汉字、笔画、书写习惯和用户的不同而有所不同。即使是同一个用户,对他来说,一个固定的超时也并不适用所有的字。
图2示出了根据本发明的改进的方法的一个实施例。该实施例利用对手写汉字输入识别来说常用的且至关重要的候选字表,使其在包括当前字的同时,也包括该当前字与此当前字之前被识别和显示的一个字的组合。该候选字表可以显示在触摸屏或一个单独的显示屏上(在写字板的情况下,通常需要独立的显示屏来显示在写字板上书写的字)。该实施例只是在候选字表中增加了当前字与此当前字之前被识别和显示的一个字的最可能的组合,不要求增加额外的显示部件占用显示屏。
如图2所示,假设同一用户要写同一个由两部分构成的字“明”。根据笔画的书写规则,他将首先以适合其书写习惯的速度写左半部分“日”,如果由于其书写习惯或其它原因,在开始写右半部分之前有一个停顿,而该停顿比预定的超时时间长,系统将会认为输入已经完成,并借助已知的方式将左半部分识别为“日”字。“日”被作为首要候选字显示在一个显示屏的某个部位,在本实施例中,候选字显示在书写区的上面。
用户继续书写剩余部分,即右半部分“月”。系统在超时之后产生一个新的候选字表,列出了他刚刚书写的“月”以及“月”与在此之前的识别和显示的“日”的组合,即他要写的“明”字。而后,“明”字可作为首要候选字或候选字字之一显示在书写区的上面。可以通过系统设置,使作为首要候选字的“明”字自动进入文本区或由用户通过选择,例如点击或以其它方式,而选取该字。选择后,该字被移至文本区。
在该实施例中,能够被识别的字不必是完整的汉字,而可以是偏旁部首等字的组成部分。例如如果用户书写“伴”字,在完成左半部分之后出现超时,而左半部分是一个偏旁而非完整的汉字,在他继续书写右半部分“半”之前,系统将识别该偏旁并在候选字表中显示该偏旁。在用户写完右半部分后,系统将产生一个新的候选字表,该表中包括刚刚识别的当前字“半”和由“半”与在此之前识别和显示的偏旁结合的字“伴”。用户可以选择该字,系统将该字移到文本区。
此外,所述的组合必须构成一个完整的字。根据显示屏的大小和布局,候选字表可以包括最多10个字,以便于选择。
这样,通过仅在候选字表中增加当前字与此当前字之前被识别和显示的一个字的最可能组合,通常只是一个字,可以大大的改善识别的效率,而无须增加显示部件而占据显示屏。
图3示出了图2实施例的流程图。当用户开始在触摸屏或写字板上书写时,检测开始。系统随时检测在笔画之间是否有长于预定时间的中断(超时)(步骤102)。如果系统检测到超时,则将识别由超时前的笔画所构成的字(步骤201),而后,在候选字表中显示识别的字(步骤202)。同时系统继续检测(步骤103)。如果检测到另一个超时(步骤104),则进行识别(步骤105)和显示(步骤106)。在步骤106,系统显示在步骤105识别的字以及在步骤105识别的字和在步骤201和202识别和显示的字的组合。如果没有检测到超时,则继续检测。在步骤106的显示之后,系统根据用户的选择,将用户选择的字置于文本编辑区。
图4是根据本发明方法的另一个实施例。除了利用上述的候选字表之外,通过检测字的笔画在触摸屏或写字板上的位置,可以几乎完全消除超时对识别的影响。
由于汉字书写遵循从左到右和从上到下的规则,例如在触摸屏/写字板上,书写通常是从书写区的左上角开始,在右下角结束,可以把一个字起笔的位置,即书写区的左上部,定义为一个“开始区”。开始区的尺寸最好比书写区或书写框的四分之一稍大一些,以便大多数用户都可以在开始区开始书写。如果一个字包括两个或更多的部分,例如左右或上下两部分,可以从开始区以外的地方开始书写另一部分。在本实施例中,利用汉字输入的这一特点来检测一个字是否已经写完,并且是否开始了另一个字的书写。
根据本实施例,在下列情况下,一个笔画将被认为是一个新字的开始1)前一个笔画或前几个笔画的开始点或中间点不在开始区;2)前几个笔画构成一个完整的字;3)当前笔画的开始点或当前笔画的中间点在开始区。也就是说,只有在上述三个条件同时满足时,才认为由前几个笔画构成的字已经写完,当前的笔画是一个新字的开始。因此,不必等待超时,系统将根据上述条件而不是超时来确定一个字是否已经写完。
如图4所示,开始区在书写区或书写框的左上角,并且可以用线或图形标出,以提示用户在这个区域开始书写。
同样以“明”字为例,该字由左右两部分构成且应当从左边的“日”字旁开始书写。“日”字旁的前三个笔画的开始点和中间点都在开始区内。虽然第四笔的开始点可能会在开始区以外,但前三笔并未构成一个完整的字。因此,第四笔的开始并不被认为是一个新字的开始。右半部分“月”一般是从开始区以外开始书写的。虽然左半部分“日”作为偏旁也可以构成一个完整的字,但右半部分“月”的第一笔不会被认为是一个新字的开始,因为“月”的第一笔是在开始区以外,不满足上述第三个条件。系统会检测各个笔画的开始点,以根据这个规则确定是否已经写完一个字。也可以设置使系统检测各个笔画的中间点,即笔画的中间的部分是否落在开始区。写完的字会被识别并显示在候选字区。
由于用户可能会由于忽视等原因在开始区开始写右半部分的“月”,且这可能会导致系统将右半部分的“月”误识别为一个完整的“月”字,因此,候选字表除了包括当前字外,还应当包括当前字与紧邻此当前字之前的一个字的组合,如参照图2所描述的那样。在本例中,“月”和“明”都被显示在候选字表中,因此,由于用户未能在开始区以外开始书写右半部分“月”而引起的错误不会影响系统的正确识别。
图5示出了图4所述实施例的流程。当用户开始在触摸屏或写字板上书写时,检测开始。系统首先检测前一个笔画的开始点/中间点是否在预定的开始区(步骤301)。如果不是,则检测前几个笔画是否构成一个完整的汉字(步骤302)。如果是,则继续检测,直到检测出一个笔画的开始点/中间点不在开始区(步骤401)。如果前几个笔画构成一个完整的汉字,则检测当前的笔画开始点/中间点是否在开始区(步骤303)。如果检测的结果是肯定的,则对前几个笔画构成的字进行识别(步骤304),并且显示(步骤305)在步骤304识别的字以及在此前一轮检测中和识别和显示的字。如果步骤303的结果是否定的,则回到步骤401。最后,系统根据用户的选择,产生将所选的字置于文本编辑区。
图6A和6B是根据本发明方法的再一个实施例,它使用户能部分修改一个字。
根据汉字字型索引系统(SKIP),汉字可以被分成四种字型,即如下所示的左右型(例如“明”字),上下型(例如“吴”字),包围型(例如“国”字)和实心型(例如“大”字)。因而,除了在显示屏的书写区预设一个开始区外,可以用某种方式,例如色彩或灰度(在单色显示屏的情况下)提示以识别的字的字型。
每一个用颜色提示的部分,例如左右型的左部分和右部分分别构成一个独立的识别区,在此,系统能够识别一个完整字或一个偏旁部首等,但应当使整个书写区中识别的首要候选字是一个完整的字。
如图6A所示,在触摸屏的书写区输入汉字“拌”时,用户从左上角(开始区)开始。系统对用户的输入进行识别。识别可以用图2所述的方法进行,也可以用图4的方法进行,甚至可以用已知的方式进行识别。由于,例如字迹潦草,在书写区显示的首要候选字是“伴”而不是他要写的“拌”,书写区的背景以不同的色彩或灰度提示该字为左右型。此时,用户不必重写整个字,因为首要候选字“几乎是正确的”,即看上去像用户要写的字,只是左半部分不对。此时,用户可以只重写左半部分。当用户重写左半部分时,左侧区域的背景颜色(灰度)发生变化,以确认用户只修改左半部分,而右半部分保持不变。系统根据用户的修改产生一个新的首要候选字“拌”,这正是用户要写的字。
候选字也可以同时显示在一个候选字表中,例如图4所示的在书写区上面的候选字表中。
另一种方式是,使候选字表包括所有的(根据可以显示的字的数量而定)带有用户选择的偏旁或部首的字。在这种情况下,用户可以在书写区选择正确的部分,而不是修改错误的部分。如图6B所示,当用户注意到所显示的首要候选字不是他实际上要写的字的时候,他可以选择正确的部分,例如通过点击带有正确部分的区域(右侧区域)来选择正确的部分。而后,所有带有正确部分“半”的字都被显示在候选字表中,在本例中,“伴”,“拌”,绊”等。用户可以从候选字表中通过,例如点击选择他要写的字(“拌”)选择“拌”字。
本实施例不适用于带有单独显示屏的写字板。
图7是图6所述实施例的流程图。用户写完一个字之后,系统以图2或图4的方法,或已知的方式进行识别,随后显示被识别的首要候选字(步骤502),并用颜色/灰度提示该字的字型(步骤503),不同的颜色/灰度表示字型的不同区。如果显示的字就是用户写的字(步骤504),则系统根据用户的选择,产生所选的字并将其置于文本编辑区(步骤505)。如果在步骤503所显示的字部分正确,用户可以选择确认正确的部分或直接修改错误的部分。如果用户选择确认正确的部分(步骤601),系统将产生一个候选字表(步骤602),该表包括含有该正确部分的所有的字。如果用户选择直接修改错误的部分(步骤603),系统将通过改变修改部分的颜色/灰度来提示用户,识别并显示修改后的部分。
虽然以颜色/灰度为例说明了提示用户的方式,但显然也可以采用本领域技术人员熟知的其它方式。
以上以实施例的方式对本发明进行了描述,但本发明并不局限于所述实施例,本领域的技术人员可以在所附权利要求的范围内,对本发明做出各种修改。
权利要求
1.一种改进的用于电子装置的手写汉字输入识别方法,包括下列步骤根据预定的规则识别用户在所述电子装置的一个书写区书写的汉字,产生一个在上述识别步骤识别的候选字表,以及在所述电子装置的一个显示区显示所述候选字表;其中所述的候选字表至少包括刚被识别的当前字和该当前字与在此当前字之前被识别和显示的候选字的组合。
2.根据权利要求1的方法,其中所述的字包括完整的字和偏旁部首等构字部分。
3.根据权利要求1的方法,其中所述的刚被识别的当前字和该当前字与在此当前字之前被识别和显示的候选字的组合构成一个完整的字。
4.根据权利要求1的方法,还包括从所述候选字显示区显示的所述候选字表中选择一个字的步骤。
5.根据权利要求1的方法,其中所述的预定的规则是与超时有关的规则。
6.一种改进的用于电子装置的手写汉字输入识别方法,包括识别用户在所述电子装置的一个书写区书写的汉字步骤,其中所述的识别只有在满足下列条件时才完成前一个笔画的起始点或中间点不在一个预定的开始区,前几个笔画构成一个完成的字,且当前笔画的始点或中间点在所述的开始区内。
7.根据权利要求6的方法,其中所述的开始区位于所述书写区的左上部。
8.根据权利要求6和7的方法,其中所述的开始区的面积大于所述书写区的四分之一。
9.根据权利要求6的方法,还包括产生一个在上述识别步骤识别的候选字表的步骤,以及在所述电子装置的一个显示区显示所述候选字表的步骤。
10.根据权利要求6的方法,其中所述的候选字表至少包括刚被识别的当前字和该当前字与在此当前字之前识别和显示的候选字的组合。
11.根据权利要求6的方法,还包括从所述候选字显示区显示的所述候选字表中选择一个字的步骤。
12.一种改进的用于电子装置的手写汉字输入识别方法,包括识别用户在所述电子装置的一个书写区书写的汉字的步骤,和在所述书写区显示在所述识别步骤识别的主要候选字表的步骤;其中所述的显示包括在所述书写区提示该首要候选字的字型的不同部分,并且提示的部分构成一个独立的书写区,在该书写区内,可以独立地进行识别。
13.根据权利要求12的方法,其中所述的提示是在背景部分用不同的颜色或灰度显示该首要候选字的字型的不同部分,并且标有颜色或灰度的部分构成一个独立的书写区,在该书写区内,可以独立地进行识别。
14.根据权利要求12或13的方法,还包括产生一个在上述识别步骤识别的候选字表的步骤,以及在所述电子装置的一个显示区显示所述候选字表的步骤。
15.根据权利要求13的方法,其中所述的候选字表至少包括带有用户选择的、由色彩或灰度表示的部分的那些字。
16.根据权利要求13的方法,其中各标有颜色或灰度的部分在识别进行时会改变颜色或灰度。
全文摘要
一种改进的用于电子装置的手写汉字输入识别方法,包括下列步骤根据预定的规则识别用户在所述电子装置的一个书写区书写的汉字,产生一个在上述识别步骤识别的候选字表,在所述电子装置的一个显示区显示所述候选字表;其中所述的候选字表至少包括刚被识别的当前字和该当前字与在该当前字之前被识别和显示的候选字的组合。
文档编号G06K9/72GK1622121SQ20031011572
公开日2005年6月1日 申请日期2003年11月28日 优先权日2003年11月28日
发明者市川文子, 贝卡匹拉亚 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1