基于全混合联想库的手写输入方法和装置的制作方法

文档序号:6574213阅读:193来源:国知局
专利名称:基于全混合联想库的手写输入方法和装置的制作方法
技术领域
本发明涉及一种手写输入方法和装置。更具体地讲,本发明涉及一种基 于适用于各种输入法的能够加快字符输入速度的全混合联想库的手写输入方 法和装置。
背景技术
目前,市场上使用的手机和个人数字助理(PDA)等移动终端,由于其显 示界面和键盘的限制,通过按鍵组合来输入文字的效率不高,屏幕上一次能 够显示的候选字符个数受到限制,并且用户在输入标点时经常要进行多次切 换。即便使用手写输入的方式进行文字输入,由于字符识别准确率的限制, 往往也要显示多个候选的字符。并且由于大多数标点符号,如",。?", 其笔迹点较少,可使用的识别特征也很少,这样在同其他大容量字符集(如 GBK,大约有20000多个汉字) 一同识别时准确率不高。因此,出现了一些替 代的方法,比如特定区域内进行符号输入,或者通过4姿键切换来完成符号输 入。然而,这些操作都给用户的使用增加了多余的步骤和不便,并且不适合 全屏输入。同时,因为在大字符集的情况下,手写识别引擎对字符的识别率 较低,所以需要提供一种新的方法和装置加快手写输入的速度,并且进一步 提高识别准确率。近来,通过使用联想库来提供字符之间的联想。但是,现有的联想库提 供的联想都是同一种类字符之间的联想,忽略了不同种类字符之间的联想。 因此,进行手写输入时,不能提供不同种类字符之间的联想。可供使用的联 想字符不丰富,给输入带来了不便。另外,尚没有发现在手写输入中使用标 点符号联想的输入方法。发明内容本发明的示例性实施例克服了上述缺点以及上述未提及的缺点。此外, 本发明不需要克服上述缺点,并且本发明的示例性实施例可不克服上述的任何缺点。本发明提供了 一种基于全混合联想库进行手写输入,同时修正全混合联 想库提供的联想字符的候选排列顺序以方便用户使用并提高输入速度的手写 输入方法和装置。根椐本发明的一方面,提供了一种基于全混合联想库的手写输入方法,该方法包括以下步骤用户在输入区域中手写输入字符;字符识别单元对输 入的字符进行识别,得到一组识别候选字符;在输入字符显示区中显示识别 候选字符中的首选字符;在显示首选字符的同时,从已建立的全混合联想库 中,提取与首选字符对应的联想字符,并将其显示于联想字符显示区中;如 果用户需要输入联想字符,则直接选择显示的候选联想字符;在完成一个字 符输入以后记录用户输入过的文本的上下文关系,基于该上下文关系对全混 合联想库中相应字符的联想字符表进行修正。根据本发明的另 一方面,提供了 一种基于全混合联想库的手写输入装置, 该装置包括输入单元,用于接收手写字符和用户选择操作;运算处理单元, 用于对从输入单元输入的手写字符和选择操作进行数据计算和逻辑判断;显 示单元,用于显示从输入单元输入的手写字符和从已建立的全混合联想库中 提取的对应的候选联想字符;存储单元,用于存储上述各个单元运行所需的 相关信息,所述相关信息包括手写字符的笔迹信息和全混合联想库,其中, 在完成一个字符输入以后记录用户输入过的文本的上下文关系,基于该上下 文关系对全混合联想库中相应字符的联想字符表进行修正;通信单元,用于 管理上述各个单元之间的信息交换以及不同物理平台的相关单元之间的信息 交换。


通过下面结合附图对实施例进行的描述,本发明的这些和/或其他方面和 优点将会变得清楚和更易于理解,其中图1是示出根据本发明实施例的基于全混合联想库的手写输入装置的示意图;图2是示出根据本发明实施例的基于全混合联想库的手写榆入方法的流程图;图3是示出运行根据本发明的基于全混合联想库的手写输入方法的物理平台的示例。
具体实施方式
现在对本发明实施例进行详细的描述,其示例表示在附图中,其中,相 同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。本发明用到如下的一些术语或者定义混合输入;f莫式,在该输入模式下能够同时支持多种字符集中字符的输入, 而不需要为输入不同字符集的字符进行模式切换。例如,在输入一段含有标 点、数字和汉字的文本时,在采用单一输入模式的情况下,如果要输入标点, 则必须切换到标点输入模式;如果要输入数字,则必须切换到数字输入模式。 而在混合输入模式下,输入标点、数字和汉字等多种字符不需要任何模式切 换。上下文关系,可以根据统计的词频信息、字频信息、语意统计分析等多 种统计方式而得到,其能够表示前后相连的字符之间的关系信息。如何利用 上下文关系对联想候选字符表进行修正的算法,包含了本发明所属技术领域 常用的各种算法,具体的算法内容不属于本发明所涉及的范畴。图1是示出根据本发明实施例的基于全混合联想库的手写输入装置的示 意图。参照图l,所述装置包括交互单元101、运算处理单元102、存储单元 103和通信单元104。交互单元101用于处理装置与用户之间的交互信息,其包括输入单元110 和显示单元120。输入单元110用于接收手写输入的字符和用户的选择操作, 其中,手写输入的字符包含各种能够被识别的文字和符号。显示单元120用于显示手写输入的字符的笔迹图像和候选联想字符,其 包括识别结果显示区,用于显示识别得到的一组识别候选字符;输入字符 显示区,用于显示输入到装置内的首选字符;联想字符显示区,用于显示与 输入字符显示区中的当前字符对应的候选联想字符。在采用触摸屏为交互组 件的情况下,因为触摸屏既是输入组件也是显示组件,所以输入单元110和 显示单元可以共用一个物理界面。这里需要说明的是,以上的显示区会受到屏幕的限制而共享实际物理区域。在屏幕比较小的情况下,例如手机的屏幕,在执行输入的过程中,上述 显示区可以分别在物理屏幕相同的位置交替显示。这对本领域技术人员而言 是显而易见的。运算处理单元102用于数据计算和逻辑判断,其包括逻辑运算单元210 和字符识别单元220。逻辑运算单元210用于处理从输入单元110接收到的 选择操作信息,判断是将字符输入到装置内还是输出到显示单元120进行显 示。字符识别单元220用于将从输入单元110接收到的手写字符的笔迹信息 识别为 一组识别候选字符。存储单元103用于存储各个单元运行所需的信息。所述信息包括手写字 符的笔迹信息和全混合联想库,其中,全混合联想库包含支持所有字符的联 想候选字符表。通信单元104用于管理各个单元之间的信息交换。因为各个单元可以在 同一个平台上,或者在不同的物理平台上,所以通信单元管理的内容还包含 各个平台的相关单元之间的信息交换。本发明使用的全混合联想库的构成规则在于,不仅同 一种类的字符之间 存在着联想关系,而且不同种类的字符之间也存在着联想关系。其中,联想关系包含上下文关系。上下文关系可以根据预先统计的词频 信息、字频信息、语意统计分析等多种统计方式而得到,并可以在用户不断 使用时进行适应性调整。举例来说,对于汉字这种字符集合,如果单独输入 的文字为"人",则可以从全混合联想库中查找到根据词频得到的联想字符序 列"民家们名生……,,;如果单独输入的文字为"民",则可以从全混合 联想库中查找到根椐词频得到的联想字符序列"主族间众国……";如 果先输入"人",接着输入"民",则"人民"这个词对应的联想序列变为"币 共和国法院银行......"。用户在输入字符时,所述装置可以根据用户写入的文本的上下文关系, 不断调整相应字符的联想字符表中联想字符的先后顺序,从而将用户常用的 字符放在相应字符的联想字符表的前部,方便用户使用。本发明使用的全混合联想库不仅包含同 一种类字符的联想字符,而且还 包含不同种类字符的联想字符。对于不同的文字使用环堍,仝混合联想库的 构成也是不完全相同的。例如,当全混合联想库用于中文系统时,该库需要 包含中文文字、拼音字母、符号、英文字母、数字等中文系统使用的字符集合;当全混合联想库用于韩文系统,该库需要包含韩文的元音和辅音、符号、 英文字母、数字等韩文系统使用的字符集合;当全混合联想库用于英文系统 时,该库需要包含符号、英文字母、数字等英文系统使用的字符集合。全混合联想库不限于中丈、韩文和英丈系统中使用的字符,对于其他语 言,如日文、德文、拉丁文等系统也同样可以按照本发明描述的构成方法生 成全混合联想库。全混合联想库的构成方法按照同 一种类的字符之间的联想关系和不同种 类字符之间的联想关系得到联想候选字符表,从而构成全混合联想库。例如 不仅汉字有联想字符,数字、标点符号和字母也有对应的联想字符,而且汉 字的联想字符也可以是标点符号、数字或字母,反之亦然。在中文系统中,全混合联想库的按照如下规则构成1) 对于字符是0至9的数字,对应的联想字符为10个即数字从O到9:2) 对于字符是英文字母或字母组合,对应的联想字符为字母,其中优先 排序依据是英文单词的词频和构成的关系;3) 对于字符是标点符号,对应的联想字符为标点符号,其中优先排序依 据是标点符号的使用频率;4) 对于字符为汉字或汉字组合,对应的联想字符包含能够遵从上下文关 系的汉字和标点符号,其优先排序的依据首先是能组成词的汉字优先,其次 是使用频率高的汉字优先。其中,联想字符中的标点符号根据汉字的具体内 容而定, 一般为逗号和句号。但是,对于疑问字和感叹字等语气字或词,标 点符号为问号或者感叹号。例如疑问字"吗吧呢"的优先联想标点为"!,,;感叹字"呀啊"的优先联想标点为"! ?,,;5) 对于任何字符,标点符号或者其他分隔符都可以作为联想字符。 对于其他语言的文字,在上述规则4)和5)中同样采用该语言文字的上下文关系,包含词频、字频、语意等。如果同样存在语气词,则也可以在语 气词后面加入相应的标点符号联想字符。对于通过单字不同的组合表达不同意思的语言,例如韩文,空格提示符 也可作为联想字符。例如,当输入韩文单字时,空格作为该单字的联想字符。全混合联想库不仅可以应用于手写输入法,也可应用于其他各种输入法, 如拼音输入法和笔划输入法等。图2是示出根据本发明实施例的基于全混合联想库的手写输入方法的流程图。如图2所示,才艮据本发明的手写输入方法的详细步骤如下。 在歩骤S201中,用卢在输入区城手写输入字符。在歩骤S202中,字符 识别单元给出一组识别候选字符。在步骤S203中,将候选字符中的首选字符 显示在输入字符显示区中。在步骤S204中,在联想字符显示区中显示与输入 字符显示区中当前字符对应的候选联想字符。如果在步骤S205中用户确定需 要输入候选联想字符,则在步骤S206中用户可以直接选择显示出来的联想字 符。此时,如果用户输入的字符是语气词,则候选联想字符会自动变为"?" 或"!,,号。这样,用户只需要直接选择便可以进行符号输入,而不用再单独 打开符号键盘。在完成一个字符输入以后,记录用户输入过的文本的上下文 关系,在步骤S207中对全混合联想库的相应字符的联想字符表进行修正。在 下一次输入操作中使用更新过的联想字符表。如果在步骤S208中确定用户需 要继续输入字符,则重复步骤S201至S207。如步骤S203中所述,如果输入的字符无对应的联想字符,或者联想字符 个数不足以填满联想字符显示区,或者在联想字符显示区内预留有联想标点 符号候选区域时,加入常用标点符号或者分隔符作为候选联想字符在联想字 符显示区中显示,例如",。!,,或者"空格,,分隔符。相反,可以不显 示候选标点符号。为了更详细地说明本发明,举例说明输入一段文本。文本的内容是"他 的Tel是8123456吗?,,,采用根据本发明的方法和装置的操作步骤如下1) 用户在输入区域手写输入第一个字符,识别单元给出识别结果,"他 地池......,,;2) "他"作为首选字符输入到输入字符显示区内,联想字符显示区根据 输入的文字"他"显示对应的联想字符"们的人是......";3) 直接选择联想字符显示区中的"的",从而"的"被输入到输入字符 显示区内;4) 此时,"的"对应的联想字符为"人话事手……",无字母"T",用户需要手写输入字母"T";5) 识别单元给出识别结果"T 丁下了 7……","T,,作为首选字符 输入到输入字符显示区内,此时联想字符显示区中显示的联想字符为"a6) 直接选择联想字符中的"e",从而"e,,被输入到输入字符显示区内;7) 在联想字符显示区中显示"e"的联想字符"a e n 1……",因为联 想字符中有字母"1",所以选择字符"1",从而"1"被输入到输入字符显示 区内;8) "1"的联想字符中没有"是",用户需要手写输入字符"是","是" 被识别后显示在输入字符显示区中;9) 接着,用户需要手写输入数字"8", "8"被识别出来,显示在输入字 符显示区中,然后可以通过选择全混合联想库提供的联想数字或者手写输入, 继续将"123456吗"输入到装置内;10) 由于"吗"为语气词,所以联想字符中出现"?",用户选择"?", 从而"? " ^^皮输入到输入字符显示区内,文本输入结束。通过上述步骤可以发现,用户在混合输入模式下手写输入文本时,通过 联想字符的选择减少了输入字符所占用的时间,并且不需要任何字符集合的 切换,从而加快了手写输入速度。作,所以涵盖的字符的联想候选字符表会发生相应的变化。例如,如果用户 再次输入"他",则其对应的联想字符的顺序有可能变为"的们人是……"。 根据修正算法的不同,得到的联想字符的顺序也不相同。图3是示出运行根据本发明的基于全混合联想库的手写输入方法的物理 平台的示例。所述物理平台包括手写板和PC相连的系统301、有触摸屏的PDA 302、有触摸屏的手机303和Tablet PC 304。可以应用于丄有外接输二设备的有;算能力的i:备上,如PC、服务器等。本发明涉及到的各个组件不局限于一个单一设备,可以分布在多个设备上,例 如通过互联网连接的服务器PC和客户端PC上。综上所述,本发明的手写输入方法和装置基于全混合联想库进行手写输 入,同时修正全混合联想库提供的联想字符的候选排列顺序,方便用户使用, 并且提高了输入速度。虽然已经参照本发明的示例性实施例具体显示和描迷了本发明,但是本 领城普通技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范 围的情况下,可以在形式和细节上对这些实施例进行各种变动。
权利要求
1. 一种基于全混合联想库的手写输入方法,该方法包括以下步骤用户在输入区域中手写输入字符;字符识别单元对输入的字符进行识别,得到一组识别候选字符;在输入字符显示区中显示识别候选字符中的首选字符;在显示首选字符的同时,从已建立的全混合联想库中,提取与首选字符对应的联想字符,并将其显示于联想字符显示区中;如果用户需要输入联想字符,则直接选择显示的候选联想字符;在完成一个字符输入以后记录用户输入过的文本的上下文关系,基于该上下文关系对全混合联想库中相应字符的联想字符表进行修正。
2、 如权利要求l所述的方法,其中,如果用户输入了语气词/字,则候 选联想字符自动变为"?"号或"!"号。
3、 如权利要求1所述的方法,其中,如果输入的字符无对应的联想字符, 或者联想字符个数不足以填满联想字符显示区,或者在联想字符显示区内预 留有联想标点符号候选区域时,则将常用标点符号或者分隔符作为候选联想 字符显示在联想字符显示区中。
4、 如权利要求l所述的方法,其中,联想字符显示区中的联想字符根据 输入字符显示区中显示的当前字符的变化而变化,显示为与当前字符对应的 联想字符。
5、 如权利要求l所述的方法,其中,全混合联想库包含支持所有字符的 联想候选字符表,按照同一种类的字符之间的联想关系和不同种类字符之间 的联想关系得到所述联想候选字符表。
6、 如权利要求5所述的方法,其中,联想关系包含上下文关系,所述上 下文关系根据预先统计的词频信息、字频信息、语意统计分析等多种统计方 式得到,并且在用户不断使用时进行适应性调整。
7、 如权利要求5所述的方法,其中,全混合联想库根据不同的文字使用 环境而不同地构成,当文字使用环境为中文系统时,全混合联想库包含中文文字、拼音字母、符号、英丈字母、数字等中丈系统使用的字符集合;当文 字使用环境为韩文系统时,全混合联想库包含韩文的元音和辅音、符号、英 文字母、数字等韩文系统使用的字符集合;当文字使用环境为英文系统时,全混合联想库包含英文字母、符号、数字等英文系统使用的字符集合。
8、 如权利要求7所述的方法,其中,当文字使用环境为中文系统时,全 混合联想库如下构成对于输入的字符是数字,对应的联想字符为从0到9的数字;对于输入的字符是英文字母或字母组合,对应的联想字符为字母,所述 联想字符按照英文单词的词频和构成的关系排列;对于输入的字符是标点符号,对应的联想字符为标点符号,所述联想字 符按照使用频率排列;对于输入的字符为汉字或汉字组合,对应的联想字符包含遵从上下文关 系的汉字和标点符号,所述联想字符首先按照能够组成词的汉字优先排列, 其次按照使用频率排列;对于上述任何字符,标点符号或者其他分隔符应该作为其联想字符。
9、 如权利要求7所述的方法,其中,对于其他语言文字系统,联想字符 包含遵从上下文关系的文字和标点符号。
10、 如权利要求7所述的方法,其中,对于通过单字不同的组合表达不 同意思的语言,空格分隔符作为联想字符。
11、 如权利要求8至权利要求10中任意一项所述的方法,其中,全混合 联想库应用于手写、拼音和笔划等各种输入法。
12、 一种基于全混合联想库的手写输入装置,该装置包括 输入单元,用于接收手写字符和用户选择操作;运算处理单元,用于对从输入单元输入的手写字符和选择操作进行数据 计算和逻辑判断;显示单元,用于显示从输入单元输入的手写字符和从已建立的全混合联 想库中提取的对应的候选联想字符;存储单元,用于存储上述各个单元运行所需的相关信息,所述相关信息 包括手写字符的笔迹信息和全混合联想库,其中,在完成一个字符输入以后记录用户输入过的文本的上下文关系,基于该上下文关系对全混合联想库中相 应字符的联想字符表进行修正;通信单元,用于管理上述各个单元之间的信息交换以及不同物理平台的 相关单元之间的信息交换。
13、 如权利要求12所迷的装置,其中,运算处理单元包括字符识别单元,用于将从输入单元接收到的手写字符的笔迹信息识别为一组识别候选字符;逻辑运算单元,用于处理从输入单元接收到的选择操作信息,判断是将手写字符输入到装置内还是输出到显示单元。
14、 如权利要求12所述的装置,其中,显示单元包括 识别结果显示区,用于显示识别得到的一组识别候选字符; 输入字符显示区,用于显示输入到装置内的首选字符; 联想字符显示区,用于显示与输入字符显示区中当前字符对应的候选联想字符。
15、 如权利要求12所述的装置,其中,输入单元和显示单元共用一个物 理界面,该物理界面包括具有显示和感应功能的触摸屏。
16、 如权利要求12所述的装置,其中,手写字符的笔迹信息至少对应一 个能够被文字识别单元识别的字符。
17、 如权利要求12所述的装置,其中,全混合联想库包含支持所有字符 的联想候选字符表,按照同 一种类的字符之间的联想关系和不同种类字符之 间的联想关系得到所述联想候选字符表。
18、 如权利要求17所述的装置,其中,联想关系包含上下文关系,所述 上下文关系根据预先统计的词频信息、字频信息、语意统计分析等多种统计 方式得到,并且在用户不断使用时进行适应性调整。
19、 如权利要求17所述的装置,其中,全混合联想库根据不同的文字使 用环境而不同地构成,当文字使用环境为中文系统时,全混合联想库包含中 文文字、拼音字母、标点符号、英文字母、数字等中文系统使用的字符集合; 当文字使用环境为韩文系统时,全混合联想库包含韩文的元音和辅音、标点 符号、英文字母、数字等韩文系统使用的字符集合;当文字使用环境为英文 系统时,全混合联想库包含英文字母、标点符号、数字等英文系统使用的字 符集合。
20、 如权利要求19所述的装置,其中,当文字使用环境为中文系统时, 全混合联想库如下构成对于输入的字符是数字,对应的联想字符为从0到9的数字; 对于输入的字符是英文字母或字母组合,对应的联想字符为字母,所述 联想字符按照英文单词的词频和构成的关系排列;对于输入的字符是标点符号,对应的联想字符为标点符号,所述联想字符按照使用频率排列;对于输入的字符为汉字或汉字组合,对应的联想字符包含遵从上下文关 系的汉字和标点符号,所迷联想字符首先按照能够组成词的汉字优先排列, 其次按照使用频率排列;对于上述任何字符,标点符号或者其他分隔符应该作为其联想字符。
21、 如权利要求19所述的装置,其中,对于其他语言文字系统,联想字 符包含遵从上下文关系的文字和标点符号。
22、 如权利要求19所述的装置,其中,对于通过单字不同的组合表达不 同意思的语言,空格分隔符作为联想字符。
23、 如权利要求20至权利要求22中任意一项所述的装置,其中,全混 合联想库应用于手写、拼音和笔划等各种输入法。
全文摘要
本发明提供一种基于全混合联想库的手写输入方法和装置,所述方法包括用户在输入区域中手写输入字符;字符识别单元对输入的字符进行识别,得到一组识别候选字符;在输入字符显示区中显示识别候选字符中的首选字符;在显示首选字符的同时,基于预先建立的全混合联想库,在联想字符显示区中显示与首选字符对应的候选联想字符;如果用户需要输入联想字符,则直接选择显示的候选联想字符;在完成一个字符输入以后记录用户输入过的文本的上下文关系,基于该上下文关系对全混合联想库中相应字符的联想字符表进行修正。所述方法和装置基于全混合联想库进行手写输入,同时修正全混合联想库的联想字符的候选排列顺序,方便用户使用,并提高了输入速度。
文档编号G06F3/041GK101256462SQ20071007962
公开日2008年9月3日 申请日期2007年2月28日 优先权日2007年2月28日
发明者刘向华, 炎 王, 陈又新 申请人:北京三星通信技术研究有限公司;三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1