一种具有容错功能的文字处理系统及方法

文档序号:6482141阅读:171来源:国知局
专利名称:一种具有容错功能的文字处理系统及方法
技术领域
本发明涉及一种具有容错功能的文字处理系统及方法。
背景技术
目前,随着可文字输入的电子产品日趋小型化、便携化,其用于文字输入 的键盘也随之小型化,键与键之间的间距也越来越小,每个字符键上的接触面 积也相对缩小,各种按键更加紧密地组合在一起,这样,虽然可大大减小电子 产品的体积,但同时也给使用者的操作上带来很多不便,在击键操作时,由于 字符键的接触面积较小,指尖往往容易连带地点击到其相邻4定,或因键位辨别 不清而错误地点击到相邻键,输入的人为失误造成系统不能输出正确的文字, 从而影响了文字输入的准确率。
因此,如何有效提高文字输入的准确率是文字输入领域亟待解决的问题

发明内容
本发明的目的在于提供一种通过容错技术克服人为输入失误的干护"纠正 误输的字符,才是高文字输入的准确率,并且可分类输出的文字处理技术和方法。
为了实现上述发明目的,本发明提供了一种具有容错功能的文字处理系统,
其包括
输入模块,用于输入字符,所述字符包括若干个第一字符和第二字符;
字符容错表,包括若干对具有容错兼容关系的第一字符与第二字符的组^^
容错处理模块,用于接收输入模块所输出的第一字符,并在字符容错表中 查找出与之相互容错兼容的第二字符;词库,用于存储文字;
文字搜索模块,用于在词库中查找出由第二字符所组成的文字;
输出模块,用于将经文字搜索模块查找出的文字输出;以及
分配模块,用于对所查找到的文字根据容错兼容关系进行分类处理。
在本发明的一个优选实施例中,在所述字符容错表进一步包括具有容^"兼 容关系的两两第一字符与第二字符在输入模块上的位置关系,所述两两第一字 符在输入模块上的位置关系为相邻关系,优选相邻关系为左右相邻或/和上下相 邻关系。通过将字符之间的容错关系与其在输入模块(如键盘)上的位置关系 相结合,既方便了人们直观地从输入模块上了解字符之间的兼容关系,也扩大 了容错兼容的概念,扩展到单一字符之间,从而增加了更多可供选^^的文字, 以供人们从中选取合意的目标并输出。
在本发明的另 一个优选实施例中,所迷文字处理系统进一步包括一输出控 制模块,其设置于分配模块与输出模块之间,用于控制经分配模块进行分类处 理后的不同类别文字的输出。在分配模块中,按照所述第二字符与第一字符是 否相同或兼容进行标示,将所述搜索出的文字分为相同和相兼容两种类别,并 分类处理。在所设定的文字输出规则下,通过输出控制模块将不同类别的文字 进行分类输出,使得人们根据需要控制某类文字的输出,可进一步缩小词组候 选区中的选择范围。
在本发明中,所述第一字符为词库中任意一种语言的文字的组成或其音节, 所述文字的组成可为字母、注音符号或笔画中任选一种或多种。
本发明还提供了 一种具有容错功能的文字处理方法
步骤1)建立词库和字符容错表,所述词库中存储若干个文字,所述字符容 错表中包括若干对具有容错兼容关系的第一字符与第二字符的组合,
步骤2)输入第一字符;步骤3 )容错处理,在所述字符容错表中查找出与所述第一字符相互容4普兼
容的至少一个第二字符;
步骤4)分类标示,根据第一字符与第二字符是否相同或相兼容进行分类, 在所述第二字符上进行标示,并获得字符兼容性比较结果;
步骤5 )搜索处理,判断所述词库中是否存在由第二字符组成的文字或其音 节,并输出词库比较结果,根据词库比较结果判定是否将该文字输出;
步骤6 )根据字符兼容性比较结果和所设定的文字输出规则,将所述文字在 词语候选区中进行分类显示,以供使用者从中选取合意的目标以输出。
通过本发明的文字处理方法,对所输入的第一字符根据字符容错表进行容 错处理,查找出与之相互容错兼容的第二字符,根据第二字符与第一字符之间 的兼容性比较来对第二字符进行标示,同时,在词库中查找是否存在由第二字 符组成的文字或其音节,并根据所设定的文字输出规则,选择性地将相匹配的 文字分类显示在词组候选区中,以供人们从中选取合意目标以输出。
与现有技术相比较,本发明的文字处理系统以及处理方法具有以下几点优占.
j 、 、、 ■
1) 提高文字输入的准确率采用容错输入的技术,设定输入字符与输出字 符之间的相互容错关系,特别是一一对应的字符容错兼容关系,扩展了容错技 术在输入法中应用的范畴,扩展到单一字符之间,从而增加了更多可供选择的 文字,以供人们从中选取合意的目标并输出;
2) 分类输出显示根据第二字符与第一字符相比较,相互兼容性的判定结 果,来对第二字符以及经词库搜索所查找到的文字进行标示,并根据系统预先 设定的文字输出规则,选择性地将相匹配的文字分类地显示在词组候选区中, 由此, 一方面,使得人们能够从词组候选区中了解到各文字的类别,另一方面, 也使人们能够有选择性控制某一种或几种类别的文字的输出,从而更明确地限 定词组候选区中的文字的范围。3) 应用范围广在语种应用方面,可应用于各种文字的输入系统中,长口中
文、英文、日文等等各种语种,根据语种不同,建立不同的字库和词库,以文 字的语音或音节为々某介进行输入处理的系统,还可建立与文字相对应的音节库,
根据输入形式、语种以及词库大小的不同,来进行文字的输入;在装置应用方 面,所述输入模块可为各种全键盘,包括机械式4定盘和触摸屏^:盘,可应用于 手机、电脑、PDA等各种文字输入装置中;
4) 将字符之间的容错关系与其在输入模块上的位置关系相结合,即在输入 模块上具有某种位置关系的字符之间建立容错关系,具有容错兼容关系的两两 字符可为相邻关系,这样,解决了在文字输入过程中,因^T建盘过小或操作失"i吴 时,因不小心而误输入相邻字符而造成错误输出或中断输出的问题通过容错 技术的手段来自动纠正用户的误按,也不会影响正确地输出字符,有效提高了 文字输出的效率和准确率;
5) 容错形式多样化可在容错表中针对不同语言或输入形式建立各种不同 的字符关系表,在字符关系表中,可以设定单一输入字符与单一输出字符之间 ——对应的容错兼容关系,也可以设定单一输入字符与多个输出字符之间相互 容错兼容关系等等;
6) 输入形式多样化所输入的第一字符可构成词库中的文字或其音节,当 其为音节时,输入形式可选拼音输入或注音输入,根据不同语种,输入形式进 4亍相应改变。
为使本发明更加容易理解,下面将结合附图进一 步阐述本发明不同的具体 实施例。


图1为本发明文字处理系统的结构示意框图2为本发明文字处理系统的结构另一个实施例的示意框欧图3为本发明文字处理方法的流程图。
具体实施方式
本发明提供了 一种具有容错功能的文字处理系统,可将各种语言文字的输 入应用于各种全键盘的文字输入装置中(如电脑键盘、手机键盘或触摸式键盘 等),通过对输入模块上的若干个字符之间的匹配关系进行定义,设定任意两个 字符之间或者一个字符与多个字符之间的容错兼容关系,由此通过向文字处理 系统输入某一第一字符或字符串,经容错兼容后,输出与之相同或相容错的第 二字符或字符串,将该第二字符或字符串从词库中查找出相对应的文字并输出。参照图l所示,在本发明的文字处理系统中,包括输入模块l、解码模块2、 字符容错表3、容错处理模块4、词库5、文字搜索模块6、分配模块7以及输 出模块8,其中,所述输入模块l用于输入表征第一字符的代码,其可为键盘, 优选各种文字输入装置的全键盘;所述解码模块2,其输入端与输入模块l的输 出端相连接,用于接收输入模块1输出的代码,并对其进行解码,生成与之相 对应的第一字符,表征为第一字符的图形;所述字符容错表3,其中记录有输入 模块1上所有第一字符以及与之具有容错兼容关系的第二字才争,所述容错处理 模块4,其与字符容错表3相连接,且其输入端与解码^t块2的输出端相连才矣, 用于接收解码模块2所输出的笫一字符,并在字符容错表l中查找出与之相互 容错兼容的至少一个第二字符;所述词库5,用于存储某种语言的若干个文字, 所述文字可为单字或词组;所述文字搜索模块6,其与词库5相连接,其输入端 与容错处理模块4的输出端相连接,用于在词库5中查找出由第二字符所组成 的文字;所述分配模块7,其输入端与文字搜索模块6的输出端相连接,用于对 所查找到的文字进行分类处理;所述输出模块8,可为屏幕,其输入端与分配模 块7的输出端相连接,用于将经文字搜索模块6查找出的文字分类输出。在本发明的字符容错表3中,划分有若干个存储空间,分别用于存储各个 字符关系表,在本发明的一个优选实施例中,设输入模块1为英文键盘,某一字符关系表中,包括有输入模块1上某一第一字符和某一第二字符之间的容错 兼容关系,通过三维数组的形式定义任意两个字符之间兼容关系,如仏,S, 1},
表示第一字符"a"和第二字符"s"之间为容错兼容关系;而在另一组字符关 系表中,如(a, t, 0},表示第一字符"a"和第二字符"t"之间无容错兼容关 系。所述字符关系表的表现形式不受限制,可用三维数组或二维数组等等表示。 在三维数组的字符关系表中,通过"1"和"0"分别表示"相互容错兼容"和 "相互不容错兼容,,两种字符之间的关系。 一般地,在字符关系表中,仅记载 具有容错兼容关系的第一字符和第二字符。对于英文字母或汉语拼音而言,字 符容错表3中包含有26 x 26组字符关系表,对于注音而言,则包含有36x36 组字符关系表。当然,字符关系表的个数根据输入模块1上的第一字符的个数 而定。
在本发明的一个优选实施例中,在所述字符容错表进一步包括具有容错兼 容关系的两两第一字符与第二字符在输入模块上的位置关系。换言之,表示第 二字符也标示在输入模块上,且具有容错兼容关系的两两字符在输入模块上的 位置相互关联。所述两两第一字符与第二字符在输入模块上的位置关系为相邻 关系,优选为左右相邻或/和上下相邻关系。以一英文的全4建盘为例,在英文字 符区域,当在字符容错表中设定相互容错兼容字符之间在键盘上的位置关系为 左右相邻关系时,以字符"g,,作为第一字符为例,则与之左右相邻的字符"f" 和字符"h"与该第一字符"g"之间具有容错兼容关系,可作为与第一字符"g" 相容错兼容的第二字符,以此来定义输入模块1上的各个字符之间的容错兼容 关系。
所述第一字符为词库5中某一文字的组成或其音节,如在英文单词"about" 中,5个英文字母作为第一字符构成该单词的组成;在汉字词语"雨伞,,中,其 拼音为"yusan",通过由第一字符"yusan"组成的音节可乂人词库5中找出该词 语来。所述第一字符为任意一种语言的字母、注音符号或笔画的任选一种或多 种,即可通过这几种字符形式来反映某一文字的组成或音节。在本发明的另 一优选实施例中,在字符容错表中也可以设定一个字符与多
个字符之间的容错兼容关系。比如当第一字符为某一文字的音节时,在字符 容错表中设定相互谐音的字符"c"与两个字符"ch"之间为容错兼容关系,当 输入第一字符串"cabie"时,经容错分析处理,查找出若干组第二字符串,其 中包括"chabie",将该第二字符串"chabie"导入词库中,查找出与之音节相 匹配的词组"差别"。由此可见,可以通过设定谐音字符或字符串之间的容错兼 容关系,使得文字处理系统能够查找出与所输入的第一字符或字符串的音节相 匹配的字或词组,以帮助输出拼写不准的文字。
在本发明中,所述文字处理系统中的分配模块7,其输入端与文字搜索模块 6的输出端相连接,输出端与输出模块8的输入端相连接, 一方面,用于对经容 错查找出的第二字符进行标示,标示的基准为与所输入的第一字符相比,(A) 相同或(B)相兼容,在第二字符的属性中进行标示,使得相同和相兼容的两类 第二字符相互区别;另一方面,用于对经词库搜索获得的文字进行标示,标示
的基准同上,在文字的属性中进行标示,从而将所搜索到的文字根据所依据的 第二字符的属性来进行标示并分类处理。
例如,以输入模块为英文全键盘,字符容错表上相互容错兼容的字符在输 入模块上为相邻关系,输出文字为中文汉字,输入形式为拼音输入为例,当输 入第一字符串"laoshi,,时,经容错处理后,获得以下几组第二字符串①laoshi、 ②kaoshi、③paoshi等,将各第二字符串分别与所输入的第一字符串相比乾 其中,第二字符串①laoshi与第一字符串laoshi完全相同,并在该第二字符串 ①的属性中标示为"(A)";第二字符串②kaoshi、③paoshi分别与所输入的第
一字符串相比较,均包含有一个或多个相兼容的第二字符,即判定为相兼容, 并在第二字符串②和③的属性中标示为"(B)"。另外,还可对经词库搜索获得 的文字进行标示。如在上述相同条件下,输入第一字符串"laoshi",经容^l昔后 获得的第二字符串包括①laoshi、②kaoshi、③paoshi等,将各第二字符串 分别与词库中的文字的音节相比较,其中,其音节与第二字符串①laoshi相匹
12配的文字有老师、老实、老式,根据字符兼容性比较结果,分别在由第二字符串①所搜索出的文字的属性中标示为"(A)";同样地,其音节与第二字符串
② kaoshi相匹配的文字有考试、考室;其音节与第二字符串③paoshi相匹配的文字有抛尸、抛石,根据字符兼容性比较结果,分别在由第二字符串②、
③ 所搜索出的各文字的属性中标示为"(B)"。这样,采用分类模块在对第二字符串根据字符兼容性比较结果进行标示的前提下,进一步对采用相应第二字符串进行词库搜索而获得的文字进行同样的标示,以此将文字相互区别开来,以实现对其进行分类处理。
参照图2,在本发明的一个优选实施例中,所述文字处理系统进一步包4舌一输出控制模块9,其设置于分配模块7与输出模块8之间,用于控制经分配模块7进行分类处理后的不同类别文字的输出。在本实施例中,可在输入模块l上设置某一功能键为输出类型选择键,其与所述输出控制模块9相关联,使得使用者能够通过输入模块1上的输出类型选择键来对选择性地控制不同类别的文字的输出。例如,当经词库搜索获得的文字中包括有相同和相兼容两类时,可以通过输出类型选择键来切换选择文字处理系统中的菜单,以实现其中一类或两类文字的输出显示。
在本发明的另一个实施例中,所述解码;漠块2亦可省略,通过输入才莫块1直接对所输入的字符代码进行解码处理,再传输至字符容错表进行容错分析处理。
参照图2所示,以下具体介绍一下釆用该文字处理系统进行文字处理的方

步骤l)建立词库和字符容错表,所述词库中存储某种语言的若干个文字,所述字符容错表中包括输入模块上所有第一字符以及与之具有容错兼容关系的第二字符;
步骤2)输入至少一个第一字符;步骤3 )容错处理,在所述字符容错表中查找出与第一字符相互容错兼容的至少一个第二字符;
步骤4)分类标示,根据第一字符与第二字符是否相同或相兼容进行分类,在所述第二字符上进行标示,并获得字符兼容性比较结果;
步骤5 )搜索处理,判断所述词库中是否存在由第二字符组成的文字或其音节,并输出词库比较结杲,根据词库比较结果判定是否将其输出;
步骤6 )根据字符兼容性比较结果和所设定的文字输出规则,将所述文字在词语候选区中进行分类显示,以供使用者从中选耳又合意的目标以输出。
在步骤l)中,在某一文字处理系统中,所述词库中存储某种语言的若干个文字,所述文字至少包括单字和词组;在所迷字符容错表中划分有若干个存储空间,分别用于存储若干个字符关系表,根据字符关系表的定义分别具有三个不同的实施例
实施例一,在字符关系表中定义输入模块中的任意一个第一字符与一个第二字符之间的容错兼容关系。
实施例二,在字符关系表中定义输入模块中的一个第一字符与多个第二字符之间的容错兼容关系。
实施例三,在字符关系表中定义输入模块中的多个第一字符与多个第二字符之间的容错兼容关系。
在字符关系表的实施例一中,具有容错兼容关系的任意一个第一字符与一个第二字符在输入模块上具有相互关联的位置关系,所述位置关系可为相邻关
系,如左右相邻或上下相邻,表示具有容错兼容关系的两个第一字符在输入才莫块上位于相邻位置,使得当使用者因击键失误而误输第一字符时,根据字符容错表可引出与之相邻的另一相容错字符并输出,这样,即便因击键失误而误输入与之相邻的其他键,也可通过容错处理而将目标字符映射并导入如在一英文全键盘中,设定字符"u,,和与其相邻的字符"y"和字符"i,,之间为容^"兼容关系,当输入字符"U"时,其作为第一字符,与之相兼容的两个第二字符"y"
和以及该第一字符"u"均可被输出,这样,当使用者需要输入字符"y", 但却误输入与之相邻的第一字符"u"时,通过容错处理模块也可以将与该字符 "u"相兼容的"y"导出,反之亦然。从而解决了因误输相邻键而造成的后果, 引导字符的正确输出。
在字符关系表的实施例二中,具有容错兼容关系的一个第一字符与多个第 二字符之间可在读音上相互容错兼容即在具有相同或相近音节的字符与字符、 字符与字符串、字符串与字符串之间建立容错兼容关系,在通过音节输入时, 查找出由所输入的第一字符或字符串,或与之兼容的字符或字符串所组成的音 节,并通过该音节查找出与之相对应的文字。如在一英文4定盘中,i殳定具有相 近读音的字符"z"与两个字符"zh"之间为容错兼容关系,当输入第一字符"z,, 时,经过容错处理,可以输出该字符"z,,以及与之相容错兼容的另一组字符"zh,,, 输出两种结果以供选择,反之亦然。从而通过相同或相似读音相互兼容的方式, 可帮助人们纠正文字或字符的读音,引导正确的输出。
根据适用的语言以及第 一字符的形式的不同,在文字处理系统中可以i殳置 不同的字符关系表,结合文字输入的不同特点,应用容错技术来提高字符或文 字输出的准确率。
在步骤2)中,所述第二字符中可包舍有第一字符,表明容错兼容的字符也 包括有相同的字符,经容错处理后输出的第二字符中既包含有与之兼容的字符, 还包含有第一字符本身。
如在一英文全键盘中,字符"j"和与其相邻的两个字符"k"和字符"h" 为容错兼容关系,在输入第一字符"j"时,经过容错处理后,可输出该第一字 符"j"和另两个第二字符"k"和"h"。
在步骤3)中,容错处理的过程根据容错表而定,在字符关系表的实施例一 中,相互容错兼容的第一字符与第二符之间为——对应关系,即输入某一第一字符,通过容错处理,仅能输出一个与之相互容错兼容的一个第二字符;以此类推。
在步骤4)中,进一步包括以下步骤
步骤41)将经容错处理得出的第二字符与所输入的第一字符相比專l判定 两者是否相兼容或相同,得出字符兼容性比较结果;
例如,假设字符兼容性比较结果中,相同为"A",相兼容为"B"。当输入 第一字符串"daxue"时,经容错处理后,得出若干个第二字符串①daxue、 ②faxue等,将其与第一字符串相比较,得出字符兼容性比较结果为第二字符串 ①daxue与第一字符串完全相同;而将另 一个第二字符串②faxue与第一字才寻串 相比较,得出字符兼容性比较结果为第二字符串①daxue与第一字符串相兼容;
步骤42 )根据所述字符兼容性比较结果对第二字符进行标示;
在本实施例中,根据字符性兼容性比较结果,在第二字符的属性中分别进 行标示,如在第二字符串①daxue的属性中标示"A",在第二字符串②faxue的 属性中标示"B,,;
步骤43 )根据上述字符兼容性比较结果将第二字符进行分类。
(A) 相同,即与第一字符相同的第二字符;
(B) 相兼容,即与第一字符相兼容的第二字符。
在步骤5)中,搜索过程根据第二字符的形式而定,在某一文字处理系统中, 当选用英文键盘以拼音输入法来输出中文文字时,第二字符为中文文字的音节, 根据该音节在词库中查找出与其相匹配的单字或词组,输出至候选区,以备候 选;同样地,当选用英文键盘来输出英文单词时,第二字符为文字本身,根据 经兼容输出的第二字符所组成的英文字符串,在词库中查找出与其相匹配的英 文单词。
步骤6 )根据词库搜索比较结果来判定是否输出搜索结果,只有查找到与第二字符完全相同的文字或与之相同的音节时,比较结果方能判定为真,才能将 搜索结果输出,不完全输入、多余输入、部分正确输入等情况都被视为比较结 果为假,不能输出显示,同时,根据字符兼容性比较结杲和所设定的文字输出 规则,将所述文字在词语候选区中进行分类显示,以供使用者从中选取合意的 目才示以l叙出。
在本发明的 一个优选实施例中,在字符关系表中定义输入模块中的任意一 个第一字符与一个第二字符之间的容错兼容关系,当选用英文键盘以拼音输入
法来输出中文文字时
步骤l,)建立词库和字符容错表,所述词库中存储若干个中文单字或词组, 所述字符容错表中包括输入模块上所有第一字符以及与之具有容错兼容关系的
第二字符;
步骤2,)输入若干个第一字符,组成第一字符串;比如输入第一字符串 "fuhao,,.,
步骤3,)容错处理,在所述字符容错表中查找出分别与第一字符相互容错 兼容的至少一个第二字符,将所查找出的第二字符按与其相兼容的第一字符的 输入顺序进行排列,生成若干组第二字符串;
设具有容错兼容关系的任意两个第一字符在输入模块上具有左右相邻的位 置关系,则上述第一字符串分别经过容错处理后,获得与之兼容的第二字符串, 包括fuhao、 guhao、 duhao、 fihao、 fyhao、 fugao、 fudao等等,可根据所述 各第二字符串分别在词库中搜索比乾判断是否有与之相对应的文字。
在步骤4,)对第二字符进行标示并分类处理将经容错处理得出的第二字 符与所输入的第一字符相比较,判定两者是否相兼容或相同,得出字符兼容性 比较结果,并根据该结果对第二字符进行标示并分类。
设A为相同,B为相兼容。在本实施例中,对上述若干个第二字符串进行标 示并分类,如fuhao为A,即第二字符与第一字符相同;guhao、 duhao、 fihao、fyhao、 fugao、 fudao为B,即第二字符与第一字符相兼容。 在步骤5')中进一步包括
步骤51')分别将上述每组第二字符串划分为若干组不同字长的字符段
以第二字符串"fuhao"为例,分别划分为若干组不同字长的字符段,包括 "f/uhao"、 "fu/hao"、 "fuh/ao"、 "fuha/o"和"fuhao"等等;
步骤52')将所述各字符段分别与词库中文字的音节相比乾并输出比较结

其中,按字长的升序逐一将所述字符段与词库中文字的音节相比4么即将 "f/uhao"、 "fu/hao"、 "fuh/ao"、 "fuha/o"和"fuhao"等各字符l殳分别与词 库中文字的音节相比较;
步骤521,)在任意一组第二字符串中,将所述字符段按与其相兼容的第一 字符的输入顺序进行——比对;
若其第n个字符段与词库中的某一单字的音节相匹S己,则转步骤5211,);
步骤5211,)进行第n+l个字符段的比较,当前字符下标(zifuindex)设 置为词语第一个字对应的音节的长度加l,同时,字下标设置(zilndex)加1, 表明将搜索光标指向音节的下个字符段,同时将光标指向字的已查找到的文字 的下一个;
如,在第二字符串"fu/hao"中,包括有第一字符段"fu"和第二字符段 "hao",首先将第一字符段"fu"与词库中的文字的音节相比较,查找到若干 个对应该音节的单字符、服、富、复、扶等等,采用第一字符^R可在词库中 搜索到与之音节匹配的单字,将字符下标(zifuindex)设置为词语第一个字对 应的音节的长度加1,同时,字下标设置(zilndex)力口 1,将搜索光标指向音 节的第二个字符段,同时将光标指向下一个字。
若其第n个字符段与词库中的任何单字或其音节均不相匹se^则终止字符段搜索过程。
如,在第二字符串"f/uhao"中,包括有第一字符4殳"f"和第二字符^:"uhao,,, 首先将第一字符段"f"与词库中的文字的音节相比较,没有找到与之相对应的 单字或词组,则不再进行第二字符段"uhao"的比專交,终止词库搜索过程。
步骤5212,)判断当前字下标(zilndex)是否大于当前词语的长度,即判 断是否存在下一个字
若当前字下标大于词语的长度,判定存在下一个字,则转步骤522,);
若当前字下标小于或等于词语的长度,判定不存在下一个字,则转步骤 5213,);
步骤5213,)判断当前字符下标(zifiilndex)是否大于当前第二字符串的 总长度,即判断是否存在下一个音节字符段
若当前字符下标大于第二字符串的总长度,判定还存在下一个音节,则转 步骤5211'),进行下一个音节字符段的比较;
在本实施例中,则接下来进行第二个字符段"hao"的比较,在词库中查找 到对应该音节的若干个单字好、号、耗、好、豪等等,逐一比较各个音节字 符段;
若当前字符下标小于或等于第二字符串的总长l判定不存在下一个音节, 字符段比较结束,则转步骤522,);
在本实施例中,当完成第二字符段"hao"的比较后,当前字符下标 (zifulndex)设置长度为5,与第二字符串的长度相同,则判定不存在下一个 音节,结束字符段比较过程。
步骤522,)将对应第二字符中各字符段的单字按输入顺序进行组合,组成 若干个词组,如符好、符号、符耗、服好等等,将所述词组放入词库中进行 比较,搜索词库中是否存在与之相同的词组若比较结果为不相匹配,则返回步骤521'),对另一组第二字符串进行音节
字符段比较;
在本实施例中,如针对某一第二字符串"duhao"的音节字符段搜索,结果 可能为"度好",在词库比较中,不存在该词语,则进行另一组第二字符串的音 节字符段比较。
若比较结果为相互匹配,则将转步骤5221,),对字下标(zilndex)加一, 字光标指向下一个汉字;字符下标(zifulndex)加一,字符光标指向下一个音 节,且返回步骤5212,),重新对字符长度进行判断,并根据字符长度的比较来 判定是否结束音节字符段比较过程
步骤522,)将对应第二字符中各字符段的单字按输入顺序进行组合,组成 若干个词组,如符好、符号、符耗、服好等等,将所述词组放入词库中进行 比较,根据词库比较结果判定是否输出该词組
步骤5221')若词库比较结果为真,即在词库中搜索到与之相同的词组,表 示第二字符串构成词库中某一词组的音节,则转步骤6,),将其输出显示以供选
取;
步骤5222')若词库比较结果为假,即在词库中没有搜索到与之相同的词组, 表示第二字符串不能组成某一文字,则终止词库4叟索过程,不输出显示。
步骤6,)根据字符兼容性比较结果将与词库中词组相匹配的词组可选择性 地加入词语候选区,并对各词组进行标示并分类,分为相同或相兼容的两类词 组,并根据所设定的输出规则,从中选取相同和/或相兼容的词组输出,并在词 语候选区中显示。
根据词库大小的不同、所输入的第 一字符的不同以及对经容错后的第二字 符的字符段划分的不同,在候选区中,可能出现若干个字或词组,以供使用者 根据自我意愿从中选取合意的目标以输出。
在词组候选区中,优先按与第一字符串相同的比较结果的顺序输出;其次按所述搜索结果按其使用频率的降序由高到低进行排序,可帮助人们尽快地查 找出合意的目标词组以输出。
在本实施例中,针对第二字符串"fuhao(A)"依次进行音节字符革殳比4支和 词库比较后,导出以下词组符号、富豪、负号、鼓号、讣告、辅导、妇道、 辅道等等,根据字符兼容性比较结杲对该等词组进行标示,均为相同(A);针 对第二字符串"guhao(B)"依次进行音节字符段比较和词库比较后,导出以下 词组鼓号,对其进行标示,为(B);以此类推,可以分别对经不同第二字符 串进行词库搜索得出的词组进行标示并分类。
在本实施例中,所述输出规则可为以下三种①输出A类文字,即输出由 与第一字符相同的第二字符经词库搜索获得的文字;②输出B类文字,即输出 由与第一字符相兼容的第二字符经词库搜索获得的文字;③输出A类和B类文 字。所述输出规则可通过文字处理系统的操作菜单进行预先设定。
在本发明的另 一个实施例中,所述相同或相兼容的词组的输出亦可由输入 模块上的输出类型选择键进行控制,所述输出类型选择键与所述输出控制模块 相关联,当经词库搜索获得的文字中包括有相同和相兼容两类时,可以通过输 出类型选择键来切换选择文字处理系统中的菜单,以实现其中一类或两类文字 的输出显示。
在本发明中,所述文字处理系统及其处理方法具有以下优点
1) 提高文字输入的准确率采用容错输入的技术,设定输入字符与输出字 符之间的相互容错关系,特别是一一对应的字符容错兼容关系,扩展了容错技 术在输入法中应用的范畴,扩展到单一字符之间,从而增加了更多可供选择的 文字,以供人们从中选取合意的目标并输出;
2) 分类输出显示根据第二字符与第一字符相比较,相互兼容性的判定结 果,来对第二字符以及经词库搜索所查找到的文字进行标示,并根据系统预先 设定的文字输出规则,选择性地将相匹配的文字分类地显示在词组候选区中,由此, 一方面,使得人们能够从词组候选区中了解到各文字的类别,另一方面, 也使人们能够有选择性控制某一种或几种类别的文字的输出,从而更明确地限 定词组候选区中的文字的范围。
3) 应用范围广在语种应用方面,可应用于各种文字的输入系统中,如中 文、英文、日文等等各种语种,根据语种不同,建立不同的字库和词库,以文 字的语音或音节为媒介进行输入处理的系统,还可建立与文字相对应的音节库, 根据输入形式、语种以及词库大小的不同,来进行文字的输入;在装置应用方 面,所述输入模块可为各种全键盘,包括机械式键盘和触摸屏键盘,可应用于 手机、电脑、PDA等各种文字输入装置中;
4) 将字符之间的容错关系与其在输入模块上的位置关系相结合,即在输入 模块上具有某种位置关系的字符之间建立容错关系,具有容错兼容关系的两两 字符可为相邻关系,这样,解决了在文字输入过程中,因键盘过小或操作失误 时,因不小心而误输入相邻字符而造成错误输出或中断输出的问题通过容错 技术的手段来自动纠正用户的误按,也不会影响正确地输出字符,有效提高了 文字输出的效率和准确率;
5) 容错形式多样化可在容错表中针对不同语言或输入形式建立各种不同 的字符关系表,在字符关系表中,可以设定单一输入字符与单一输出字符之间 一一对应的容错兼容关系,也可以设定单一输入字符与多个输出字符之间相互 容错兼容关系等等;
6) 输入形式多样化所输入的第一字符可构成词库中的文字或其音节,当 其为音节时,输入形式可选拼音输入或注音输入,根据不同语种,输入形式进 行相应改变。
惟以上所述者,仅为本发明的较佳实施例而已,当不能以此限定本发明实 施的范围,即大凡依本发明权利要求及发明说明书所记载的内容所作出简单的 等效变化与修饰,皆仍属本发明权利要求所涵盖范围之内。
2权利要求
1.一种具有容错功能的文字处理系统,其包括输入模块,用于输入字符,所述字符包括若干个第一字符和第二字符;字符容错表,包括若干对具有容错兼容关系的第一字符与第二字符的组合;容错处理模块,用于接收输入模块所输出的第一字符,并在字符容错表中查找出与之相互容错兼容的第二字符;词库,用于存储文字;文字搜索模块,用于在词库中查找出由第二字符所组成的文字;分配模块,用于对所查找到的文字根据容错兼容关系进行分类处理以及输出模块,用于对经分类处理后的文字选择性地输出。
2. 根据权利要求l所述的文字处理系统,其特征在于在分配模块中,按 照所述第二字符与第一字符是否相同或兼容进行标示,'将所述搜索出的文字分 为相同和相兼容两种类别,并分类处理。
3. 根据权利要求2所述的文字处理系统,其特征在于所述文字处理系统 进一步包括一输出控制模块,用于控制经分配模块进行分类处理后的不同类别 文字的输出。
4. 一种具有容错功能的文字处理方法,其特征在于步骤l)建立词库和字符容错表,所述词库中存储若干个文字,所述字符容 错表中包括具有容错兼容关系的第一字符与第二字符的组^", 步骤2)输入第一字符;步骤3 )容错处理,在所述字符容错表中查找出与所述第一字符相互容^"兼 容的第二字符;步骤4)分类标示,根据第一字符与第二字符是否相同或相兼容进行分类, 在所述第二字符上进行标示,并获得字符兼容性比较结杲;步骤5 )搜索处理,判断所述词库中是否存在由第二字符组成的文字或其音节,并输出词库比较结果,根据词库比较结果判定是否将该文字输出;步骤6 )根据字符兼容性比较结果和所设定的文字输出规则,将所述文字在 词语候选区中进行分类显示,以供使用者从中选取目标文字以输出。
5. 根据权利要求4所述的一种文字处理方法,其特征在于 步骤2)输入若干个第一字符,组成第一字符串;步骤3)容错处理,在所述字符容错表中查找出与第一字符串相互容错兼容 的第二字符,将所查找出的第二字符按与其相兼容的第一字符的输入顺序进行 排列,生成若干组第二字符串。
6. 根据权利要求5所述的一种文字处理方法,其特征在于在步骤4)中 进一步包括步骤41)将经容错处理得出的第二字符与所输入的第一字符相比乾判定 两者是否相兼容或相同,得出字符兼容性比较结果;步骤42 )根据所述字符兼容性比较结杲对第二字符进行标示; 步骤43 )将第二字符根据字符兼容性比较结果分为以下两类(A) 相同,即与第一字符相同的第二字符;(B) 相兼容,即与第一字符相兼容的第二字符。
7. 根据权利要求6所述的一种文字处理方法,其特征在于在步骤5 )冲 进一步包括步骤51)分别将每组第二字符串划分为若干组不同字长的字符段; 步骤52)将所述字符段分别与词库中的文字或其音节相比乾并输出比较 结果。
8. 根据权利要求7所述的一种文字处理方法,其特征在于在步骤52)中 进一步包括步骤521)在任意一组第二字符串中,将所述字符段按与其相兼容的第一字符的输入顺序进行——比对;若其第n个字符段与词库中的某一单字或其音节相匹配,则转步骤5211);若其第n个字符段与词库中的任何单字或其音节均不相匹配,则完成字符 段比较过程;步骤5211)进行第n+l个字符段的比较;步骤522 )将对应第二字符串中各字符段的单字按输入顺序进行组合,组成 若千个词组,将所述词组放入词库中进行比较,搜索词库中是否存在与之相同 的词《且若词库比较结果为相互匹配,即在词库中搜索到与之相同的词组,则转步 骤6),将其输出显示以供选取;若词库比较结果为相互不匹配,即在词库中没有搜索到与之相同的词组, 则返回步骤521),对另一组第二字符串进行音节字符段比乾或终止词库搜索 过程,不输出显示。
9.根据权利要求8所述的一种文字处理方法,其特征在于在步骤521) 中进一步包括步骤521D若其第n个字符段与词库中的某一单字的音节相匹配,则进行 第n+l个字符段的比较,当前字符下标设置为词语第一个字对应的音节的长度 加l,字下标设置加l;步骤5212)判断当前字下标是否大于当前词语的长度若当前字下标大于词语的长度,则转步骤522 );若当前字下标小于或等于词语的长度,则转步骤5213);步骤5213 )判断当前字符下标是否大于当前第二字符串的总长度若当前字符下标大于第二字符串的总长度,则转步骤5211),进行下一个音 节字符段比较;若当前字符下标小于或等于第二字符串的总长免字符段比较结束,则转 步骤522 )。
10.根据权利要求9所述的一种文字处理方法,其特征在于在步骤6)中 进一步包括步骤61)根据字符兼容性比较结果对所匹配的文字进行标示, 步骤62 )将所述文字进行分类,分为相同和相兼容两类; 步骤63)根据所设定的输出规则,从中选取相同和/或相兼容的文字输出, 并在词语候选区中显示。
全文摘要
一种具有容错功能的文字处理系统,包括输入模块,标示第一字符;字符容错表,包括第一字符和与之相容错的第二字符;容错处理模块,用于在字符容错表中查找与第一字符相容错的第二字符;词库,存储文字;文字搜索模块,用于在词库中查找出由第二字符所组成的文字;分配模块,用于对文字进行分类处理;输出模块,用于将查找到的文字输出;容错关系设定于一个或多个第一字符与一个或多个第二字符之间。采用容错输入技术,设定输入与输出字符之间相互容错关系,并与在输入模块上字符间的位置关系相关联,使在输入字符过程中,不小心而误按了其他字符,也不影响正确输出,提高文字输入的准确率。本发明还提供采用该系统的使用方法。
文档编号G06F17/20GK101630310SQ20091004183
公开日2010年1月20日 申请日期2009年8月13日 优先权日2009年8月13日
发明者陈炳辉, 高精鍊 申请人:广东国笔科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1