以词为单位的汉字的通用计算机输入方法

文档序号:6341802阅读:406来源:国知局
专利名称:以词为单位的汉字的通用计算机输入方法
技术领域
本发明是一种以词为单位的汉字的通用计算机输入方法,根据汉语拼音归纳出音码及声调码,并将所有汉字拆解为部首+字身的形式,分别用音码或者笔画标记部首或者字身,构成汉字的部首码和字身码,用汉字的音码及声调码,以及汉字的部首码和字身码,以词为单位按规则依次击键输入汉字。本发明属于中文信息处理在汉字及相关信息处理领域方面的应用,是在“拼音混合输入技术”(中国专利ZL 95102608.9)和“小键盘拼音混合输入技术”(中国专利申请03153755.3)基础上进行再创造所产生的发明。
背景技术
目前,计算机出现了膝上型、掌上型、微型化的趋势,手机逐渐出现了具备计算机各项功能的趋势,PDA、机顶盒、电子书、手持终端、家用电器以及固定电话等也都迫切需要用10个数字键方便、快捷地输入中文信息,这就要求我们将现有的主要使用英文字母编码的汉字输入方法转变为主要使用10个数字键编码的数字化汉字输入方法。
以智能ABC(itABC)和微软拼音(Microsoft Pinyin)为代表的拼音输入法是人们在PC机上输入汉字的主流输入方法。为提高拼音汉字输入方法的输入效率,发明人于1995年根据《汉语拼音方案》、《汉语拼音正词法基本规则》等规范的汉语知识,发明了拼音混合输入技术(“以词为单位的音形意汉字计算机输入方法”,中国专利ZL95102608.9),有效地解决了汉字输入前期易学性和后期效率的矛盾,使主要使用汉语拼音编码的计算机汉字输入变得更为快捷和便利。
在掌上型、微型化电脑以及手机、PDA、机顶盒、电子书、手持终端、家用电器、固定电话等领域,汉字输入的效率还比较低。发明人于2003年在中国专利ZL 95102608.9的基础上,发明了小键盘拼音混合输入技术(“以词为单位的数字化汉字计算机输入方法”,中国专利申请03153755.3),有效地解决了这一难题。该专利技术得到智能ABC(itABC)和美国特捷通讯(Tegic Communications,其T9输入法占据了世界手机输入法70%以上市场)公司的好评,三方将在该技术的基础上共同开发T9ABC小键盘汉字输入法,使主要使用汉语拼音编码的计算机小键盘汉字输入变得更为快捷和便利。
但是,在日常生活中,人们对在不同设备上需要使用不同的汉字输入方法,如在PC机上使用智能ABC(itABC),而在手机上使用T9(或者T9ABC)输入法,需要重新学习输入规则,需要重新建立个人词库等感到十分不便,他们迫切希望能有一种通用的汉字输入方法,以使在使用任何诸如计算机、手机、PDA、遥控器、智能家电等所有需要用到汉字的设备上,在输入任何汉字、阿拉伯数字、英文字母、标点符号等中文信息以及世界上其他任何国家的语言文字的时候,都可以使用同一种输入方法。可以想象,如果真能如人们所愿,发明出这种输入方法,那么,今后无论用户在任何领域处理中文信息,都可使用该输入法进行输入,不用重新学习输入规则、不用重新建立个人词库、不用操心需要多家公司提供技术支持和售后服务等诸多问题,等等,一切后顾之忧都可抛之脑后。本发明就试图在此方面进行有益的尝试。
此外,无论是拼音混合输入技术(中国专利ZL 95102608.9),还是小键盘拼音混合输入技术(中国专利申请03153755.3),一方面,对不认识的汉字,尚不能直接用音码输入,还需要查字典,或者切换到其他输入方法进行输入;另一方面,单字词的输入效率明显偏低,如输入“yi”仅仅在GB 2312-80中就有超过100个重码,在GB 18030中重码数量更是大大增加。人们迫切希望改进上述两项技术,从根本上改善单字词的输入方法,解决这两个难题。

发明内容
定义一种新型的计算机、手机、PDA、遥控器、智能家电、电子书、手持终端、固定电话等设备的通用键盘,包括大键盘和/或小键盘,取拼音混合输入技术(中国专利ZL 95102608.9)定义的30个音码,并将其按照拼音混合输入技术(中国专利ZL 95102608.9)的定义分布在大键盘“a”、“b”、“c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”、“k”、“l”、“m”、“n”、“o”、“p”、“q”、“r”、“s”、“t”、“u”、“v”、“w”、“x”、“y”、“z”、“;”、“,”、“.”、“/”这30个键上,以及按照小键盘拼音混合输入技术(中国专利申请03153755.3)的定义分布在小键盘1、2、3、4、5、6、7、8、9、0这10个数字键上,按照国家标准将横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个笔画分别定义在大键盘以及小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,按照国家标准将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在大键盘以及小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,使用小键盘拼音混合输入技术(中国专利申请03153755.3)的编码规则对所有词进行编码,或者用本发明所定义的部首码和字身码对单字词进行编码,或者用汉字的音码+部首码的第一码+字身码的第一码对单字词进行编码,在大键盘或者小键盘上依次击键输入汉字。同时,兼容编码标点符号、阿拉伯数字、英文词、混合词等。
本发明所述的新型的计算机、手机、PDA、遥控器、智能家电、电子书、手持终端、固定电话等的汉语通用键盘包括(1)大键盘的定义在任何qwerty大键盘上,定义“v”键上同时标记逗号(“,”),“u”键上同时标记斜杠(“/”),“i”键上同时标记分号(“;”);同时,定义“,”键上同时标记“ch”(或者 以下凡是在编码中均标示为“,”),“.”键上同时标记“ng”(或者η,以下凡是在编码中均标示为 或者“η”),“/”键上同时标记“zh”(或者 以下凡是在编码中均标示为“/”),“;”键上同时标记“sh”(或者 以下凡是在编码中均标示为“;”)。
(2)小键盘的定义在PC等键盘上的小键盘使用类似手机的数字分布定义,即将原普通PC键盘上的小键盘定义的第一行789、第二行456、第三行123中的第一行和第三行对调,也就是变为第一行123、第二行456、第三行789。
(3)以上大键盘和小键盘可任意组合,即可以只使用大键盘(小键盘不使用或者使用原小键盘),也可以只使用小键盘(大键盘不使用或者使用原定义),当然,推荐在计算机上两者同时使用。
本发明所述的计算机汉字输入方法包括(1)音码定义同小键盘拼音混合输入技术(中国专利申请03153755.3)。
(2)词的编码规则同小键盘拼音混合输入技术(中国专利申请03153755.3)。
(3)单字词除可按照小键盘拼音混合输入技术(中国专利申请03153755.3)编码外,还可以按照下述的汉字的部首—字身音码输入方法进行输入取部首的一个集合,该部首集合必须包含横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个单笔部首。对这五个笔画按照横1竖2撇3点4折5的国家标准进行编码,构成其部首码。对该部首集合中的其他部首每个部首确定一个唯一的读音,将该读音按照小键盘拼音混合输入技术(中国专利申请03153755.3)转换为音码,构成该部首的部首码。任何一个汉字的部首对应的部首码就是该汉字的部首码。
如果一个汉字是无字身的汉字,即该汉字就是所确定部首集合中的部首之一,如“匚”,或者就是由一个部首的变体构成的,如“孑”或者“孓”,则该汉字的编码就是该部首对应的部首码。
对于有字身的汉字,即除无字身的汉字外的其他汉字,则部首之外的部分构成该汉字的字身。对部首取部首码,对字身取字身码。部首码加字身码就是该汉字的编码,具体的取码顺序与部首和字身的相对位置相一致,但最长取6码(即按规则取码后略去第6码以后的部分)。
字身码的具体取法如下a)如果字身是由1个部分组成的,且该部分是一个部首或者一个汉字,则取该部首的部首码或该汉字的音码,构成该字身的字身码。字身既是一个部首同时又是一个汉字的,按照是一个部首处理。
例如“汉”的部首为“氵”,部首码为“;ui”,字身为“又”,字身码为“you”,由于“氵”在前,“又”在后,所以“汉”的编码为“;uiyou”(如果取“汉”的部首为“又”,则其部首码为“you”,字身为“氵”,字身码为“;ui”,由于“氵”在前,“又”在后,所以“汉”的编码同样为“;uiyou”)。
再如“旦”的编码为“ri1”,其部首是“日”,部首码为“ri”,字身是一个部首横“一”,字身码为“1”。
b)否则,如果字身是由1个部分组成的,则按顺序逐笔取笔画,最多取6和部首码码长之差个编码。
例如“禺”的部首为竖“丨”,部首码为“2”,部首码长度为1;字身为一个部分,按笔顺逐笔取6-1=5码,即“51125”,则“禺”的编码为“251125”。
再如“我”的部首为撇“丿”,部首码为“3”,部首码长度为1;字身为一个部分,按笔顺逐笔取6-1=5码,即“15153”,则“我”的编码为“315153”。
c)对于其他任何情况,即字身为2个或者2个以上部分,则对每一个部分按照下述规则取一码构成该汉字的字身码构成部首的部分取该部首所对应的部首码的第一码,构成一个汉字的部分取该汉字音码的第一码,其他部分取该部分第一笔所对应的部首码。
如“能”的部首为“厶”,部首码为“si”,字身为“月匕匕”,字身码为“ybb”,则“能”的编码为“siybb”。再如“繁”的部首为“糸”,部首码为“jiao”,字身为“每”mei“攵”fan,则“繁”的编码为“mfjiao”。
又如“孬”的部首码为横1,字身为“不”的字身+“好”,则“孬”的编码为部首码横“1”+“不”的字身的第一码撇“3”+“好”的音码的第一码“h”,也就是“13h”。
再如“哉”的部首为“戈”,字身为“十口”,“戈”位于“十口”的中间,其编码为“;gek”(按照先后顺序,先取“十”的音码的第一码“;”,再取“哉”的部首码“ge”,最后取“口”的音码的第一码“k”)。
上述编码为规范码。对于上述c),如果一个汉字的字型是左右型,但其规范码的部首不是位于其左边或者右边的全部部分,而左边或者右边的全部部分可以构成一个汉字;或者一个汉字的字型是上下型,但其规范码的部首不是位于其上边或者下边的全部部分,而上边或者下边的全部部分可以构成一个汉字,则将该汉字视为虚拟的部首按照上述规范码编码的规则分别取部首码和字身码,构成容错码。当然,具有容错码的汉字一定具有规范码。
如“孬”可虚拟“不”为部首,相应的字身为“好”,则容错码为“buhao”;或者虚拟“好”为部首,相应的字身为“不”,结果同样为“buhao”。
再如“夥”的规范码为“gxxi”,部首为右下脚的夕,字身为果夕,符合容错码的条件,则其容错码为虚拟“果”为部首,相应的字身为“多”,则结果为“guoduo”;或者虚拟“多”为部首,相应的字身为“果”,则结果同样为“guoduo”。
(4)单字词还可以按照下述方法输入对于无字身的汉字,编码为该汉字的音码+部首码的第一码。如“木”的编码为“mum”;对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。如“编”的编码为“bianjb”。
(5)对于标点符号采用下述方法编码所有中文标点符号按照其读音所对应的音码的第一码编码输入。
如逗号“,”或者其半角方式“,”编码为“d”,句号“。”或者其半角形式“.”编码为“j”。
此外,在大键盘上还可以直接用v键输入“,”,用u键输入“/”,用i键输入“;”。其他标点符号在大键盘上也可按照一般PC机汉字输入法(如智能ABC等)的约定输入。
(6)对于英文词采用下述方法编码对每个英文字母视为一个虚拟汉字,编码为其本身,然后对该英文词按照小键盘拼音混合输入技术(中国专利申请03153755.3)的编码规则进行编码。
如“china”编码为“china”,“microsoft”编码为“microt”。
(7)对于阿拉伯数字采用下述方法编码对每一个阿拉伯数字视为一个虚拟汉字,编码为其本身,数字长度为1-6的,编码就是该数字本身,如“2003”编码为“2003”;长度大于6的,每6个或少于6个数字为一组分组输入,如“20031111”编码为“200311”+“11”。
(8)对于混合词采用下述方法编码对混合词中除汉字外的英文、阿拉伯数字、希腊字母等等的各种信息,每一个都视为一个虚拟汉字,编码为其本身,然后对该混合词按照小键盘拼音混合输入技术(中国发明专利申请03153755.3)的编码规则进行编码。
如“aol公司”编码为“aolgsi”,“智能abc”编码为“/nabc”,“microsoft公司”编码为“micros”。再如“lxd@znabc.com”编码为“lxdazm”、“www.hhpy.com”编码为“wwwdhm”、“hhpy.com”编码为“hhpydm”,“α粒子”编码为“alizi3”,“№1”编码为“no1”。又如“2003年”编码为“2003ni”,“11月11日”编码为“11y11r”。(网址、邮箱地址中的“.”定义为“d”,即拼音“dian”或者英文“dot”的首字母)(9)上述方法也都具有小键盘拼音混合输入技术(中国专利申请03153755.3)定义的简码形式任何一个词的编码可省去其除第一码外的最后一码,或最后两码,或最后三码,或最后四码,或最后五码,构成词的简码。
(10)上述方法在大键盘上采用编码的本身逐键键入,在小键盘上则需要根据小键盘的定义转换为数字逐键键入。如“编码”在大键盘上输入“bianma”即可,在小键盘上则需要转换为数字(如采用小键盘拼音混合输入技术实施方法二所定义的小键盘,则为“242662”)。
为提高大键盘上的汉字输入速度,本方法对上述方法作如下改进(以下称本改进方法为大键盘改进方案1)(1)音码定义按照拼音混合输入技术确定,即音码=音码I+音码II,或者音码I+音码III,或者音码I+音码IV。
如“音”的音码为“yin”或者“yk”,“键”的音码“jian”或者“jx”或者“js”。
(2)用构成单字词的汉字的音码或者标准汉语拼音,顺序击键输入单字词。
如“音”的编码为“yin”或者“yk”,“键”的音码“jian”或者“jx”或者“js”,“帮”的编码为“ba.”或者“b;”或者“bang”。
(3)用组成双字词的两个汉字的音码(长于6码的取前6码),顺序击键输入双字词。
如“键盘”的编码为“jianpa”,或者“jxpan”,或者“jspan”,或者“jianps”,或者“jxps”,或者“jsps”,等等。
(4)用首字的音码I+后两个汉字的音码(长于6码的取前6码),顺序击键输入三字词。
如“计算机”的编码为“jsuanj”,或者“jswji”。
(5)用前三个汉字的音码I+最后一个汉字的音码的前三码,顺序击键输入四字词。如“计算机系”的编码为 (6)用前四个汉字的音码I+最后一个汉字音码的前两码,顺序击键输入五字词。
如“计算机语言”的编码为“jsjyya”,或者“jsjyys”。
为进一步提高大键盘上的汉字输入速度,本方法可对大键盘改进方案1进一步作如下改进(以下称本改进方案为大键盘改进方案2)(1)由2-4个汉字组成的词如其编码长度不足6码,则在其编码后加最后一个汉字的声调码。
如“编码”当编码为“bxma”时长度不足6码,则可在“bxma”后加“码”的声调码“3”,结果为“bxma3”。
(2)对于无字身的汉字,编码为该汉字的音码+部首码的第一码。对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。
如“巾”的编码为“jinj”,或者“jkj”。
如“编”的编码为“bianjb”,或者“bxjb”。
(3)单字词还可用部首—字身音码输入方法(含规范码和容错码)输入,其中凡是部首码和字身码用到音码的,音码定义按照拼音混合输入技术的音码定义确定。
如“键”的编码可为“jinjia”,或者 或者 等等,“能”的编码为“siybb”。
上述大键盘改进方案1和大键盘改进方案2中的编码也都具有简码形式任何一个词的编码可省去其除第一码外的最后一码,或最后两码,或最后三码,或最后四码,或最后五码,构成词的简码。
具体实施例方式
实施方法一采用大键盘,不使用小键盘。
部首采用中国文字改革委员会、国家出版局1983年版《汉字统一部首表》(草案),共有部首201个。部首与部首码的对应关系如下






编码规则同小键盘拼音混合输入技术(中国专利申请03153755.3)的实施方法一。则“法”编码为“fa”,或者“;uiqu”,或者“fa;q”;“方”编码为“faη”,或“fang”,或者“wen35”,或者“faηw3”;“方法”编码为“faηfa3”;“计算机”编码为“jsuanj”;“不进则退”编码为“bjztui”;“印度尼西亚”编码为“ydnxya”;“中华人民共和国”编码为“/hrmgg”,“aol公司”编码为“aolgsi”,“α粒子”编码为“alizi3”等。
当然,以上编码具有简码形式。例如“法”的简码为“f”;“方法”的简码可为“faηf”;“计算机”的简码可为“jsuan”;“不进则退”的简码可为“bjzt”;“印度尼西亚”的简码可为“ydnxy”;“中华人民共和国”的简码可为“/hrm”,“aol公司”编码为“aolgs”,“α粒子”编码为“aliz”等。
实施方法二采用小键盘拼音混合输入技术(中国专利申请03153755.3)实施方法二所定义的小键盘,不使用大键盘。部首与部首码的定义以及编码规则同本申请的实施方法一。
则“法”编码为“32”(fa),或者“08478”(;uiqu),或者“3207”(fa;q);“方”编码为“320”(faη),或“3264”(fang),或者“93635”(wen35),或者“32093”(faηw3);“方法”编码为“320323”(faηfa3);“计算机”编码为“578265”(jsuanj);“不进则退”编码为“259884”(bjztui);“印度尼西亚”编码为“936992”(ydnxya);“中华人民共和国”编码为“147644”(/hrmgg),“aol公司”编码为“26574”(aolgsi),“α粒子”编码为“254943”(alizi3)等。
当然,以上编码具有简码形式。例如“法”的简码为“3”(f);“方法”的简码可为“3203”(faηf);“计算机”的简码可为“578”(jsu);“不进则退”的简码可为“2598”(bjzt);“印度尼西亚”的简码可为“93699”(ydnxy);“中华人民共和国”的简码可为“1476”(/hrm),“aol公司”编码为“26547”(aolgs),“α粒子”编码为“2549”(aliz)等。
实施方法三采用大键盘和小键盘。大键盘的编码规则采用大键盘改进方案1和大键盘改进方案2。小键盘的编码规则同实施方法二。(以下括号内的为大键盘上的编码,括号外的为小键盘上的编码)则“法”编码为32(fa),或者08478(;uiqu、;bqu),或者3207(fa;q);“方”编码为320(faη、f;),或3264(fang),或者93635(wen35、wd35),或者32093(faηw3、f;w3);“方法”编码为320323(faηfa3、f;fa3);“计算机”编码为578265(jsuanj、jswji);“不进则退”编码为259884(biztui、bjztb4);“印度尼西亚”编码为936992(ydnxya);“中华人民共和国”编码为147644(/hrmgg),“aol公司”编码为26574(aolgsi),“α粒子”编码为254943(alizi3)等。
当然,以上编码具有简码形式。例如“法”的简码为3(f);“方法”的简码可为3203(faηf、f;f);“计算机”的简码可为578(jsu、jsw);“不进则退”的简码可为2598(bjzt);“印度尼西亚”的简码可为93699(ydnxy);“中华人民共和国”的简码可为1476(/hrm),“aol公司”编码为26547(aolgs),“α粒子”编码为2549(aliz)等。
本发明与现有技术相比,具有以下显著优点1、以词为单位输入,任何词码长最多6码,平均码长短,重码率低,输入效率高;2、附和汉字和汉语的传统知识,科学、系统、合理,学习的起点低,编码自然流畅,易学易用;3、通用性强,可对所有汉字和各种非汉字信息编码输入,有助于普通话的推行与传播,有助于汉语文化的传播;4、该输入法还有一个其他任何输入法无法比拟的巨大优势,就是其在PC上与在手机等设备上具有相同的编码规则和类似的输入习惯,个人词库也完全可以实现共享,最大限度地减轻了用户的学习负担,大大方便了用户。
权利要求
1.一种以词为单位的汉字的通用计算机输入方法,根据汉语拼音归纳出音码及声调码,并将所有汉字拆解为部首+字身的形式,分别用音码或者笔画标记部首或者字身,构成汉字的部首码和字身码,用汉字的音码及声调码,以及汉字的部首码和字身码,以词为单位按规则依次击键输入汉字,其特征在于1-1所述的汉语通用键盘包括在任何qwerty大键盘上,“v”键上同时标记逗号(“,”),“u”键上同时标记斜杠(“/”),“i”键上同时标记分号(“;”);“,”键上同时标记“ch”(或者 ),“.”键上同时标记“ng”(或者η),“/”键上同时标记“zh”(或者 ),“;”键上同时标记“sh”(或者 );1-2取拼音混合输入技术定义的30个音码,并将其按照拼音混合输入技术的定义分布在大键盘“a”、“b”、“c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”、“k”、“l”、“m”、“n”、“o”、“p”、“q”、“r”、“s”、“t”、“u”、“v”、“w”、“x”、“y”、“z”、“;”、“,”、“.”、“/”这30个键上,将横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个笔画分别定义在大键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在大键盘“1”、“2”、“3”、“4”、“5”这5个数字键上;1-3音码定义同小键盘拼音混合输入技术;1-4词的编码同小键盘拼音混合输入技术;1-5标点符号的编码所有中文标点符号按照其读音所对应的音码的第一码编码输入;1-6英文词的编码对每个英文字母视为一个虚拟汉字,编码为其本身,然后对该英文词按照小键盘拼音混合输入技术的编码规则进行编码;1-7阿拉伯数字的编码对每一个阿拉伯数字视为一个虚拟汉字,编码为其本身,数字长度为1-6的,编码就是该数字本身;长度大于6的,每6个或少于6个数字为一组分组输入;1-8混合词的编码对混合词中除汉字外的英文、阿拉伯数字等各种信息每一个都视为一个虚拟汉字,编码为其本身,然后对该混合词按照小键盘拼音混合输入技术的编码规则进行编码;1-9上述编码使用编码的原码逐键键入。
2.如权利要求1所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可按照下述方法输入2-1取包含横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个单笔部首的一个部首集合,对横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个单笔部首按照横1竖2撇3点4折5编码,构成其部首码;对该部首集合中的其他部首每个部首确定一个唯一的读音,将该读音按照小键盘拼音混合输入技术音码的定义转换为音码,构成该部首的部首码;对任何一个汉字按照通用方法取部首,该部首对应的部首码就是该汉字的部首码;2-2如果一个汉字是所确定部首集合中的部首之一,或者是由一个部首的变体构成的,则该汉字的编码就是该部首对应的部首码;2-3对于有字身的汉字,部首之外的部分构成该汉字的字身;对部首取部首码,对字身取字身码;部首码加字身码就是该汉字的编码,具体的取码顺序与部首和字身的相对位置相一致,但最长取6码,即按规则取码后略去第6码以后的部分;2-4字身码的具体取法如下2-4-1如果字身是由1个部分组成的,且该部分是一个部首或一个汉字,则取该部首的部首码或该汉字的音码,构成该字身的字身码;字身既是一个部首同时又是一个汉字的,按照是一个部首处理;2-4-2如果字身是由1个部分组成的,且该部分既不是一个部首,也不是一个汉字,则先确定该汉字部首码的码长,然后按顺序逐笔对字身取笔画,最多取6和该汉字的部首码码长之差个编码;2-4-3如果字身为2个或者2个以上部分,则对每个部分分别取一码构成该汉字的字身码构成部首的部分取该部首所对应的部首码的第一码,构成一个汉字的部分取该汉字音码的第一码,其他部分取该部分第一笔对应的部首码;2-5对于上述2-4-3,如果一个汉字的字型是左右型,但其规范码的部首不是位于其左边或者右边的全部部分,而左边或者右边的全部部分可以构成一个汉字;或者一个汉字的字型是上下型,但其规范码的部首不是位于其上边或者下边的全部部分,而上边或者下边的全部部分可以构成一个汉字,则该汉字具有容错码2-5-1将上述可以构成汉字的部分视为虚拟的部首,取其音码构成汉字的虚拟部首码;2-5-2取汉字的虚拟部首外的部分视为虚拟字身,按照2-4的规则对虚拟字身进行编码,定义编码结果为虚拟字身码;2-5-3按照2-3的规则组合汉字的虚拟部首码和汉字的虚拟字身码,构成汉字的容错码。
3.如权利要求1、2所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可以按照下述方法输入对于无字身的汉字,编码为该汉字的音码+部首码的第一码;对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。
4.如权利要求1、2、3所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于部首采用1983年版《汉字统一部首表》(草案),与部首码的对应关系如下

5.如权利要求1、2、3、4所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于任何一个词的编码可省去其除第一码外的最后一码、两码、三码、四码或五码,构成词的简码。
6.如权利要求1、2、3、4、5所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于使用小键盘输入6-1在小键盘上使用类似手机的数字分布定义,即将原普通PC键盘上的小键盘定义的第一行789、第二行456、第三行123中的第一行和第三行对调,也就是变为第一行123、第二行456、第三行789;将30个音码按照小键盘拼音混合输入技术键盘分布的定义分布在小键盘1、2、3、4、5、6、7、8、9、0这10个数字键上,将横“一”、竖“丨”、撇“丿”、点“丶”、折“乛”这五个笔画分别定义在小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上,将阴平1、阳平2、上声3、去声4、轻声5这五个声调码分别定义在小键盘“1”、“2”、“3”、“4”、“5”这5个数字键上;6-2将权利要求1-5所述的编码全部根据上述小键盘的定义逐键转换为数字编码,然后在小键盘上逐键键入。
7.如权利要求1、2、3、4、5所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于在大键盘上由1-5个汉字组成的词的编码规则如下7-1音码定义按照拼音混合输入技术确定;7-2用构成单字词的汉字的音码或者标准汉语拼音,顺序击键输入单字词;7-3用组成双字词的两个汉字的音码(长于6码的取前6码),顺序击键输入双字词;7-4用首字的音码I+后两个汉字的音码(长于6码的取前6码),顺序击键输入三字词;7-5用前三个汉字的音码I+最后一个汉字的音码的前三码,顺序击键输入四字词;7-6用前四个汉字的音码I+最后一个汉字音码的前两码,顺序击键输入五字词。
8.如权利要求7所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于由2-4个汉字组成的词如其编码长度不足6码,则在其编码后加最后一个汉字的声调码。
9.如权利要求7、8所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可采用下述方法输入对于无字身的汉字,编码为该汉字的音码+部首码的第一码;对于有字身的汉字,编码为该汉字的音码+部首码的第一码+字身码的第一码。
10.如权利要求7、8、9所述的一种以词为单位的汉字的通用计算机输入方法,其特征在于单字词还可用权利要求2所述的部首一字身方法输入,其中凡是部首码和字身码用到音码的,音码定义按照拼音混合输入技术的音码定义确定。
全文摘要
本发明属于中文信息处理在汉字及相关信息处理领域方面的应用,是在ZL 95102608.9和专利申请03153755.3基础上再创造所产生的发明。针对目前不同设备输入法不同、不认识汉字无法直接用音码输入及单字词输入效率低的问题,根据汉语拼音归纳出音码及声调码,并将所有汉字拆解为部首+字身形式,分别用音码或笔画标记部首或字身,构成汉字的部首码和字身码,用汉字的音码及声调码,以及汉字的部首码和字身码,以词为单位按规则依次击键输入汉字。本发明码长短,重码率低,输入效率高;科学、系统、合理,学习起点低,易学易用,编码自然流畅;通用性强,可编码所有汉字和非汉字信息;在各种设备上编码规则相同、输入习惯类似、个人词库共享,可有效减轻用户的学习负担。
文档编号G06F3/023GK1542594SQ20031011342
公开日2004年11月3日 申请日期2003年11月10日 优先权日2003年11月10日
发明者刘向东 申请人:刘向东
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1