表象输入法的制作方法

文档序号:6412602阅读:259来源:国知局
专利名称:表象输入法的制作方法
技术领域
本发明是一种汉字输入和检索、外文输入和检索的方法,属于电信领域中的信息处理技术。
至今为止,汉字编码已有上千种,在电脑上实施的也有数千种。这些汉字编码方案,可以分为形码、音形码、数字码四种类型,本方案属于形码、音形码、数字码的范畴。
目前,应用比较广泛的编码有“五笔字型汉字输入法”、“仓颉码”等,这些编码的缺点是字元需要背诵记忆,因此学习和掌握编码有一定难度,同时进行词组扩充亦是有一定难度的。现有的外文输入方法都是以外文字母进行输入,因而不利于小键盘上输入外文单词。
现行用于检索汉字的方法有“汉语拼音查字法、”“四角号码查字法”、“部首查字法”等几种。“汉语拼音查字法”比较易学,但不懂得字的读音就不能查字;“四角号码查字法”查字速度较快,但规则较多,不容易掌握,因而未被人们普遍接受;“部首查字法”简单易学,但查字花费时间长,因而大大影响了查字速度,现行的外文检索方法是对外文单词的字母逐个检索,因而检索速度较慢。
现有的汉字编码方案所存在的问题是“易学的打不快,打得快的不易学”,现有的查字方法亦存在着这样的问题“易学的查得慢,查得快的不易学”。本发明的目的,就是要扬长避短,既要易学易记,又要输入速度快,同时又能应用于中文和外文的快速查字,使学习知识的同时又学到汉字输入方法,使中华民族的传统文化成功地跨越汉字输入这上障碍,使汉字输入方法象外文输入方法一样容易,使中华民族的光辉灿烂文化迅速走向世界。
达到本发明的目的方法是将汉字的字元划分为黄炎字元(简称“母字元”)和派生字元(简称“子字元”),将汉字的黄炎字元划分为太极、五行、六爻、河图四大类,并依据四大类的母字元的相交或相交特征优选推衍出太极、五行、六爻、河图四大类派生字元,将26个键位(亦称“字母代码”简称“代码”)的键盘分成太极(WXEYA)、五行(GMSET)、六爻(DIPNZL)、河图(RHKCUJVBQO)四个区,分别将四大类的母字元和派生字元归入对应的四个区中,形成拼形组字、拼形组词的汉字输入法及输入键盘。黄炎字元又可分为正字元和正部首元,正字元是从汉字的字元中优选出的26种最常用的字元,正部首元是依据26种正字元的相关特征优选出的26个最常用部首。
下面,对上述四大类的黄炎字元和派生字元作进一步说明。
太极类用“口”象征太极,用“日”、“月”象征阴阳,用“大”、“小”象征天地,这五个字元分别分布在常用英文键盘的A、E、Y、W、X,其中A(a)与“口”的形状较相似,E、Y、W、X分别取“日”、“月”、“大”、“小”的谐音,

图1是太极类的字元集。
如图1所示,字母代码W的正部首元与字母W、正字元2的形状相同,正字元3是正字元1的变形,字母代码X的正部首元与正字元“小”的形状相似,字母代码E、Y、A的正部首元与正字元“日”、“月”、“口”相同,字母代码A的派生字元9是指“囗”内有其它笔画时其代码为aW(即大的“囗”),图1太极类中的派生字元是依据太极类的母字元与各类的母字元相交或相关特征选推衍而得。
五行类用金、木、水、火、土五个字元来象征五行,这五个字元分别分布在常用英文键盘的G、M、S、F、T上,G、M、S、F、T分别取金、木、水、火土的谐音,因而记忆十分方便。图2是五行类的字元集。
如图2所示,字母代码S的正部首元“鱼”,其原因是“鱼”与“水”是分不开的,故从“鱼”联想到“水”是十分容易的,S的正字元1、2与“水”的形状十分相似,字母代码G、M、F、T的正部首元与正字元相同,字母代码G中的正字元1、2与字母G的形状相似,图2五行类中的派生字元是依据五行类的母字元与各类的母字元相交或相关特征优选推衍而得。
六爻类用点、竖、撇、折、钩、捺6个字元来象征六爻,这六个字元分别分布在常用英文键盘的D、I、P、N、L、Z上,其中D、I、P分别取点、竖、撇的谐音,N、L、Z分别取折、钩、捺的近似形状。图3是六爻类的字元集。
如图3所示,字母代码D中的正部首元的首笔为“点”D的正字元亦为“点”,字母代码P中的正部首元的首笔为“撇”,P的正字元1、2、3、分别是“撇”、“提”、P的形状,字母代码N的正部首元的总体形状为“折”,N的正字元2是“n”的相似形状,字母代码L中的正部首元的总体形状为“钩”,L的正字元1、2、3含有“L”的形状,字母代码I的正部首元的首笔为“竖”,I的正字元为“竖”,字母代码Z的正部首元的总体形状与字母Z的形状相似,Z的正字元1为“捺”,Z的正字元2、3、4、5、6、7、与字母Z的形状相似。图3六爻类中的派生字元是依据六爻类的母字元与各类的母字元的相交或相关特征优选推衍而得。
河图类用一、二、三、四、五、六、七、八、九、十等十个字元来象征河图数,这十个字元分别公分布在常用英文键盘的R、H、K、C、U、J、V、B、Q、O键上,其中R、U、C、取一、五、四的谐音,而H、K、J、V、B、Q、O分别取二、三、六、七、八、九、十的近似形状,记住了这些字元与键盘字母的联系特征是十分有利于记忆的。图4是河图类这十个字元的字元集。
如图4所示,字母代码R的正部首元与正字元“一”的音相近、与正字元“衣”的形状相近似,字母代码H的正部首元与“二”(2)相近似,字母代码K的正部首元是“三点水”,故亦含有“三”的形象,K的正字元2、3、4均是人们熟悉的3、14、K、3的形象,字母代码C中的正部首元含有正字元4的形象,正字元3、4均是“四”、“4”演变而来,C的派生字元4是来源于正字元2的“4”,字母代码U的正部首元是来源于“伍”的左偏旁,U的正安元3的“正”字被人们通常用来表示五画,U的正字元4的“戊”字与“五”的音相近似,U的正字元5与正部首元相同,字母代码J的正部首元与字母J的形状相似,J的正字元1来源于“六”的内部形状,J的正安元2是一个特殊的母字元,字母代码V的正部首元“石”含有正字元3的形象,V的正字元“七”、“7”十分易记,字母代码B的正部首元含有正字元2、3的形象,B的派生字元5含有“八(8)”的形象,字母代码Q的正部首元是由K的正字元3构成,由于3×3=9,故记忆十人容易,Q的正字元2、3与“九(9)”的形象相近似,字母代码O的正部首元“王”含有正字元“十”的形状,O的派生字元“丑”是由正部首元“王”演变而得,0的派生字元5是“衣”无头故为零(0)。图4河图类中的派生字元是依据河图类的母字元与各类的母字元的相交或相关特征推衍优选面得。
由于阿拉数字比较形象直观,为了方便起见,本说明采用1、2、3、4、5、6、7、8、9、0表示R、H、K、C、J、U、J、V、B、Q、O。
图1、2、3、4派生字元中的带有括号的代码为该派生字元作为单字使用时的输入代码。图1、2、3、4中的绝大部分母字元和派生字均有阿拉伯数字序号(序号相同的字元其代码亦相同),其目的是为了方便说明。图1、2、3、4派生字元的画线代码为虚码,以下再作说明。本说明为了直观起见,一些地方采用“等号(=)”来说明。
以上分析了黄炎字元和派生字元的内在联系和记忆规律,从图1、图2、图3、图4中可以看出,黄炎字元只有一个代码,派生字元的代码均为二个或三个,为了更好地理解和记忆字元,下面将继续说明字元方位图、实码和虚码、连体字和分体字、正部首和副部首这几个概念。
字元方位图图5是本发明设计为区别字元和减少重码而设计的字元方位图。由于字元的方向不同和字元的位置不同,因而字元方向的代码和字元位置的代码也不同。例如,图3的字母代码N中的派生字元1、2、3就是根据字元“开口”方向不同而分别取代码n1、n2、n4,其中1、2、4为方向码,这样就因为相同相近的字有了区分就自然离散了许多重码。又如“毛=PL4”,就是因为L的字元不是母字元,又因为L的方向朝着4的原因。再如“朋”字是由两个“月”字构成,但这两个“月”字的位置是不同的,因而它们的位置码也不同,前一个“月”字的位置码为“1”,后一个“月”字的位置码为“4”,这样对离散重码有很大的帮助。这个图还可以用来区分各种不同的字型,可以用1或3表示上下结构的字型,用2或4表示左右结构的字型,用5表示方框包围、半包围的字型。
实码和虚码把反映字元总体特征的具有一定实际形状的代码称为实码,把反映派生字元局部特征的或人为假设的、无实际形状的代码称为虚码。如又=4a,4反映字元“又”的整体特征故为实码,a反映字元“又”的局部特征故为虚码。认识实码和虚码的本质特征,对了解和记忆字元很有帮助。图1、2、3、4中画线的代码为虚码,不画线的代码为实码(以下带有虚线的字元均为虚码)。
在说明编码规则和编码方法之前,先说明以下这几个与编码有关的概念。
连体字和分体字本发明设计把汉字分为连体字和分体字两类。把由字元明显相交而成的汉字称为连体字,如兼、禾、士、金等字是连体字,连体字除去部首后所剩下的第一、二、三、四、五个字元分别称为第一连体、第二连体、第三连体、第四连体、第五连体,如“禾”字除去部首后还有一个连体,“兼”字除去部首后还有三个连体。把由相互分离的字元或无明相交的字元组合而成的汉字称为分体字,如黄、纵、类、明为分体字,分体字除去部首后所剩下的分离的或无明显相交的字元称为分体,分体字除去部首后所剩下的第一、二、三、四、五个字元分别称为第一分体、第二分体、第三分体、第四分体、第五分体,如“纵”字除去部首后还有两个分体,“明”字除去部首后还有一个分体。本发明设计把没有连体和分体的字称为母字元字。
正部首和副部首笔型是汉字的基本笔划,是组成汉字的最小单位。部首是由若干个笔画交叉连接而成的相对不变的结构。部首没有公认的标准和一定的数量。在本发明设计中,规定每个汉字均有部首,并把部首分为正部首和副部首两大类,把构成汉字的第一字元为母字元的部首称为正部首,例如“测、语、草、炎”等字的部首为正部首,把构成汉字的第一字元为派生字元的部首称为副部首,例如“狭、兼、争”等字的部首为副部首。需要特别说明的是,如果分体字的部首为两个相交的母字元时,那么该字的部首被视为副部首,例如“称、故”这两个分体字的部首为副部首。分析了字元的基本内容之后,对本发明设计的编码规则说明如下本发明设计规定每个汉字或词组最多只能取四码,不足4码的,加按一次空格键,取码时必须遵循本发明设计的取码原则和取码公式。
本发明设计的取码顺序是“先高后低,先左后右,先外后内”。本发明设计的取码顺序是将汉字看成已经写成的字进行静态取码,即按照各字元所占据的位置依次取码,因此取码顺序与汉字的书写顺序基本上相同,有些个别则不同。例如,犬=DW,太=WD,这两个字的取码顺序是依照“先高后低”的原则进行取码,又如,这=Z6X,诞=ZZP7,这两个字就是依照“先左后右”的原则进行取码,再如,凶=n1X,国=aWOD,这两上字就是依照“先外后内”的原则进行取码。
本发明设计对汉字的拆分原则是大元优先,实元优先,分体字元优先,中间字元优先,尽量兼顾左右笔画的字元,尽量保持字元的完整性。例如,古=Oa,“十”为大元故先取,这就体现了“大元优先”的原则,又如,泐=3I39,“力”的虚元P不取,这就体现“实元优先”的原则,又如,示=11X,这就体现了“分体字元优先”原则,再如,峦=688I,这就体现了“尽量兼左右笔画的字元”的拆分原则,再如,先=Pt8L,这就体现了“尽量保持字元的完整性”的拆分原则。再如,沉=3nL9,沟=3PLD,这就体现了“中间字元”优先原则。
由于本发明设计把汉字分为连体字和分体字,因此本发明设计的取码方法和取码公式也分为连体字的取码方法和取码公式及分体字的取码方法和取码公式。
首先说明连体字的取码方法和取码公式。连体字分为正部首连体和副部首连体字,连体字除去部首后又分为一连体字、二连体字、三连体字以及超过三连体以上的字,因此正部首的连体字和副部首的连体字的取码方法和取码公式就有了好几种情况,下面就详细说明这几种情况。
第一种情况,当连体字为正部首且除去正部后只有一个连体时,其取码方法是首先取正部首的代码,其次取连体的首代码、次代码及尾代码。假定O为正部首,A为正部首代码,囗为连体,B、C、D、E、F为连体的代码,那么正部首一连字的取码公式就是OA+囗B或囗BC或囗BCD或囗BCD或囗BCDE或囗BCDEF=AB或ABC或ABCD或ABCD或ABCD或ABDF。
第二种情况,当连体字为正部首且除去正部首后只有二个连体时,其取码方法是首先取正部首的代码,其次取第一连体的首代码、次代码或首代码,最后取第二连体的尾代码或首、尾代码。假如O为正部首,A为正部首代码,囗为连体,B、C、D、E、F、G为连体代码,那么,正部首二连体字的取码公式为①OA+囗B+囗C或囗CD或囗CD或CDE或CDE或CDE=ABC或ABCD或ABCD或ABCE或ABCD或ABCE;②OA+囗BC+囗D或囗DF或囗DF=ABCD或ABDF或ABCD;③OA+囗BC+囗D或囗DE或囗DE=ABCD或ABCE或ABCD。
第三种情况,当连体字为正部首且除去正部首后有三个连体或有三个以上连体时,其取码方法为首先取正部首的代码,其次取第一、二连体的首代码,最后取第三连体或最末连体的尾代码。假定O为正部首,A为正部首的代码,囗为连体,B、C、D、E、F、G、H为连体代码,那么正部首三连体字或三连体以上的字的取码公式是OA+囗BC+囗DE+…囗FGH=ABDG。
第四种情况,当连体字为副部首且除去副部首后只有一个连体时,其取码方法为首先取副部首的二个代码,其次取连体的首、尾代码。假定O为副部首,AB为副部首的代码,囗为连体,C、D、E、F为连体的代码,那么副部首一连体字的取码公式是OAB+囗C或囗CD或囗CDE或囗CDEF=ABC或ABCD或ABCD或BACE。
第五种情况,当连体字为副部首且除副部首后有两个或两个以上连体时,其取码方法为首先取副部首的二个代码,其次取第一连体的首代码,最后取第二连体或最末连体的尾代码。假定O为副部首,AB为副部首代码,囗为连体,C、D、E、F、G、H为连体的代码,那么副部首二连体字或二连体以上的字的取码公式是OAB+囗CD+……+囗EF或囗EFGH=ABCF或ABCG。
图6是连体字的取码示例。
其次分析分体字的取码方法和取码公式。分体字分为正部首分体字和副部首分体字,分体字除去部首后又可分为一分体字、二分体字、三分体字或三分体以上的字,因而正部首分体字和副部首分体字的取码方法和取码公式就有了好几种情况,下面就详细说明这几种情况。
第一种情况,当分体字为正部首且除去正部首后只有一个分体时,其取码方法是首先取正部首的代码,其次取分体的首代码、次代码、尾代码。假定O为正部首,A为正部首代码,囗为分体,B、C、D、E、G为分体的代码,那么正部首一分体字的取码公式是OA+囗B或囗BC或囗BC或囗BCD或囗BCD或囗BCDE或囗BCDEF=AB或ABC或ABC或ABCD或ABCD或ABCD或ABDF。
第二种情况,当分体字为正部首且除去正部首后还有两个分体时,其取码方法为首先取正部首的代码,其次取第一分体的首代码、次代码或首代码,最后取第二分体的尾代码或首、尾代码。假定O为正部首,A为正部首的代码,囗为分体,B、C、E、F为分体的代码,那么正部首二分体字的取码公式是OA+囗B+囗C或囗CD或囗CED或囗CD=ABC或ABCD或ABCD或ABCD;②OA+囗BC+囗D或囗DE或囗DE或囗DEF或囗DEF=ABCD或ABCE或ABCD或ABCF或ABCE。
第三种情况,当分体字为正部首且除去正部首后有三个分体或三个以上的分体时,其取码方法为首先取正部首的代码,其次取第一、二分体的首代码,最后取第三分体或最末一个分体的尾代码。假定O为正部首,A为正部首代码,囗为分体,B、C、D、E、F、G、H、I为分体的代码,那么正部首三分体或三分体以上的字的取码公式是OA+囗BCD+囗EFG+囗EFG+……+囗HI=ABEI。
第四种情况,当分体字为副部首且除去副部首后只有一个分体时,其取码方法为首先取副部首的二个代码,其次取分体的首、尾代码。假定O为副部首,AB为副部首的代码,囗为分体,C、D、E、F为分体的代码,那么副部首一分体字的取码公式是OAB+囗C或囗CD囗CDE或囗CDEF=ABC或ABCD或ABCD或ABCE。
第五种情况,当分体字为副部首且除去副部首后有两个或两个以上分体时,其取码方法为首先取副部首的二个代码,其次取第一分体的首代码,最后取第二分体或最末分体的尾代码。假定O为副部首,AB为副部首代码,囗为分体,C、D、E、F、G、H为分体的代码,那么副部首二分体或二分体以上的字的取码公式为OAB+囗CD+……+囗EF或囗EFGH=ABCF或ABCG。
当太极类的母字元“大、小、日、月、囗”、五行类的母字元“金、木、水、火、土”、六爻类的母字元“山、女、虫”、河图类的母字元“一、二、三、四、五、六、七、八、九、十”在作为单字使用时,其输入方法为把该母字元的所在键连打四下。几个母字元在作为单字使用时的特殊编码为鱼=SYE1,衣=161,戊=55D,石77a,王03I。派生字元在作为单字使用时,其输入方法为直接输入该派生字元的代码即可。
图7是分体字的取码示例。
本发明设计的词组取码方法是①二字词,先取第一字的部首的首代码及第一分体或第一连体的首代码,再取第二字的部首的首代码及第二字的第一分体或第一连体的首代码;②三字词,先取第一、二字的部首的首代码,再取第三字的部首的首代码及第三字的第一分体或第一连体的首代码;③四字词,取第一、二、三、四字的部首的首代码;④四字以上的词,取第一、二、三字及最末字的部首的首代码;⑤词组输入在单字状态下进行,不必切换。
图8是词组的取码示例。
本发明设计在每一个字元键都安排一个使用频度特别高的汉字,其输入码为所在键加打一下空格键,谓之一级简码,如图9所示;约有676个汉字采用只取其全部字元码的前两个代码加打空格键输入,谓之二级简码;有几千个汉字采用其全部字元码的前三码加打空格输入,谓之三级简码。同时,具有简码的汉字的全码输入方式仍然保留。
图10是汉字信息处理设备的一种中文键盘。
本发明设计的重码处理方法是①当输入的汉字出现长声时,表示真重码,只按与该字在提示行中的序号相同的数字键,所要的字即可显示在现行编辑的位置上。②当输入的汉字出现短声时,表示该字为假重码,此时可以继续顺取或逆取所剩余的一个代码即可,若无剩余代码,就取该字的字型码或该字最末一个字元的位置码。
黄炎码的容错处理①对不易确定的字元进行容错,例如,“警”字可以按代码为846a方式输入,也可以按代码为8P4a方式输入,也可以按代码为8a4a方式输入,也可以按代码为8X6a方式输入。②对于容易混淆的字元进行容错,例如“I”字可按代码为t0方式输入,也可按代码为171方式输入,也可按代码为2I方式输入,也可按代码为71方式输入,又如“丰”字可以按代码为3I方式输入,也可以按代码为3O方式输入。③对于容易混淆的部首进行容错,例如“躬”字可以按代码为PY75方式输入,亦可以按代码为PP75方式输入。④对于容易混淆的取码顺序进行容错,如“沉”字可以按代码为3nL9方式输入,也可以按代码为3n9O方式输入。⑤对于正部首化为副副部首进行容错,如“蚌”字可以按代码为n3I方式输入,也可以按代码为aD3I方式输入,也可以按代码为aL3I方式输入。⑥对于副部首化为正部首进行容错,如“躬”字可以代码为PY75方式输入,也可以按代码为P75方式输入,又如“输”字可以按代码为7O5L方式输入,也可以按代码为751L方式输入。由于本发明设计对汉字输入进行了大量的容错处理,因而要了解和掌握本编码方案是十分容易的。
黄炎音形码是将简化拼音的取码和本发明设计的取码相结合的一种输入方式。简化汉语拼音(简称“简拼”)是对传统汉语拼音(简称“全拼”)的声母及韵母进一步简化,把这些简化了的声母和韵母一一对应在黄炎码的键盘上,就形成了黄炎音形码的输入键盘。如图11所示,说明了“全拼”和“简拼”的对应关系,以及说明了“简拼”的声母及韵母对应在黄炎码键盘上的位置。
黄炎音形码的“形码”的取码规则和取码方法与黄炎码的的取码规则和取码方法基本相同,黄炎音形码的“音码”的取码方法与传统的汉语拼音取码方法也基本相同。黄炎音形码的码长为4码,不论单字或词组均不得超过4码,不足4码的,加打一次空格键。
黄炎音形码的单字的取码方法是首先取单字的声母代码音韵母代码,再取单字的部首的首代码及该字第一分体或连体的首代码。碰到只有韵母没有声母的字时,先取该字的首位韵母代码,然后再取该字的部首的首代码、第一分体或连体的首代码及第二分体或连体的首代码,不足4码的加打一次空格键。黄炎音形码的母字元和派生字元在作为单字使用时,其输入方法与黄炎码相同。
黄炎音形码的词组的取码方法是①两字词,先取第一、二字的首位的声母代码或韵母代码,再取第一、二字的部首的首代码,如中国=jgaa,黄炎=hi8f②三字词,先取第一、第二字的首位的声母代码或韵母代码,再取第三字的部首的首代码及第三字的第一分体或连体的首代码,如解放军=jfn7,共和国=ghao。③四字词,先以第一、二字的首位声母代码或韵母代码,再取第三、四字的部首的首代码,如坚持不懈=jqlx,再接再励=jjof。④四字以上的词,首先取第一、二字首位声母代码或韵母代码,再取最末字的部首的首代码及最末字的第一分体或连体的首代码,如中国共产党=jgxa,人造地球卫星=Ijep。
黄炎音形码处理重码的方法与黄炎码处理重码的方法相同。
黄炎音形码的容错处理①对取码顺序进行容错,即在对汉字的单字或词组进行取码时,可以先取“形码”,再取“音码”,如“炎”字可以按代码为iff方式输入,也可按代码为ffi方式输入,又如“中国”可以按代码为jgaa方式输入,也可按代码为aajg方式输入。②对于一些容易读错的字进行容错,如“黄”可以按代码为hu8e方式输入,也可以代码为ha8E方式输入。
黄炎音形码在黄炎码输入状态下进行,不必切换。
黄炎数字码是把黄炎码各类字元的代码化成数字而在数字键盘上输入汉字或外文单词的一种输入方法。图12是黄炎数字码的数字字元,图12中,带有画线的数字字元为虚数字元,不带画线的数字字元为实数字元,图12中的数字字元是黄炎数字码的母字元(即正部首元和正字元),黄炎数字区的数字码的正部首元只有一位实数字元,黄炎数字码的非数字区的正部首元只有一位实数字元和一位虚数字元。
把黄炎码的副首化为黄炎数字码的副部首的方法是先把黄炎码的副部首的首代码化为黄炎数字码的实数字元,再把黄炎码的副部首的次代码化为黄炎数字码的实数字元。例如“躬”字的黄炎数字码的副部首为97,“狼”字的黄炎数字码副部首为49,“行”字的黄炎数字码的副部首为95。
把黄炎码的派生字元化为黄炎数字码的派生字元的方法是把黄炎码的派生字元的每个代码化为黄炎数字码的实数字元,若代码本身为数字的照取数字即可。
黄炎数字码的码长为5码,不论单字或词组均不得超过5码,不足5码的加“O”。
黄炎数字码的单字取码规则和取码方法与黄炎码的取码规则和取码方法基本相同。黄炎数字码的母字元和派生字元在作为单字使用时,其输入方法与黄炎码相同。例如语=25040,彼=95414,快=47732,炎=49490。
黄炎数字码的词组的取码规则为黄炎码的取码规则相同,其取码方法为①两字词,先取第一字的前3个数码,即取第一字的部首的首位实数字元、第一字的第一分体或连体的首位实数字元、第一字的第二分体或连体的首位实数字元,若第一字无第二分体或连体,则输入第一分体或连体的次位实数字元或虚数字元,不足3码的加“O”补足,再取第二字的2个数码,即取第二字的部首的首位实数字元、第二字的第一分体或连体的首位实数字元,②三字词,先取第一字的2个数码,即先取第一字的部首的首位实数字元、第一字的第一分体或连体的首位实数字元,再取第二字的1个数码,即取第二字的部首的首位实数字元,最后取第三字的2个数码,即取第三字的部首的首位实数字元、第三字的第一分体或连体的首位实数字元,③四字词,先取第一、二、三字的部的首位实数字元,④四字以上的词,先取第一、二、三、四字的部首的首位实数字元,再取最末字的部首的首位实数字元。
图12的数字字元的记忆方法是①太极区W=32,因为W的形状似3,且其开口方向为2;X=47,X的音与4的音相近,X的形状象7;e=94,e的形状似9,且其方向为4;y=79,y的形状似7和9;a=04,a的形状似0,且其尾部的方向为4;②五行区g=9o,因为g的形状似9,O为虚数字元;m=33,m的形状似3,且其开囗方向为3;s=55,s的形状似5,5为虚数字元,t=71,t的形状似7,且t含有1的形状;③六爻区d=64,d的形状似6,d的尾部方向为4;I=11,I的形状似1,1为虚数字元;P=93,P的形状似9,P的尾部方向为3;Z=22,Z的形状似2,2为虚数字元;n=53,n的形状与u(5)的形状相反故为5,n的开囗方向为3;L=14,L的形状似1,且L的尾部方向为4;④数字区的字元前面已论述。
黄炎数字码的容错处理①字元容错。图13是黄炎数字码的另一种数字字元,图12、图13的两种数字字元是相互兼容的,即在输入汉字时,既可按图12中的字元方式进行输入,又可按图13的字元方式进行输入,图13的数字字元是根据太极区的“大、小、日、月、囗”、五行区的“金、木、水、火、土”、六爻区的“点、竖、撇、捺、折、钩”及数字区的字元本身取码而得。例如“金(g)=51”,是取“金”的首代码为5,其尾代码“1”,又如“火(f)=25”,取“火”的首代码为2,其尾代码为5,其它字元仿此而得;②个别字元容错。图12、图13中的i字元可以容错为i=62,因为i的形状似6和2,故i可按11方式输入,也可按62方式输入。
黄炎数字码在黄炎码、黄炎音形码的状态下进行,不必切换。
黄炎数字码在应用于外文单词输入时,单词的输入方法是输入单词的每个字母的实数字元和虚数字元,或者是输入单词的每个字母的实数字元。例如英文单词China可以按42625304方式输入,也可按42650方式输入。
黄炎数字码处理重码的方法与黄炎码相同。
黄炎数字码在应用于汉字检索或外文检索时,可以根据字典或词典的汉字或单词的多少来确定汉字或单词的码位长短。
本发明提出的字元体系及其输入键盘对繁体字同样适用。这时只须把简化字元一律改换成对应的繁体字元,即可形成一个能够处理繁体汉字的输入法和键盘设计。
本发明的优点是易学易记,输入速度快,同时又能应用于汉字输入和检索、外文单词的输入和检索,因而有着广泛应用和推广。
以上说明了本发明的一个具体实施方案,必须指出,本发明不仅仅限于上述给出的方案,在本领域中的技术人员根据本发明的构思,可以做出不脱离本发明本质的多种变型方案,因此本发明的提出为编码技术提供了研究基础和开发前景。
权利要求
1.一种黄炎码及其输入键盘,其特征是将汉字的字元划分为母字元和子字无,将汉字的母字元划分为太极、五行、六爻、河图四大类,并依据四大类的母字元的相交或相关特征优选推衍出太极、五行、六爻、河图四大类子字元,将26个键位的键盘分成太极、五行、六爻、河图四个区,分别将四大类的母字元和子字元归入对应的四个区中,形成拼形组字、拼成组词的汉字输入法及其输入键盘。
2.一种黄炎音形码,其特征是将简化汉语拼音的声母b、p、m、f、d、t、n、l、g、k、h、j、q、x和韵母a、o、e、i、u分别归入黄炎码的键盘字母b、p、m、f、d、t、n、l、g、k、h、j、q、x和a、o、e、i、u中,形成的音形组字、音形组词的汉字输入法。
3.一种黄炎数字码,其特征是把黄炎码的母字元和子字元的字母代码分别化成数字,形成的数字组字、数字组词的汉字输入法和外文输入法。
4.如权利要求书1所述,英文键盘的四个区是一区(太极区)wxEYA;二区(五行区)GMSFT;三区(六爻区)DIPNZL;四区(河图区)RHKCUJVBQO。
5.如权利要求书1所述,字元方位图是用1、2、3、4、5来区别方向不同的字元和位置不同的字元,此图还可以用来区别不同的字型,用1或3表示上下结构的字型,用3和4表示左右结构的字型,用5表示方框包围、半方框包围的字型。
6.如权利要求书1所述,母字元可以分为正字元和正部首元,正字元是从汉字的字元中优选出的26种最常用的字元,正部首元是依据26种正字元的相关特征优选出的26个最常用的部首。
7.如权利要求书1所述,子字元的字母代码可以划分为实码和虚码,实码是反映子字元总体特征的具有一定实际形状的代码,虚码是反映子字元局部特征的或人为假设的、无实际形状的代码。
8.如权利书要求1所述,连体字的输入方法和步骤包括A当连体字为正部首且除去正部首后只有一个连体时,首先输入正部首的代码,其次输入连体的首、次代码及尾代码;B当连体字为正部首且除去正部首后只有两个连体时,首先输入正部首的代码,其次输入第一连体的首、次代码或首代码,最后输入第二连体的尾代码或首尾代码;C当连体字为正部首且除去正部首后有三个或三个以上的连体时,首先输入正部首的代码,其次输入第一、第二连体的首代码,最后输入第三连体或最末连体的尾代码;D当连体字为副首且除去副部首后只有一个连体时,首先输入部首的二个代码,其次输入连体的首、尾代码;E当连体字为副部首且除去副部首后有两个或两个以上的连体时,首先输入副部首的二个代码,其次输入第一连体的首代码,最后输入第二连体或最后末连体的尾代码。
9.如权利要求书1所述,分体字的输入方法及步骤包括A当分体字为正部首且除去正部首后只有一个分体时,首先输入正部首的代码,其次输入分体的首、次代码及尾代码;B当分体字为正部首且除去正部首后只有两个分体时,首先输入正部首的代码,其次输入第一分体的首、次代码或首代码,最后输入第二分体的尾代码或首、尾代码;C当分体字为正部首且除去正部首后有三个或三个以上的分体时,首先输入正部首的代码,其次输入第一分体、第二分体的首代码,最后输入第三分体或最末分体的尾代码;D当分体字为副部首且除去副部首后只有一个分体时,首先输入副部首的二个代码,其次输入分体的首、尾代码;E当分体字为副部首且除去副部首后有两个或两个以上分体时,首先输入副部首的二个代码,其次输入第一分体的首代码,最后输入第二分体或最末分体的尾代码。
10.如权利要求书1所述,词语的输入方法及步骤包括A两字词的输入首先输入第一字的部首的首代码及第一字的第一分体或连体的首代码,其次输入第二字的部首的首代码及第二字的第一分体或连体的首代码;B三字词的输入首先输入第一、第二部首的首代码,再次输入第三字的部首的首代码及第三字的第一分体或连体的首代码;C四字词依次输入第一、二、三、四字的部首的首代码;D四字以上的词依次输入第一、二、三字及最末字的部首的首代码。
11.如权利要求书8、9、10所述,连体字是指字元明显相交的汉字,分体字是指由相互分离的字元或不明显相交的字元组合而成的汉字。
12.如权利要求书8、9、10所述,正部首是指构成汉字的第一字元为母字元的部首,副部首是指构成汉字的第一字元为子字元的部首。
13.如权利要求书8、9、10所述,连体是指连体字除去部首后所剩下的字元,分体是指分体字除去部首后所剩下的字元。
14.如权利要求书1、4所述,4区共26位的母字元和子字元及其代码是W大纟丈wx 尢wL 幺WDX小忄卡XI 长XL 心XP 犭XPE日 日EW 巴EL 田EI 串EII 甲E3 由E1艮E4 鼠ELY月 巾yI 且y1 耳y7 豸yp 角yI 冂YOA口 巳a1 母a6 凸ay 凹au 囗aw 毋awG金钅氐G7DM木 柬m4 束maS鱼水米slF火 斤fI 丘f7 辰f4T土 工to 老tp7 走t5 赤t8 青tyD疒丶门DI 广Df 穴D8 户DP 鹿D7 麻Dm宀DN 灬D4I山丨隶IS 卜ID 彐I2 臼II 刂ILP女丿毛PL 生Pt 牛P2I 失P25 尸Pa 禾pm白PE 血P41 自P4 身Py 鬼PD 鼻P8 彡PP 彳P5 勹PLZ 辶 矛ZLN虫 巛nn 已nL 贝n5 臣nn 骨ny 冖NL巛nn 匚n4L扌 羽LL 疋L5 乜LLR一衣衤 不1X 丁1L 万1y 牙14p 雨1S 开18礻1Q 末1m 干1O 歹1y 瓦1DH二讠来2s 井28 未ZX 夫25 业23 羊20K氵 酉3E 西3a 韦3L 丌38 兀38C四4 目42 皿41 矢4W 午40 攵4X乍43 又4a 气4Z 黑4D 齿4nU正五戊亻人5z 隹56i 丐5al 己52J亠 六68 亡6L 文6X 立621 方6yV石七7 马71 弓75 戈72 车70 比77 豕7S 匕70B八艹兆8S 甘8E 非83 其86 革80
8P廿8aQ九 刀91 力9p 片97 几90
97O王十士01 丑0I
15.如权利要求书2所述,黄炎音形码的单字输入方法及步骤为首先输入单字的声、韵母代码或韵母代码,再次输入单字的部首的首代码及单字的第一分体或连体的首代码或第一字的部首的首代码、第一分体或连体的首代码及第二分体或连体的首代码。
16.如权利要求书2所述,黄炎音形码的词组输入方法及其步骤为A两个词首先输入第一、二字的首位的声母代码或韵母代码,再次输入第一、二字的部首的首代码;B三字词首先输入第一、二字的首位的声母代码或韵母代码,再次输入第三字的部首的首代码及第三字的第一分体或连体的首代码;C四字词首先输入第一、二字的首位的声母代码或韵母代码,再次输入第三、四字的部首的首代码;D四字以上的词首先输入第一、二字的首位的声母代码或韵母代码,再次输入最末字的部首的首代码及其第一分体或连体的首代码。
17.如权利要求书3所述,黄炎数字码的单字输入与黄炎码的输入方法相同,码长为5码,不足5码的加“O”补足。
18.如权利要求书3所述,黄炎音形码的词组输入方法及步骤包括A二字词首先输入第一字的前3个数字,即输入第一字的部首的首位实数字元、第一字的第一分体或连体的首位实数字元,第一字的第二分体或连体的首位实数字元,若第一字无第二分体或连体,则输入第一分体或连体的次位实数字元或虚数字元,不足3码的加“O”补足,再次输入第二字的两个数码,即输入第二字部首的首位实数字元,第二字的第一分体或连体的首位实数字元;B三字词首先输入第一字的2个数码,即输入第一字的部首的首位实数字元、第一字的第一分体或连体的首位实数字元,再次输入第二字的1个数码,即输入第二字的部首的首位实数字元,最后输入第三字的2个数码,即输入第三字的部首的首位实数字元、第三字的第一分体或连体的首位实数字元;C四字词首先输第一、二、三字的部首的首位实数字元,再次输入第四字的部首的首位实数字元、第四字的第一分体或连体的首位实数字元;D四字以上的词首先输入第一、二、三、四字的部首的首位实数字元,再次输入最末字的部首的首位实数字元。
19.如权利要求书3所述,把黄炎码的母字元转化成黄炎数字码的母字元的一种方法为W32、X47、E94、Y79、A04、G90、M33、S55、F49、T71、D64、I11、P93、N53、Z22、L14、R1、H2、K3、C4、U5、J6、V7、B9、Q9、O0。
20.如权利要求书3所述,把黄炎码的母字元转化为黄炎数字码的母字元的另一种方法为W15、X18、E01、Y02、A00、G51、M08、S17、F25、T21、D66、I11、P99、Z88、L77、N55、R1、H2、K3、C4、U5、J6、V7、B8、Q9、O0。
21.如权利要求书3所述,把黄炎码的子字元转化为黄炎数字码的子字元的方法是把黄炎码的子字元的每个代码转化为黄炎数字码的实数字元,若代码本身为数字的照取数字即可。
22.如权利要求书19、20所述,带有画线的数字为虚数字元,不带面线的数字为实数字元。
23.如权利要求书3、18、19所述,黄炎数字码在应用于外文单词输入时,单词的输入方法是输入单词的每个字母的实数字元和虚数字元,或者是输入单词的每个字母的实数字元。
全文摘要
一种编码的发明,其把汉字分为连体字和分体字,把汉字部首分为正部首和副部首,把汉字的字元分为母字元和子字元,并具有独特的取码方法和取码公式,它的特点是易学易记,应用范围广,既可以用于汉字的输入和检索,又可应用于外文的输入和检索。
文档编号G06F3/023GK1221899SQ9712564
公开日1999年7月7日 申请日期1997年12月30日 优先权日1997年12月30日
发明者黄景明 申请人:黄景明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1