声母拆字码汉字输入编码方案的制作方法

文档序号：6599427阅读：532来源：国知局

专利名称：声母拆字码汉字输入编码方案的制作方法
本方案属于计算机汉字输入编码领域。
计算机汉字输入编码方案种类繁多，目前使用的编码方案可归纳为四类一类为数字码。使用阿拉伯数字，不考虑汉字的发音和书写规律，为每个汉字规定一组数字代码。如国标区位码，电报码等。优点是不重码，输入速度快。缺点是记忆量巨大，很少有人能够掌握。二类为拼音码。以汉字发音为依据，输入每个汉字的拼音，在同音字中寻找所需汉字。如全拼码，双拼码等。优点是不用专门学习，会拼音方案即可操作。缺点是重码字太多，输入速度慢；卷平舌发音不易做到准确无误；不会读的字无法输入。三类是字型码。不考虑汉字的发音，以字的构造形态为基础，规定若干拆分部件和它们在键盘上的位置。如五笔字型等。优点是重码率低，输入速度快。缺点是拆分部件较多，与已有文字知识联系不够紧密，需专门学习，负担一定的记忆量，非专职操作人员不易牢固掌握。四类是混合码。拼音和字型并用。如自然码等。这类编码吸收了拼音码和字型码的优点，同时也保留了它们的缺点。
声母拆字码是以不用死记硬背，无需专门训练，符合书写习惯，一天即可学会为目的的汉字输入编码方案。
为了实现上述目的，本发明是采取如下技术方案来实现的1、本方案将汉字分成“笔划、部首、单字”三种基本要素。
笔划分“点、横、竖、撇、捺、折、提、钩、弯”9种。
部首选自新华字典部首目录，共50种(主要是非字部首)。这些部首在取码时不再拆分，如“氵、扌、艹、讠”等。每个部首取一个表义字作为它的要素名称，如氵(水)，扌(手)，艹(草)，讠(言)等。
单字即字中字。如“努”中的“女、又、力”，“语”中的“五、口”等。字中字大小随机而定，数量不限，认识即可，字本身就是要素名称。
2、每个汉字，不论笔划多少，均取四码。第一码是分类码，为该字拼音方案的第一个字母(以下称声母)。如前—Q，知—Z，安—A等。第二码至第四码为拆字码，每码均取所拆要素名称的声母。如大(横、撇、捺)，拆字码为HPN，全码为DHPN；描(手、草、田)，拆字码为SCT，全码为MSCT；喘(口、山、而)，拆字码为KSE，全码为CKSE。以此类推。拆字码的取码顺序是先左后右，先上后下，先外后内，先横后竖。如树(木、又、寸)，莫(草、日、大)，国(口、王、点)，长(横、钩、捺)等。
一个字以三码拆光为首选。如辞(舌、立、十)，不能拆成两码“舌，辛”和四码“千、口、立、十”；活(水、千、口)，不能拆成两码“水、舌”和四码“水、撇、十、口”；王(横、十、横)，不能拆成两码“横、土”和四码“横、横、竖、横”。
在拆分过程中，要遵循“先大后小，取字优先”的原则。如辞(舌、立、十)不能拆成“千、口、辛”；兢(克、古、儿)不能拆成“十、兄、克”、“古、儿、克”和“克、十、兄”；活(水、千、口)，不能拆成“水、撇、古”等。
一个字如果不能正好三码拆光，就选择两码拆光，这时需再取一个复码，即再取末码中的末字(取大优先)、末部首或末笔，补够三码。如坡(土、皮)，末码“皮”中的末字为“又”，其拆字码为TPY(土、皮、又)，全码为PTPY；硕(石、页)，全码为SSYB(石、页、贝)；樱(木、婴)，全码为YMYN(木、婴、女)。如果末码中无末字可取，就取末部首或末笔。如喻(口，俞)，末部首为“刀”，全码为YKYD(口，俞，刀)；吕(口、口，，末笔为“横”，全码为LKKH；佛(人、弗)，末笔为“竖”，全码为FRFS。以此类推。
在拆分过程中，要坚持“先拆散、后拆连、不拆交”的原则。如“楂”，首选方案拆分为“木、杳、一”(先拆散)，次选方案为“木、木、旦”(后拆连)。这类字，两种拆法均可。“朱”(撇、未)，再取复码“捺”，全码为ZPWN(撇、未、捺)，不能拆成“撇、横、木”(不拆交)；好(女、子)，再取复码“横”，全码为HNZH(女、子、横)，不能拆成“女、了、横”(不拆交)。
如果一个字只能拆成四码以上(含四码)时，按“前二末一”取码，剩余的放弃。如嚣(口、口、口)，拆字码为KKK；游(水、方、子)，拆字码为SFZ；发(折、撇、点)，拆字码为ZPD。按“前二末一”取码也遵循“取大优先”的原则。
3、在四笔以上的字中含有两笔的单字时，两笔单字不拆，如果拆字码不够三码，加打复码。如朴(木、卜、点)，拆字码为MBD；公(八、厶、点)，拆字码为BSD；古(十、口、横)，拆字码为SKH。但不成字的可以拆，如叫(口、折、竖)，拆字码为KZS；石(横、撇、口)，拆字码为HPK。
4、三笔以内的字，一律按笔划取码。如土(横、竖、横)，拆字码为HSH；下(横、竖、点)，拆字码为HSD。二笔的字，末笔打两次。如人(撇、捺、捺)，拆字码为PNN；十(横、竖、竖)，拆字码为HSS；一笔的字，连打三次，如一(横、横、横)，拆字码为HHH。
5、四笔以上的字，不能在散和连的条件下两码拆光，称独体字。独体字可以拆相交的要素。这类字的拆法是按书写顺序依次拆出编码要素，规则同前。如长(横、钩、捺)，手(撇、二、钩)，东(横、折、小)，井(二、撇、竖)。
6、多音字、允许打错拆字码的字和既可这样打也可那样打的字设置了多码。如“长”有“CHGN”和“ZHGN”两个编码；“张”有“ZGCN”和“ZGZN”两个编码，输入哪个编码都能打出该字。如“樱”的标准编码为“YMYN”(木、婴、女)，误打成“YMBN”(木、贝、女)；将“楂”的标准编码“ZMYY”(木、杳、一)打成“ZMMD”(木、木、旦)；再如“禁”，按规则既可打成JMMS(木、木、示)，也可打成JLEX(林、二、小)等等。多码字打哪个编码都能输入该字，可以减少错打次数，提高输入效率。
7、词汇的编码以字的编码为基础。两字词汇的编码，依次取每个字全码的前两码，共四码。如森林—SMLM，动员—DEYK，笔记—BZJY，工人—GHRP。其余类推。
三字词汇的编码，依次取每个字的分类码加空格键。如国务院—GWY，不得不—BDB，了不起—LBQ，等等。
四字词汇的编码，依次取每个字的分类码。如计划经济—JHJJ，改革开放—GGKF，调查研究—DCYJ，等等。
五字和六字词汇的编码，依次取一、二、三、末字的分类码。如电子工业部—DZGB，据不完全统计—JBWJ，计划委员会—JHWH。以此类推。
七字以上词汇的编码，依次取一、三、五、末字的分类码。如中华人民共和国—ZRGG，计划生育委员会——JSWH，全国人民代表大会—QRDH。依此类推。
8、为方便使用，设置了一部分简码。字母键“I”加键盘上排的阿拉伯数字(“0”代表“10”)键为该数字的小写；字母键“U”加键盘上排的阿拉伯数字(“0”代表“10”)键为该数字的大写。键盘上的26个字母键加空格键，分别代表一个通用高频字。如；L—了，Z—在，D—的，等等。在两字词汇中挑选676个通用高频词，以两码加空格键输入。其编码是依次输入每个字的分类码加空格键。如；因为—YW，所以—SY，只有—ZY，才能—CN。等等。
9、为满足实际操作的需要，设置了万能键“V”。在取码时，不知道四码中的任何一码(或更多时)，均可用“V”代替，这时，已知码相同的字，依次在提示行显示，供选择。如；“殁”，不知道该字读什么，分类码可以打“V”键，然后键入拆字码“DJY”(歹、几、又)，全码为“VDJY”此时，拆字码相同的字在提示行依次全部显示，供选择；如“吮”(口、厶、儿)，既不知该字读什么，也不知拆字码的第二码“厶”读什么，此时键入“VKVE”，这时，2、4码相同的字在提示行依次显示，供选择。其余类推。
10、上述编码所用拼音字母与键盘英文字母完全一致。为合理利用键盘，便于操作，降低重码率，在键盘上规定了三个例外键来代表出现频率较高的笔划和部首。它们的替代关系是字母键“O”代表“冫、氵”，字母键“I”代表“丨、扌”，字母键“U”代表“艹”。如“莫”的编码为“MURD”，“河流”的编码为“HOLO”，“推广”的编码为“TIGD”，等等。
本编码方案中，无论输入单个汉字还是词汇都是四码输入，中间没有换档操作。当出现重码时，响笛提醒，提示行显示顺序为单字在前，词汇在后(依字数多少顺次排列)。重码单字在两个以上时，常用字在前(词汇同理)。本编码方案中，每组编码的重码单字一般只有2—3个，最多不超过5个，如果所需要的汉字(或词)是提示行的第一个字(或词)，继续输入下面的字(或词)，使该字(或词)自动输入即可。
本方案与现有编码方案相比较，具有如下优点与数字码相比较，避免了巨大的记忆负担，不经常使用也不会忘记，并可输入词汇。
与拼音码相比较，可以避免大量的重码字选择，提高输入速度。发音不需要准确无误，能知道每个要素名称的第一个字母就行(不知道的可以用“V”键代替)。没学过拼音的人，只要认识26个拼音字母，了解拼音的一般知识即可。
与字型码相比较，不需学习拆字部件，不用记住部件与键盘字母的对应关系，不必对字进行分型识别，仅靠小学程度的文字知识就能操作，编码方法与书写汉字关系密切，有利于加深理解汉字的构造，容易学会，不易忘记。
与混合码相比较，规则简单，规律性强，没有例外。无需对字进行表音、表义和分型判断，无需输入拼音方案，操作失误率极低。
本编码方案无重码输入率可达90％，易学难忘，适合各种文化程度、各种年龄、各类操作人员使用，具有更高的推广价值。
实现本方案的方式与实现其它方案的方式相同。
权利要求
声母拆字码汉字输入编码方案，与已有的各种编码方案一样，是由现有的计算机键盘和击键时字母的某种排列组合而组成的，键盘上键入的是计算机汉字的外码，通过键入外码，调出所需要的字或词汇。声母拆字码的技术特征是1.将“笔划、部首、单字”作为构成汉字的三种基本要素。笔划分“点、横、竖、撇、捺、折、提、钩、弯”9种。部首共50个(主要是非字部首)，取每个部首名称的一个表义字作为该部首的要素名称。单字，即字中字，大小随机而定，认识即可，字本身就是要素名称；
2.每个汉字，不论笔划多少，均取四码。第1码是分类码，为该字拼音方案的第一个字母。第2、3、4码为拆字码，按三种基本要素拆分(单一或混合)，每码均取要素名称的声母；
3.每个字的拆分，都以三码分光为首选，三码不能分光就两码分光。两码分光的字，须再补一个复码，即在末码要素中再取一个末字(取大优先)、未部首或末笔划，补足三码。如果一个字只能拆成四码以上(含四码)时，按前二末一取码(取大优先，剩余的放弃)；
4.三笔以内的字，一律按笔划取码。两笔的字，末笔取两次。一笔的字，连取三次。四笔以上的字中含有两笔的单字时，两笔的单字一律不拆，拆字码不够三码时，用复码补够；
5.多码。多音字、允许拆错的字和既可这样拆也可那样拆的字，设置了多码。打多码同样可以输入该字；
6.两字词汇依次取每字全码的前两码，合为四码。三字词汇依次取每字的分类码加空格键。四字词汇依次取每字的分类码。五字和六字词汇依次取一、二、三、末字的分类码。七字以上词汇依次取一、三、五、末字的分类码；
7.简码。字母键“I”加键盘上排的阿拉伯数字键(“0”代表“10”)为相应的小写。字母键“U”加键盘上排的阿拉伯数字键为相应的大写。在双字词汇中挑选676个常用词汇，以两个单字的分类码加空格输入；
8.万能键“V”代表单字编码中的任何一个未知码，使其余已知码相同的字在提示行显示，供选择。
全文摘要
声母拆字码汉字输入编码方案属计算机汉字输入编码领域。本发明的特征在于以键入声母代替写字，每字四码。第一码是分类码，为该字拼音的第一个字母，第二至第四码为拆字码，拆字码取自构成汉字三要素的“笔划、部首、单字”(单一或混合)，每个要素名称的声母为其代码。拆字时，每字三码拆光为首选，不能三码拆光就两码拆光，加复码(末码中的末字或末笔)打够三码，四码以上的字取前二末一(取大优先)。
文档编号G06F3/023GK1124851SQ9410243
公开日1996年6月19日申请日期1994年3月26日优先权日1994年3月26日
发明者邓兆林申请人:邓兆林

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓兆林
技术所有人：邓兆林
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。