声母拆字码汉字输入编码方案的制作方法

文档序号:6599427阅读:532来源:国知局
专利名称:声母拆字码汉字输入编码方案的制作方法
本方案属于计算机汉字输入编码领域。
计算机汉字输入编码方案种类繁多,目前使用的编码方案可归纳为四类一类为数字码。使用阿拉伯数字,不考虑汉字的发音和书写规律,为每个汉字规定一组数字代码。如国标区位码,电报码等。优点是不重码,输入速度快。缺点是记忆量巨大,很少有人能够掌握。二类为拼音码。以汉字发音为依据,输入每个汉字的拼音,在同音字中寻找所需汉字。如全拼码,双拼码等。优点是不用专门学习,会拼音方案即可操作。缺点是重码字太多,输入速度慢;卷平舌发音不易做到准确无误;不会读的字无法输入。三类是字型码。不考虑汉字的发音,以字的构造形态为基础,规定若干拆分部件和它们在键盘上的位置。如五笔字型等。优点是重码率低,输入速度快。缺点是拆分部件较多,与已有文字知识联系不够紧密,需专门学习,负担一定的记忆量,非专职操作人员不易牢固掌握。四类是混合码。拼音和字型并用。如自然码等。这类编码吸收了拼音码和字型码的优点,同时也保留了它们的缺点。
声母拆字码是以不用死记硬背,无需专门训练,符合书写习惯,一天即可学会为目的的汉字输入编码方案。
为了实现上述目的,本发明是采取如下技术方案来实现的1、本方案将汉字分成“笔划、部首、单字”三种基本要素。
笔划分“点、横、竖、撇、捺、折、提、钩、弯”9种。
部首选自新华字典部首目录,共50种(主要是非字部首)。这些部首在取码时不再拆分,如“氵、扌、艹、讠”等。每个部首取一个表义字作为它的要素名称,如氵(水),扌(手),艹(草),讠(言)等。
单字即字中字。如“努”中的“女、又、力”,“语”中的“五、口”等。字中字大小随机而定,数量不限,认识即可,字本身就是要素名称。
2、每个汉字,不论笔划多少,均取四码。第一码是分类码,为该字拼音方案的第一个字母(以下称声母)。如前—Q,知—Z,安—A等。第二码至第四码为拆字码,每码均取所拆要素名称的声母。如大(横、撇、捺),拆字码为HPN,全码为DHPN;描(手、草、田),拆字码为SCT,全码为MSCT;喘(口、山、而),拆字码为KSE,全码为CKSE。以此类推。拆字码的取码顺序是先左后右,先上后下,先外后内,先横后竖。如树(木、又、寸),莫(草、日、大),国(口、王、点),长(横、钩、捺)等。
一个字以三码拆光为首选。如辞(舌、立、十),不能拆成两码“舌,辛”和四码“千、口、立、十”;活(水、千、口),不能拆成两码“水、舌”和四码“水、撇、十、口”;王(横、十、横),不能拆成两码“横、土”和四码“横、横、竖、横”。
在拆分过程中,要遵循“先大后小,取字优先”的原则。如辞(舌、立、十)不能拆成“千、口、辛”;兢(克、古、儿)不能拆成“十、兄、克”、“古、儿、克”和“克、十、兄”;活(水、千、口),不能拆成“水、撇、古”等。
一个字如果不能正好三码拆光,就选择两码拆光,这时需再取一个复码,即再取末码中的末字(取大优先)、末部首或末笔,补够三码。如坡(土、皮),末码“皮”中的末字为“又”,其拆字码为TPY(土、皮、又),全码为PTPY;硕(石、页),全码为SSYB(石、页、贝);樱(木、婴),全码为YMYN(木、婴、女)。如果末码中无末字可取,就取末部首或末笔。如喻(口,俞),末部首为“刀”,全码为YKYD(口,俞,刀);吕(口、口,,末笔为“横”,全码为LKKH;佛(人、弗),末笔为“竖”,全码为FRFS。以此类推。
在拆分过程中,要坚持“先拆散、后拆连、不拆交”的原则。如“楂”,首选方案拆分为“木、杳、一”(先拆散),次选方案为“木、木、旦”(后拆连)。这类字,两种拆法均可。“朱”(撇、未),再取复码“捺”,全码为ZPWN(撇、未、捺),不能拆成“撇、横、木”(不拆交);好(女、子),再取复码“横”,全码为HNZH(女、子、横),不能拆成“女、了、横”(不拆交)。
如果一个字只能拆成四码以上(含四码)时,按“前二末一”取码,剩余的放弃。如嚣(口、口、口),拆字码为KKK;游(水、方、子),拆字码为SFZ;发(折、撇、点),拆字码为ZPD。按“前二末一”取码也遵循“取大优先”的原则。
3、在四笔以上的字中含有两笔的单字时,两笔单字不拆,如果拆字码不够三码,加打复码。如朴(木、卜、点),拆字码为MBD;公(八、厶、点),拆字码为BSD;古(十、口、横),拆字码为SKH。但不成字的可以拆,如叫(口、折、竖),拆字码为KZS;石(横、撇、口),拆字码为HPK。
4、三笔以内的字,一律按笔划取码。如土(横、竖、横),拆字码为HSH;下(横、竖、点),拆字码为HSD。二笔的字,末笔打两次。如人(撇、捺、捺),拆字码为PNN;十(横、竖、竖),拆字码为HSS;一笔的字,连打三次,如一(横、横、横),拆字码为HHH。
5、四笔以上的字,不能在散和连的条件下两码拆光,称独体字。独体字可以拆相交的要素。这类字的拆法是按书写顺序依次拆出编码要素,规则同前。如长(横、钩、捺),手(撇、二、钩),东(横、折、小),井(二、撇、竖)。
6、多音字、允许打错拆字码的字和既可这样打也可那样打的字设置了多码。如“长”有“CHGN”和“ZHGN”两个编码;“张”有“ZGCN”和“ZGZN”两个编码,输入哪个编码都能打出该字。如“樱”的标准编码为“YMYN”(木、婴、女),误打成“YMBN”(木、贝、女);将“楂”的标准编码“ZMYY”(木、杳、一)打成“ZMMD”(木、木、旦);再如“禁”,按规则既可打成JMMS(木、木、示),也可打成JLEX(林、二、小)等等。多码字打哪个编码都能输入该字,可以减少错打次数,提高输入效率。
7、词汇的编码以字的编码为基础。两字词汇的编码,依次取每个字全码的前两码,共四码。如森林—SMLM,动员—DEYK,笔记—BZJY,工人—GHRP。其余类推。
三字词汇的编码,依次取每个字的分类码加空格键。如国务院—GWY,不得不—BDB,了不起—LBQ,等等。
四字词汇的编码,依次取每个字的分类码。如计划经济—JHJJ,改革开放—GGKF,调查研究—DCYJ,等等。
五字和六字词汇的编码,依次取一、二、三、末字的分类码。如电子工业部—DZGB,据不完全统计—JBWJ,计划委员会—JHWH。以此类推。
七字以上词汇的编码,依次取一、三、五、末字的分类码。如中华人民共和国—ZRGG,计划生育委员会——JSWH,全国人民代表大会—QRDH。依此类推。
8、为方便使用,设置了一部分简码。字母键“I”加键盘上排的阿拉伯数字(“0”代表“10”)键为该数字的小写;字母键“U”加键盘上排的阿拉伯数字(“0”代表“10”)键为该数字的大写。键盘上的26个字母键加空格键,分别代表一个通用高频字。如;L—了,Z—在,D—的,等等。在两字词汇中挑选676个通用高频词,以两码加空格键输入。其编码是依次输入每个字的分类码加空格键。如;因为—YW,所以—SY,只有—ZY,才能—CN。等等。
9、为满足实际操作的需要,设置了万能键“V”。在取码时,不知道四码中的任何一码(或更多时),均可用“V”代替,这时,已知码相同的字,依次在提示行显示,供选择。如;“殁”,不知道该字读什么,分类码可以打“V”键,然后键入拆字码“DJY”(歹、几、又),全码为“VDJY”此时,拆字码相同的字在提示行依次全部显示,供选择;如“吮”(口、厶、儿),既不知该字读什么,也不知拆字码的第二码“厶”读什么,此时键入“VKVE”,这时,2、4码相同的字在提示行依次显示,供选择。其余类推。
10、上述编码所用拼音字母与键盘英文字母完全一致。为合理利用键盘,便于操作,降低重码率,在键盘上规定了三个例外键来代表出现频率较高的笔划和部首。它们的替代关系是字母键“O”代表“冫、氵”,字母键“I”代表“丨、扌”,字母键“U”代表“艹”。如“莫”的编码为“MURD”,“河流”的编码为“HOLO”,“推广”的编码为“TIGD”,等等。
本编码方案中,无论输入单个汉字还是词汇都是四码输入,中间没有换档操作。当出现重码时,响笛提醒,提示行显示顺序为单字在前,词汇在后(依字数多少顺次排列)。重码单字在两个以上时,常用字在前(词汇同理)。本编码方案中,每组编码的重码单字一般只有2—3个,最多不超过5个,如果所需要的汉字(或词)是提示行的第一个字(或词),继续输入下面的字(或词),使该字(或词)自动输入即可。
本方案与现有编码方案相比较,具有如下优点与数字码相比较,避免了巨大的记忆负担,不经常使用也不会忘记,并可输入词汇。
与拼音码相比较,可以避免大量的重码字选择,提高输入速度。发音不需要准确无误,能知道每个要素名称的第一个字母就行(不知道的可以用“V”键代替)。没学过拼音的人,只要认识26个拼音字母,了解拼音的一般知识即可。
与字型码相比较,不需学习拆字部件,不用记住部件与键盘字母的对应关系,不必对字进行分型识别,仅靠小学程度的文字知识就能操作,编码方法与书写汉字关系密切,有利于加深理解汉字的构造,容易学会,不易忘记。
与混合码相比较,规则简单,规律性强,没有例外。无需对字进行表音、表义和分型判断,无需输入拼音方案,操作失误率极低。
本编码方案无重码输入率可达90%,易学难忘,适合各种文化程度、各种年龄、各类操作人员使用,具有更高的推广价值。
实现本方案的方式与实现其它方案的方式相同。
权利要求
声母拆字码汉字输入编码方案,与已有的各种编码方案一样,是由现有的计算机键盘和击键时字母的某种排列组合而组成的,键盘上键入的是计算机汉字的外码,通过键入外码,调出所需要的字或词汇。声母拆字码的技术特征是1.将“笔划、部首、单字”作为构成汉字的三种基本要素。笔划分“点、横、竖、撇、捺、折、提、钩、弯”9种。部首共50个(主要是非字部首),取每个部首名称的一个表义字作为该部首的要素名称。单字,即字中字,大小随机而定,认识即可,字本身就是要素名称;
2.每个汉字,不论笔划多少,均取四码。第1码是分类码,为该字拼音方案的第一个字母。第2、3、4码为拆字码,按三种基本要素拆分(单一或混合),每码均取要素名称的声母;
3.每个字的拆分,都以三码分光为首选,三码不能分光就两码分光。两码分光的字,须再补一个复码,即在末码要素中再取一个末字(取大优先)、未部首或末笔划,补足三码。如果一个字只能拆成四码以上(含四码)时,按前二末一取码(取大优先,剩余的放弃);
4.三笔以内的字,一律按笔划取码。两笔的字,末笔取两次。一笔的字,连取三次。四笔以上的字中含有两笔的单字时,两笔的单字一律不拆,拆字码不够三码时,用复码补够;
5.多码。多音字、允许拆错的字和既可这样拆也可那样拆的字,设置了多码。打多码同样可以输入该字;
6.两字词汇依次取每字全码的前两码,合为四码。三字词汇依次取每字的分类码加空格键。四字词汇依次取每字的分类码。五字和六字词汇依次取一、二、三、末字的分类码。七字以上词汇依次取一、三、五、末字的分类码;
7.简码。字母键“I”加键盘上排的阿拉伯数字键(“0”代表“10”)为相应的小写。字母键“U”加键盘上排的阿拉伯数字键为相应的大写。在双字词汇中挑选676个常用词汇,以两个单字的分类码加空格输入;
8.万能键“V”代表单字编码中的任何一个未知码,使其余已知码相同的字在提示行显示,供选择。
全文摘要
声母拆字码汉字输入编码方案属计算机汉字输入编码领域。本发明的特征在于以键入声母代替写字,每字四码。第一码是分类码,为该字拼音的第一个字母,第二至第四码为拆字码,拆字码取自构成汉字三要素的“笔划、部首、单字”(单一或混合),每个要素名称的声母为其代码。拆字时,每字三码拆光为首选,不能三码拆光就两码拆光,加复码(末码中的末字或末笔)打够三码,四码以上的字取前二末一(取大优先)。
文档编号G06F3/023GK1124851SQ9410243
公开日1996年6月19日 申请日期1994年3月26日 优先权日1994年3月26日
发明者邓兆林 申请人:邓兆林
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1