一种微机汉字编码方法

文档序号:6601555阅读:570来源:国知局
专利名称:一种微机汉字编码方法
技术领域
本发明涉及一种机算机应用技术,具体地说是一种微机汉字编码方法。
随着计算机在我国的普及应用,人们对计算机的学习兴趣越来越浓厚,但要学习计算机并在实际工作中得心应手地运用,就必须先掌握计算机的汉字输入方法。本发明的微机汉字编码方法是借鉴了五笔字形汉字编码方法的优点,克服其记忆无规律难以在短时间内掌握的不足,提出一种更为简易、直观和实用的汉字编码方法,能使初学者在较短的时间内轻松地接受和掌握,是一种适合各种层次用户需要的、具有普遍意义的新方法。
本发明的微机汉字编码方法是对从汉字中拆分出的字根以音或形相近的原则,重新进行设置,把字根分为单字根和双字根两类,并规定字根的代码为其本身的声部,双字根的代码为双码,归类后分为26组,分别对应26个英文字母,使之更加简明直观,规律性更强,更便于记忆和运用。引进双字根概念,省去了字形的交叉识别这一手续,不仅简化了编码程序,而且同样能起到减少重码作用。在给含有双字根的单字进行编码时要遵循三个原则[1]双字根在首位必须用全码;[2]必须有末位字根参与编码;[3]编码最多为四码。
以下对本发明的微机汉字编码方法作以下详细地介绍;一、字根的设置
本发明中汉字字根的选取是以简体楷书为标准,同时适当兼顾其他实际中的草写情况,把音或形相近的字根相搭配归类后分成26组,分别对应26个键位字母,并以它为代码。(见附表)二、字体的拆分在发明的方法中,字体的拆分基本原则类同五笔字型编码方法,但在具体拆分方法上有扎不同,本方法更注重拆分的直观性。
拆分的基本原则是①按书写习惯,以先左后右,先上后下,先外后内,先主干后两侧的顺序进行拆分。(含“”、“”的字在拆分时,放在前首,这同书写习惯不同)如算、目、廾;楼木、米、女;逃辶、儿、水;建廴、彐、二、丨;②按字体结构,“能散不连,能连不交”,“字根取大优先”以保证拆出的字根总数最少。
如生丿、;云二、厶;天一、大;夫二、人;开一、廾;井二、 平一、、丨;其艹、三、八;③兼顾直观,把握总体进行拆分。
如或戈、口、一;可丁、口;巫工、人、人甫十、月;曹艹、曰、日;曲口、艹;在具体拆分时,还有以下几种特殊方法①变形处理法(按单笔划的归类进行变形)
如才十、丿;长丿、七、丶;未二、小;民 、乙、七;夜亠、亻、 ;东七、小;②近似处理法(有时,增减一笔划,以求直观归类)如步止、小、丿; 舞矢、、一、丨;岛鸟、山; 旅亠、勹、、 惯忄、母、贝; 越土、 戈;③反向取法如飞乙、冫;年、 、丨;虐上、 、七、彐;④重合(或截断)处理法如成厂、乙、戈;发乙、 、又;黑 、土、灬练纟、七、乙、小;专二、乙、出山、山三、单字的编码根据拆分出的字根(或单个笔划),依序将其所对应的代码组合成串,就可得到单字的编码,多字根者取其第一、二、三、末位字根参与编码,不足四码者以空格结束。单字编码最多为四码。
如拾扌人一(AFHK)编纟丶尸艹(VDSC)根木彐艮(MSE) 伟亻二乙丨(FDLA)途辶人一 (ZHFM)值得注意的是,含“双字根”的单字,因其特殊性,它们的编码也稍有不同。
所谓“双字根”,是音形法中特别引进的概念,即把某些特定的字根看成是“两个字根的重合”,它们的代码为两码,如“禾”为HE,“马”为MA,“足”为ZZ等。引进双字根的原因有两条,一是为了保证同音字根尽量归为同类这一原则;二是为了减少重码。我们规定;“双字根”附属于单字根,它是单字根的一种特殊情形。双字根的首二、末位字根参与编码的情况,而不是通常的第一、二、三末位字根。
四、单字的特殊编码1、高频字的编码。从每组字根中,选出含该字根的一个常用字,以字根代码来作为它的编码。这类高频字在音形法中被称为“键位字”(跟“五笔字型”不同)它们各自又有常规编码。(其中,“我”、“的”两字为特意安排,跟字根无关)。
如把A 或B 一H的K2、字根成字的编码。对于字根本身就是一单字的这类字,我们规定它们的编码为原代码+序号,借以区分。这样处理,不仅简捷且有助于字根的记忆。(个别生僻字的编码为四个重码)手A1贝B1匕B2戈B3戈B4寸C1(廿CCCC)大D1犬Q2衣E1入F2工G1弓G2广G3火H1水I1小I2巾J1(臼JJJJ)口K1立L1木M1毛M2母M3皿M4女N1鸟N2乃N3目01身O2片P1厂P2气Q1欠Q2丘Q3日R1儿R2(日、巳RRRR) 山S1尸S2田T1土T2士T3(幺VVVV)王W1文W2心X1西X2夕X3月Y1用Y2于Y3子Z1之Z2止Z3 (孑ZZZZ)另外,双字根成字的编码即为它的代码。(石、力除外)如马MA米ME车CH壬RN门MN石SHL 力LIL(L为补充码)数字字根的编码为原代码+自身数字(-、+除外)一H(高频字) 二D2 三S3 四S4五W5 六L6 七B7 八F8码音部即为它的原码。它的尾码只起限定的作用,有时要根据情况去掉尾码,只留首码。“双字根”只适用于单字的编码,在词汇编码中恢复为单字根。
给含“双字根”的单字进行编码时,若按常规则会出现编码超过四码的情况,这显然不行。为解决这一问题,我们在给某些字进行编码时,要预先把双字根的尾码去掉,这一过程称之为“去尾”具体方法如下①单字中只含一个双字根。
若双字根处于字体首位或第2位,要保持全码;若双字根处于第三位且又是末位字根,也取全码,若其后还有别的字根,则要“去尾”,只用首码;若双字根处于多字根字的末位时,一律去尾,以保证最多四个码长。
例如精MEWY神EERA医KOLD啊KREK奥PUMD劲UGLI和HEK 都TPRR磨GMMS渠IKOM②单字中含两个或多个双字根。
若单字正好拆成两个双字根,则都取全码(共四码);若字根数目多,则排在后面的那个双字根要预先去尾,用其首码参与编码。
例如闻MNRE 码SHMA斩CHJN暂CHJR 磊SHSS总之,给含双字根的单字进行编码时,要遵循三条原则一、双字根在首位必须用全码;二、编码最多四个码长;三、必须有末位字根参与编码。其间,有的字根要预先“去尾”,并会出现只有第一、
九J9 十YL(L为补充码)五、词汇的编码1、两字词的编码。
分别取两字的前两位字根,将它们的代码予以组合,即得两字词的缩码。须注意“双字根”在词汇的编码中恢复为单字根,新代码为其首码。
例如生活PWIP音乐LRVI革命GKFH精神MWER成功PLGL新闻LMMR含字根成字的词中,成字以重码形式参与编码,双字根同样。
如伟大FDDD汽车IQCC力量LLRH运输ZDCF工人GGFF人民FFKL2、三字词的编码。
分别取前两字的首位字根及第三字的前两位字根,参与编码。
如为什么DFPV对不起UHTZ生产力PLLL共产党CLIG3、四字词的编码。
四个字分别各取首位字根参与组合编码。
如科学技术HIAM社会主义EFDD万众一心HFHX我行我素PFPW4、多字词的编码。
取第一、二、三末位字根的首码组合编码。
如中华人民共和国KFFK人民代表大会FKFF百闻不如一见HMHU六、容错码的设置为照顾不同人的拆分习惯,减少失误,音形法中同样设置了容错码,供输入时参考。
如切七、刀(BDO) 常规码切土、刀(TDO) 容错码行彳、一、丁(FHDZ)常码行彳、二、丨(FDA) 容码得彳、日、一、寸(FRHL)常码得彳、日、于、(FRYD) 容码养丷、、丶、 (CWDA)常码养丷、王、八、 (CWFA)容码戕乙、 、丨、戈(LHAB)常码戕乙、厂、丨、戈(LPAB)容码七、重码的处理音形法中,重码的字数同“五笔字型”接近。
每组重码的字,通常为2-3个。一般把常用字放在提示行的前面,可按数字“1”键或打空格键将它输入;排在后面的按序号敲相应的数字键,使之输入。
若想使要输入的字“一步到位”,可在熟记重码字组的前提下,在原编码的后面加上它在重码组中的序号作为新编码,直接输入,从而省去选择的时间,提高输入速度(四码字可将原编码的末码改为序号)。
如要输入“导”字,先敲入编码“RC”,机器显示它为重码字,提示行给出1时2异3导,再按“3”键,“导”字上屏。那么以后再遇“导”字时,根据记忆,我们就可直接输入“RC3”则可使“导”字直接上屏,从而提高了输入效率。
本发明的微机汉字编码方法和现有其他微机编码方法相比,具有易学易懂易操作,拆字编码简单、直观,适合中文汉字的书写习惯,规律性强,便于记忆和运用并可提高输入速度,具有很好的推广使用价值。
表1音形法字根总表
续表(1)
权利要求
1.一种微机汉字编码方法,其特征在于对从汉字中拆分出的字根,以音或形相近的原则重新进行设置,把字根分为单字根和双字根两类,并规定字根的代码为其本身的声部,双字根的代码为双码,归类后分为26组,分别对应26个英文字母。
2.根据权利要求1所述的方法,其特征在于给含有双字根的单字进行编码时要遵循三个原则[1]双字根在首位必须用全码;[2]必须有末位字根参与编码;[3]编码最多为四码。
全文摘要
本发明涉及一种微机汉字编码方法,该方法对从汉字中拆分出的字根,以音或形相近的原则重新进行设置,把字根分为单字根和双字根两类,并规定字根的代码为其本身的声部,双字根的代码为双码,归类后分为26组,分别对应26个英文字母。该方法和其它编码方法相比,克服了记忆无规律,难以在短时间内掌握的不足,提出一种更为简易、直观和实用的汉字编码方法,能使初学者在较短的时间内轻松地接受和掌握,能满足各种层次用户需要,具有很好的推广普及价值。
文档编号G06F3/023GK1133987SQ95110390
公开日1996年10月23日 申请日期1995年3月22日 优先权日1995年3月22日
发明者刘卫国 申请人:刘卫国
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1