声码输入法及其编码的制作方法

文档序号:6619258阅读:388来源:国知局
专利名称:声码输入法及其编码的制作方法
技术领域
本发明涉及了汉字的计算机编码及输入法,尤其是采用汉字或部首名称首字拼音首字母输入汉字的方法。
尽管社会上出现了许多种汉字输入法,包括专业型五笔输入法,以及适合大众的声形结合的输入法,但绝大部分不仅学习起来难度大,记忆的东西太多,而且对汉字拆分也不符合汉字的读写与认字习惯,给汉字的拆分带来了极大的不便。尽管汉字的重码少了,但影响了汉字的输入速度。
鉴于此,本发明的目的在于提供一种简便易学、重码适中、记忆量小、编码规律,收录字词完备,拆分汉字容易,更符合汉字的读写与检部规律的汉字输入方法。
一、声码的基本名称1.声码依一定规则将汉字拆分成若干字元(包括部首、字、非字笔划),并以其名称首字拼音首字母,即音元组合成编码进行汉字输入的方法。
2.字元用以拆分表示汉字结构的元素。
3.声元(音元)即某字元名称的首字拼音首字母。如“宀”宝盖头bao声元为“B”。“田”读音为“TIAN”,音元为“T”。
4.非字笔划在汉字拆分中,某部分既不成字,又不作部首,如“亠、饣”。
5.非字笔划组多于两笔以上的非字笔划,如“屮、饣”等。用“A”表示。
6.特征字元在汉字拆分中,最接近末字元或为末字元本身,此字元不为规定部首或规定部首字的字元或全为部首时为末字元。
7.再生字元某字元末笔相连的最大字,或无末笔连字取首笔相连的最大字(原字元除外)。如放(方,攵)特征字元为方; 再生字元为(万W)。
狠(犭,艮)特征字元为艮; 再生字元为(彐E)。
8.复字至少由两个部分构成的字或由一部分构成且可拆为多字的字。如“古、忠、奉、留、非、以、尔、欠、朝、早、想、间、包”等。
9.非复字由一个部分或由几个相分的单笔构成的字。如“二、三、七等。
二、声码字元的构成部分1.基本笔划表
注“\,丶”与撇或折撇同时出现称“捺”;如“未、木、久”等。否则称为“点”。如“心、冬”等。“一”在单字中作笔划称“横H”。
2.部首部分
注“二、三、五、六、七、八、九、十”也作为部首处理。
3.生僻字简表(只收录部分)
注孑、孓在复体字中同“子”。单字中分别读“JIE、JUE”三、汉字的拆分。
(一)、非复字拆法1.去第一笔划或末笔划有再生字元。(优先去第一笔,再去末笔的顺序)编码为整字声元+再生字元声元如“方”再生字元为“万”编码为FW“土”去末笔再生字元“十”编码为TS2.去多笔有再生字元。(再生字元与首笔或末笔划相连,第四码一般不加)编码为整字声元+再生字声元+“U”+末笔划声元如“石”再生字元“口”编码为sku“艮”再生字元“彐”编码为geun3.可拆成多字的,基本上遵照汉字书写顺序。个别兼顾直观,其中单笔要丢弃。编码为整字声元+拆出各字声元排列如“击”(二,山)编码为jes“夷”(一,弓,人)编码为YGR
4.拆不出字的非复字。如五、无、七、二、儿(一级简码除外)编码为整字声元+整字末笔划声元+补码补码要看字的末笔与其它笔划的关系而定,补码关系有分fen(末笔与其它笔划相分)如八;拆为“八;捺;分”编码为bnf交jiao(末笔与其它笔划相交)如九;拆为“九;乙;交”编码为jij包bao(末笔与其它笔划相包)如寸;拆为“寸;丶;包”编码为cdb重chong(末笔与其它笔划相重)如乙;拆为“乙;乚;重”编码为yic连lian(末笔与其它笔划相连)如人;拆为“人;捺;丿”编码为rnp注单笔划相包含判断方法为在内为包(勺),在外为分(弋)。
其中相连关系时要打第一笔划的声元,而不打“L”。
(二)、复字拆分(至少有两个非字笔划组构成或一部分且可拆出多字的字)1、拆分方法。
(1)、确定字型,依字型中相分关系或兼顾直观将字拆分成若干部分块(可有部首或字、非字笔划组、单双笔。)如“型”拆为(开;刂;土)“估”拆为(亻;古)(2)、判别部分块类型分别处理。
1.部首、部首字确定为字元。如“估”中“亻”为部首确定为字元。
2.一般字若此字仍可以相连关系拆成多个字,(两个字为多),可含部首、非字笔划组,则拆为多字。如“愫”中“素”拆为(非字部分;幺;小)3.非字笔划组,兼顾直观。可拆多字时拆,否则不拆。如“朝”中左部分拆为“十;日;十”①若相邻两部分块都是非字笔划组,且可组合成字,则优先成字。如“非”在“悲”字中拆为“非;心;”编码为FXS②若一个非字笔划组在前与一个字在后可组合成字(可含单笔),则优先成字。如“青”在“清”字中不拆。
③单笔或两笔用第一笔声元替代,两笔划以上非字笔划组用“A”替代。如“京”拆为“亠;口;小”编码为DKX “亠”用“D”表示。“鬓”拆为“镸;彡;宀;八”编码为AOBB“镸”用“A”表示。
④单笔的运用。
A、服从可归不弃的原则,单笔划若可归于其它字则归于其它字。如“得”字中“旦”在其右部分不拆,“一”单笔不弃。
B、单笔可弃原则。即多于四个字元时单笔划要丢弃。如“愉”拆为“忄、人、一、月、刂”,“一”丢弃。编码为XRVL2、复字编码如尔、以、古、忠、留、渺、茫等。
(1)、双字元型。首字元声元+末字元声元+补码+次补码(一般与整字含同声元或首字元不是部首或此字不常用,加次补码)(2)、三字元型。首字元声元+次字元声元+末字元声元+补码(一般与整字含同声元或首字元不是部首或此字不常用,加补码)(3)、三字元以上型。首字元声元+次字元声元+第三字元声元+末字元声元补码与次补码1.所有字元是规定的部首,且末字元无再生字元,此时看末字元与次末字元的关系取码。关系有包含两字元相包含如回;kkb 连接两字元相连 如古;skl分开两字元上下分如吕;kkf 旁边两字元左右分 如叶;ksp“补码”为分F、连L、包B、旁P。“次补码”为首字元的再生字元或无再生字元取首笔划的声元。
2.不全为部首。“补码”此时看特征字元是否有再生字元,有,补码为再生字元的声元;否则为特征字元的末笔划声元。如“放”特征字元为“方”,再生字元为“万”;补码为“万W”“次补码”(1)首字元不是规定部首“次补码”为首字元的再生字元或无再生字元取其第一笔划的声元。如“放”编码“FFWW”两个W分别代表特征字元“方”的再生字元“万”。“刘”编码“WLND”N为特征字元末笔声元,D为首字元的首笔声元。
(2)首字元为规定的部首“次补码”为特征字元的再生字元或无再生字元取其第一笔划的声元。如“证”编码为“IZZH”,H代表特征字元的首笔划声元。!注当词组与单字发生重码时,此时单字取三码。除非前三码已有字占位。当常用字与非常用字发生重码时,非常用字取全码。
3、词组编码。注复字首字元与次字元的确定,基本上与单字拆法相同。非复字首字元为字本身,次字元为再生字元或无再生字元为末笔划声元。
①、双字词编码。
首字前两个字元声元+次字前两个字元声元如中国(中;口;口;玉)ZKKY 结构(纟;士;木;勾)JSPG②、三字词组编码。
前三字的首字元声元+末字次字元声元如结构性(纟;木;忄;生)JPXS 图书馆(口;书;饣;宀)KSAB③、四字词组或四字以上词组。前三字首字元声元+末字首字元声元如中国人民解放军(中;口;人;冖)ZKRB(4)、部首或特殊字符编码。
①、部首编码或部分非字笔划组编码或难检字。部首声元+VV+再生字元(末笔声元)或非字笔划组首笔声元+VV+末笔声元(再生字元)如纟 JVVH;冂 SVVI;②、特殊字符编码。
A数字序号;如1.、(一)、(1)、①、ii根据其特点编码。“1.”含“.”点(D)。“(1)”含“()”括号(K)。“(一)”含“一”中文(Z)。“①”含“○”圈(Q)。“ii”含“i”英文(Y)编码为特点编码+数字拼音前两个字母+U如“5.”DWUU“(2)”ZERU“ii”YERUB拼音字母;如ā、ǒ、ē、ǖ(V)、ū等编码为拼音字母+拼音声调序次数字拼音前两个字母+U如“ō”OYIU“ǘ”VERU“ě”ESAUC万能码(非标准码)便于输字。(只收录部分难检字)(1)、生僻字编码,如毋、厶等。编码除正常规定外可采用以下两种规则。
①、生僻字声母+UU+再生字元或末笔声元②、字(首笔划+次笔划+末笔划)声元+字声元(2)、两部分构成的字,第一部分为非字笔划(收录部分字)。如欠、尔。编码为首字元声元+次字元声元+整字声元如“旬”(勹;日;旬)PRX(3)、容错码根据汉字拆分取舍不同或将生僻字作为非字笔划组产生一字多码。如“真”拆为(十;具;八)SJB 或(直;八;十;十)ZBSS“快”拆为(忄;夬;大)XGD或XAD五、一级简码(26个)
权利要求
1.声码输入法及其编码,其特征在于以汉字或部首、笔划的名称首字的拼音的首字母(声元)表码,并以汉字中各部分相分的关系或把汉字拆分成以非复字(独体字)、非字部分、笔划为单位的字元,对其字元表码组合进行汉字编码输入的方法。
2.如权利要求1中所述,声码输入法及其编码其特征还在于汉字拆分中作为字元的非字部分,少于三笔划的用其第一笔划的声元(音元)表码,两笔划以上的非字笔划组用字母“A”表码的方法。
3.如权利要求1中所述,声码输入法及其编码的基本笔划分为八种,其中“\,、”在不同位置称谓不同,与撇或折撇同时出现称为“捺”;否则称为“点”。
4.如权利要求1中所述,声码输入法及其编码的基本字元为一些基本的、常用的汉字部首或字。共49个。
另外“二、三、五、六、七、八、九、十”也作为部首,表码是其声元(音元)。
5.声码输入法及其编码,其特征除权利要求1中所述外,最大的特征还在于声码的特征字元与再生字元,用以形成声码复字的识别码。特征字元指除规定部首外最接近末字元的字元。再生字元为字元第一笔划或末笔划相连的除本字外的最大字。
6.声码输入法及其编码,如权利要求5中所述,用再生字元的声元或无再生字元时用特征字元的末笔划声元形成声码复字的识别码“补码”;或当所有字元都是部首时,末字元又无再生字元时,补码视末字元与其它部首之间的关系而定。关系有“分F、连L、包B、交J”,形成补码。
7.声码输入法及其编码,除前述特征外,非复字(独体字)编码其特征在于也运用了再生字元,用本字的声元与再生字元的声元组合进行编码。非复字无再生字元的用字的声元与末笔划声元与末笔划与其它笔划的关系表码组合编码,关系表码有“分F、交J、旁P、包B”,当关系相连时取字的第一笔划声元表码。
8.声码输入法及其编码,另外一大特征在于对汉字以外的部分特殊字符也进行了编码。数字序号,如1.、(一)、(1)、①、ii根据其特点表码。“1.”特征“.”点(D)。“(1)”特征“( )”括号(K)。“(一)”特征“一”中文(Z)。“①”特征“○”圈(Q)。“ii”特征“i”英文(Y)编码为特点表码与数字拼音前两个字母加字母“U”。拼音字母,如ā、ǒ、ē、ǖ(V)、ū等。编码为拼音字母加拼音声调序次数字拼音前两个字母加字母“U”。
全文摘要
声码输入法及其编码发明涉及了汉字的计算机编码及输入法,编码采用汉字或部首名称首字拼音首字母(声元)。其字元灵活、简便易学、重码适中、记忆量极小、编码规律,收录字词完备,拆分汉字容易,超强容错,更符合汉字的读写与检部规律。并收录了部分特殊字符,其常用部首不足50个,编码采用26个英文字母,对中文排版录入有极大优越性。适宜于广大非文盲人员使用,学习周期短,不易忘记,重在掌握方法,利用已有知识。
文档编号G06F3/023GK1380595SQ0111065
公开日2002年11月20日 申请日期2001年4月16日 优先权日2001年4月16日
发明者秦永久 申请人:秦永久
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1