汉语字词全息编码方法及键盘的制作方法

文档序号:6406575阅读:411来源:国知局
专利名称:汉语字词全息编码方法及键盘的制作方法
技术领域
本发明汉语字词全息编码方法及键盘属于数据处理装置领域,特别是一种汉字编码方法及其所用键盘,能简便地把汉字输入计算机及其它类似设备和用作汉语字、词典等工具书的编目、索引,成为一种可供计算机和徒手使用的多功能编码。
汉字排检法主要有音形两种,拼音或音形结合编码,利用汉语音素少,读音简单,但要求认、读准确,所以输入效率低,限制大,不利于广泛推广使用,字根编码法是将汉字分解为上百个字根,用一码多根的方法,字根量大,记忆困难,笔形编码是将汉字分解为几种基本笔形,重码率高,输入速度低,各种编码都不能解决编码在计算机中和字、词典中通用排检的难题,不利于推广和普及。
本发明的目的在于避免现有技术的不足之处而提供一种编码规律性强,简单实用,输入效率高,易学易用,不需要操作人员大量记忆,可用于计算机输入和汉语字、词典排检通用的汉字编码方法及键盘。
本发明汉字编码方法是利用汉字结构作纽带,结合笔画和笔形排检汉字,从汉字的整体结构,顺其自然,根据汉字书写规律,将汉字分解成合理的、简单易认的几个部件或部首,分解后的部件笔画数减少,可以用笔画数和笔形作为编码,本发明的关键构思在于对汉字进行整体性抽象分析,将汉字化简定位,把汉字的结构抽象为符号,作为编码中的汉字形象代码,对分解后的简单部件,用部件笔画数和部件的起笔笔形作为数码,形码和数码结合组成字符编码对应汉字,汉字经过结构抽象分析,分解后的部件笔画大大减少,解决了数笔画之难,经过对46980个词的数码测算,2-5画码占90%,6-7画码占10%,根据汉字的结构,将汉字划分为十三种形式,独体结构形,上下结构形,左右结构形,包围结构形,上下加上下结构形,上下加左右结构形,上下加包围结构形,左右加上下结构形,左右加左右结构形,左右加包围结构形,包围加上下结构形,包围加左右结构形,包围加包围结构形,每一种结构形给一个形码,划分后的汉字部件每一部件的笔画数和每一部件第一笔的笔形作为编码的数码,笔形分为横、竖、撇、点、横折、竖折、撇折七种,笔画数横、竖、撇三种笔形设2-7画,1画用2画代替,7画以上用7画代替,点笔画设2-6画,1画用2画代替,6画以上用6画代替,横折、竖折、撇折不计笔画数,共26个数码,每一个汉字用四个码组成一个字符编码,1个形码,3个数码,每一个汉字有一个形码,数码的选取根据字的结构选取,汉字分解为十三种结构形式,每一汉字根据划分的部件为独体字、两部件组成的字和三部件组成的字,独体字数码的选取用笔画数和前三笔笔形构成三个数码,两部件组成的字,数码的选取,第一部件取笔画数和第一笔笔形构成一个数码,第二部件取笔画数和第二部件前两笔笔形构成两个数码,三部件组成的字用三部件的笔画数和三部件的第一笔笔形构成三个数码。
两个以上的字组成的词也采用一个形码,三个数码组成词符编码,四码一词,词的编码的第一个码采用第一个字的形码,其余数码根据不同的字数来取,二字词,第一个字取一个数码,第二个字取两个数码,三字词,第二个字取两个数码,第三个字取一个数码;四字词,第二、三、四字各取一个数码,五字词,第三、四、五字各取一个数码,六字词,第三、五、六字各取一个数码,七字以上的词,第三、五、七字各取一个数码。
本发明汉字编码方法可以用来编排汉语字、词典等工具书,汉字、词符集的编排均按结构-笔形-笔画数,分类顺序排列,结构形分为独体-上下-左右-包围4大类,每一大类根据结构形分为小类,共十三小类,笔形分横-竖-撇-点4大组,横折、竖折、撇折在横、竖、撇后面,笔画为小组按序从小到大排列。
本发明提供的键盘至少包括26个英文字母键和一个空格键,将英文键盘的26个字母键分为2个区,左区QWERTASDFZXCV13个字母键,右区YUIOPGHJKLBNM13个字母键,键盘左区的每一个键位对应一个汉字结构形码,键盘右区的每一个键位对应一个汉字结构形码,26个数码键对应排列在键盘上。
本发明的主要优点是编码方法简单一致,字符和词符形式统一,徒手使用和计算机输入方法通一,对所有汉字、词语无一例外,是一种全息型码,用作计算机的输入排检,字、词兼容,统一编排,四码等长,26个键操作方便,用于徒手排检,可适用于汉语字、词典等工具书的编目索引,编码规则少,规律性强,易学、易用、易记,重码少,效率高,通过对两万多个字词的测算,字的重码率不超过12%,词的重码率不超过10%,单个字词重码最多为5个,80%为1个重码,适用于繁、简体字,应用范围广泛,识码准确,排检迅速。


图1是汉字取码总表。
附图2是汉字符集排检表。
附图3是汉字形码在键盘上的排列。
附图4是汉字数码在键盘上的排列。
附图5是汉字形码、数码在英文键盘上的排列。
下面结合附图对本发明作进一步的说明。
本发明将汉字化简定位,把汉字的结构抽象为符号,作为编码中的汉字形象代码,根据汉字的结构,将汉字划分为十三种形式,独体结构形,上下结构形,左右结构形,包围结构形,上下加上下结构形,上下加左右结构形,上下加包围结构形,左右加上下结构形,左右加左右结构形,左右加包围结构形,包围加上下结构形,包围加左右结构形,包围加包围结构形,每一种结构形给一个形码,用英文字母作符号,独体结构形,例如天,用“囗”表示,符号A,上下结构形,例如芒,用“
”表示,符号B,左右结构形,例如林,用“
”表示,符号M,包围结构形,例如国,用“
”表示)符号O,上下加上下结构形,例如盒、苦,用“
”表示,符号BB,上下加左右结构形,例如华、花,用“
”表示,符号BM,上下加包围结构形,例如恩、茵,用“
”表示,符号BO,左右加上下结构形,例如故、持,用“
”表示,符号MB,左右加左右结构形,例如例、彬,用“
”表示,符号MM,左右加包围结构形,例如欧、河,用“
”表示,符号MO,包围加上下结构形,例如赵、周,用“
”表示,符号OB,包围加左右结构形,例如鼎、麻,用“
”表示,符号OM,包围加包围结构形,例如彪、疯,用“
”表示,符号OO,字体结构的划分要有明确的界线,相对完整,从大到小,合体字最多划分为三个部件。对分解后的简单部件,用部件笔画数和部件的起笔笔形作为数码,划分后的汉字部件用每一部件的笔画数和每一部件第一笔的笔形作为编码的数码,笔形分为横包括提一
、竖丨、撇丿、点包括捺丶
、横折包括所有横起笔的折笔
乛乙了、竖折包括所有竖起笔的折笔
、撇折包括所有撇起笔的折笔
七种,笔画数横、竖、撇三种笔形设2-7画,1画用2画代替,7画以上用7画代替,点笔画设2-6画,1画用2画代替,6画以上用6画代替,横折、竖折、撇折不计笔画数,共26个数码,每一个汉字用四个码编码,1个形码,3个数码,每一个汉字有一个形码,数码的选取根据字的结构选取,汉字分解为十三种结构形式,划分为三大类,独体字例如王、两部件组成的字例如汪和三部件组成的字例如花,独体字数码的选取用笔画数和前三笔笔形构成三个数码,例如木独体类,是4画,前三笔是横、竖、撇,它的数码是4横、4竖、4撇,两部件组成的字数码的选取第一部件取笔画数和第一笔笔形构成一个数码,第二部件取笔画数和第二部件前两笔笔形构成两个数码,例如杜,第一部件是4画,起笔笔形是横,数码为4横,第二部件笔画数为3,前两笔笔形横、竖,数码为3横、3竖,杜的数码为4横、3横、3竖,三部件组成的字用三部件的笔画数和三部件的第一笔笔形构成三个数码,例如花,三部件的笔画数为3画、2画、2画,三部件第一笔笔形为横、撇、撇,数码为3横、2撇、2撇,数码的排列按字的部件书写顺序,包围类一律按先外后内的顺序排列。
在用作计算机输入时,有三对部首“氵-忄”、“扌-土”、“木-王”使用频率特别高,而笔画数相同,容易引起重码,为避免重码,在两部件组成的字中的M、MB、MM、MO四种结构中,采取将其中一个部首的笔画数加倍计算的方法,将“忄”、“土”、“王”笔画数加倍计算,改变数码,例如坏、怀、环。对中、日、目、田、申、
和月、贝、见、且、
两类字形特别多,笔画数和前两笔笔形相同,出现重码多,对中、日、目、田、申、四的口形只取一笔竖,如需要再取笔形,则按笔顺取下面的笔形,例如田字,它的数码5竖、5横、5竖,口形的5横折和5横不取数码。
两个以上的字组成的词也采用一个形码,三个数码组成词符,四码一词,词的编码的第一个码采用第一个字的形码,其余数码根据不同的字数来取,二字词,第一个字取一个数码,第二个字取两个数码,第一个字如果是合体字,要避开部首取数码,取原字符的第二个数码,例如车间,它的编码为A、4横、3点、4竖,例如社会,它的编码为M、3横、2撇、2横,三字词,第一个字不取数码,第二个字取两个数码,第三个字取一个数码,例如思想性,它的编码为B、4横、5竖、3点,四字词,第二、三、四字各取一个数码,例如生活资料,它的编码为A、3点、2点、6点,五字词,第三、四、五字各取一个数码,例如人民共和国,它的编码为A、3横、5撇、3竖,六字词,第三、五、六字各取一个数码,例如科技英语语法,它的编码为M、3横、2点、2点,七字以上的词,第三、五、七字各取一个数码,例如中华人民共和国,它的编码为A、2撇、3横、3竖。
本发明汉字编码方法可以用来编排汉语字、词典,汉字、词符集的编排均按结构-笔形-笔画数,分类顺序排列,结构形分为独体A-上下B.BB.BM.BO.-左右M.MB.MM.MO.-包围O.OB.OM.OO.4大类,每一大类根据结构形分为小类,共十三小类,笔形分横-竖-撇-点4大组,横折、竖折、撇折在横、竖、撇之后,笔画为小组按序从小到大排列。
本发明提供的键盘至少包括26个英文字母键和一个空格键,将英文键盘的26个字母键分为2个区,左区QWERTASDFZXCV13个字母键,右区YUIOPGHJKLBNM13个字母键,键盘左区的每一个键位对应一个汉字结构形码,Q(BO)W(BM)E(BB)R(B)T(A)A(MO)S(MM)D(MB)F(M)Z(OO)X(OM)C(OB)V(O),键盘右区的每一个键位对应一个汉字结构形码,Y(A)U(B)I(BB)O(BM)P(BO)G(M)H(MB)J(MM)K(MO)L(OO)B(O)N(OB)M(OM),左区的形码键用作词符键,右区的形码键作为字符键,字、词混打,不用换挡,26个数码键对应排列在键盘上,每一个键位对应一个数码键,与英文键盘对应,左区Q(6竖)W(5竖)E(4竖)R(3竖)T(2竖)A(5点)S(4点)D(3点)F(2点)Z(6点)X(7撇)C(7竖)V(7横),右区Y(2横)U(3横)I(4横)O(5横)P(6横)G(2撇)H(3撇)J(4撇)K(5撇)L(6撇)B(横折)N(竖折)M(撇折),例如河,它的编码是MO、3点、2横、3竖,对应英文键名KDYR,河流,它的编码是MO、2横、3点、4点,对应英文键名AYDS。笔形可以用符号代替,横-(一),竖-(丨),撇-(丿),点-(丶),横折-
,竖折-
,撇折-

权利要求
1.一种汉语字词全息编码方法及键盘,其特征是在于对汉字进行整体性抽象分析,将汉字化简定位,把汉字的结构抽象为符号,作为编码中的汉字形象代码,对分解后的简单部件,用部件笔画数和部件的起笔笔形作为数码,形码和数码结合组成编码对应汉字。
2.根据权利要求1所述的汉语字词全息编码方法及键盘,其特征是将汉字划分为十三种形式,独体结构形,上下结构形,左右结构形,包围结构形,上下加上下结构形,上下加左右结构形,上下加包围结构形,左右加上下结构形,左右加左右结构形,左右加包围结构形,包围加上下结构形,包围加左右结构形,包围加包围结构形,每一种结构形给一个形码,用英文字母作符号,划分后的汉字部件每一部件的笔画数和每一部件第一笔的笔形作为编码的数码,笔形分为横、竖、撇、点、横折、竖折、撇折七种,笔画数横、竖、撇三种笔形设2-7画,1画用2画代替,7画以上用7画代替,点笔画设2-6画,1画用2画代替,6画以上用6画代替,横折、竖折、撇折不计笔画数,共26个数码。
3.根据权利要求2所述的汉语字词全息编码方法及键盘,其特征是一个汉字用四个码编码,1个形码,3个数码,每一个汉字有一个形码,数码的选取根据字的结构选取,汉字分解为十三种结构形式,每一汉字根据划分的部件为为独体字、两部件组成的字和三部件组成的字,独体字数码的选取用笔画数和前三笔笔形构成三个数码,两部件组成的字的数码的选取第一部件取笔画数和第一笔笔形构成一个数码,第二部件取笔画数和第二部件前两笔笔形构成两个数码,三部件组成的字用三个部件的笔画数和三部件的第一笔笔形构成三个数码。
4.根据权利要求2所述的汉语字词全息编码方法及键盘,其特征是汉字、词符集的编排均按结构-笔形-笔画数,分类顺序排列,结构形分为独体-上下-左右-包围4大类,每一大类根据结构形分为小类,共十三小类,笔形分横-竖-撇-点4大组,横折、竖折、撇折在横、竖、撇之后,笔画为小组按序从小到大排列。
5.根据权利要求1、2、3所述的汉语字词全息编码方法及键盘,其特征是键盘至少包括26个英文字母键和一个空格键,将英文键盘的26个字母键分为2个区,左区QWERTASDFZXCV13个字母键,右区YUIOPGHJKLBNM13个字母键,键盘左区的每一个键位对应一个汉字结构形码,键盘右区的每一个键位对应一个汉字结构形码,26个数码键对应排列在键盘上。
6.根据权利要求5所述的汉语字词全息编码方法及键盘,其特征是键盘左区的每一个键位对应一个汉字结构形码,Q(BO)W(BM)E(BB)R(B)T(A)A(MO)S(MM)D(MB)F(M)Z(OO)X(OM)C(OB)V(O),键盘右区的每一个键位对应一个汉字结构形码,Y(A)U(B)I(BB)O(BM)P(BO)G(M)H(MB)J(MM)K(MO)L(OO)B(O)N(OB)M(OM),左区的形码键用作词符键,右区的形码键作为字符键,字、词混打,不用换挡,26个数码键对应排列在键盘上,每一个键位对应一个数码键,与英文键盘对应,左区Q(6竖)W(5竖)E(4竖)R(3竖)T(2竖)A(5点)S(4点)D(3点)F(2点)Z(6点)X(7撇)C(7竖)V(7横),右区Y(2横)U(3横)I(4横)O(5横)P(6横)G(2撇)H(3撇)J(4撇)K(5撇)L(6撇)B(横折)N(竖折)M(撇折)。
全文摘要
本发明汉语字词全息编码方法及键盘的关键构思在于对汉字进行整体性抽象分析,将汉字化简定位,把汉字的结构抽象为符号,作为编码中的汉字形象代码,对分解后的简单部件,用部件笔画数和部件的起笔笔形作为数码,形码和数码结合组成编码对应汉字。本发明的主要优点是编码方法简单一致,对所有汉字、词无一例外,是一种全息型码,用作计算机的输入排检,字、词兼容,统一编排,四码等长,26个键操作方便,用于徒手排检,可适用于汉语字、词典等工具书的编目索引,编码规则少,规律性强,易学、易用、易记、适用于繁、简体字,应用范围广泛。
文档编号G06F3/023GK1064556SQ92101660
公开日1992年9月16日 申请日期1992年3月10日 优先权日1992年3月10日
发明者刘国桢 申请人:刘国桢
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1