层次结构汉字编码法及其键盘的制作方法

文档序号:6410730阅读:636来源:国知局
专利名称:层次结构汉字编码法及其键盘的制作方法
技术领域
本发明涉及一种新的汉字编码法及其键盘,其中包括一套新的汉字字型划分方案及其拆分方法,和与此相适应的两套码长分别为5码和6码的键盘汉字输入方案。
随着计算机等技术的讯速发展,以键盘输入为主的汉字输入技术已成为中文信息处理技术领域地重要分支。经过近20年的发展,国内已提出的输入方案已达近千种,其中已形成生产力的已达20余种。这些方案除电报码、区位码外从方法上基本上可归为音码、音形码和形码三类。
目前市面上已流行的智能ABC、双拼双音等均属于音码范筹。音码的特点是好学易用,但重码太多,速度太慢及难以实现盲打是该类方法的缺点。虽然目前该类方法均采用了以词组输入为主的技术以减少重码和加快速度,但这并不能有效地将重码率降低到很低的限度,操作者仍不能摆脱对屏幕的依赖。
目前市面上流行的五笔字型、太极、郑码、表形码等均属形码。形码的特点是重码率低,一般只有3%左右。因此可实现高速盲打。但使用该类方法的先决条件是必须首先记住大量字根,如五笔字型最新板本字根总数是199个,郑码为170多个,而表形码超过了360个,这就为一般人员的学习和使用带来了较大的困难。同时重码仍为该类方法不能忽视的问题。以五笔字型为例,在国标(GB2312—80)6763个汉字中,有246组重码,最多一组涉及4个汉字,总共涉及500多个汉字。虽然通过安排简码可分散一部分重码,但仍有102组重码没有得到异化。说明形码在本身体系上仍有难以逾越的缺陷。
目前市面上常见的大众音形码、四笔声形码、自然码等均属于音形码。该类方法重码率居中,一般在5%—8%,学起来也比较容易,但要完全熟练掌握仍有一定难度。因为该类方法仍需记住大量字根,比如四笔声形字根数量为380多个,虽然这些字根大多同其发音一致,但要记住这几百个可以使用的和几十个特殊规定的字根本身已非易事了。
总之在目前已有的各种输入法中普遍地存在着“易学的打不快,打得快的不易学”的问题。因此还没有一种方法能在计算机用户中占绝对优势,多种输入方法并存的局面很难打破,这表明目前用于编码的汉字输入理论及汉字结构理论存有缺陷。主要表现在
1、现有的主流理论认为为了提高打字速度,汉字编码的码长以小于4码为好,因为若以26个英文字母为码元集,4码的编码空间就可达40万个,相对于6763个汉字来说是足够了,所以目前绝大多数编码方案均选用4码和3码。实际上这就大大地低估了汉字本身的规律性,结果是按3码和4码建立起来的各种输入方案均有数百个重码字,均没有从根本上解决汉字的重码问题。特别是在计算机汉字输入技术发展到以词输入为主的今天,该编码空间更显得不足。
2、在汉字的结构上,大多数编码设计人应用了字根是最小构字单位的概念,所以在拆字时使用了固定字根的方法,其数量从几十个到几百个不等。这此均需要使用者强记,这是该类方法难学易忘的主要原因。同时在一个汉字中这种字根绝大多数只含有2~3个,这导致了在一个汉字中提取的信息量不足。另一方面由于大都采用顺序取码方式,又容易使含有5个字根以上的汉字编码,漏掉关键性的区别信息。如对“羸、嬴、赢、蠃”这四个字,许多方案都不能区分,五笔字型对它们的编码均为YNKY,大众码为LLDJ,太极码为TMGT。这就是该类方法不可能消除重码的原因。
本发明的目在于避免上述汉字输入法的不足之外,提供一类兼顾易学性和高效性的汉字键盘输入编码方案。
本发明的目的可通过如下技术方案来达到提供一套新的汉字字型划分方案和在此基础上的汉字逐层拆分方法和取码方法,通过把这些方法纳入人们已有的知识体系中,使之具有易学性的特点,同时由于采用对汉字进行逐层拆分的方法,可以提取到足够的信息量,从而达到大大降低重码率的目的。
在本发明中将汉字定义为由两个一级字根按照一定的位置关系组成的块。而一级字根是由两个二级字根按一定的位置关系而组成的块。依次类推,可定义三级字根,四级字根等,最后末级字根就是由二个笔画按一定的位置关系而构成的块。
取码时对字和字根以取音为主,对某些没有读音却常用的字根也做了一些硬性规定、如

图1,对本身有读音或已规定了取码的字根称为成字字根,否则称为不成字字根,不成字字根是必须进一步拆分的字根。对字或成字字根取码时所用的音主要指该字汉语拼音的首字母。(其中zh、ch、sh用u、v、i代替)和规定韵母。规定韵母一般指韵母的末字母,对单韵母来说就是该字母本身。例外情况是ei、ui和ou是按发音来归类的,其中ei、ui、归入a,ou归入o,这样实际使用的韵母为7个,即图2。
字根的代码分全码和拆分码两种。对成字字根全码指整字根拼音首码或硬性规定码,对不成字字根全码是次级字根的首字根码(取前时)或末字根码(取后时)全码一般是单码。如夫(F)、人(R)等,拆分码指将整字拆分成次级字根后的两个字根码。拆分码一般是双码。如夫(ER)人(PN)。笔画只有全码没有拆分码。
在本发明中将汉字的笔画归为两类,一类为线状笔画,包括横(一)H、竖(丨)I、撇(丿)P、捺(_)N、点(丶)D、提(
)T;另一类为块状笔画,包括钩(
ㄋ)G、折(
_ )U、刺(乛、亅、
)C及Z(
、乙、
)。除明确规定的外,其余笔画可以稍有变形,或方向上旋转。如乛、亅均为C,乚、
均为G,_、_、
均为U。U和C的区别是U的两段长度相同,且均为直笔,而C的两段长度不等,有时一段是弯的。如“登”左上角的“
”即为C。
在本发明中,对于少于三画的汉字取码方式为拼音首码+规定韵母码+第一笔画码+第二笔画码+第三笔画码,笔画不足三画的用空格键结束。如一YIH、乙YIZ、二ERHH、人RNPN、入RUPN、工GGHIH、土TUHIH、兀WUHPG、万WNHPG等,此类汉字共86个。无重码。
对多于四画的汉字,则根据字中字根的连接关系和字型,分区后编码,5码方式为拆分成A、B两区,整字编码为拼音首码+A区拆分码+B区拆分码;6码方式为拆分成A、B、C三区,整字编码为拼音首码+A区拆分码+B区拆分码+C区全码(或拆分末码)。在对汉字进行拆分时,要尽量不拆出单笔画。字根的连接关系分为交、连、随、散四种,字型即指汉字整字的字型,也指字根的字型有交体型、叠体型、上下型、左右型、夹型、串型、右上带点型7种,下面主要根据取5码的情况分别进行说明。
一、连接关系
1、交指两个笔画相交,有一个交叉点。如十、
等。
2、连指字根之间必须连接在一起,否则算错。如“厂”中的“一”“丿”、“革”中的“廿”“
”、“目”中的“口”“二”等。
3、随指字根之间可以连在一起,也可以不连接在一起,二者均算对。如“类”中的“米”“大”、“主”中的“·”、“王”、“玉”中的“王”“丶”等。
4、散指笔画、字根之间必不可连在一起,否则算错。如“吕”中的两个“口”,“句”中的“勹”“口”等。
这些连接关系的强度一般由散到交依次增强,但首或末笔的随的连接强度高于次笔的连,如主中“丶”和“王”之间的连接强度要高于“亠”和“土”之间的连接强度,首或末笔连的连接强度要高于组成框的连接强度,而后者又高于其它连的连接强度。如“自”中连接强度最弱的是“
”和“二“之间,其次是“
”和“_”之间。
二、字型及汉字拆分字型的划分主要是看一个字中最弱的连接关系出现在字的什么部位
1、左右型在一个汉字的字根之间出现贯穿上下的散或随的关系则该字属于左右型的字。如引、肭、相、招等。另外结构上主要是左右型,但中间有一笔连接笔画的字,应将该笔剪断后视为左右结构的字。如我、戢。
划分A、B区时,左右结构的字应从最左边的散或随处拆开,左边为A区,右边为B区。如“渊”应拆成“氵”和“
”,“鹕”应拆成“古”和“
”、“招”应拆成“扌”和“召”等
取码时,若A区是左右结构的字根,同样从最左边的散或随处拆开,左边取1码,右边取1码。若右边是不成字字根则应继续拆分,对左右型取前面字根码,对上下型取上部字根码。如“羸”拆分后A区为
为左右型结构字根,拆分后左边为“月”码为Y,右边为“
”为不成字字根,仍为左右型结构,则再次拆分为“羊”和“凡”取前部字根码Y,这样A区码为YY。又如“崔”拆分后A区为“隹”仍为左右形字根,拆分后左为“亻”码为R,右为“
”为不成字字根,且为上下型,拆分后为“亠”和
,取上部字根码B,则A区编码为RB,若B区是左右型结构的字,拆分方法和A区相同,只是第二码要取后取下。如“鹕”拆分后B区为“
”,为左右型结构的字根,码为YN,上两例若位于B区,则
的码应为YF,“
”码应为RU。另外具有“辶”“廴”结构的字也应视为左右结构的字。
2、上下型在一个汉字的字根之间出现贯穿左右的散的关系,或着除首末笔画外上下字根、笔画之间仍有连的或随的关系,则该字为上下型结构。如主、旦、赢、革等。
上下型结构的汉字划分A、B区时,若是散的结构则从最下部散处划分,下为A区,上为B区。如“亘”A区为“一”B区为“
”、“吴”A区为“天”B区为“口”,但对有“人”或“一”的字则从“人”或“一”处划分。如“嵛”A区应为“俞”,B区应为“山”、“禀”A区应为“示”,B区应为“
”另外下部为“鱼”字结构的则“鱼”为A区其余为B区。
对以随或连相连接的上下型结构的字,若只有一个随或连的连接点,则从该处直接划分如“共”A区为“八”B区为“
”、“革”A区为
”B区为“廿”,若有多个随或连的连接点则从均衡处划分,即划分后A、B两区尽量均为成字,否则从下部划分,如“冀”A区为“共”B区为“

取码时,若A或B区仍为上下结构的字根则应上下拆分为后各取一码。如“部”拆份后A区为“咅”则上码为L,下码为O,若可拆分成多个部分,则应取上码和最下码,如“
”拆分后A区为“
”,则应取“士”和“角”码,即IJ,若下部为不成字字根且为内外结构的字则取内,如“敲”拆分后A区为“高”上部取“亠”码为B,下部取“冋”为不成字字根,则应取“口”码O。B区取码方式相同。
在一个汉字中,若上下,左右均有散的构型则以上下型优先。如“翳”应归为上下型,A区为“羽”B区为“殹”另外在以交叉或连接笔画大于90°夹角内含有字根时,也应视为上下结构的字。如历、友、或、病等。A区别为“力、又、
、丙”,B区分别为“厂、ナ、
、疒”。
3、交体型在一个汉字中去掉以连或随相连接的首末笔后,若剩余笔划只有一个交叉点,或横向有两个交叉点,则属于交体型,如王、干、开等。
对交体字,若去掉以连式随与其余部分相连接的首末笔后,其余部分为成字字根,该首末笔为A区,其余部分为B区。若首末均有单笔画则以末笔优先拆分。如“王”A区为“一”B区为“干”,“干”A区为“一”B区为“十”否则按笔画拆分,如“十”可拆成“一”“丨”等。取码时,金码取整字字根码,拆分码取按上述拆分规则拆分后各字根码。如“王”拆分码为GH,“壬”为QH,“干”为HX,“十”为HI等。
4.叠体型在一个字或字根内部出现交、连、随、散的关系,或多个字根在空间位置上相互重叠的构型。如回、半、冉等,当出现首末单笔是以连的关系同叠体型字根相连时,也归入该类。如央、西、夷等。根据叠体型字中各字根的位置情况,又可分为内叠、外叠、叠交三种情况。
(1)内叠除首末单笔画外,外围字根从三或四面包围其余笔画、字根或其主要部分的构型。如回、包、目、白、巫、玉、匡、司等。
(2)外叠某几笔画包含在其它几笔或折笔所形成的小于90°的字框内的结构。如半、业、止、米等。
内叠和外叠字的拆分规则和取码规则相同,均是将框作为A区,其余部分为B区,如“句”A区为“勹”B区为“口”,“米”A区为“十”B区为“
”、“业”A区为“
”B区为“丷”,“止”A区为“丄”B区为“
”等。
取码时,全码取整字根码,如,“米”全码为M,“半”为B,取拆分码时框取1码,其余部分取1码,如上两例的拆分码分别为XS和FB,“止”的拆分码为TI(A区)或TII(B区)
(3)叠交型某几笔画同其它几笔画所构成的区域重叠并相交。如西、夷、重、曳等。叠交根据各字根所围成区域的覆盖情况又可分为以下四种情况。
a、区域叠交,即两个叠交的字根共用全部或部分区域,如西、夷、重等。拆分时在整字中位置比较高、面积比较大的字根在A区,其余为B区,如“西”A区为“兀”B区为“口”、“夷”A区为“大”B区为“弓”“重”A区为“
”B区为“日”,“再”A区为“王”B区为“冂”当区域叠交字或字根位于A区或B区,取拆分码时按上述拆分规则拆分后,两字根各取一码。如“再”拆分码为WK,“夷”拆分码为DG,“西”的拆分码为WO等。
b、插入式叠交即两个字根中有一个字根用某一笔画的延长线插入另一个字根中。如央、币等,对该类型的字或字根拆分和取码时,只要将该单笔画拔出后按上下型结构字处理,同时拔出时应尽量拔成成字、如
应拆成“中”和“三”,“里”应拆成“日”和“土”,“丰”应拆成“十”和“二”。
c、插出式叠交即处于框内位置上的字根以单笔画伸出框外,而构成的字型。如内、
等,对该类字或字根拆分或取码时,将该伸出笔画缩回后按内叠字处。
d、单笔叠交即一个单笔同一个字根叠交,如甲、由、申、中、廿等,除甲、由、申外,其余按笔画次序拆分,如“中”A区为“口”,B区为“丨”“廿”A区为“一”B区为“
”,甲、由、申拆分时A区为“十”B区为“口”。
取码时,除甲、由、申外其余同其拆分次序一至,如“中”拆分码为OI,“廿”拆分码为HK,对甲、由、申三个字取拆分码时第一码取整字声母码,第二码取“十”的规定码X,则甲、由、申的拆分码分别为JX、YX、IX。
5.右上带点型指发、甫、犬、戈、戊右上带有一点的结构,拆分时忽略该点然后进行拆分和取码,若忽略该点后,其余部分少于三画的按小于三画的字取码,如“戈”码应为GEHCP,“犬”编码应为QNHPN。若右上带点的结构出现在A或B区,取拆分码时,若去掉该点后其余部分为成字字根则取该字根码和“
”码D,如“犬”拆分码应为DD,“
”拆分码为YD,若去掉该点后其余部分为不成字字根,则忽掉该点,其余部分拆分后取码。如“戊”拆分码应为VV,“戈”拆分码应为VP,“发”拆分码应为UY等。
6.夹体型指水、非、小、永、北、兆等及与这几个相似结构的字,拆分时被夹笔画为A区,其余笔画为B区,如“非”A区为“
”B区为““
”,“永”A区为“
”B区为
。取码时若夹体型字根位于A或B区,则拆分码头码取整字拚音首码,第二码取被夹笔画码。如“非”拆分码为FE,“永”为YG,“小”为XC等。
7.串体型指除首末连或随笔外,其余笔画首尾相连而成环形结构。如凹、乓等,对该种类型的字整字取码时,第一、二码取整字拼音首字母码和规定韵母码,第三、四、五码取第一、二、末笔画码。如“凹”编码为AOIZH,丘编码为QUPIH。若该型字位于A或B区,则按结构拆成两个最大成字字根取码。如“凹”为内叠字拆分码为KJ,“凸”为上下结构,拆分码为JK,“丘”应拆成“
”和“工”后取码VG,“乒”拆分码为QP。
注1.在叠体字结构中出现外叠、内叠、叠交的混合结构时,则三者的优先次序为外叠、内叠、叠交,如“
”应为外叠形字根,“肉”为内叠型字。
注2、对一个字或字根进行拆分时总是从连接最弱处拆分。如“与”和“
”应分别视作“一”和“灬”同“
”内叠。
三、单字取码规划
首先将汉字按拆分规则分成A区和B区,然后对A区和B区分别取码。
(一)、A区取码规则
1、对即常在汉字的左边又常在汉字的下部出现,且有变化笔画的成字字根,分取整字字根码和变化笔画码。如“桉”和“案”中的“木”应分别取MD和MN,这样的字根有
_TT—土TH
MD—木MN
MT—马MH
YT—鱼YH
HD—火HN
NT—鸟NH
NT—牛NH
WT—王WH
VH—车VH
LT—立LH
另外有些虽然没有上述字根的变化,但取码方式上也归入该类的字根有两组,即扌IT—手 IH—
IP和XD—心XH
2、应指明位置或状态的字根
阝E Z(在左),若在B区则为EY(在右)口OO(在左,或在右)—OX(在下部)—DO(内有字根)
3、二、三笔画的常见字和偏旁部首,交体字及内叠型字中内部笔画两头连在框上的字,取整体拼音首字母+规定韵母。如月YE 白BI用YG 又YO 女NU 乃NI 廿NN 久JU 大DA 亻RN 厶SI 七QI 丘QU 子ZI 孑JE ㄨVA 兀WU 久WN 片PN 毛MO 廴VE 必BI 互GG 丈UG之 UI巾JN 犭QN 了LO等。
4、较复杂的偏旁部首取整体声+上部或上部字根声。如衤YB礻IB石IO 饣IC 门MG 辶VD 讠YZ 钅JR 彳PR
5、上下结构的字和叠体字则按拆分规则拆分后取拆分码。(二)B区取码规则
1、艹、鸟、山、刂、_、口取规定码CO、NO、IN、DO、UU、OO
2、其余均取拆分码。
对在A区和B区取拆分码的情况,若两个字根大小、方向一至则第二码用A来代替。如“琶”拆分后B区为“
”则码应为WA。又如“葭”拆分后A区为“叚”为左右型结构的字,则“
”和“
”应各取一码,但二者均不是成字字根,则应拆分后分别取码,取码的字根均为“_”则码应为KA。
(三)字编码举例赢YYBWO 提 TITRR 鹕HXOYN 蝴HUTGY压YTDHP 叭BOOPN 依YRNBZ 限XEZIZ固GDOXO 锢GJROG 逊XVDJX
四、词编码规则
对二字词,第一码和第二码分别是该二字汉语拼音的首字母码,第三码是第一个字拆分后的前码,第四、五码是第二个字的拆分码。如高兴GXBCB但是DIRRR 体会THRRY 同学TXKSZ迅速XSVVS 汉语HYSYW等。
对三字词,前三码取每个字拼音首字母,第四码取第一个字拆分后的首码,第五码取第三个字拆分后的末码。如国务院GWYOW 怎么样ZMYZY等。
对四字词,前四码为每个字的拼音首字母,第五码为第一个字拆分后的首码。如比比皆是BBJIQ 半壁江山BBJIF 大公无私DGWSV任劳任怨RLRYR等。
对五字及五字以上的词,取前四个字及最末一个字的拼音首字母。如中国外交部UGWJB 中国外贸部UGWMB,中华人民共和国UHRMG等。
取六码时的情况同取五码时的拆分方式基本相同,对单字只是在分出A区后,若剩下部分仍是左右、上下或叠体型应再往前分一次而成为A、B、C三区,A、B区同取5码时A区和B区取码规则相同,C区取一码,对成字字根取全码,对不成字字根取拆分码。如同 TKGOOH 喱LOORTV 呖LOOGPV 笞TOXUDU等。
对二字词先取两个字的拼音首码,后四码分取两个字的拆分码。如高兴GXBOCB 但是DIRDRR 如果RGNORB等。
对三字词先取三个字的拼音首码,第四、五码分取第一、二个字拆分前码,第六码取第三个字拆分后码。如国务院GWYOWW 怎么样ZMYZPY 对四字词先取四个字的拼音首码,第五码取第一个字的拆分前码,第六码取第四个字的拆分末码。如大公无私DGWSVS 任劳任怨RLRYRX等。
对五字词先取五个的拼音首码,第六码取第一个字的拆分前码,如中国外交部UGWJBO
对六字及六字以上词的取前六个字及最末一个字的拼音首字母。如中华人民共和国UHRMGG。
本发明的优点主要表现在以下几个方面
一、由于只有少部分常用的字根采用归类或硬性规定的办法处理,所以具有易记性的特点,同时,绝大多数用拆分的办法取成字字根的代码,所以取码方式明确。
二、重码率极低可配置大容量词库,在国际GB2312—80所确定的6763个汉字中,在5码的情况下只有两组重码,即喱—呖(LOOVL)台—笤(TOXUD),而在6码的情况下则完全消除了重码。词重码率在包含5万条词的词库中,5码情况的重码率小于0.5%,而6码情况下基本消除了重码。
3、可有效地提高汉字输入效率。由于本方案以五或六码作为基本码长,且没有一个汉字或词采用完全相同的字母组合,这就为键盘的合理安排创造了条件。根据北京航空航天大学等单位所做的“现代汉语词频统计”,在现代汉语各类文章中,当覆盖50%词条数时,一字词为63个,二字词为672个,三字词为342个,四字词为344个。对这些词均可以简码方式输入。在本方案中,在26个字母键上每键安排五个有联系的字,这样共可字排130个高频字。如我W 你WW 他WWW 她WWWW 它WWWWW、中U 上UU 下UUU 左UUUU 右UUUUU等。另外在10个数字键上安排50个与数字有关的字。如一1 壹11 百111世纪1111 星期一11111、二2 贰22 千222 季度2222星期二22222等。对简码词采用一字一键的方式输入。如但是DI、如果RG、怎么样ZMY、不得不BDB、科学技术KXJI等。对编码字母完全一样的词末字母用“1”等代替。如事实I1等。
通过以上安排可大大提高汉字的输入效率,下面是本方案与五笔字型的比较。
根据现代汉语词频统计,在现代汉语的各类文章中,二字以上词,加上熟语,常用搭配,常用短句共占字数的70%左右。26个高频字占总字数的20%左右,其余10%为一般用字。以一篇1000字的文章为例(词均以二字词计算),二字词占700个字,高频字为200个,其余一般字为100个。由于本方案中的5万余条词库可覆盖词频统计中的99%的词,所以这700个字中的99%(即693个字)的字可用词语方式输入,其中一半可用简码(1.5键/字),另一半按正常编码输入(2.5键/字),所以在不出现错误的情况下,对这1000个字总击键次数为
346.5×1.5+346.5×2.5+200×2+107×5=2321键,平均为2.32键/字。
但由于对词库中所不包含的这1%的词,往往是打错后重打,则这7个字的击键次数应为7×(5+2.5)=52.5键,总击键次数变为2338.5键,平均为2.34键/字。
当然由于在这些词中还包含三字以上的词,所以平均击键次数还会有所下降。
若采用六码方式,则总击键次数为2601键,平均2.6键/字,可见即使是使用六码方式也比大多数三码方案击键次数少。
五笔字型最新的5.0版本中包含1.5万条词汇,可覆盖词频统计中90%的词,重码率约为2%,在不出错的情况下对这1000个字的总击键次数为2340键,平均2.34键/字。
但若对词库中所不包含的这10%的词是打错后重打,则总击键次数变为2480键,即2.48键/字。当然在这里还未考虑重码的影响。可见本方案中的5码方式比目前广泛使用的五笔字型方案具有更高的输入效率。
图1硬性规定的字根及其代码。
图2规定韵母表。
权利要求
1、一种层次结构汉字编码法及其键盘,其特征在于依据汉字中字根或笔画间的连接方式和字型,采用逐层拆分,分区取码的方式而形成的编码体系。
2、根据权利要求1所述的一种层次结构编码法及其键盘,其特征在于将汉字中的字根分成成字字根和不成字字根两种,字根代码分全码和拆分码两种。
3、根据权利要求1或2所述的字根代码取码方式有用u、v、i代替zh、ch、sn后的汉字拼音首字母;硬性规定代码、即图1;规定韵母码、即图2;及其相互组合。
4、根据权利要求1所述的一种层次结构编码法及其键盘,其特征在于将组成汉字的笔画分为线状笔画,即横、竖、撇、捺、点、提,和块状笔画,即钩、折、刺、Z两类十种,这10种笔画的代码分别为H、I、P、N、D、T、G、U、C、Z。
5、根据权利要求1所述的一种层次结构编码法及其键盘,其特征在于将汉字中字根、笔画间的连接方式分为交、连、随、散四种,字型分为左右型、上下型、交体型、叠体型、夹型、串型、右上带点型7种。
6、根据权利要求1所述的一种层次结构编码法及其键盘,其特征在于在码长为5码的情况下,除笔画数少于三画的汉字外,均依字型分为A、B两区,整字编码为整字拼音首字母码+A区拆分码+B区拆分码;在码长为6码的情况下分为A、B、C三区,整字编码为整字拼音首字母码+A区拆分码+B区拆分码+C区全码。
7、根据权利要求1或6所述的少于三画的汉字,其整字编码为整字拼音首码+规定韵母码+第一、二、三笔画码,不足三画的以空格键结束。
8、根据权利要求1所述的一种层次结构编码法及其键盘,其特征在于在码长为5码的情况下,二字词的编码为两字拼音首字母码+第一字拆分首码+第二字拆分码,三字词为三字拼音首字母码+第一字拆分首码+第三字拆分末码,四字词为四字拼音首字母码+第一字拆分首码,五字以上的词为前四个字及最末一个字的拼音首码;在码长为6码的情况下,二字词的编码为两字拼音首字母码+第一字拆分码+第二个字拆分码,三字词为三字拼音首字母码+第一字拆分首码+第二字拆分首码+第三个字拆分末码,四字词为四个字拼音首字母码+第一个字拆分首码+第四个字拆分末码,五字词为五个字拼音首码+第一个字拆分首码,六字以上的词为前五个字及最末一个字拼音首字母码。
9、根据权利要求1所述的一种层次结构编码法及其键盘,其特征在于可用在各种计算机中文信息处理系统中,也可以用于汉字电传机和各种通讯系统中。
全文摘要
层次结构汉字编码法及键盘,是根据汉字逐层拆分的原理,而建立起来的具有较强科学性的汉字键盘输入方法。发明将汉字及字根分为7种构型、4种连接关系,代码以取拼音首字母为主,从而具有记忆量小、易学的特点。同时将汉字的结构和拆分作为取码的主线,从而具有思路明确、单一的特点。另外极低的重码率,大容量的词库和合理的键盘布局使其具有较高的输入效率,其动态平均码长低于五笔字型等多数流行的编码方案。
文档编号G06F3/023GK1162145SQ96118660
公开日1997年10月15日 申请日期1996年4月8日 优先权日1996年4月8日
发明者白云山 申请人:白云山
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1