二维字根汉字编码方案的制作方法

文档序号:6602726阅读:431来源:国知局
专利名称:二维字根汉字编码方案的制作方法
技术领域
本发明设计了一种适用于通过计算机键盘进行汉字输入的《二维字根汉字编码方案》以下简称“二维码”,本“二维码”属于形码,在进行汉字输入时不要求一定要认识汉字或是正确掌握汉字的发音。只要会书写既可以正确取码输入。
目前在同类编码中已有许多广为用户使用的编码方案。如形码中有“表形码”,“汉字起末笔编码法”(G06F 3/023 87 1 00210),“汉字笔序形码编码输入法”(G06F 3/023 87 1 03761)“二维汉字形码”(G06F 3/023 87 1 06169)“五笔字型”(实用汉字五笔字型快速输入自学教程,吉林科学技术出版社)。音形结合地有“四笔声形码”(电脑写作一日通,化学工业出版社)“认知码”等。以上众多汉字编码对汉字计算机输入做出了重大贡献,使汉字计算机输入技术有很大的提高。
就目前汉字计算机输入技术的状况看,由于形码的重码率低,不受地方口音的防碍,输入速度快。在汉字输入中大有发展前途。可是现有形码输入技术有一定的局限性。主要缺点有以下四个方面。
1、根据形象相似利用英文字母和数字对汉字字根和结构进行编码的方案,由于汉字结构多和汉字的方块形结构与英文字母和数字没有有机联系,随意性较大,不容易掌握。
2、根据人为设定的规律进行编码的方案,规则多,键位与字根的联系复杂,难记,取码不符合汉字结构原理,语文教学方式和人们的书写习惯,取码时分析,联想过程复杂不容易掌握。
3、以音代形的编码方案,音形关系密切,好学易记。但由于汉字结构中的有机联系使人们无论如何确定音形关系都存在着大量的重码。为此有些编码方案不得不借助于汉字的发音区别重码。这样又不能充分体现形码自身的优越性。
4、除以上各种情况外。由于各种编码方案都过于强调规律性,虽然设定了很多的规则也无法有效的降低重码率。只好依靠人为设定简码以区别重码。有的方案为了区别重码要求记注大量的简码字,而记忆简码字的唯一根据是哪些是常用字。这对于中小学生可能还不算太大的问题。可越是文化程度高,掌握汉字多的人越难做到这一点。
本“二维码”方案的设计在一定程度上解决了以上提到的问题。基本符合汉字构形规律及汉字书写习贯,字根选取规范,取码少,编码规律性强,好学易记,汉字拆分简单。除不单独成字的偏旁部首以外,如亻、阝等没有重码。
一、字根编码方法
本“二维码”方案设有229个基本字根与64个联想字根。其中基本字根包括点、横、坚、撇,折等5个单笔画,40个常用偏旁部首及182个独体字。使用除I、O、U、V以外的22个英文字母和1~0,10个数字进行编码。229个字根中有84个一维字根码和145个二维字根码。
字母码按偏旁部首的名称及独体汉字汉语拼音发音的第一个字母编码。数字码按相容性编码。见“一维字根码表”“二维字根码表”。
二、偏旁部首名
本“二维码”方案选用了40个偏旁部首,其中大部分如亻,阝,宀等。有传统名称,一部分如勹亠等没有传统名称,在本“二维码”方案中对这些偏旁部首根据汉字结构的特点分别起了名。还有一些如艹、扌、疒等有传统名称的偏旁部首,根据本“二维码”方案的需要进行改名。见偏旁部首名简表。
三、联想字根码
汉字结构复杂,笔画组合很多,二百多个基本字根无法反映所有的笔画组合。为此选取了64种主要结构做为联想字根。通过这种联想的引导作用能有效的提高用户的理解力和记忆速度。
联想字根的按排根据是(1)结构形状相似,(2)字源相同。见“联想字根表”
四、功能码
在本“二维码”方案中设计了4个功能码。O为字根重复码,当同一字根连续出现时后面的字根用O代替,如“器”字一开始出现2个口编码为KOQK,“噩”字编码为WKOO。I、U、V为确认码,当一个字的编码不够四位时用确认码确认。
I,确认独体结构和杂合结构的汉字。如“吏”的编码为HKXI,“果”字为RMI,“疹”字为TRPI,“压”字为CTDI。
U确认上下结构的汉字。如“旦”字的编码为RHU,“草”字为ARSU,“呈”字为KWU。
V确认左右结构的汉字。如“按”字编码为FBNV,“利”字为HLV,“叭”字为KBV。
由于本“二维码”方案中I、O、U、V和1~0数字码均不出现在汉字编码的开头,所以,当一个汉字输入完时数字码可以直接输入,以上4个字母也可以定义出某种功能或是利用它们开头组合成各种键盘命令。方便汉字的输入和编辑。
五、汉字编码方法
1、普通汉字编码方法
本“二维码”方案采用4位码制。分别选用第一个,第二个,第三个和最后一个码按顺序组合为四位码。如“搽”字拆分后分别为扌,艹,人,木编码为FARM,“常”字拆分为小,冖,口,巾,而最后一个为二维码字根,所以编码为XPK0,“肠”字拆分后为月,第一个是二维码字根编码为Y1ZP,“放”字拆分后为方,攵是两个二维码字根组合后编码为F7W6。
2、字根汉字编码方法
(1)字根中独立成字的二维字根的编码均为二级简码字。键入字根码后加空格键凵确认。如“不”字的编码为B5凵,“可”字的编码为K4凵等。
(2)字根中独立成字的一维码字限的编码,首先键入字根码,然后再对汉字进行拆分取码。如“木”字拆分后为十,八编码为MSBI,“王”字拆分后为一,土编码为WHTI,“小”字拆分后为丨,八编码为XS6B。
(3)单笔画的编码,由于单笔画无法拆分,而且只能是独立结构,所以,编码是在单笔画码后边加I。如“一”的编码为HI,“乙”的编码为ZI,“丿”的编码为PI。
(4)不独立成字的偏旁部首的编码,由于偏旁两字发音的第一个字母都是P所以,只在字根码的前边加两个P。如犭,编码是PPCI,“扌”是PPFI等。
六、取码原则
1、按照笔顺原则。按汉字书写的笔顺先后进行取码。
2、取大优先原则。在取码中选择笔画最多的结构取码,如“须”字的第一位码的三个撇不能拆开,空字拆分为穴和工而不能把穴拆成宀、八。
3、一笔多用原则。为了方便取码,个别字中的一笔做为两笔使用。如“我”字拆分为手和戈。“戢”字拆分为口,耳和戈等。
4、兼顾直观原则。在按照以上各项原则取码时有时要照顾汉字书写的直观性。如“因”字的拆分为囗,大而不严格按书写笔顺拆分为冂、大和一。主字拆分为丶和王,而不按取大优先拆分为亠和土。另外在汉字结构中也存在直观的问题。如“森”字直观认为是木字下面加一个林字,而焱和品等一般认为是杂合结构。
七、简码字
1、自然简码字
本“二维码”方案中有大量的自然简码字,其中,一种是独立成字的二维字根和两个单笔画字。另一种是由确认码确认的不足四位码的汉字。如“艾”字编码为AXU,“扒”字编码为TBV,“尘”字编码为XTU等。
2、人为简码字
本“二维码”方案为了减少汉字码位和取码简单,提高输入速度,人为地设定了大量的简码字。其中,除I、O、U,V四个键位以外每个键位上设定了一个一级简码字如“的”字为B,“指”字为F,“和”字为H,“这”字为W等。
取汉字编码中前两个字母的各种组合设定了481个二级简码字。如,“苯”字为AM,“答”字为ZR等。
同样分别取前三个字母设定了三级简码。
在《国标汉字信息字典》的一级字库中各级简码字占77.3%在一、二级字库中的6763个汉字中各级简码字占65.99%。
全部共4463个简码字,不论是自然简码字还是人为简码字基本不要求认真记意。因为所有的简码字均有按编码规则编的全码。如,“和”字有H,HKV两种码,“指”字有F,FB2R两种码,“床”字有GM,GMI两种码,“给”字有LRH,LRHK两种码等。
在全部简码字中只有66个字的全码造成重码字,而且,每组中只有两个字。如,“什”和“仕”两个字的编码均为DSV,什字有二级简码DS而在DSV码中仕为默认字,什为选择字。这样66组重码字就全部区别开了。如,还有“队”和“阳”字的编码为ERV而队字有二级简码。
八、次码字编码方法
在本“二维码”方案中有两组字,“徽、微、徵”,编码为C6S6,“赢、嬴、蠃、羸”,编码为W0KF。由于重码字多,用简码无法区分,但只有两组七个字,为了在方案中消除重码字在保留原来的编码的情况下进行特殊的编码。最后一位码取自于倒数第二个字根进行编码。如,“徽”C6SX“微”C6SJ“徵”C6SW“赢”W0K6“嬴”W0KN“蠃”W0KC“羸”W0K5这样以上七个字即可以用原码输入也可以用次码输入。
用户通过一段时间的熟练,掌握了66个重点简码字和7个次码字以后本“二维码”方案除不单独成字的偏旁部首以外没有一个重码字。
一维字根码表
二维字根码表
联想字根表A 艹(廾)
B 八(丷) 巴
卜()C 厂(丆) 车(車)屮
D 东
丁(
丅)丶()癶(登)E 阝(卩
)
F 扌() 丰
H 一

J
) 金(钅)
(祭)L 纟
立(
)N 牛(
) 内
P 片(丬
爿) 丿(彡厂
Q 且

R 人()S 水(氵巛巜
示(礻)食(饣) 山 (彐
) 四
手()丨()W 无
文(攵)X 小(忄) 夕
Y 言(讠) マ(ス)Z 走(辶 廴) 止
足()
字根名简表A 艹 (艾)衤 (袄)
(哀)C 豸 (豺)爫 (采) 屮 (出)
(曹)D
(段)夂 (冬)E
(尔)
(厄)F 扌 (扶)
(阜)G
(共)J
(介) 勹 (句)L  (兰) 虍 (虑)M
(卯) 亠 (亩)Q  (青)
(券) 匚(区)T 疒 (痛)W 冂 (网)X ㄨ (凶) 凵 (凶)Y マ (甬)Z ナ (左) 耂 (者)
权利要求
(1)本发明《二维字根汉字编码方案》简称“二维码”,适用于计算机汉字输入,主要设计特征是通过字根名的发音与英文字母的联系及相容性原则用字母和数字对字根编码,主要由“一维字根码表”,“二维字根码表”,“联想字根表”,“字根编码方法”,“功能码”,“汉字编码方法”,“次码字编码方法”等组成。
(2)按权利要求(1)规定的“二维码”方案,其特征是设计了以相容性原则,利用英文字母加数字编码的二维字根码。
(3)按权利要求(1)规定的“二维码”方案,其特征是设计了四个字根编码不使用的,独立的功能码。
(4)按权利要求(1)规定的“二维码”方案,其特征是为了区别两组重码字设计了“次码字编码方法”。
全文摘要
本发明《二维字根汉字编码方案》适用于计算机汉字输入。主要设计特征是通过字根名的发音与英文字母的联系和相容性原则,利用除I、O、U、V以外的22个字母和1至0,10个数字定义了包括84个一维字根码和145个二维字根码的基本字根码,联想字根码,和I、O、U、V四个功能码,利用字根码、功能码、取码原则对、《国标汉字信息字典》按“汉字编码方法”,“次码字编码方法”进行编码。所得各级简码字,全码字和次码字完全区别了除不独立成字的偏旁部首以外的全部汉字。
文档编号G06F3/023GK1184281SQ9611959
公开日1998年6月10日 申请日期1996年12月2日 优先权日1996年12月2日
发明者李子元 申请人:李子元
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1