统一汉字输入法及其键盘的制作方法

文档序号:7646664阅读:363来源:国知局
专利名称:统一汉字输入法及其键盘的制作方法
技术领域
本发明涉及一种形码电脑汉字输入法及其键盘,尤其涉及一种统一汉字输入法及其键盘。

背景技术
众所周知,现在流行的汉字输入法是王码五笔,还有智能,ABC,拼音输入法等等,用于手机上的汉字输入法是Motorola的9键汉字输入法(采用的是一位教授的汉字输入法专利技术),基于5个基本笔划(横竖撇点折)的汉字输入法,还有在香港流行的九方汉字输入法。但王码五笔基本上不能用于移动电话或手机、PDA和电子词典上,9键以及基于5个基本笔划的用于PC机却效率都很低。“九”方的汉字输入法是导码输入方式(即一步一步提示选择输入),应用于pc机则不能盲打。全拼的重码率太高,频繁选字造成输入效率大大下降,形码比之于全拼,输入效率要高很多,但由于使用难度大,使得其普及应用还远远比不上全拼输入法,形码仅仅占输入法市场10%的用户,而全拼依然拥有90%的用户。“双笔划”输入法基本上使用的是《辞海》双比划检字法,但是打字时,把双笔划翻译为按键的记忆回映时间较长。人们对汉字的认识还是基于偏旁部首和分块结构的,“双笔划”就显得很不直观,不符合对汉字的认识与学习规律。“王码五笔”虽是基于字根分块的,但不是表形码,字根分类有一定的随意性,很多专家认为不符合认知与学习的形象思维,学习与记忆难度相当大,必须经过几个月严格的培训,才能逐渐熟练,打得快但不好学,不用即忘,打字员的劳动强度非常高。“王码五笔”最典型的缺点是若一段时间不使用就会忘记。“仓颉”是比“王码五笔”更难学的输入法,只是香港、台湾地区和东南亚一些国家的主流输入法。现在市场上还出现了一种叫“酷极”的形码输入法,“酷极”表形码虽然属于形码,但其分类的易于记忆的特征不足,即象形特征不足,不能对“五笔”构成威胁,也不易成为最好的输入法。所以目前来说仍然有大量人员在研究更加适合用户的简单易用而使用效率更高的汉字输入法。


发明内容
本发明的目的在于为克服现有技术的不足而提供一种易于记忆,使用方便,重码率低的统一汉字输入法及键盘。其技术方案为统一汉字输入法及键盘,用符合编码规则的一至五位码长进行汉字编码,用字母键形成拼形组字,拼形组词,将优选的字根分配在计算机通用键盘的二十六个字母键里,用汉字特征根分类,用汉字字尾特征识别码识别和减少重码,对手机键盘,将26个字母分成12类,分别安排在0-9和※、#号键, 各字母键,字根(见附图6)。
字尾特征识别码分为十六类(见附图2)。
字尾特征识别码是当汉字的字尾是如上图中的情况时可补打对应的字母。统一输入法用这种字尾识别码取代王码五笔的基于五个单笔划和三个字形特征组成的识别矩阵,不用推算,更为直观,效率更高,具有比王码五笔识别码更大的优越性。上图中的数字1/2/3/4/5/6/7/8是用于12键手机键盘(见附图5)的识别码。
对手机键盘,还可采用将字根分配在0-9数字键和※、#键里,其数字,字根(见附图3,12键可充分利用手机的硬件资源)。
本发明主要采用象形编码、汉字部件或字根大多数都与英文字母的字型相似或通过联想相似,从分类规律上看,由于有与相关字母的极其相似和可联想的特点,比之如王码五笔等大量的输入法,可以发现其记忆性能和易用性的大大增强,基本上可以见字识码,使得汉字输入法有了巨大的进步。
本发明26键编码方法应用于6763个GB2312汉字,其重码数为0;该编码方法应用于22100个GBK汉字进行测试重码率为2.2%(重码对数为500做右),而“五笔”用于6763个汉字的重码对数为60~90对,港台流行的“仓颉”汉字输入法用于13000个BIG5汉字其重码数为400多(但如果改为4位码长,则重码对数为1500多),德仔表形码用于22000个GBK汉字,其重码对数为5000-6000多,由此对比可见,“统一”加上了字尾特征识别码后其重码率是远远优于当今的主流汉字输入法的,其应用前景势不可挡。
本发明把26个键组合到手机的12个键上,若使用GB2312字库的6763个汉字进行测试,重码率为33%。用22100个汉字进行测试,其重码率为43%。但实际效果要好得多,因为常用字大约只有3750个左右,用2-4键就可把常用字打出候选,重码数一般在2-4个,大大地扩大了该输入法的使用范围,使之可用于成千上万的手机上面。



图1是本发明统一汉字输入法及其键盘的字根表; 图2是本发明统一汉字输入法及其键盘的汉字字尾特征识别码及分类; 图3是本发明统一汉字输入法(26键)应用于手机的键盘字母分布图; 图4是一个33键输入法的字根表图。
图5是一个12键的手机键盘字根分布图。
图6是本发明统一汉字输入法及其键盘的字母键、字根图。

具体实施例方式 下面结合附图,对本发明作进一步详述 实施例1参见附图1,附图2,本发明的统一汉字输入及其键盘将字根,汉字字尾识别码列入表中,将字根分配在如图1所示的计算机通用键盘的26个字母里,用字母键形成拼形组字,拼形组词的格局。
附图1说明如下 AA键上的字根都很象字母‘A’的“人”字结构,都隐含有“人”的特征;

这个字根是为了对有些繁体字进行编码,秃宝盖上方的两个并排的火字规定拆为一个字根。飠与食的字根都在该键上。
BB键上的字根如“早日”,口中有一竖或一横的字根,另外两个口字并排的结构在繁体字集中用的很多,也作为一个字根处理。
CC键可叫“馬车”键,上部都有个缺口,“土”字也可沿竖线分解为两个缺口。还有如C型的缺口已己

巴,起笔逆时针方向旋转的“折”,但不包括
DD型“刀片”键“刀片爿

”,包括起笔顺时针方向旋转的“折”,但不包括如

乙Z型的折。另有如“了阝卩 马乃”等字根,以“横折”起笔。D键上的字根没有交叉结构。
E“三E”键,E型的左右对称型,字根上都隐含有三横。‘王’字可划分为左右对称的两个E型。
F含有“禾”两个主字根,隐含有两横,还有近似于F的变型。
G“G键”有些含有两个连继的折,另外的都含有“撇折+点”,非常类似于字母G的写法。G键上还有三个又形,含2或三个交点。
H“艹”草头及其变形草头,还有如“工业皿革”等左右对称的结构。尤其是“业”的各种简繁体写法中的对称结构与“赢鼎肅“这三个字中的复杂结构如
Ii型含有如卜

丨等子结构的部件,如“上止”。
Jj键上面一排包含类似于“广”起笔的结构如疒



,多为半包围结构。下面一排多为“折点”、“折撇”起笔。另外还有4种叉型

寸力
K除主字根“虫”,其它是隐含“冫”子结构或其旋转子结构的字根类。
L以点或点横起笔的字根集(言文方

,不含“K”型子结构。
M包括“十忄宀車门”主字根,另外还有M型字根





(有3到4个纵向的笔划)。
N缺口朝下的n型构件,要特别注意


这几个字根,如“凹凸”可分别拆为“upp”和“npp”。
O口,○筐的内部不含有其它笔划或字,如囡qv。
P横及横起笔的一些字根“一西酉石牙”。P型字根“尸”,門的半边很象P,也作P型字根。
Q方筐中有两个或以上笔划“田目罒臼貝”,还有“口日”与“十”的筐叉结构“母毋

甲”,

,“

甲”。
R“立人”键r含“撇”,直立的“亻彳”字键,把

刂这些部件想象成站立的人的两条腿。
S“川水”键,如弯弯的河流,包括各种水的变型,为便于记忆,还把“雨黑”两个含有四点水的部件放在S键上。
Tt键包含象“T”和“t”型的结构,除“扌手”外最多只有一个交叉点。
U十与“E”型的交叉结构,“缺口”内含有部件的较复杂字根。
V“鱼尾”键,“撇,横折”起笔,还有“女”

,注意对33键的输入法丷在V键而不在A上。
W主要字根是“钅釒”主要是“撇撇”,“撇横”,“撇横点”,“撇折点“夕”双笔划起笔的字根。
X象形于x或*的交叉形字根“乂





”。
Y“小木”键,Y形部件,如“丫


”。
ZZ形的折



,‘廴

身舟’,之的底部,还有“五

”的Z字型结构,‘五’的草书字体也很象

,字根‘又’是

的上半部。
本发明将汉字分为字根字,非字根字两大类,每个字根都有一个代码,某些字根本身就是一个单字即为字根字,非字根字的编码方法如下 成字字根=字根编码+字尾识别码+声码+重复声码; 单字(有两个字根)=第一字根编码+第二字根编码+字尾识别码+声码; 单字(有三个字根)=第一字根编码+第二字根编码+第三字根编码+字尾识别码; 单字(大于三个字根)=第一字根编码+第二字根编码+第三字根编码+最末字根编码; 字尾特征识别码包括了基本的横P、竖i、撇r、点L(捺)四个单笔画。根据折笔的起笔运转方向,把折笔分为4种情况 逆时针起笔的折(C键)

ㄣ,例如区cx/cxc,兦ac/accw; 顺时针起笔的折(D键)乛亅ㄋ

,例如则nr/nrd,到gcr/gcrd; 竖折钩(U键)乚,例如扎tu/tuu,仓ac/acu; 类似于Z键形状的折(Z)廴





,例如亿rz/rzz,之lz/lzl,远fwz/fwzl; “人”字型字尾特征为A键,例如责en/ena,姀vf/vfa,米x/xa,是bi/bia,蛽kq/lqa,林yy/yya; K形特征的识别码在K键,例如衣lk/lkk,长k/kk,跳zws/zwsk,疼jvs/jvsk,炎aa/aak,冰ks/ksk,食a/ak,家mp/mpk/mpkk,張dek/dekk; “日”字型的识别码在Q键,例如昍bb/bbq,昌bb; “四目田口”其他除”日”字的四面围特征根的识别码在B键,例四q/qb,晶bbb,晿bbb/bbbq,品ob/obq,洒sp/spb,酒sp,圆qon/qonb; “小”“心”以及有四点水的特征识别码为S键,例如小y/ys,雷sq/sqs,黯skb/skbs,志cg/cgs,馼cl/cls,傌rc/rcs。要注意“馬鳥魚雨黑”这几个字作为偏旁部首无论出现在字首或字尾,其字尾识别码都为S。
“又攵夂文”型识别码为X键,例又z/zx,枚yv/yvx,纹gl/glx,双zz/zzx,复wbv/wbvx; “ㄨ”的识别码为V键,例冈nx/nxv,风ux/uxv;“月”的识别码为F键,例有xn/xnf; “丨”竖的识别码为i键,例申bi/bii,吲odi/odii; “一”横的识别码为P键,例二f/fp,仨re/rep; “丿”撇的识别码为r键,例易bjw/bjwr,勿jw/jwrw; “丶”点的识别为L键,例勺/jl/jll,村yj/yjl。
如果汉字加字尾识别后不满四码还可加一到两个声码(这里声码是指该汉字拼音的首字母)。
词组编码方法一 双字词=第一字的前两码+第二字的前两码; 三字词=第一字的前一码+第二字的前一码+第三字的前三码; 四字词=第一字的前一码+第二字的前一码+第三字的前一码+第四字的前两码; 五字及以上的词=第一字的前一码+第二字的前一码+第三字的前一码+第四字的前一码+第一的前一码; 词组编码方法二 双字词=第一字的声码+第二字的声码+第一字的形码+第二字的形码; 三字词=第一字的声码+第二字的声码+第三字的声码+第二字的形码+第三字的形码; 四字词=第一字的声码+第二字的声码+第三字的声码+第四字的声码+第四字的第一形码; 四字以上词=第一字的声码+第二字的声码+第三字的声码+第四字的声码+第五字的声码; 词组编码方法二是以声码为主的编码方法,因为考虑到全拼输入法占有90%的用户,采用方法二对三字及以上长度的词组编码来说,可以大大方便用户,提高输入效率。在七万多汉字中有很多是没有读音的,所以形码和拼音要做到具有互补性。
鉴于全拼拥有90%的用户,词组编码方法二就是针对懂汉语拼音的用户而专门设计的词组输入方法,可以更加提高输入效率。
实施例2,参见附图4,统一汉字输入法及其键盘的33键输入法,它采用了比26键多加了=、/、\、-、·、,、;七个按键符号,将繁体字偏旁和简体字偏旁分开,使繁体字和简体字无重码,编码方法相同。
实施例3,参见附图3,26键统一汉字输入法及其键盘在手机上的应用。
从附图3上可以看出使用了12个键,对于21键的手机,硬件资源稍微有点紧张,要用一个确认键来输入空格,标点符号需要编入汉字组。对于有24个按键的手机,输入标点符号和空格是没有任何问题的。若使用GB2312标准的6763个汉字集,其重码率为33%。应用于手机是完全可行的,比全拼输入法在手机上应用时的重码率小得多。
实施例4,统一汉字输入法精简字根集用在手机键盘上的字根分布图(见附图5),把字根分布在1、2、3、4、5、6、7、8、9、0、※、#十二个键上。对汉字采用码长为四,取一二三末字根的编码方法。
权利要求
1、 一种统一汉字输入法及其键盘,用符合编码规则的一至五个位码长进行汉字编码,用字母键形成拼形组字,拼形组词,其特征在于将优选的字根分配在计算机通用键盘的二十六个字母键里,用汉字特征根分类,用汉字字尾特征识别码识别和减少重码,对手机键盘,将26个字母分成12类,分别安排在0-9和※、#号键,各字母键,字根如下
A人入八


B
日曰
C 匚已己

土士
D刀乃了乛亅

弓卩阝马[刀片爿
]
E


F 禾


G纟
幺心戋戈
糹鬼
H工艹廿廾



i礻衤卜
丨上
j


寸力
k 虫冫习羽巛

立六
L 讠丶
文方
m 宀门古十


n

O 口
P一石酉西


Q 目
罒四口

r 亻彳
刂 丿
s 氵灬
川水灬
雨黑
t扌(手)
七丁
U 山由


臣九几乚
V鱼魚

W 钅

爫儿
彡夕歹

K大米乂
Y 丫
木小
Z 廴



字尾特征识别码分为十六类如下
1 i 丨
2 p-一
3 L 丶
辶 之
6 r / 丿
4 c
7 D
亅 乛
6 u 乚
6 z 乙
8 B 口四目田囗西酉
k 食
火长
5A木


X
夂夂又文
S

小心
V乂
F月
Q


2、 根据权利要求1所述的一种统一汉字输入法及其键盘,其特征在于对手机键盘还可采用将字根分配在0-9数字键和※、#键里,其数字、字根如下
1 亻彳忄卜
丨上止

2 讠言一亠二
3 丶冫


4

心[
女](4形交点)
5 人入八
6 釒钅
乚丿儿
7 衤礻
8 日
9
冂门
0

* 大乂木米
# 扌
艹廿(多于两个交点)
(只有一个交点)。
全文摘要
本发明公开了一种统一汉字输入法及其键盘,用符合编码规则的一至五位码长进行汉字编码,用字母键形成拼形组字,拼形组词,其特征在于将优选的字根分配在计算机通用键盘的二十六个字母键里,按汉字特征根分类,用汉字字尾特征识别码识别和减少重码,对手机键盘,将26个字母分成12类,分别安排在0-9和※、#号键,各字母键,本发明从分类规律上看,由于有与相关字母的极其相似和可联想的特点,比之如王码五笔等大量的输入法,可以发现其记忆性能和易用性的大大增强,基本上可以见字识码,使得汉字输入法有了巨大的进步。
文档编号H04M1/23GK101286090SQ20071005045
公开日2008年10月15日 申请日期2007年11月7日 优先权日2007年11月7日
发明者赵元鸿 申请人:赵元鸿
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1