汉字形码输入法的制作方法

文档序号:6330529阅读:275来源:国知局
专利名称:汉字形码输入法的制作方法
技术领域
本发明涉及一种计算机汉字的输入法,它是基于形码+形码+形码+音码 的构字方法和规则而产生的.
(二) 背景技术:
现有汉字输入法主要有五笔和拼音两类,它们分别采用了单一形码或音码 来确定一个汉字的方法.但是这两种都有各自的缺点.拼音输入法主要是因为其 输入速度慢且重码多.i笔输入法则是因为其编码规则多,不易记,又有很多的;隹 拆字.重码率仍无泅令^满意,记正如王氨明敉授在他的<<汉字电脑输入法形码 设计三原理》中写道
7. 编码规则
对汉字拆分来说,取码顺序是个首要的问题。
许多初级的拼形方案,大都违反人们传统的汉字书写顺序,对汉字进行拆 分编码。这样做,虽然是出于无奈——以便取得更好的编码离散性,使重码减 少,但可以肯定地说,这种设计是难于被社会公众接受的。因为正确的书写习 惯和字根在汉字中的先后位置,是一切稍有中文修养的人们既有的知识和良好 的习惯,为了向电脑输入汉字,迫使千百万人改变这种既有习惯,那几乎是不 可能的,它必然要遇到传统习惯的强力抵制而失败。
违背书写习惯,方案设计的难度小一点,容易办到,但社会很难接受。 遵从书写习惯,社会公众很容易接受,但方案设计的难度大一些。
8. 简繁兼容
一个好的、或者高级的拼形组字"形码"设计,除了能够处理简体字之外,还应当把与简体字对应的繁体字包括在内,同时处理,也就是实现"简繁兼容"。 由于简体、繁体的区别只在于字形不同,只要字形不同,其"形码" 一般也就 不同,这正是"形码"的优势所在。倘若是音码,要做到"简繁兼容",恐怕 就不是件容易的事。
"简繁兼容"如能做到用同一个字根表、同一套编码规则,那是最理想的。 9.高效与简易并行的"双轨制"
作为中文电脑用户, 一般对一个编码方案最直接的要求不外乎两条第一 是规则简便,规律性强,记忆量小,易学易记;第二是输入速度高、效率高, 经过培训能实现盲打。 *
同时做到这两条,是用户十分合情合理的要求。只可惜,这二者是既统一、 又矛盾的。时至今日,研究和使用人员都有了一个共同的经验,这就是好学 的方法打不快,能够快的方法不好学。"
现在的中国非常需要一种能够解决以上这对矛盾且能收录27000个汉字的 输入法软件
好学的方法打不快,能够快的方法不好学。 一直以来都困扰之输入法的研究.
以上三点很好的说明了现有输入法的不足之处.而这也正是汉字形码输入法 首先要解决的问题.

发明内容
为了解决这些难题,用形码+形码+形码+音码的编码规则和方法. l.其特点是前三个为形码,后一个为音码,以此来确定一个汉字. 汉字的确定有如下三种情况第一种:以圆字为例:口 + 口+贝+Y
它是以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+剩余部首(或 笔画)的最后一个+这个汉字拼音的声母. 第二种:以林字为例:木+木+^+L
它是以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+全字的最后 一笔(因为已没有剩余的部首或笔画)+这个汉字拼音的声母. 第三种:以木字为例:木+—+^+M
它是以汉字的第一个部首(或第一笔)+这个汉字的第一个笔画(因为已没有 剩余的部首或笔画)+全字的最后一笔+这个汉字拼音的声母.
2. 组词法,先确定第一个汉字+第二个汉字的第一个部首(或第一笔)+第二个部首 (或第二笔)
例如浙木沐+又+寸+S(到这已将"树"字确定下来了)+木+— 汉语?十又+ +H(到这己将"汉"字确定下来了)+ i +五 部分立+口+IS +8(到这已将"部"字确定下来了)+八+刀
3. 除编码规则外,还要有一个能够适应这个规则的字根表.
这是一个全新的字根表,它有一个明显的特点就是绝大部分部首都是完整的, 而不像五笔将很多部首一个拆成两个.
为什么要使用完整的部首呢 这完全是由汉字的结构决定的. 大部分汉字是由两到三个部首组成的,这也是为什么此输入法采用三个形码 加一个音码的原因了.根据我的研究发现,如果将一个完整的部首划分为两个(这在五笔输入法中 是很常见的).那么由这个部首组成的汉字的编码重码率将提高7到15倍(因为这 等于将三个形码减少一个,那么由概率学可以知道重码率将提高7到15倍).
于是以这个理论为指导,部首应尽可能采用完整部首.只有少数的部首没有 (那是因为这些部首的组字数都在40个以下).出现重码的概率不大.
按部首组字率的大小分别均分到26个按键上,最好是每个按键上的组字数 相近.GB18030共约27000个汉字,能够每个键上1000个左右最好.但是不可能, 能够做到800到1200就很好了,这也是字根表的分布目标.
'以下为此输入法的字根分布表
<formula>formula see original document page 8</formula>N:十尸乙"已已羽
O:火"、、米业(上部)亦(下部)乡
P:才、丰—穴^ 5_ i_
Q: *毛氏(无七)勺食夕儿身
R:净手白反(无又)看(无目)斤丘(一)
S:木(木)两(w西)丁
T:禾《竹夂夂 j 舌
U:广门.立^4 (爿)辛六3心
V:女示(《刀九臼
W:人U ) 入八 t 乃"酉
X:纟弓己毋匕比(左部)幺魚
Y:i工广文方、\鹿麻高(上部)谁(去i及4 ) Z: 3馬黑缶走力jL仓(下部)也田 它有一个明显的特点就是绝大部分部首都是完整的,而不像五笔将很多部首 一个拆成两个.
以下是这个字根表比五笔多出来的完整部首
豸互耒鱼气牛舟片角歹
韦門中疋齿足血屮糸
净氺穴食身舌酉魚
鹿麻3,馬蹈 川、缶走这样使得输入更遵从书写习惯,社会公众很容易接受.除了能够处理简体字 之外,还能够把与简体字对应的繁体字包括在内,同时处理,也就是实现"简 繁兼容"
由于采用了三个形码+音码,解决规则简便,规律性强,记忆量小,易学易记; 又因为只用四个按键,所以输入速度高、效率高,经过培训能实现盲打.
这样使得字根表的分布能够适应这个编码规则,也使得大写汉字能轻松输入. 终于解决了王永明教授在他的《汉字电脑输入法形码设计三原理〉>中所提到的 7.编码规则8.简繁兼容9.高效与简易并行的"双轨制"三大难题。
权利要求
它是以形码+形码+形码+音码的构字方法和规则来确定汉字的一种汉字处理法.1.其特点是前三个为形码,后一个为音码,以此来确定一个汉字.汉字的确定有如下三种情况第一种以圆字为例口+口+贝+Y它是以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+剩余部首(或笔画)的最后一个+这个汉字拼音的声母.第二种以林字为例木+木+ id="icf0001" file="A2007100275140002C1.tif" wi="3" he="3" top= "107" left = "78" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>+L它是以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+全字的最后一笔(因为已没有剩余的部首或笔画)+这个汉字拼音的声母.第三种以木字为例木+一+ id="icf0002" file="A2007100275140002C2.tif" wi="3" he="3" top= "136" left = "77" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>+M它是以汉字的第一个部首(或第一笔)+这个汉字的第一个笔画(因为已没有剩余的部首或笔画)+全字的最后一笔+这个汉字拼音的声母.
1. 其特点是前三个为形码,后一个为音码,以此来确定一个汉字.汉字的确定有如下三种情况 第一种:以圆字为例:口+口+贝+Y它,以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+剩余部首(或 笔画)的最后一个+这个汉字拼音的声母.第二种:以林字为例沐+木+^+L它是以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+全字的最后 一笔(因为已没有剩余的部首或笔画)+这个汉字拼音的声母. 第三种:以木字为例:木+—+ +M它是以汉字的第一个部首(或第一笔)+这个汉字的第一个笔画(因为己没有 剩余的部首或笔画)+全字的最后一笔+这个汉字拼音的声母.
2. 组词法,先确定第一个汉字再确定第二个汉字.词语:第一个汉字+第二个汉字的第一个部首(或第一笔)+第二个部首(或第二笔)例如:树木沐+又+寸+S(到这已将"树"字确定下来了)+木+— 汉语、? +又+\+11(到这已将"汉"字确定下来了)+ i +五 部分立+口+|5十B(到这已将"部"字确定下来了)+八+刀
3.以下为此输入法的字根分布表:A:工卄升七弋戈B:耳金子(孑"F孓)了 u言〈〈PC:马豸厶又互巴矛(顶部)D:大厂二羊匚耒石县E:鱼月气角片牛舟-豕衣(底部)用F:十土士二干寸雨G: —王歹韦青(上部)五浅(右部)門H: 1田百中疋止虎(上部)齿卜I: 水小J:曰曰虫早'JK: 口川L:足车□甲四血皿 w 骨(上部)M:山(屮)贝几门由N:个尸乙,已巳羽O:火>"、米业(上部)亦(下部)糸P:卑年穴^ l_ i_Q:韦毛氏(无七)勺食夕儿身R:矛手白反(无又)看(无目)斤丘(无一)S:木(本)两(西西)丁T:禾f竹夂夂〗舌U:广门立?4 (爿)辛六3心V:女示〈〈〈刀九臼力W:人(4 ) 入八 1: 乃"酉X:纟弓己毋匕比(左部)幺魚Y:i二广文方、\鹿麻高(上部)谁(去i及4 )Z:3馬黑缶走力jL仓(下部)也田这是一个全新的字根表,它有一个明显的特点就是绝大部分部首都是完整的, 而不像五笔将很多部首一个拆成两个.为什么要使用完整的部首呢 这完全是由汉字的结构决定的. 大部分汉字是由两到三个部首组成的,这也是为什么此输入法采用三个形码 加一个音码的原因了.根据我的研究发现,如果将一个完整的部首划分为两个(这在五笔输入法中 是很常见的).那么由这个部首组成的汉字的编码重码率将提高7到15倍(因为这 等于将三个形码减少一个,那么由概率学可以知道重码率将提高7到15倍).于是以这个理论为指导,部首应尽可能采用完整部首.只有少数的部首没有 (那是因为这些部首的组字数都在40个以下).出现重码的概率不大.以下是这个字根表比五笔多出来的完整部首豸耒鱼气牛舟片角歹韦門中疋齿足血屮糸卑穴食身舌酉魚鹿麻3馬黑缶走这样使得字根表的分布能够适应这个编码规则,也使得大写汉字能轻松输入
全文摘要
汉字形码输入法涉及一种计算机汉字的输入法。采用了形码+形码+形码+音码的编码规则和方法,以此来确定一个汉字。它是以汉字的第一个部首(或第一笔)+第二个部首(或第二笔)+剩余部首(或笔画)的最后一个+这个汉字拼音的声母。组词法,首先确定第一个汉字+第二个汉字的第一个部首(或第一笔)+第二个部首(或第二笔)。字根表上的部首基本上都是完整的部首。
文档编号G06F3/023GK101286089SQ20071002751
公开日2008年10月15日 申请日期2007年4月12日 优先权日2007年4月12日
发明者邱楚盛 申请人:邱楚盛
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1