一种数码汉字输入法及其键盘的制作方法

文档序号:6330669阅读:265来源:国知局
专利名称:一种数码汉字输入法及其键盘的制作方法
技术领域
本发明涉及一种数码汉字输入法及键盘,属于计算机中文信息处理技术领域。
在现有技术中,利用数字键盘进行汉字输入的方法主要有以下几种①笔划输入法在5个或10个数字键上定义若干种笔划,依照书写笔顺,依次按键输入汉字的每一笔划。这一方法显而易见的优点是“不用学习”,只要会写字便会输入,其缺点是按键次数多,输入速度慢,效率不高。
②拼音输入法这是参考英文字母的数字输入方法,通过按1至4次数字键逐个输入汉语拼音的字母。其优点是可以直接在数字键盘上打拼音,简单易学,其缺点是大量的同音字需要挑选,而且击键次数多,同样效率不高。
③九键六码汉字输入法这一输入方法由五笔字型的发明人王永民先生提出,其中国发明专利申请为00103505.3号(公开号为CN1264859A)的《五笔数码键盘汉字电脑输入法及其键盘》,该输入法利用1~9共九个数字键来输入汉字,单字最大码长为6码。其优点是重码率低,缺点是单字编码过长,影响了编码方案的实用性。
另外,已有技术的各种汉字编码方案,一直来都沿袭五笔字型输入法的字词编码兼容技术,其缺陷在于,词组的容量不能太多,否则将产生大量地字、词重码,影响输入速度。
本发明解决上述技术问题所采用的技术方案为该数码汉字输入法的键盘包括有0、1、2……9共10个数字键,其特征在于各键所对应的汉字笔形及部件为“1”“横”类,对应“一”、 及部件“艹、、 “2”“竖”类,对应“丨”、“亅”及部件“日”;“3”“撇”类,对应“丿”及部件“月”;“4”“捺”类,对应“丶”、“ㄟ”及部件“亠、讠”;“5”“折”类,对应“乙”及部件“幺、纟”;“6”“交”类,对应“十、ナ、七”、“乂、 ”及部件“木”;“7”“插”类,对应“、、“丰、 韦、 聿、 及部件“扌”;“8”“八”类,对应“八、 冫、丷、 ”、“人、亻、”;“9”“小”类,对应“小、、 ”及部件“氵、灬、辶、心、”;“0”“口”类,对应“口、囗、 并且,单个汉字按“前4末1”规则取码,即按规范的书写顺序,取第一、二、三、四、末共五个笔形的代码,不足五码按实际码长。
对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则可以为首部或尾部只有一个或二个笔形的,则仍按所述的“前4末1”规则取码;首部、尾部的笔形均在三个以上的,则按“首2尾3”规则取码,即首部按书写顺序取第一、第二共二个笔形的代码;尾部按书写顺序取第一、二、末共三个笔形的代码,一共五码。
或者,首部或尾部只有一个笔形的,则仍按前述的“前4末1”规则取码;首部的笔形在二个及二个以上、尾部的笔形在三个及三个以上的,则按”首2尾3”规则取码,即首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、二、末共三个笔形的代码,共五码;首部的笔形在二个及二个以上、尾部的笔形为二个的,则按“首2尾2”规则取码,即首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、第二共二个笔形的代码,共四码。
而汉字词组的编码方法可以为二字词分别取第1字的一、二、末三个笔形和第2字的一、二、末三个笔形,共六码,其中如有汉字不足三个笔形的,则以“0”补齐;三字及三字以上的多字词分别取第1、第2和最后一个汉字的前两个笔形的代码,共六码,其中如有汉字不足二个笔形的,则以“0”补齐。
由于单字和词组的码长不等,因此当汉字输入系统有词组编码存在时,在输完单字编码后,可以键入数字键盘上的“非数字键”作为输码结束键。
与现有技术相比,本发明由于将汉字拆分笔形增加至10种,因而在单字码长为5、词组码长为6的情形下,不仅可以适用于具有简繁汉字的大字符集,而且重码率低,并且由于各字形仅与10个数字键相关联,因而可以适用于手机、电话、电子字典、个人数字助理(PDA)、个人电脑(PC)等各种具有数字输入设备的产品。
(一)笔形、部件及代码本发明将构成汉字的基本笔形分为5种单笔形和5种复笔形。
5种单笔形的划分采用国家统一标准,即分为“横(含提)、竖(含左竖钩)、撇、捺(含点)、折”,不再详述。
5种复笔形为“交”——两笔交叉且连续写成,具体笔形为“十(ナ七)、乂( )”。
(括号前的笔形为代表性笔形,括号内为形似笔形,下同)“插”——所有连续写成的若干笔划被随后写成的一笔划纵穿的笔形。具体笔形为“()、丰( 韦 聿 )”。
“八”——“八、人”及其变形。即“八( 冫丷 )、人(亻)”。
“小”——“小”及其变形。即“小( )”。
“口”——四角整齐的方形。具体笔形为”口囗 上述10种笔形的代码分别为“横1、竖2、撇3、捺4、折5、交6、插7、八8、小9、口0”代码助记记词为“1、2、3、4、5,横竖撇捺折;6、7、8、9、0,交插八小口。”为离散重码,本发明还优选了10余个高频部件,按照易记、便于联想的原则定义在数字键上,具体如下
(1)艹( )因其首笔为“一”,故定义在数字键“1”上。
(2)日因其首笔为“丨”,故定义在数字键“2”上。
(3)月因其首笔为“丿”,故定义在数字键“3”上。
(4)讠、亠因其首笔为“丶”,故定义在数字键“4”上。
(5)幺、纟因其首笔为“乙”,故定义在数字键“5”上。
(6)木因其首笔形为“十”,故定义在数字键“6”上。
(7)扌因其笔形与“插”笔形相似,故定义在数字键“7”上。
(8)氵灬辶心()因笔形中有多个点,故定义在最大的数字键“9”上。
以上十个基本笔形及10余个优选部件构成了本发明的笔形体系,这是本发明的核心技术。需要说明的是上述笔形及部件是本发明人根据规范、易记、高效等原则优选得到,在具体实施本发明时,允许作适当增减。如在“交”笔形中,可增加“又、力”等部件;可将“丈、 ”等部件也定义为“插”笔形。
(二)单字取码规则(1)独体字(含对称结构、部分包围结构的汉字)独体字按“前4末1”规则取码。即按规范的书写顺序,取一、二、三、四、末共五个笔形的代码,共为五码。不足五码按实际码长输入。如独体结构 我3764 重31261本61对称结构 乘36288 坐8861 爽16668包围结构 可102或10164匿11605(上述包围结构的汉字,因其包围部分不是连续写成,故按笔顺取码。)(2)合体字合体字,先从结构上将其分成两部分。具体是左右(左中右)结构的合体字分成左、右(左、中右)两部分;上下(上中下)结构的合体字分成上、下(上、中下)两部分;包围结构的合体字分为内、外两部分。
为便于叙述,下文中将合体字的第一部分称为“首部”,第二部分称为“尾部”。
合体字分成首、尾两部分后,若首部、尾部只有一个或二个笔形,则该合体字仍按独体字“前4末1”规则取码。若首部、尾部的笔形均在三个以上,则按“首2尾3”规则取码。即首部按书写顺序取一、二共两个笔形的代码;尾部按书写顺序取一、二、末共三个笔形的代码,一共五码。
合体字也可按如下规则取码合体字分成首、尾两部分后,若首部或尾部只有一个笔形,则该合体字仍按独体字“前4末1”规则取码。若首部、尾部的笔形均在二个以上,则按“首2尾3”规则取码,尾部不足3码按实际码长输入。
合体字结构的划分,以现行的教科书及规范的写字字典为依据。
由于汉字间架结构具有很强的直观性,因此,只要略懂汉字结构知识,对合体字都能很容易地切分,不会产生“二义性”。对少数几个结构不好切分的汉字,则可通过设置“容错码”加以解决。
合体字编码举例如下左右、左中右结构村664 撬73737 情82713 鲍35355 鞭11816 辫48546上下、上中下结构京409 赢45034 露14020 翼58068 登54101 英1274半包围结构磨43660 着81011 左6121 虚21221匈35652 氧81817 司510 灰688毯37888 起61215 彪21333 邂35329闼42649 同2510 凶652 函52882全包围结构国01614 圆00258本发明不仅可对国GB2312中的简体字编码,同样可对GBK中的繁体字及其它汉字编码,且简、繁汉字编码不同。如镕81440 詡41588 垚61611 頌85138 絞59486本发明还可对非成字部首、常用标点、字母进行编码输入。如一177 丨277 宀44577 卩5277 氵977 疒43877,188 。288 、388 ;488其中,“77”、“88”、“99”为特殊符号的编码后缀。
(三)词组的取码规则词组按“二字词”与“多字词”两种方式取码。
二字词取每字的一、二、末三个笔形的代码,一共六码。若某字取不足三个笔形,则以“0”补齐。如词语450410不是190218多字词(三字及三字以上)取第1、第2和最后一个汉字的前两个笔形的代码,一共六码。若某字取不足二个笔形,则以“0”补齐。如计算机468463精益求精868186教育委员会664581中华人民共和国028301本发明的特征是采用字、词编码分离技术。这一技术的进步性在于实现了文字录入以词组输入为主这一录入方式。并且将词组的编码空间扩大到一百万,基本实现词组输入无重码。从而极大地提高汉字的录入速度。
由于采用字、词编码分离技术,因此当输完单字编码(或简码)后,可以键入数字键盘上的某一“非数字键”作为输码结束键。如果没有重码,则该字直接上屏,如果有重码,则用数字键进行选择。对于词组,当输完六码后,如果无重码,则该词组直接上屏,如果有重码,则用数字键进行选择。
权利要求
1.一种数码汉字输入法及其键盘,其键盘包括有0、1、2……9共10个数字键,其特征在于各键所对应的汉字笔形及部件为“1”“横”类,对应“一”、 及部件“艹、、 “2”“竖”类,对应“丨”、“亅”及部件“日”;“3”“撇”类,对应“丿”及部件“月”;“4”“捺”类,对应“丶”、“ㄟ”及部件“亠、讠”;“5”“折”类,对应“乙”及部件“幺、纟”;“6”“交”类,对应“十、ナ、七”、“乂、 ”及部件“木”;“7”“插”类,对应“、”、“丰、 韦、 聿、 及部件“扌”;“8”“八”类,对应“八、 冫、丷、 、”人、亻、”;“9”“小”类,对应“小、、 ”及部件“氵、灬、辶、心、”;“0”“口”类,对应“口、囗、 并且,单个汉字按“前4末1”规则取码,即按规范的书写顺序,取第一、二、三、四、末共五个笔形的代码,不足五码按实际码长。
2.根据权利要求1所述的数码汉字输入法及其键盘,其特征在于对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则为首部或尾部只有一个或二个笔形的,则仍按所述的“前4末1”规则取码;首部、尾部的笔形均在三个以上的,则按“首2尾3”规则取码,即首部按书写顺序取第一、第二共二个笔形的代码;尾部按书写顺序取第一、二、末共三个笔形的代码,一共五码。
3.根据权利要求1所述的数码汉字输入法及其键盘,其特征在于对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则为首部或尾部只有一个笔形的,则仍按前述的”前4末1”规则取码;首部的笔形在二个及二个以上、尾部的笔形在三个及三个以上的,则按”首2尾3”规则取码,即首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、二、末共三个笔形的代码,共五码;首部的笔形在二个及二个以上、尾部的笔形为二个的,则按“首2尾2”规则取码,即首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、第二共二个笔形的代码,共四码。
4.根据权利要求1、2或3所述的数码汉字输入法及其键盘,其特征在于,汉字词组的编码方法为二字词分别取第1字的一、二、末三个笔形和第2字的一、二、末三个笔形,共六码,其中如有汉字不足三个笔形的,则以“0”补齐;三字及三字以上的多字词分别取第1、第2和最后一个汉字的前两个笔形的代码,共六码,其中如有汉字不足二个笔形的,则以“0”补齐。
5.根据权利要求4所述的数码汉字输入法及其键盘,其特征在于,在输完单个汉字编码后,再键入数字键盘上的“非数字键”作为输码结束键。
全文摘要
一种数码汉字输入法及其键盘,其键盘包括有0、1、2……9共10个数字键,其特征在于各键所对应的汉字笔形及部件为“1”对应“横”类;“2”对应“竖”类,“3”对应“撇”类;“4”对应“捺”类;“5”对应“折”类;“6”对应“交”类;“7”对应“插”类;“8”对应“八”类;“9”对应“小”类;“0”对应“口”类;并且,单个汉字按“前4末1”规则取码,即;按规范的书写顺序,取第一、二、三、四、末共五个笔形的代码,不足五码按实际码长。对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则还可以变更为“首2尾3”或“首2尾2”;汉字词组的编码则可以为六码。与现有技术相比,本发明不仅可以适用于具有简繁汉字的大字符集,而且重码率低,并且由于各字形仅与10个数字键相关联,因而可以适用于手机、电话、电子字典、个人数字助理(PDA)、个人电脑(PC)等各种具有数字输入设备的产品。
文档编号G06F3/023GK1460914SQ0312931
公开日2003年12月10日 申请日期2003年6月14日 优先权日2003年6月14日
发明者罗康宁 申请人:罗康宁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1