数码双重五笔汉字输入法的制作方法

文档序号:6419418阅读:270来源:国知局

专利名称::数码双重五笔汉字输入法的制作方法
技术领域
:本发明涉及汉字编码输入方法。二
背景技术
:目前电脑的汉字输入方法较为完善,但是只利用数字键进行输入的不多,且不够理想。只有手机输入法,即用手机在编写短信息或是电话簿等项目中用到的输入方式采用数字键进行输入。手机输入法的种类英文输入法和中文输入法,中文输入法目前主要有T9智能输入法、字能输入法、iTAP输入法等。T9输入法全名为智能输入法,特点程序按算法自动组成合理的拼音。字库容量九千多字,支持十多种语言,包括欧洲及中文繁体、简体、香港常用字等。该输入法是由美国特捷通讯(TegicCommunications)软件公司研制的,T9输入法解决了小型掌上设备的文字输入问题,已经成为全球手机文字输入的标准之一。目前诺基亚、西门子、松下、飞利浦等公司均支持此种输入法。T9输入法的特点T9输入法是高效快速的、聪明的输入法,以往的输入法在用汉语拼音输入一个汉字的时候需要选择该按键上的字母然后确定后才能输入一个汉字,而且在输入一个汉字以后需要重新再进行下一个汉字的输入。此输入法应用于早期的手机中,其特点是简单易学,其缺点就是输入效率极低,在输入所需字以后屏幕会出现一些常见字,而这些字都可以与此字组成词组,这就是T9智能输入法的优越之处。正因为T9输入法高效便捷的输入方式引起了众多手机厂商的注意,并得到广大手机用户的认可,以至于T9成为了使用频率最高知名度最大的手机输入法。T9的中文输入包括简体中文和繁体中文,输入方式包括笔划、拼音以及注音。在T9中使用频率最高的就是拼音和笔划输入。拼音输入是用户们熟悉的,但是对于笔划输入或许就不那么熟悉了,T9将简体中文字的24种笔划和繁体字的41种笔划按其共同点分为5类,每类笔划用小型设备面板上的一个按键代表。在使用笔划输入汉字的时候,用户只需按照平时手写汉字那样,按顺序输入比划,T9会从内置的语言数据库中选出匹配这些笔划的汉字,用笔划输入汉字跟用拼音一样快捷。字能输入法是由总部设在加拿大的字源资讯技术有限公司(ZiCorporation)和爱立信公司合作推出。此种输入法具有20902个汉字的高容量字库,是T9输入法字库的两倍多,所以许多T9不能输入的字,字能都能轻松输入。字能输入法特点字能输入法虽然跟T9是完全不同的两种输入法,但在拼音的输入方面字能跟T9的方法是几乎一样的,而在笔划的输入上,字能输入法则更高一筹,因为字能输入法在输入汉字的时候,对于用户不大熟悉的笔划可以使用笔划询问键来进行模糊输入。iTAP输入法是摩托罗拉的独家输入法,输入法语言支持20多种语言,汉语包括简体中文、繁体中文,支持的语言种类比其他的输入法都多,由于iTAP是在T9的基础上发展起来的,所以在输入的算法方面也跟T9基本相似,不过在笔划输入上iTAP也有自己的特色,就是iTAP支持倒划笔,用户在输入过程中出现倒划笔的现象,iTAP仍然能从字库中搜索的用户所需要的汉字,这样从某种程度上来讲也提高了笔划输入的效率。智能手机输入法,积木式汉字输入法,把所有的偏旁部首按其起笔分为横(一)、竖(1)、撇(i)、点(、)、折(乙)五类,分别分布于12345的五个数字键位上,为"部件渐变单笔区";按其起笔分为横(一)、竖(1)、撇(j)、点(、)、折(乙)五类,分别分布于67890的五个数字键位上为"纯部件预设区";以选中的预设偏旁部首及笔画智能找偏旁部首,同时偏旁部首智能找偏旁部首的特色。此法要选字,慢。部首输入法手机版,构思独特,"6、7、S、9、0"分别代表一、1、j、、、乙用于输入字根的首笔画,〃1、2、3、4、5〃用于输入字根的笔画数和选择汉字。汉字输入取其第一、第二、最末一个字根的代码进行编码,每个字根用两个数字键表示,先输入字根的首笔画,再输入字根的笔画数(多于5画的字根都记为5画)。需要数笔划数,速度慢,然后使用五个笔画键和五个笔画数键在手机等数码设备上进行汉字录入,往往十多笔才能输入一个汉字。通过对众多输入法的对比、分析,我们发现,综上可见,影响汉字输入存在着四个因素—、编码的长短。编码越长重码越低。但人们不希望编码太长,因此,客观上需要编码尽可能短些;二、字元表的构成。字元是编码的基本单元。在形码中也可理解成字元即字根。提取编码用的字根很困难,字根越多,重码不一定越少;但字根太少,又难以统领众多的汉字;另一方面,纯用字元做字根进行编码,可简化编码,但不能有效解决重码问题。纯用汉字的笔画编码,重码更多,且很繁复;编码还与大小键盘有关。采用编码基本元素(打字的盘键数)愈少,重码愈高;但元素多,重码不一定少。同等条件下,大键盘打字,码长要短,小键盘打字,要多一至二个码长;三、编码规则也决定着重码率。编码规则简单了重码多,复杂了又难学,因此,编码规则要尽可能简单,还要起到降低重码的作用;加外,汉字库的大小与输入法方案有关。即小字库的方案大字库不一定适用。四、混合编码,会使重码降低。同一种输入法中,两种不同的方法混合使用,一般来说,有降低重码的作用。但不是绝对的。
发明内容本发明的目的是克服上述不足问题,提供一种数码双重五笔汉字输入法,编码简单,易于学习,有效控制和降低重码率,简化输入方法。本发明输入法可直接在电脑上使用,更适宜在手机上使用。本发明为实现上述目的所采用的技术方案是数码双重五笔汉字输入法,以电脑小键盘或手机十个阿拉伯数码做键码,每个键码上对应存储字元,由字元编码输入汉字,十个数字键对应共34个字元,每个数字键对应的字元如下<table>tableseeoriginaldocumentpage6</column></row><table>在这一编码表中,0-4是单一码元,分别代表0-口,闭合的圈,与口对应;l-—,l代表横;2-1,2代表竖;3-j,3代表敝;4-、,4代表点;编码表中,5-9是复数码元,分别代表5-乙"3,勺^,无论单笔双笔,与数字5的书写笔形很相似;6-LAh^,类似6的书写笔顺,^取自六字头,,为六画;7-7i,又,类似7的书写笔顺,'又'是7的笔画加一撇,从属于7;8八,八、々,捺,汉字小写'八,中的一画,从属8,八、々及'水,中的撇与捺,与'八,形似,从属8;9_J3,小十三乡《〈,单笔勾的方向与9相同,包括多中的勾;笔划中的提,'提'较少见,也归为9;另外,连续的相同的三笔,在此约定取作9,故'三乡《〈'全从属9;'小十'借鉴四角号码的方法,从9。汉字输入时,按照下列编码规则点击数字键输入首先按汉字的书写笔序取码,码长最长为7位码(1)相同连续的双划只取其中的一笔;(2)相同连续的三划直接取作9码,'提'取作9;(3)两笔交叉构成单一叉点,交叉的这两笔跳过不取码;(4)两笔构成单一叉点的一码字字,如'十',拆开取码;(5)多笔交叉(有交叉就算),取其叉点数做编码。一字中连续的单叉,算多叉;(6)闭合的方框字,如口、日、目、田,甲、由等,直接取0码;(7)—码字,如'乙',连续重复该字的编码,直至该字出现。以上所讲,都是针对输入单个汉字的。词组输入更简单l,双字词组先打首字,第一个汉字打出后,再接着打后面的字,直至该词组出现。2,三字词及三字以上的词组先打首字,第一个汉字打出后,其余的字只取该字第一码。重码时,最后一字打全码。出现重码时加O即可。打词时,留意简码。本发明在大小键盘上通用,采用科学的记忆方法制定编码规则,自成一套完整的编码体系,并对应在数字键码上,利用数码即可以输入汉字具有重大突破。本发明数码字元分别依据形与数、声与数、数与数的关联,以及联想记忆方法设置;单字输入无翻页;输入法编码规则简单易学;平均码长四点六六码,最长七码,七千三百余字,重码率不足千分之二。比五笔更简单,比五笔更好用。本输入法基于笔画五笔演化而来,但相比之下本发明具有更显著的特点(—)笔画五笔用1-5个数来输入汉字,编码长,重码多,本输入法的笔画扩大至十个,即二乘五,可有效减少重码。这是'双重五笔'的第一重意思。(二)十个数0-4只有一个编码单元;而5-9编码单元是复数,每个数所包含的编码单元都不少于五个。这是第二重意思。(三)本输入法遇到单画取单画,遇到字根取字根,属双重取法。如果出现重码,还可二次取码,以便为重码字分组。即采用两套方法取码,故才有双重之说。除上述所说,本输入法创新与发展。主要体现在如下几点(1)将五百多汉字字构件做了大量筛选,最终只择用了十余个。五笔字型字根总量共一百三十多个,与之相比,本发明字元要少很多,大大减少了记忆数量,减轻学习负担。(2)编码规则改变了五笔的思路,不再对汉字进行字型分类与拆分。在本发明中,汉字就两种交叉的和不交叉的。笔画不交叉的汉字,按笔顺取码即可。交叉的汉字,按笔顺取码,取到交叉处,无论什么笔画,有叉就算。直接取其交叉的点数作编码,简单、直观,易学。(3)在编码规则中,本发明有一个独家发明取码时,可以漏掉某些特定的笔画。这样,即可减少冗长的编码,又等于在十个编码元素中,增加了一个新的元素。在十个数字用尽的情况下,组码方案可实现更多组合。(4)—般输入法,对付重码没有太好的办法。老五笔那套办法非常复杂,没法用。本发明的方法因为开始漏掉了某些笔画,在出现重码时,按规则补上这些编码信息即可。如果用完了该字的信息,则补加零,用零来为重码字分组。具体实施例方式下面结合具体实施方式对本发明进一步详细说明,但本发明并不局限于具体实施例。实施例1数码双重五笔汉字输入法,以电脑数字键盘或手机十个阿拉伯数码做键码,每个键码上对应存储字元,由字元编码输入汉字,十个数字键对应共34个字元,每个数字键对7<table>tableseeoriginaldocumentpage8</column></row><table>在这一编码表中,0-4是单一码元,分别代表0-口,闭合的圈,与口对应;l-—,l代表横;2-1,2代表竖;3-j,3代表敝;4-、,4代表点;编码表中,5-9是复数码元,分别代表5-乙"3,勺^,无论单笔双笔,与数字5的书写笔形很相似;6-LAh^,类似6的书写笔顺,^取自六字头,,为六画;7-7i,又,类似7的书写笔顺,'又'是7的笔画加一撇,从属于7;8八,八、々,捺,汉字小写'八,中的一画,从属8,八、々及'水,中的撇与捺,与'八,形似,从属8;9-J3,小十三乡《〈,单笔勾的方向与9相同,包括3中的勾;笔划中的提'提'较少见,也归为9;另外,连续的相同的三笔,在此约定取作9,故'三乡《〈'全从属9;'小十'借鉴四角号码的方法,从9。汉字输入时,按照下列编码规则点击数字键输入首先按汉字的书写笔序取码,码长最长为7位码(1)相同连续的双划只取其中的一笔。(2)相同连续的三划直接取作9码,'提'取作9。(3)两笔交叉构成单一叉点,交叉的这两笔跳过不取码。(4)两笔构成单一叉点的一码字,如'十',拆开取码;单叉收尾的字,如'干''字'等,拆开取码。8(5)多笔交叉(有交叉就算),取其叉点数做编码。一字中连续的单叉,算多叉;(6)闭合的方框字,如口、日、目、田,甲、由等,直接取0码。(7)—码字,如'乙',连续重复该字的编码,直至该字出现。以上所讲,都是针对输入单个汉字的。词组输入更简单l,双字词组先打首字,第一个汉字打出后,再接着打后面的字,直至该词组出现。2,三字词及三字以上的词组先打首字,第一个汉字打出后,其余的字只取该字第一码。重码时,最后一字打全码。出现重码时加O即可。打词时,留意简码。下面,举例说明使用本发明输入法如何输入单个字和词。单个字输入1、字中两笔交叉构成单一叉点,交叉的笔划跳过不取。举例1:"噪"依次取码口口口口八,即00008;"奰"依次取码口口口\,即0008举例2:"玉"依次取码一一、即114,"梧"依次取码八一一口,即8110:单一叉点,交叉的笔划跳过不取。玉有一个叉点,梧有两个单一的叉点,都跳过不取。2、闭合的方框字,如口、日、目、田,甲、由等,直接取0码。举例1:"野"依次取码口一7,即097,"迪"依次取码口、7\,即0478。按取码规则,由、甲二字,是作0来取的。需要提示的是如果是申,两边出头,就不作O来编码了。例2:"啤"依次取码口j口匕,即0306、"黑"依次取码口一、,即014:这里的O,也同属由、甲二字,但编码时要稍加注意。例3:"要"依次取码一口,S卩IO,"醒"依次取码一口口j,即1003:这里的O,也同属由、甲二字之列,把复杂的笔画(指去掉横的西、去掉横的酉)归为o,编码时会简化很多。3、相同连续的双划只取其中的一笔。举例1:"取"依次取码一1一又,即1217依次取码一1n八,即1278:都有两个连续的'横','字中有相同连续的双划,只取其中的一笔'。举例2:"修"依次取码jlj又乡,即32379,"钢"依次取码j一l,即3127:这组例子中,虽然笔画长短不同,但我们仍可以理解成是两竖和两横的关系,只取其中的一笔。4、多笔交叉(有交叉就算),取其叉点数做编码。一字中连续的单叉,算多叉。举例1:"老"依次取码,j,即23,"希"依次取码,11,即2272:—字中连续的单叉,算多叉,同等情况还有'势'字;举例2:"来"依次取码廿八28,"舟"依次取码j升、、3244:多笔交叉(有交叉就算),取其交叉的点数做编码,'来'字叉点间夹带的笔画不再编码。这样,来字只剩下了'撇'和'捺',即'八'从属8。'舟'字按笔画点是在叉点后面的,因此与'来'字的取码有所不同。举例3:"燕"依次取码卄一口l一21021、"挂"依次取码矛一一211、"姬"依次取码女一1口2120、"革"依次取码卄一1李2123、"毒"依次取码卄一李、2134、"蛰"依次取码矛*(丸)1*(中)2222:起头的编码主要取自交叉的点数。举例4:"卉"依次取码升一l〇2120:多叉,但不是单叉同时出现,视为2点交叉,把单叉跳过。5、一码字,连续重复该字的编码,直至该字出现举例l:3333卅。333丰此2字有三个叉点,且只能取一码,按取编码规则,'独码字,连续重复该字的编码,直至该字出现'。举例2:999三,99小;相同连续的三划直接取作9码,独码字。相同连续的三划直接取作9码,'提'取作9。举例1:"采"398依次取码j、1,八,"慢"90依次取码十口;"坏"9191依次取码——小,"蝴"22903依次取码1*一口j(编码简化字)6、关于重码字编码正常编码后面加O,以便为高重码字分组,可连续加O直至该字出现。如"若"2110依次取码廿一一0甘,"乞"3150依次取码j一乙〇;下述情况另行处理(1)方框取零出现重码字,取方框内笔画做识别码;如"咽"OOlll依次取码口口---,"咽"0013依次取码口口一j,方框内的笔画是展开的,不再考虑交叉问题。(2)重码字有单叉时,按序拆解其笔画做补加编码;如"五"117依次取码一一7,"干"112依次取码——l,"钾"31011612依次取码j一口——L一1(3)多叉字重码,要注明带钩和带折的笔画或注明其中夹带的未取的笔画;如"杀"289依次取码卄八j,"如"206依次取码女口L,"夹"2843依次取码卄\、J。(4)重码字有连续的笔画,补上漏掉的连续的第二笔;如"某"21811依次取码*一八一一。上述情况同时出现,按出现顺序取码。取尽笔画后仍重码再加零。正常编码后,余有单叉且与其他字重码时,优先拆解单叉的笔画。如"旱"011210依次取码口一一l一〇,"幹"081121依次取码口八一一1一。(5)简码的处理鹿、辟等字做偏旁部首其笔画繁多,按打字时的简码提醒用简码编码;如打'鹿'字,63211即可打出,那么63211就是'鹿'字旁的简码。'麂'字的编码就可写作6321135而全码是6321163635。词组输入l,双字词组先打首字,第一个汉字打出后,再接着打后面的字,直至该词组出现。如上海先输入"上"字21,该字出现在字框第一行,再输入483,就可打出'上海'一词;再如酒店,4810打出酒,再打6,即可打出'酒店'。又如2376376电脑810271合同87623创造821228企业0292是非3432我们0312118昨天100318明天84718今天4621以上2,三字词及三字以上的词组先打首字,第一个汉字打出后,其余的字只取该字第一码。重码时,最后一字打全码。如和平统一,38打出'和'剩下的字各打一码,即161,便可打出此词。再如中华人民共和国,22,打出'中'字,再打3872,此词出现,且无重码。又如8888224众人拾柴火焰高1811772天下无难事882348数风流人物9991151三下五除二881158坐飞机38127348输入法279297好好学习2173302虎啸龙吟452723宜将胜勇追穷寇38419777科学发展观无编码时,出现重码时加O即可。打词时,留意简码。经统计,词组的平均码长六点八O码,平均一点六八码打一字。十二万词库,重码个数1967,占总编码数的1.64%,其他编码指标如下单字个数7473,占总编码数的6.378%二字词个数48554,占总编码数的41.44%三字词个数19705,占总编码数的16.82%四字词个数32825,占总编码数的28.017%五字以上词个数32825,占总编码数的7.34%单字重码个数16,占总编码数的0.0137%,占单字编码数的0.2%。权利要求数码双重五笔汉字输入法,其特征是以电脑数字键盘或手机十个阿拉伯数码做键码,每个键码上对应存储字元,由字元编码输入汉字,十个数字键对应共34个字元,每个数字键对应的字元如下2.根据权利要求1所述的数码双重五笔汉字输入法,其特征是汉字输入时,按照下列编码规则点击数字键输入首先按汉字的书写笔序取码,码长最长为7位码(1)相同连续的双划只取其中的一笔;(2)相同连续的三划直接取作9码,'提'取作9;(3)两笔交叉构成单一叉点,交叉的这两笔跳过不取码;(4)两笔构成单一叉点的一码字字,拆开取码;(5)多笔交叉(有交叉就算),取其叉点数做编码;一字中连续的单叉,算多叉;(6)闭合的方框字,直接取0码;(7)—码字,连续重复该字的编码,直至该字出现;(8)简码的处理鹿、辟等字做偏旁部首其笔画繁多,按打字时的简码提醒用简码编码;(9)重码字编码正常编码后面加O,以便为高重码字分组,可连续加O直至该字出现。3.根据权利要求2所述的数码双重五笔汉字输入法,其特征是重码字编码正常编码后面加〇,以便为高重码字分组,可连续加O直至该字出现,下述情况另行处理(1)方框取零出现重码字,取方框内笔画做识别码;(2)重码字有单叉时,按序拆解其笔画做补加编码;(3)重码字有连续的笔画,补上漏掉的连续的第二笔;(4)多叉字重码,要注明带钩和带折的笔画或注明其中夹带的未取的笔画;上述情况同时出现,按出现顺序取码;取尽编码后仍重码再加零;(5)对编码过长、连续众多出现的重码字,机内会自动在尾码加写这些字的字频顺序号;用户只要按提示点击尾号,即可输入此字;正常编码后,余有单叉且与其他字重码时,优先拆解单叉的笔画。4.根据权利要求l所述的数码双重五笔汉字输入法,其特征是输入汉字词时,按照下列编码规则点击数字键输入双字词组先打首字,第一个汉字打出后,再接着打后面的字,直至该词组出现;三字词及三字以上的词组,先打首字,第一个汉字打出后,其余的字只取该字第一码。重码时,最后一字打全码;打完全码,出现重码时加0即可。全文摘要本发明涉及汉字编码输入方法。数码双重五笔汉字输入法,其特征是以电脑数字键盘或手机十个阿拉伯数码做键码,每个键码上对应存储字元,由字元编码输入汉字,十个数字键对应共34个字元,每个数字键对应的字元如下。本发明在大小键盘上通用,采用科学的记忆方法制定编码规则,自成一套完整的编码体系,并对应在数字键码上,利用数码即可以输入汉字具有重大突破。本发明数码字元分别依据形与数、声与数、数与数的关联,以及联想记忆方法设置;单字输入无翻页;输入法编码规则简单易学;比五笔更简单,比五笔更好用。文档编号G06F3/023GK101776955SQ20101012000公开日2010年7月14日申请日期2010年3月5日优先权日2010年3月5日发明者程路连申请人:程路连
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1