基于声母和笔划的汉字输入法的制作方法

文档序号:6332857阅读:150来源:国知局
专利名称:基于声母和笔划的汉字输入法的制作方法
技术领域
本发明涉及一种基于声母和笔划的汉字输入法,特别涉及它所用的字母键盘、数字键盘和汉字编码方法。
背景技术
对于通用字母键盘上的汉字编码输入法,现有技术一般都以4位(个别的以3位或5位)编码作为汉字编码的最长码,采用同一类字符为字词进行混合编码,当出现重码时通过翻页和选择来确定所需的字词,并通过简码和增加编码规则的复杂性来提高输入效率,通过动态调整重码字词的顺序来缓解重码问题。现有技术存在的问题是由于规则复杂而增加了使用者的学习难度;由于采用同一类字符编码,输入时除了已达最长码的字词外都不能自动选择,词组的增删不能自动进行,而且随着字词的增加,由于编码空间有限,而出现大量的重码,增加键选率,导致输入速度下降;不能根据不同用户的使用情况而动态地调整输入码,对用户的适应性差。例如二笔输入法(见www.srf.cn)使用了除i、v、u以外的23个字母来表示声母,用25个字母(含四个标点符号)表示由横、竖、撇、点、折组合而成的25个二笔组合,另外5个字母表示单笔划,还使用了一些偏旁部首,在取码时要区分独体字与合体字而采用不同的方法,设置了一、二、三级简码,最长码为四码。
对于电话等数字键盘上的汉字编码输入法,现有技术主要是用拼音或笔划输入单字,并通用联想来加快输入速度,如美国特捷公司的T9拼音和T9笔划汉字输入法(见www.t9.com)。这类输入法存在的问题像早期通用字母键盘上的联想输入一样,过多地依赖于人机交互进行选择,虽然缩短了输入码长,但却严重地影响了击键速度,并且易于导致输入者疲劳。另外,数字键盘上也出现了类似通用字母键盘上的基于笔划和部件编码的字词混合编码方案,最长码一般为6码。例如王永民先生的数码系列方案(见www.wangma.com.cn)。此类输入法存在的问题和相应的通用字母键盘上的输入法的问题类似,不再赘述。

发明内容
本发明的目的是提供一种简单、规范、快速、灵活的汉字输入方法,以克服现有技术编码规则复杂、混乱,或输入效率低下、适应性差的缺点。
本发明的目的是以汉字的声母和笔划为基础,通过采用字母键盘、数字键盘结合编码规则和输入方法来实现的。在字母键盘上,用v代表零声母,复声母zh、ch、sh分别并入z、c、s,其它声母与键盘字母相同,用a、e、i、o、u分别表示横、竖、撇、点、折五种笔划,具体对应关系如表1所示;在数字键盘上,用6代表声母b、c、ch、d、f,用7代表声母g、h、j、k,用8代表声母l、m、n、p,用9代表声母q、r、s、sh、t,用0代表零声母和声母w、x、y、z、zh,并用1、2、3、4、5分别表示横、竖、撇、点、折五种笔划,具体对应关系如表2所示;不论在字母键盘上还是在数字键盘上,其编码规则和输入方法都相同单字的编码方法是取单字声母,加单字的头11个笔划,或者直接取单字的头12个笔划;二字词的编码方法是取各字的声母,加首字头2个笔划,再加末字的头8个笔划;三字词的编码方法是取各字的声母,加首字头2个笔划,加第二字头2个笔划,再加末字的头5个笔划;四字词的编码方法是取首字声母,加第三字声母,加末字声母,加首字头2个笔划,加第二字头2个笔划,加第三字头2个笔划,再加末字的头3个笔划;五字及五字以上词的编码方法是取首字声母,加第三字声母,加末字声母,加首字头2个笔划,加第二字头2个笔划,加第三字头2个笔划,加第四字头2个笔划,再加第五字的头1个笔划。
与现有技术相比,本发明具有下述优点突破了现有技术字母编码最长4位和数字编码最长6位的定式,将最长码扩展到了12位,为字词提供了巨大的编码空间,不再为字词数量增加后重码率的急剧上升而烦恼,在正常的输入过程中基本上不需要进行效率极低的翻页和选择操作;采用最为简单的汉字声母和规范的笔划、笔顺作为汉字编码的特征信息,结合简单的、在字母键盘和数字键盘上一致的编码规则,降低了学习难度,扩大了编码的应用范围;在数字键盘上实现了纯笔划输入的引导式联想技术;利用互不相交的字符集为声母和笔划编码,在输入过程中既能在未出现所需字词时不断地延长输入码,又可以随时在出现所需字词时输入下一字词,同时将前一字词自动选中,减少了击键次数;在根据大规模统计为高频字词分配较短的输入码后,又在输入过程中进一步根据输入者的使用情况动态调整输入码长度,可以很快地适应各个输入者不同的需要,提高其输入效率;能够自动地定义新词和删除不常使用的具有最长输入码的词组,在基本上不用输入者手工干预的情况下适应新的输入场合。这样便能达到使本发明所述的输入法易学、易用、规范、高效、灵活的总体目标。
表1声母、笔划在字母键盘上与键盘字母的对应关系表

表2声母、笔划在数字键盘上与键盘数字的对应关系表

具体实施方式
下面结合表和实施例对本发明做进一步说明。
在表1和表2中,零声母是指汉语拼音中以a、e、o开始的音节的声母,同时将w和y也看成是声母。根据国家标准,笔划提归于横,笔划竖左钩归于竖,笔划捺归于点,所有带转折的笔划都归于折。
例如汉语拼音中的音节ao、en、ou等都是零声母音节,因此在字母键盘上用v来代表它们的声母,而音节wen、yan等中的w、y也看成是声母。又如汉字“提”左边提手旁中的提笔应归于横,汉字“水”中间的竖左钩应归于竖,汉字“八”右边的捺应归于点,汉字“刀”中的横折钩应归于折。
本发明单字和词组的完全编码在字母键盘和数字键盘上都是12位,而且编码方法相同,只是对应的键盘字母不同而已。12位的码长为字词提供的编码空间比现有技术所能提供的编码空间巨大得多。单字的编码方法是取单字声母,加单字的头11个笔划;二字词的编码方法是取各字的声母,加首字头2个笔划,再加末字的头8个笔划;三字词的编码方法是取各字的声母,加首字头2个笔划,加第二字头2个笔划,再加末字的头5个笔划;四字词的编码方法是取首字声母,加第三字声母,加末字声母,加首字头2个笔划,加第二字头2个笔划,加第三字头2个笔划,再加术字的头3个笔划;五字及五字以上词的编码方法是取首字声母,加第三字声母,加末字声母,加首字头2个笔划,加第二字头2个笔划,加第三字头2个笔划,加第四字头2个笔划,再加第五字的头1个笔划。当字词编码的笔划数不足所要求的数量时,从末笔开始按“横竖撇点折横……”的顺序各补两笔直到满足所要求的笔划数为止。
例如,“人”字的声母为r,笔划依笔顺为“撇点”。由于笔划不足11个,需要按上述规则补充9个笔划,它们是“点点折折横横竖竖撇”,因此“人”字最后的编码为“r撇点点点折折横横竖竖撇”。根据表1可以看出该字在字母键盘上对应的键盘字母序列(即字母编码)为“riooouuaaeei”,而根据表2可以看出该字在数字键盘上对应的键盘数字序列(即数字编码)为“934445511223”。
又如,“安全”这个词中“安”字的声母为零声母,其头2个笔划为“点点”,而“全”字的声母为q,其笔划序列为“撇点横横竖横”,再补2个笔划“横横”,故该词最后的编码为“零声母q点点撇点横横竖横横横”。根据表1可知该词的字母编码为“vqooioaaeaaa”,而根据表2可知该词的数字编码为“094434112111”。
再如,“操作系统”这个词中首字“操”的声母为c,第三字“系”的声母为x,末字“统”的声母为t,前三字的头2个笔划依次为“横竖”、“撇竖”和“撇折”,而末字的头3个笔划为“折折横”,故该词最后的编码为“cxt横竖撇竖撇折折折横”。根据表1可知该词的字母编码为“cxtaeieiuuua”,而根据表2可知该词的数字编码为“609123235551”。
本发明声母的编码字符和笔划的编码字符分属于两个互不相交的字符集合。字母键盘上的编码字符集合为26个英文字母,并且数字键盘上的编码字符集合为10个阿拉伯数字。在字母键盘上,表示声母的字符集合为{b,c,d,f,g,h,j,k,l,m,n,p,q,r,s,t,v,w,x,y,z},表示笔划的字符集合为{a,e,i,o,u},它们是不相交的,两者的并集则正好是26个英文字母。在数字键盘上,表示声母的字符集合为{6,7,8,9,0},表示笔划的字符集合为{1,2,3,4,5},它们也是不相交的,两者的并集则正好是10个阿拉伯数字。
本发明在实际输入时字词的输入码是通过截取相应编码而形成的不等长码,极少使用其长度为12的完全编码进行输入,输入码码长的确定原则最初是根据大规模的字词统计频次尽量给高频字词分配较短的输入码。需要说明的是,对于同一字词在字母键盘上的输入码长度和在数字键盘上的输入码长度可以是不同的。
例如,“中”字比“桌”字常用得多,那么“中”字就截取其完全编码的头两位作为其输入码,该输入码在字母键盘上为ze,在数字键盘上为02,而“桌”字就在字母键盘上截取其完全编码的头5位作为其输入码,结果为zeaeu;在数字键盘上则截取其完全编码的头6位作为其输入码,结果为021251。
再如,“主要”比“庄园”常用得多,那么“主要”在字母键盘上截取其完全编码的头3位作为其输入码,结果为zyo;在数字键盘上则截取其完全编码的头4位作为其输入码,结果为0041,而“庄园”就在字母键盘上截取其完全编码的头5位作为其输入码,结果为zyoae;在数字键盘上则截取其完全编码的头10位作为其输入码,结果为0041251135。
本发明在输入者的输入过程中字词的输入码码长可以根据输入者的输入情况而发生动态改变,缩短输入者经常使用的字词的输入码的长度,延长输入者不经常使用的字词的输入码的长度,从而提高输入效率。这是因为每个输入者一般总是在一定的领域工作,还有自己习惯使用的字词,并且在某次输入过程中某些字词常会反复出现。虽然字词的输入码最初就是在大规模统计的基础上根据“高频码短”的原则设定的,但是这种设定并不能够满足每个输入者的需要,通过这里所述的动态输入码长调整,在一段时间的使用后,就能形成最适合某个输入者的字词输入码码长配置。
例如,在把动态输入码码长设定为3时,若一个医学领域的人在第一次用字母键盘输入“声带”这个词时的输入码为sdaeaeeeo,那么当他再次输入该词时,其输入码就会变sda,替代了原来在sda这个输入码上的词组“速度”,而“速度”的码长则变为4,原来与其编码相同的输入码码长为4的词组的码长则变为5,如此类推,直到遇到一个空的输入码位置或达最大码长为止;另一方面,比“声带”输入码更长的具有相同编码的词组将依次缩短自己的码长以填充“声带”腾出来的输入码位置。
本发明当输入码码长未达最大码长12时任何输入码所对应的字词数量最多不超过1,当字词输入码的末尾出现笔划编码并出现所需字词后就可以直接输入下一字词的编码从而自动将所需字词选中,而不必按选择键选择所需字词,减少了输入时的击键数。由于码长达12的字词非常少且很不常用,故在日常的输入过程中几乎不用进行重码选择,而且几乎每次提示的反馈信息都是唯一的,通过适当的反馈设计就可以使输入者能迅速地接收反馈并做出反应。
例如,在输入“请不要吸烟!”这句话时,在字母键盘上输入的输入码序列为qoubyaxyeu!,因为在输入qou后提示的唯一汉字是“请”,而且其输入码的最后一位是笔划折的编码u;接着输入词组“不要”的第一码b后“请”字被自动选中;继续输入完bya后提示的唯一词组为“不要”,而且其输入码的最后一位是笔划横的编码a;再接着输入词组“吸烟”的第一码x后“不要”被自动选中;继续输入完xyeu后提示的唯一词组为“吸烟”,最后输入感叹号!后在自动选中“吸烟”的同时也输入了符号“!”。
本发明单字、二字词和多字词的输入码各自拥有独立的编码空间;当词组输入码的末尾出现笔划编码或输入码码长已达3,并且输入码没有任何词组对应时,可以紧接着用单字输入一遍所需的词组就能定义所需要的词组供后续的输入使用,而不必手动进入造词方式,同时对于二字词还能自动结束造词状态。
单字输入码的特征是以一个声母开始接1至11个笔划,或者直接由1至12个笔划构成;二字词输入码的特征是以二个声母开始接1至10个笔划;三字及三字以上的多字词输入码的特征是以三个声母开始接1至9个笔划。因为本发明不论在字母键盘上还是在数字键盘上,用于表示声母的字符集和用于表示笔划的字符集都是不相交的,所以就能通过输入码区分开单字、二字词和多字词。这种字与词之间、词与词之间在输入码上的分流,为输入法的实施和使用带来了很大的方便,也为定义新词时自动判断字词类型奠定了基础。
例如,假设输入者想在字母键盘上输入“仓颉”一词,他不知道原系统中没有这个词,在他按二字词的编码规则输入完cjioae后发现该输入码为空且一直未见到所需的“仓颉”一词,于是他就接着按单字方式分别输入“仓”和“颉”字,词组“仓颉”就自动定义完成了,并且其输入码码长被自动设定为当时动态码长的长度,比如3。在下文输入“仓颉”时,他就只需输入cji就行了。
本发明当某个码长为12的输入码上的词组超过1时,可用本来为笔划编码的字符兼做选择键,这时这些字符不再表示笔划的类型。
例如,如果在字母键盘上输入码为bzaeueaaaeei的二字词有“鞭子”、“本子”、“棒子”、“梆子”、“村子”、“才子”共计6个,那么可以用空格选择“鞭子”,用a、e、i、o、u分别选择其它五字词组,这时a、e、i、o、u并不表示笔划,而仅仅是作为选择键使用。
本发明当某个码长为12的输入码上的词组超过6时,将自动删除输入者最不常用的那个词组,这种情况发生在动态调整输入码码长和进行新词组的定义时。由于本发明的词组是自动定义的,如果没词组的淘汰机制,那么词库就会过于庞大,而且最终会导致某些最长输入码上的重码数超过6;如果采用手工删除词组,又会增加输入者的负担。实际上,这些最长输入码上的词组往往对于输入者来说是极不常用的,保留它们没有什么实用价值,因此最好的办法是自动删除输入者最不常用的那个词组。这样既避免了词库规模的过渡膨胀,也避免了进行效率很低的翻页操作或手工删除词组的操作。
本发明在数字键盘上按纯笔划方式输入汉字时可以在已用1、2、3、4、5作为笔划编码输入了汉字编码的至少1位后,再用6、7、8、9、0分别表示笔划横、竖、撇、点、折来进行输入,并且在码长大于1时能自动选择已出现的字;将汉字编码的第2个笔划用6、7、8、9、0录入,以表明需要根据已输入的字和编码进行引导式联想,并且若联想失败就自动转入非联想方式输入,同时定义新的联想词组。纯笔划方式既可以用来作为声母加笔划方式的补充,也可以供那些完全不懂拼音或不愿意使用拼音的人单独使用。由于采用了引导式联想技术,极大地提高了联想的准确性,加上自动选择和前述的输入码码长动态调整,本发明的纯笔划方式也具有很高的输入效率。
例如,当输入“汉字编码”这个短语时,若输入“汉”字的前三个笔划编码441后“汉”字出现在了提示窗口,就可以用9代表“字”字的第1个笔划“点”进行输入,这时“汉”字被自动选择上屏,同时9被转换为4进行显示以表明是在纯笔划方式下输入。接下来,再用9代表“字”字的第2个笔划“点”进行输入,表明需要根据已输入的“汉”字和已输入的编码“49”进行联想。此时,如果提示窗口为空,则系统自动转入非联想方式,并根据用户输入的字定义新的联想词组供下次联想使用;如果提示窗口有字但不是所需的,则可继续用1、2、3、4、5追加笔划编码直到出现“字”或提示窗口为空为止;如果出现“字”,则可用0代表“编”字的第1个笔划“折”进行输入,这时“字”字就被自动选择上屏,同时0被转换为5进行显示以表明是在纯笔划方式下输入。再接下来,由于“字”和“编”字进行联想没有什么意义,于是用5代表“编”字的第2笔“折”进行输入,表明不进行联想,系统按单字出现的频率优先显示常用字,若未见所需的字,可继续用1、2、3、4、5追加笔划编码直到出现“编”字为止,然后再用6代表“码”字的第1个笔划“横”进行输入,这时“编”字被自动选择上屏,同时6被转换为1进行显示以表明仍在笔划方式下输入。最后,用8代表“码”字的第2个笔划进行输入表明需要根据已输入的“编”字和已输入的编码“18”进行联想。以此类推,直到完成输入为止。
权利要求
1.一种基于声母和笔划的汉字输入法,包括字母键盘、数字键盘和编码方法,其特征在于1)声母、笔划在字母键盘上与键盘字母的对应关系如下
2)声母、笔划在数字键盘上与键盘数字的对应关系如下
3)单字的编码方法是取单字声母,加单字的头11个笔划,或者直接取单字的头12个笔划;4)二字词的编码方法是取各字的声母,加首字头2个笔划,再加末字的头8个笔划;5)三字词的编码方法是取各字的声母,加首字头2个笔划,加第二字头2个笔划,再加末字的头5个笔划;6)四字词的编码方法是取首字声母,加第三字声母,加末字声母,加首字头2个笔划,加第二字头2个笔划,加第三字头2个笔划,再加末字的头3个笔划;7)五字及五字以上词的编码方法是取首字声母,加第三字声母,加末字声母,加首字头2个笔划,加第二字头2个笔划,加第三字头2个笔划,加第四字头2个笔划,再加第五字的头1个笔划。
2.根据权利要求1所述的基于声母和笔划的汉字输入法,其特征在于当字词编码的笔划数不足所要求的数量时,从未笔开始按“横竖撇点折横……”的顺序各补两笔直到满足所要求的笔划数为止。
3.根据权利要求2所述的基于声母和笔划的汉字输入法,其特征在于声母的编码字符和笔划的编码字符分属于两个互不相交的字符集合,在字母键盘上的这两个集合的并集为26个英文字母,在数字键盘上的这两个集合的并集为10个阿拉伯数字。
4.根据权利要求3所述的基于声母和笔划的汉字输入法,其特征在于字词在实际输入时的输入码是通过截取相应编码而形成的不等长码,码长的确定原则是根据字词的统计频次尽量给高频字词分配较短的输入码。
5.根据权利要求4所述的基于声母和笔划的汉字输入法,其特征在于输入过程中字词的输入码码长可以根据输入者的输入情况而发生动态改变,缩短输入者经常使用的字词的输入码的长度,延长输入者不经常使用的字词的输入码的长度。
6.根据权利要求5所述的基于声母和笔划的汉字输入法,其特征在于当输入码码长未达最大码长12时,任何输入码所对应的字词数量最多不超过1,当字词输入码的末尾出现笔划编码并出现所需字词后,就可以直接输入下一字词的编码从而自动将所需字词选中,而不必按选择键选择所需字词。
7.根据权利要求6所述的基于声母和笔划的汉字输入法,其特征在于单字、二字词和多字词的输入码各自拥有独立的编码空间;当词组输入码的末尾出现笔划编码或输入码码长已达3,并且输入码没有任何词组对应时,可以紧接着用单字输入一遍所需的词组就能定义所需要的词组供后续的输入使用。
8.根据权利要求7所述的基于声母和笔划的汉字输入法,其特征在于当某个码长为12的输入码上的词组超过1时,可使用笔划的编码字符兼做选择键,这时这些字符不再表示笔划的类型;当某个码长为12的输入码上的词组超过6时,将自动删除输入者最不常用的那个词组。
9.根据权利要求8所述的基于声母和笔.划的汉字输入法,其特征在于在数字键盘上按纯笔划方式输入汉字时可以1)在已用1、2、3、4、5作为笔划编码输入了汉字编码的至少1位后,再用6、7、8、9、0分别表示笔划横、竖、撇、点、折来进行输入,并且在码长大于1时能自动选择已出现的字;2)将汉字编码的第2个笔划用6、7、8、9、0录入,以表明需要根据已输入的字和编码进行联想,并且若联想失败就自动转入非联想方式输入,同时定义新的联想词组供下次联想使用。
全文摘要
本发明是一种基于声母和笔划的汉字输入法,包括字母键盘、数字键盘和编码方法,其特征是在字母键盘上用v代表零声母,将声母zh、ch、sh分别并入z、c、s,其它声母与键盘字母相同,并用a、e、i、o、u分别表示笔划横、竖、撇、点、折;在数字键盘上,用6、7、8、9、0代表声母,并用1、2、3、4、5分别表示笔划横、竖、撇、点、折;单字的编码可以通过声母加笔划构成也可以由纯笔划构成,词组编码由声母加笔划构成;突破了字母编码最长4位和数字编码最长6位的定式;在数字键盘上还实现了高效的纯笔划引导式联想输入技术;加上动态码长调整、自动词组管理等技术,使本发明达到了易学、易用、规范、高效、灵活的目标。
文档编号G06F3/023GK1604022SQ20041009207
公开日2005年4月6日 申请日期2004年11月2日 优先权日2004年11月2日
发明者戴石麟 申请人:戴石麟
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1