一种用于数字键盘的汉字拼音输入方法

文档序号:6342901阅读:180来源:国知局
专利名称:一种用于数字键盘的汉字拼音输入方法
技术领域
本发明为使用数字键盘的汉字拼音输入方法,将汉字数字编码与数字键盘相结合,是处理汉字信息指令、实现汉字输入的一项汉字数字编码的技术方案。
背景技术
目前,随着手机短信日趋广泛的使用,在手机上以拼音输入方法输入汉字,已成为广为人知和掌握的输入技术。手机中应用汉字拼音输入方法的,绝大多数选用摩托罗拉、T9或字源的三种技术,他们的共同点是拼音字母在数字按键的设置与英文字母完全一样,26个字母设定在数字按键2至9上,2为abc,3为def,4为ghi,5为jkl,6为mno,7为pqrs,8为tuv,9为wxyz,v等同于ü使用,每个拼音字母只需按键一次,将不成音节的字母组合自动过滤,不在屏幕显示,有重码音节的,需要选择。按数字键输入音节字母,由于一个按键含有多个字母,其组合共有四种情况(1)输入首字母或多个字母,但未输入音节的全部字母时,屏幕输入提示所显示的字母,正好是所要输入的音节字母,而显示的候选字中有所要输入的单字,可即选择上字,(2)屏幕显示所在的音节正好是所要输入的音节,如果候选字中有所要之字,即可选择上字,如果没有,则需按翻屏键,所要之字必会出现,(3)屏幕显示所在的音节为重码的其他音节,则应先选定所要输入的音节,(4)剩下的各种字母组合,均不能形成音节,屏幕不显示。由于按键上含有一个以上的音节首字母,每个字母都按同一按键输入,难以确定用户究竟要输入哪一个字母,因此现行的解决办法是,或者以字母的英文排序,选取最前面的一个;或者首先选取可单独成音节的字母,其他则选取所含常用字使用频度相对较高的字母。其思路是,既然按键上有字母,按击该按键,就是输入其字母,当有多个首字母时,则选取其中的字母,其他没选中的字母可以移动光标选取。输入音节首字母时,屏幕显示的候选字只对应该光标所在的字母,其余字母所含的汉字则不能作为候选字显示在屏幕上。这种传统的思路没有将按键的字母作为一个整体来考虑,认为按键后光标必落在字母上,不能落空。
汉语的特点是,词语的使用频度大大超过不构成词语的单字,特别是两字词语的使用频度最高;其次是,单字的使用频度差别很大,实际用到的大部份汉字是数量不多的高频常用字。26个字母中有23个可作为音节首字母的,而现有的数字按键字母设置,造成除数字键8只含首字母t之外,其余22个字母分布在数字键2至9七个键上,每个按键含2至4个首字母,而且每个首字母都含有一定数量的高频常用字,因此,以现有的技术按键输入单字的首字母,由于固定选择其中某个字母,造成只有1/2至1/4的命中率,即七个键所含的22个首字母,输入首键可选中其中的7个字母,其余15个被排除在外。现有技术的输入方式是以单字独个上字的,并遵循词语为单字固定组合的规律,将词语面的单字,以联想候选字的方法优先显示,提高输入效率;但是,实际使用中由于只选定一个首字母,首字母不同于此的联想字无法显示在屏幕上,使联想功能受到很大的限制。因此,在摩托罗拉的一些机型上,联想字只在刚上完字后才显示,输入下一个字的第一键则不显示联想字。然而,屏幕上能显示的候选字大多不超过十个,很多时候是不够显示联想候选字的。虽然采取增多屏幕显示候选字的办法,可减弱此问题,但会占用屏幕更多的位置,也增加使用时的视力消耗,不是彻底解决问题的办法。此外,在现有技术中,输入单字拼音的第一键后,出现的候选字,除了优先显示联想候选字外,剩下的候选字也是从同一个固定的拼音首字母所含汉字中,选取字频最高的;由于选取的范围窄,候选字的使用频度相对不高。因此,现有技术在输入单字拼音首字母的按键后,屏幕显示的候选字是合适的联想字少,非联想字的字频不够高。
不少手机用户未能完全掌握正确的发音,特别体现在分不清是否为翘舌音,即分辩不了z c s与zh ch sh,而现有的技术没有此模糊音的输入,以照顾这部分用户。
在汉字输入过程中,有时常碰到需要输入英文字母,而现有的技术在拼音输入模式中,不支持英文字母的直接输入,需要切换到英文输入模式才可输入,因而必须来回切换输入模式,非常繁琐。

发明内容
本发明针对现有技术中所存在的上述问题。主要目的在于按键输入拼音首字母后,让屏幕显示的候选字包含更多的联想字和使用频度更高的常用字,从而提高输入效率。
本发明的另一个目的是,按键输入拼音首字母后,有包含翘舌与不翘舌的模糊音输入选项,方便部分用户的使用,又不影响按正确方法的输入。
本发明还有一个目的,即按键输入拼音首字母后,无需切换到另一种输入模式,可以输入按键上所含的英文字母,消除按键切换输入模式所带来的麻烦。
本发明的上述目的是这样实现的首先应具备有一个汉字词语的数据库,此数据库含有词语使用频度信息,其次是所用的字集单字也含有使用频度信息,字或词使用频度的信息可以让在数据库里的字或词,按其频度高低排列。根据汉语句子中,字和词的特点及其出现的规律,利用刚已输入的汉字,可预测哪些单字作为候选字,被选中的概率最高。在按键输入单字拼音首字母之前,以紧接要输入之字前面,即光标的左边是否有汉字,分为两大类型第一种类型是,前面没有汉字,包括两种情况1)要输入的单字,是文本段落开头的第一个字;2)输入汉字后,接着输入非汉字符,如英文字母、空格等,造成紧接光标左边的不是汉字。
上述情况在按键后,屏幕显示的候选字,全部来自该按键所含汉字中使用频度最高的常用字。候选字的选取范围是,该按键上各个首字母所包含的全部汉字,按这些汉字中使用频度高低,取其最高者为候选字。
第二种类型是,前面有汉字,包括三种情况1)前面的单字与按键所含的单字可组成多字词语,如果按键所含的联想字是多字词语的第二个字,则作为屏幕显示的联想字是这样选取的从词语数据库中选取以刚输入单字为首字的所有词语,包括两字词语,选取最高使用频度词语的第二个字为候选字,
因此,有可能显示的候选字全部为两字词语的第二个字,属于多字词语的第二个字并没有显示;如果按键所含的联想字是多字词语的第三个或以后的字,则最优先显示在屏幕上。因而,多字词语的输入,即使第二个字没有出现在屏幕显示的候选字里,但输入第二个字后,以后的字会最先显示在屏幕上。
2)当刚输入单字与其前面的字不构成词语或多字词语的前部分,则从词语数据库中查找出以刚输入汉字为首字的词语,将这些词语中第二个字拼音首字母不在所输入按键上的过滤去,只留下以首字母在输入按键上的词语,选取其中使用频度最高词语的第二个字为显示的候选字。
3)当刚输入单字与其前面的字构成词语,而输入按键所含的任何汉字都不能与其前面词语重新组合成多字词语,词语联想功能在这种情况下失去了预测和提高输入效率的作用,屏幕显示的候选字全部不是联想字,而是高频的常用字,候选字的选取方法与上述第一类型完全一样。
上述选取屏幕显示候选字的每一具体办法,都是为了达到充分发挥词语联想的功能,但是,当联想功能无法发挥作用的情况下,则避免让联想字作为显示的候选字,占用有限的候选字数,选取高频的常用为候选字,以增加命中率。
在现有按键字母设定与有限候选字数的条件下,输入单字拼音的首字母后,为达到屏幕显示的候选字具有最高的命中率,候选字不能局限在按键一个首字母所含的字里选取;实际上,按键输入首字母后,光标落在哪个字母,即选择哪个字母并不重要,关键在于,屏幕出现的候选字是否为所要输入的单字。屏幕显示的输入提示有多种方式,可以表达候选字是按键所含的汉字,而不只是按键中一个首字母所含有的汉字。
上述输入第一键后,屏幕的输入提示框内可显示按键所含各个字母,以及在相应的数字按键上,增加拼音包容翘舌与不翘舌的模糊输入选项,用户可输入英文字母,或选择模糊音输入,使用方便。
汉字拼音的特点是,可成音节的首字母共23个,每个首字母都含有一定的常用字;从理论上说,汉字整个字集被23个首字母分为23个部分,而现行数字按键的字母设置,则是将字集分为8大部分。应用本发明方案,由于候选字属于按键各首字母所包含的汉字,不同于现行技术,显示的候选字只属于按键中一个首字母所包含的汉字;输入一个汉字后,屏幕即显示其联想字,在屏幕显示的候选字数是固定的情况下,输入下一键,共有八个不同的按键,可显示的字数是已显示字数的八倍,剔除已显示的联想字再次出现,输入一键后最多可增加七倍的联想字数显示。
与现有技术比较,在屏幕候选字字数相同的前提条件下,输入汉字拼音的第一键,本发明技术方案的候选字包含更多合适的联想字,和使用频度更高的常用字,因而输入效率应该更高。此优越性,可从实际抽样统计的数据得到验证和支持。应用本发明技术方案,实际输入汉字比现有摩托罗拉、T9或字源的三种主流技术,按键的次数可减少20%以上。而本发明技术方案的实施,也无需增加额外的成本和代价,例如,在手机、固定电话机等终端设备上,采用本发明技术,对用户来说,无须改变原输入习惯,即能使用,享受输入速度更为快捷的成果,而不必重新学习和熟悉,无须付出任何代价;而对生产厂家来说,采用本发明技术,无须改变原相关的软、硬件环境,生产成本不变。
具体实施例方式
本发明技术的实施,必须具备一个的词语数据库和字集,词语数据库包含着一定数量的两字和多字词语,并且每个词语都含有其使用频度,即词频的信息。当然,词语数量的多少根据应用环境而定,并随时代的进步而演变,增加新的词语,删去旧的词语,词频也不断地变化,例如,“觉悟”、“斗私批修”,现在已被删去或其使用频度已大大降低,相反,“上网”、“在线”、“互联网”等,成了新的词语。字集一般指国标字集,也包含其使用频度,即字频的信息。无论是字频,还是词频,越能接近用户的使用习惯与规律,实际应用中,越能让屏幕显示的候选字达到高频先见,提高命中率高,从而减少按键次数。
汉字四百余拼音音节对应着约七千单字,造成单字的重码率高;而在手机等数字键盘上以拼音输入汉字,每个按键设定了几个字母,八个按键包含了26个字母,因而重码更高。
本发明采取了这样的实施方式在输入单字拼音首字母的按键后,针对屏幕能显示的有限候选字,一方面,以最大范围选取候选字,达到候选字中包含更多能构成词语的联想字,充分发挥联想预测的功能,无联想字作为候选字时,则同样以最大范围选取字频最高的常用字为候选字;另一方面,根据词语的特点,区分某些情况下,联想字作为候选字时被选用的可能性很低,则候选字全部取自字频最高的常用字。
将候选字的选取范围最大化是,本发明技术及实施的关键。最大的选取范围是按键上各个可成音节首字母所含汉字的总和,就是按键所含汉字。本发明采取以退为进的方式,按键后,如果该键有一个以上的拼音首字母,则不直接选取其中的字母,即光标不落在任何一个字母上。
如果按键上的首字母单独可成音节,即含有字母a,e,o的按键,按键输入不直接选取按键上的字母,选取上述可单独成音节字母,就需要多按键一次向左移动光标。例如,要输入音节o,按数字键6,屏幕的输入提示即显示该键所含首字母m n o,如果光标落在第一个字母m上,选取o,只需向左移动光标两次;但如果光标不落在任何字母上,则需向左移动三次,多出的一次是第一次按键,将光标落在m上。上述可单独成音节的三个字母,所含的字数与或高频字相对不多,实际使用中较少遇到需要先选定这些字母的,因此,摩托罗拉等并没有为了节省一次按键,而将此三个字母各放在显示的第一个字母上。事实上,即使偶尔多移动一次光标,对用户来说,其代价是微不足道的。
按键输入单字的首字母时,该键所含的每个汉字都可作为候选字,即有一个候选字集;如果前面已输入的汉字可与该候选字集的单字组成词语,即有联想字,则屏幕可显示的候选字,按词频的高低选取相应的候选字。如果前面没汉字或前面已输入的汉字,与该候选字集的任何单字都不能构成词语,或者,屏幕可显示的候选字字数多于联想字,则选取该候选字集里,字频最高的常用字为显示的候选字。
下面例子是,输入单字“发”之后,任按每个数字键,屏幕显示的候选字,假定候选字字数为五个。可以看到,输入“发”后显示的联想字才5个,而任按一键后,显示的联想字共达34个,其中有5个是再次显示的。虽然以“发”字开头的词语比较多,但只要再输入一键,大部分频度较高词语的联想字,都显示在屏幕上,因此在实际输入中,可大大地节省按键次数。还可看到,同一按键上的每个首字母基本上都有联想字,如果输入时马上选定一个首字母,则其他字母所含的联想字不能显示出来,在本例中,可显示的联想字会减少过半。

以下为按键含有一个以拼音首字母者所含的高频字,显示的高频候选字就从其中选取按键2,不产出成部场报长本重体种从北保次;按键3,的大发地到对多方法定动分等得而电;按键4,国和会工个行公高化合关后过改各好;按键5,了经家来进建开理济加机力就利可金;按键6,年你能没民万面农内目明名门美南无;按键7,人是上市生日全时企实品区设社前说;按键9,一我在有中为要这业行作以展新主资。
为避免用不上的联想字,占用候选字字数,本发明实施方式是,先从刚已输入的多个汉字开始搜索,即对照词语数据库,判断是否构成词语;如果不是,才查找最后输入汉字的联想字。例如,输入“说明”之后,按数字键2,如果以最后一字“明”的联想字,如“暗朝察辩”为显示的候选字,显然是很难用得上的,本发明在这种情况,即前面已组成词语,而该键所含的任何字不能与此词语组成多字词语,则显示的候选字全部为该键所含的字频最高常用字。以下输入简单一句话“一定在家等我”为例

上例一句话里有三个词语“一定”、“在家”、“等我”,实际输入的按键次数少是由于第一,上字后可显示该键所含的联想字,如“在家”的“家”字;即使上字后所要的联想字没显示,但按键后,缩小了联想字的范围,该键所含的联想字也大有可能显示出来,如“一定”的“定”字。第二,根据搜索、判断已输入之字是否为词语,才决定候选字是选取高频字或联想字;“一定”是词语,按键9所含字集中没有任何字,可与之组成新的多字词语,故不选择“定”的联想字为候选字,而选取按键9候选字集中字频最高的字为候选字。如按T9的实施方法,按数字键9,则会显示“定”的联想字,如“位义罪向性”等,而实际所要输入的“在”字,需要更多的按键才能输入。第三,属于候选字的高频字也一样从按键所含的候选字集里选取;“一”、“在”都是按键9的高频字,如按T9的实施方法,按数字键9,最多只能显示其中的一个字。
本发明输入字符的上字方法,与现有技术相同,可移动光标至候选字符,然后按上字键上字;或者,屏幕显示的候选字符带有数字序号,长按数字序号对应的数字键即可上字。
在开始输入,按第一键时,屏幕的输入提示框内即显示数字键所含的拼音首字母选项,并且当数字键含有一个以上拼音首字母时,在其字母的前面有该数字键的阿拉伯数字,或一个包含该按键各字母标志的选项,光标落在此选项上,表示屏幕显示的候选字是属于该数字按键所含的汉字,而不是只属于按键中某个首字母所含的汉字。按键向左移动光标至某个字母上,屏幕出现的候选字即属于该字母所含的汉字。
以屏幕最多显示的候选字为五个为例,按数字键3,屏幕的输入提示框即显示3d e f;而屏幕显示的候选字为的大发地到。按键向左移动光标,屏幕的输入提示框即显示3de f;而屏幕显示的候选字为的大到等多。再按键向左移动光标,屏幕的输入提示框即显示3 def;而屏幕显示的候选字为恶饿额阿俄。如再按键向左移动光标,屏幕的输入提示框即显示3 d ef;而屏幕显示的候选字为发方法分放。
在拼音输入模式中,如要输入英文字母,无须切换到英文输入模式,其实施方式是设定*号键为输入法的切换键,当屏幕上没有显示字母时,按*号键,即切换为另一种输入模式,而当按第一键,屏幕显示按键所含字母时,按此键,屏幕即显示数字按键上大写的各个字母,光标落在首个字母上,其余字母可移动光标选取;如再按*号键,则显示的大写字母转为小写字母。输入一个英文字母后,仍处于拼音输入模式。例如,要输入字母e,首先按字母e所在的数字键3,接着按*号键,这时屏幕显示DE F;再按*号键,屏幕则显示de f,按键向左移动光标,屏幕显示def,按上字键即输入字母e。如果要输入的字母是i,u或v,由于这三个字母不是拼音的首字母,因此,按其所在的数字键后,在输入提示框内没有显示这些字母,但接着按*号键,就会马上显示出来。
不少用户分辩不清是否为翘舌音,即无法分辩z,c,s与zh,ch,sh的音节,由于h为开头的第二个字母,一旦漏输入或多输入h,等输完音节,查完所有候选字后,发现输入错误,再重新输入,结果会十分烦琐。本发明技术为了方便这部分用户的使用,同时不给按正确方法输入的用户带来任何不良的影响,实施以下的方式输入拼音首字母时,按数字键2,屏幕的输入提示框显示2a b c c?;按数字键7,屏幕的输入提示框显示7p q r s s?;按数字键9,屏幕的输入提示框显示9w x y z z?;
z?,c?,s?为模糊音选项,包含有h与没有h两种情况,当用户碰到难以判决音节是否含有h时,按键移动光标选取此项,可避免拼音输入错误;选择模糊音选项之后,不用理会是否含有h,继续输入剩下字母。而掌握正确发音的用户,则可完全忽略此模糊音选项的存在,按其习惯输入,此模糊音选项的存在不产生任何影响。
例如,当用户无法区分要输入的“钞”字,其拼音是否含有h,选择模糊音输入。具体输入步骤如下首先,按拼音首字母c所在的数字键2,屏幕的输入提示框显示2a b c c?;根据输入提示,按键将光标移至模糊音选项c?屏幕的输入提示框显示2 a b cc?;不用理会是否含有h,继续输入剩下的字母a和o,即按数字键2和6,这时屏幕的输入提示框显示c?anc?ao;光标所在的音节不是所要之字的音节,按键将光标移至音节c?ao,屏幕即显示候选字“钞”,选择上字,完成输入。
权利要求
1.一种用于数字小键盘的汉字拼音输入方法,将26个字母设定在数字按键2至9上,2为abc,3为def,4为ghi,5为jkl,6为mno,7为pqrs,8为tuv,9为wxyz,v等同于ü使用,输入每个拼音字母只按相应数字键一次,由此对应的字母组合共有四种情况(1)只输入首字母或更多字母,还未输入音节的全部字母,屏幕的输入提示也只显示输入的字母,而所要输入的汉字已出现在候选字中,可即选择上字,(2)屏幕的输入提示显示所在的音节正好是所要输入的音节, 如果候选字中有所要之字,即可选择上字,如果没有,则需按翻屏键,所要之字必会出现,(3)屏幕显示所在的音节为重码的其他音节,则应先选定所要输入的音节,(4)剩下的各种字母组合,均不能形成音节,屏幕不显示,当输入的音节首字母为t,则不存在首字母不同的重码音节;本发明的特征在于按键输入音节的首字母,屏幕有该按键的输入提示,显示的候选字属于设定在该按键上各个字母为首字母的音节所对应的汉字,是与刚输入汉字可构成词语的联想字,或是该按键所含汉字中的高频常用字。
2.根据权利要求1所述的候选字,其特征是如果按键所含的任何单字,都不能与刚输入的词语重新组合为多字词语,则屏幕显示的所有候选字,为该按键上所含汉字中的高频常用字。
3.根据权利要求1所述的常用字,其特征是常用字为按键所含的所有单字中使用频度最高的汉字,常用字显示的排序在联想字之后。
4.根据权利要求1或4所述的常用字,其特征是按键含有一个以上拼音首字母的,其对应的高频字为按键2,不产出成部场报长本重体种从北保次;按键3,的大发地到对多方法定动分等得而电;按键4,国和会工个行公高化合关后过改各好;按键5,了经家来进建开理济加机力就利可金;按键6,年你能没民万面农内目明名门美南无;按键7,人是上市生日全时企实品区设社前说;按键9,一我在有中为要这业行作以展新主资。
5.根据权利要求1所述的按键输入提示,其特征是除了音节首字母为t之外,屏幕还显示按键的阿拉伯数字或一个含有该按键上各个字母的标志。
6.根据权利要求1所述的按键输入提示,其特征是无需切换为另一种输入模式,数字键上所含各个字母,可选择输入。
7.根据权利要求1所述的按键输入提示,其特征是按数字键2、7或9,首字母为c、s或z的,有音节第二个字母为h或非h的两种可能,在屏幕输入提示中,有包含此两种可能的模糊音输入选项,选取此选项后,不用输入h,其余字母如常输入。
全文摘要
本发明公开了一种用于数字键盘的汉字拼音输入方法,按键输入音节的首字母时,屏幕显示的候选字属于设定在该按键上所含的汉字,是与刚输入汉字可构成词语的联想字,或是该按键所含汉字中的高频常用字;具有模糊音选项输入,无需切换输入模式,可输入英文字母。本发明技术方案的候选字包含更多合适的联想字,和使用频度更高的常用字,输入效率高,技术方案的实施,无需增加额外的成本和代价。
文档编号G06F3/023GK1581041SQ20041002726
公开日2005年2月16日 申请日期2004年5月20日 优先权日2004年5月20日
发明者汤步青 申请人:汤步青
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1