输入法的制作方法

文档序号:6429826阅读:170来源:国知局
专利名称:输入法的制作方法
技术领域
本发明涉及输入法技术,用于提高输入法输入字或词的效率,特别是对于拼音类输入法。
背景技术
非英文语言的国家为了输入本国文字,可以使用各种输入法实现,例如,汉字的输入就存在众多的输入法,其中,拼音作为绝大部分人使用的输入法,具有无需专门学习(如全拼)或只需简单的学习(如简拼、双拼、以及自然码等)的特点,而且符合使用者平常的思维习惯,因而尽管其输入速度不是很快,但仍然为大部分人所首选。基于拼音的输入法存在的最大问题是发音的混淆问题,这源于中国众多的方言, 如z, C,S和zhi,chi, shi不易区分,1和η不易区分,in, en和ing和eng不易区分等,基于此,现有的输入法做了改进,如模糊音设置就是一种,在该方法中,不再区分发音相近的声母或韵母,以此减少用户击键的次数,以提高输入速度。但这带来了新问题,即该方法使人们越来越分不清标准拼音,对民族文化和拼音的标准化不利,特别是对于学生和年青人而言,可能会形成他们一生错误的拼写。另外,为提高拼音的输入速度,人们开始使用部分匹配技术,即输入的拼音编码 (或对应的拼音)部分匹配某个字或词的拼音,则也将该字或词列入备选列表中,供用户选择,该方法也是为了减少击键次数,提高输入速度,带来的问题是,用户输入的拼音和其最终输入的汉字的拼音容易形成错误的对应,如用户如果输入拼音编码"shen",对于 “生”字来讲,由于其拼音〃 sheng"包括〃 shen",因而,如果使用局部匹配,“身〃,“ 生"均可能出现在shen的备选列表中,容易让用户形成"生"字的发音就是"shen"的错误,同样,“ra〃,“ ran"和〃 rang"等等也有可能形成该问题。上述问题也适用于基于词的输入情况。同时,人们使用调频技术来提高字或词的首选命中率,减少击键次数,提高输入速度,并允许用户增加自定义词组来加快输入,但现在的问题是,基于上述技术的字频/字序、词频/词序、词组库等等用户使用习惯数据一般存在于本地存储器中,用户积累的使用习惯只与在本机上的使用有关,一旦更换了机器或重新安装了系统,以往的积累往往付之东流。

发明内容
本发明提供一种方法,用于解决以上问题,具体而言,就是使用功能键在容易混淆的拼音间进行切换,从而将用户输入的错误发音切换到正确的发音上,方便用户快速获得需要的字或词,同时还可以纠正用户错误的拼音拼写;通过对不同匹配程度的备选列字或词进行分区显示的方式,使用户对完全匹配或部分匹配情况一目了然,不至于混淆其输入字或词的发音;通过将用户使用习惯数据存储在网络或移动存储上的方式,使用户积累的输入经验可以长久保存,且随时随地可以使用,另外,使用历史更新记录来同步用户使用习惯数据在本机和移动或网络存储上的存储。技术方案本发明所述的使用功能键切换容易混淆的字或词方法使用如下步骤来实现1.用户输入一拼音编码;2.系统解析该拼音编码,并将符合解析结果的字或词放入备选列表中;3.用户在备选列表中寻找自己欲输入的字或词,如果发现,则表明用户输入正确, 本次输入结束,否则转4;4.表明用户输入错误,假如错误不是由于容易混淆的拼音造成,而是由于错误的输入造成,则修改输入拼音编码,转2,否则转55.表明用户输入了错误的容易引起混淆的拼音编码,此时,用户按功能键,则用户输入的拼音编码自动切换为另一个与之相近的拼音编码,备选列表中也出现与之对应的备选字或词;6.用户在新的备选列表中寻找自己所需的字或词,如果发现,则本次输入结束,用户在输入所需的字或词的同时,也获得了该字或词的正确拼音;7重复4-6的过程,直到回到初始用户输入的拼音编码为止,则表示本次输入失败,需要用户重新输入正确的拼音编码;在上述的发明方法中,如果拼音输入法同时使用了部分匹配技术,则备选列表中可能出现部分匹配的字或词,此时,可能出现以下几种情况1.备选列表中没有用户所需要的字或词;2.备选列表中的完全匹配区中有用户所需要的字或词;3.备选列表中的非完全匹配区中有用户所需要的字或词;对于情况1和2,用户按所述的方法很容易处理,无须额外考虑,对于第3种情况, 用户可以有两种选择,即1.使用功能键切换容易混淆的拼音,使欲输入的字出现在备选列表中的完全匹配区中,这样,可以获得其正确的拼音;2.用户已经知道欲输入的字或词的发音或者当时用户更关心的是输入速度,则可以直接选中欲输入的字或词,以结束本次输入;对于切换顺序以及解析顺序,可以按固定顺序,也可以是用户设定的顺序,或者是系统根据用户的使用情况动态调整。对于该部分使用习惯以及用户增加的易混淆的字或词的拼音,可以一并加入到用户使用习惯数据中去。本发明所述的对不同匹配程度的备选字或词进行分区显示的这样来实现1.用户输入一拼音编码;2.系统解析该拼音编码,通过解析,可以完成声母、韵母的分割或识别,或者字或词的拼音的识别或分割;3.根据匹配策略对解析后的拼音或拼音编码进行匹配4.根据匹配结果,将备选字或词进行组织;5.将备选的字或词根据匹配结果用多个备选列表或者一个备选列表的多个区域来显示;所述方法中可以为完全匹配的字或词单独设置一备选列表或备选列表中的一个区域,不完全匹配的字或词使用另外的备选列表或选列表中的其他区域,当然,对于不完全匹配的部分,根据需要,还可以根据匹配的程度,进一步划分成更多的备选列表或备选列表中的更多区域。同一备用列表中的不同区域,可以在显示中使用不同的颜色来进行区分,所述颜色,可以是字体颜色,也可以是背景颜色;对于不完全匹配的区域的细分,可以使用多种颜色,也可以使用几种颜色交替使用,达到区别的目的,对于不完全匹配的备选字或词,其排列顺序可以是按匹配程度排列,也可以是按拼音的顺序排列,还可以是按该字或词的使用频率或最近使用情况等排列,或者是它们组合的结果排列,当然,也可按照其他的策略进行排列;对不完全匹配的备选字或词,还可以在备选列表中标出其正确的注音,方便用户纠正其错误的拼写;同一备用列表中的不同区域,还可以通过在区域间加入分隔标志来区分,如分隔线,同时,在分隔线上还可以标注出正确的拼音;本发明所述的使用习惯数据的移动或网络存储以及与本地使用习惯数据的同步方法这样来实现a.简单方式,即将字频/字序记录、词频/词序记录或词组记录直接存储在移动存储或网络存储上,此时,在移动存储或网络存储与本机存储见的字频/序或词频/序的同步相对比较简单,只要根据时间标记简单替代即可,当然替代前用户可以干预替代与否以及替代的方向,而词组的同步只需将两边的词组简单合并即可。b.高级方式,该方式使用历史更新记录来实现,具体而言,就是在本机保存原始的字频/序记录、词频/序记录或词组记录,而同时在本机和网络或移动存储上保存历史更新记录,通过历史更新记录从原始的字频/字序记录、词频/词序记录或词组记录来生成当前的字频/字序记录、词频/词序记录或词组记录;在该方式下,所述的同步,核心就是历史更新记录合并;历史更新记录中记载了用户对字频/序,词频/序,词组的更改的情况,可以有多种实现方法,例如对于词组,我们可以设置基本的操作为增加词组,删除词组,加上时间标记,即可实现;而对于字频或词频,可以通过记录字或词的使用次数的变化情况及当时的时间标记来实现,对于字序或词序,可以记录它们的顺序的变化情况及产生变化时候的时间标记来实现;所述历史更新记录合并,只需按时间标记,对欲合并的两个历史更新记录中的所有记录重新排序,对于重复记录,只保留一个,这样即可完成。有益效果本发明所述的方法,可以提高用户在容易混淆的拼音间修改的速度,从而提高输入法的输入速度,而且可以纠正用户错误的拼音,对于提高和推广普通话和拼音的标准化具有较大帮助,而用户输入习惯的积累,也有助于提高输入速度。


图1 使用不同颜色来区分备选列表中不同匹配情况的示意图,图中,备选词”荏苒”,完全匹配,为深色,”忍让”和”仍然”为不完全匹配,浅色;
图2 使用分隔标志来区分备选列表中不同匹配情况的示意图,图中,分隔标志使用分隔线,且在其中加注了该区域字或词的拼音;
图3 使用两个备选显示区来表示不同匹配情况的示意图,上面的为完全匹配备选显示区,下面的为不完全匹配备选显示区;下面,结合具体实施例对本发明所述的方法做进一步的说明。具体实施本发明所述的方法,还可以用实施例1来进一步说明,在本事实例中,我们需要输入"生命”这个单词,其正确的拼音是"shengming",假如用户发音不准,输入的是"shenmin〃,则一个可能的过程如下1.用户在拼音输入区输入拼音"shenmin"所对应的编码,该编码由用户使用的拼音输入法所定义;
2.备选显示区显示1.神民2···..
3.用户不能发现其欲输入的单词,发现可能是发音不准,存在混淆;
4.用户按功能键CTRL
5.拼音输入区的"shenmin"对应的编码变为〃shenming"对应的编码;
6.备选显示区显示1.申明2.神明3.....
7.用户还是不能发现其欲输入的单词
8.再按CTRL功能键
9.拼音输入区的"shengmin"对应的编码变为"shengming"对应的编码;
10.备选显示区显示1.生命2.....
11.用户发现"生命”这个词,选中它,完成输入;
在本过程中,用户只多按了两次CTRL键,就完成了对两组拼音的切换,而传统需要按光标键移动到正确位置,删除错误的,再输入正确的,需要按多次及多个键,无疑,使用本方法大大提高了效率。对于使用部分匹配技术的拼音输入法,可能在步骤2或步骤6中已经出现了〃生命"这个词,但其显然不在完全匹配区,此时,用户依然可以按上述方法进行到步骤10,此时,“生命"出现在备选显示区的完全匹配区,用户可获得该单词的正确发音;当然,用户为求快,也可在步骤2或步骤6中直接选择。在本实施例中,如果用户需要输入的是"生“,而用户输入的是"shen",则只须经过一次功能键就能从"shen"变化为"sheng",从而获得正确的输入;而用户如果输入的是,sen,,则可能需要,sen,->,shen,->〃 sheng"的变换。对于sheng,相近的发音有shen,sen, seng,当然,对于特定的方言,可能还有其他容易混淆的发音,可以另加;对于 shengming,相近的发音有shengmin,shenmin,senmin,sengmin,shenming, senming, sengming,同样对于特定的方言,可能还有其他容易混淆的发音,可以扩展;相近的发音,系统可以预定义一些,用户可在此基础上自己修改增加。在本实施例中,只须将1,5,9中的拼音用各种特定的拼音输入法中的拼音编码实现,即可应用到各种具体的拼音输入法,如全拼不用变换;
双拼将声母和韵母分别用双拼定义的字母替换简拼将声母或韵母分别用简拼定义的编码替换;其他拼音输入法只要将标准拼音用其所使用的输入法的拼音编码简单对应替换即可。本发明的另一实施例是〃西安〃的输入,当用户输入〃 xian"时候,备选区出现的一般为〃 1:先2:线3:县....〃,没有用户期望的〃西安〃,此时,用户按CTRL建,则拼音输入区的〃 xian"变成〃 Xi’an〃,备选区出现〃西安〃,或者〃西安〃直接出现在拼音输入区,成为缺省选择,用户可直接输入。该实施例子演示了同一拼音不同解析顺序的情况。在上述两个实施例中,对容易混淆的相同或相近的拼音,系统本身可设定缺省的切换顺序,如 shenmin->shengmin->shengming->senmin->sengmin->shenming->senming-> sengming, shen->sheng->sen_>seng,设定角军析顺序,如xi,an_>xian,在使用过程中,可根据用户的使用习惯、频率,最近使用,语义环境等等因素动态调整,该技术与字或词的调频技术类似,是成熟技术。实施例3用来说明使用部分匹配技术时,对备选字或词进行分区显示的情况,该实施例假定用户输入的是"renran",使用一个备选显示区来显示备选字或词的列表,备选区使用字体颜色来区分完全匹配和部分匹配区,完全匹配区使用标准颜色暗红色(图中深色),如"荏苒",不完全匹配区使用灰色(图中浅色),如"仍然",如图1所示;本实施例如果使用区域分隔符,并加注音,则如图2所示。实施例4使用多个备选显示区来实现不同的匹配情况,如图3所示,使用两个备选显示区,上面的为完全匹配备选显示区,下面的为不完全匹配备选显示区,选择下面的字或词,使用功能键+数字实现。最后两个实施例用来说明用户使用习惯数据的网络或移动存储与同步。实施例5 简单同步的实现,对于字频/字序记录,词频/词序记录,混淆音频率/ 次序等等,直接复制即可,对于词组,两个词组库这样合并,采用以下步骤进行1.建立一新的词组库,初始词组条数为0 ;2.将欲合并词组库中的某一词组库中的所有词组加入新的词组库中;3.依次读取另一词组库中的每一词组,并与新的词组库中已有的词组比较,若不存在重复,则将之加入新的词组库中,否则放弃;4.最后新的词组库就是合并后的词组库加入词组库的操作可结合词频、次序的信息,将加入的词放入合适的位置;实施例6 使用历史更新记录方式记录用户使用习惯及该方式下同步的实现a.基于频率的记录,可以这样来设计频率使用双字来表示,每使用一次加1,这样,历史更新记录可设计为频率的变化量,该变化量可以每N分钟记录一次,或者频率变化 M次记录一次,记录时,同时需要记录下当时的时间,这样,只要按照时间顺序,将所有的变化量相加,即可从原始频率记录获得当前频率记录;b.基于顺序的记录,可以这样来设计顺序记录使用指针来表示,该指针指向该元素在所在队列中前一个元素,历史更新记录可设计为该指针所指向的元素的变化,这样, 只要按照时间顺序,依次模拟这样顺序的变化,就可得到最接近用户最终要求的顺序;
c.基于词组记录的同步,比较简单,只要设置两种记录操作即可,即增加词组,删除词组,再加上时间标记,这样,只要按照时间顺序,依次模拟增加词组或删除词组的操作, 就可以从初始词组库生成当前最新词组库;在上述三种情况下,历史更新记录的合并使用如下步骤1.建立一新的历史更新记录,初始记录数目为0 ;2.将欲合并历史更新记录中的所有记录加入新的历史更新记录中;3.依次读取欲合并的另一历史记录中的每一记录,并与新的历史更新记录中的记录比较,若不存在重复,则将之加入新的历史更新记录中,否则放弃;4.最后新的历史更新记录就是合并后的历史更新记录。可在合并过程中,或合并结束后对所有的历史更新记录按时间由小到大排序,以便以后使用。本发明所述的方法也适用各种拼音输入法,所述的拼音编码可以是全拼、双拼、简拼或其他拼音输入法,因为双拼和简拼只是简单的将拼音中书写较长的声母或韵母用较短的字母或字母组所替代,本质上并没有区别,对于其他拼音输入法,也类似。本发明所述的方法也适用与基于拼音的句子的输入,因为,显然句子是由字和词组成的。
权利要求
1.一种输入法,使用拼音方式进行字或词的输入,其特征在于,还包括对于那些拼音包含用户输入的拼音编码所对应的拼音或与用户的输入拼音编码所对应的拼音相同或相似或相近的备选字或词,根据对它们的拼音的匹配的相同与否或匹配的程度或编码的相同与否,来使用不同的备选列表或同一备选列表中不同的区域来组织或显示它们的步骤。
2.如权利要求1所述的方法,其特征在于,所述同一备选列表中不同的区域显示时使用颜色来区别。
3.如权利要求1所述的方法,其特征在于,所述同一备选列表中不同的区域显示时通过在不同的区域间使用分隔标志来区别。
4.如权利要求1所述的方法,其特征在于,还包括将用户使用习惯数据存储在移动或网络存储器中的步骤。
5.如权利要求4所述的方法,其特征在于,还包括将所述存储在移动或网络存储器上的用户使用习惯数据与存储在本机上的用户使用习惯数据之间同步的步 骤。
6.如权利要求4,5所述的方法,其特征在于,还包括使用历史更新记录来存储用户使用习惯数据的变化。
7.如权利要求1所述的方法,其特征在于,还包括使用功能键在具有相同或相似的发音或拼音的字或词的拼音编码间进行切换的步骤。
8.如权利要求1所述的方法,其特征在于,所述拼音编码是全拼。
9.如权利要求1所述的方法,其特征在于,所述拼音编码是简拼。
10.如权利要求1所述的方法,其特征在于,所述拼音编码是双拼。
全文摘要
一种输入法,使用功能键在容易混淆的拼音间进行切换,从而将用户输入的错误发音切换到正确的发音上,方便用户快速获得需要的字或词,同时还可以纠正用户错误的拼写;通过对不同匹配程度的备选字或词进行分区显示的方式,使用户对完全匹配或部分匹配情况一目了然,不至于混淆其输入字或词的发音;通过将用户使用习惯数据存储在网络或移动存储上的方式,使用户积累的输入经验可以长久保存,且随时随地可以使用,另外,使用历史更新记录来同步用户使用习惯数据在本机和移动或网络存储上的存储;本发明所述的方法对提高和推广普通话和拼音的标准化具有一定的意义。
文档编号G06F3/023GK102411431SQ20111021802
公开日2012年4月11日 申请日期2005年10月21日 优先权日2005年10月21日
发明者钟巨航 申请人:钟巨航
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1