一种基于汉字拼音输入法的重码过滤及字库编码方法

文档序号:6632346阅读:271来源:国知局
一种基于汉字拼音输入法的重码过滤及字库编码方法
【专利摘要】一种基于汉字拼音输入法的重码过滤及字库编码方法,包括重码过滤及字库编码两个方面,其特征是:拼音输入法的界面由长条拼音编码输入框和分栏式候选汉字版面组成,在长条拼音编码输入框的一侧设置笔画检索器开关,当输入的汉字拼音编码出现大量重码字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,过滤重码字,遴选所需的汉字;或者当输入的汉字拼音编码没有对应的汉字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,从系统字库中调出所需的汉字,给予编码。
【专利说明】一种基于汉字拼音输入法的重码过滤及字库编码方法

【技术领域】
:
[0001]本发明应用于汉字拼音输入法,也可推广用于其他形式的汉字编码输入法,适用于台式电脑和笔记本电脑的实物键盘打字和手机和平板电脑的虚拟键盘打字。

【背景技术】
:
[0002]汉字输入法,也叫汉字打字方法,一般分为拼音输入法、笔画输入法、字根输入等,拼音输入法又分为全拼输入法和双拼输入法,全拼输入法习惯用小写字母做编码的代码,双拼输入法习惯用大写字母做编码的代码。
[0003]现在的拼音输入法,已经由过去的单一的字词输入模式转变为现在的智能语句输入模式,可以输入一连串的拼音编码,然后智能组合成一整句话来。比较有影响的智能语句拼音输入法有搜狗拼音输入法、QQ拼音输入法、谷歌拼音输入、百度拼音输入法、华宇拼音输入法......0
[0004]众所周知,拼音输入法的一大缺点就是重码字太多,面对单字输入时,选字太慢,需要不停的翻页选字,即使是上面这些能够实现智能语句输入的拼音输入法,在面对地名、人名及单字输入时,仍然是束手无策。
[0005]本方法就是针对这个问题提出的解决方案,在拼音输入法的界面上设置笔画检索器开关,当出现大量同码字时,可以点击开关打开检索器,在检索器的笔画编码输入框中输入汉字的笔画迅速的过滤重码汉字。
[0006]现在的Unicode汉字字符集,有CJK、CJK-A, CJK-B, CJK-C, CJk-D…等不同的子集合,有7万多字,一般的拼音输入法大都采用CJK子集合,21000多字,很少有拼音输入法包含7万多字的,原因是没有大型字典的辅助,许多汉字根本不清楚其读音,而且许多汉字连目前最大的汉语大字典都找不到,因此,拼音输入法作者不采用过大的字符集,而一般的形码输入法,由于不涉及汉字读音,因此它可以编码全部的7万多汉字,这就造成拼音输入法在汉字输入能力上不及字根式形码输入法。
[0007]为了解决这个问题,本方法提出了解决之道:对所有的汉字制定笔画编码,当某个读音下没有该汉字时,通过开启笔画检索器,从系统字库中把汉字调出来,给予自动编码,这样,这个汉字就能拼音输入了。


【发明内容】

:
[0008]一种基于汉字拼音输入法的重码过滤及字库编码方法,包括重码过滤及字库编码两个方面,其特征是:拼音输入法的界面由长条拼音编码输入框和分栏式候选字版面组成,在长条拼音编码输入框的一侧设置笔画检索器开关,当输入的汉字拼音编码出现大量重码字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,过滤重码字,遴选所需的汉字;或者当输入的汉字拼音编码没有对应的汉字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,从系统字库中调出所需的汉字,给予编码。
[0009]本方法在统一的输入法界面下采用全拼编码和双拼编码双体模式输入,并定义规则如下:
[0010]1、全拼编码的码元为小写字母(图1),双拼编码的码元为大写字母(图2),按键盘上的Caps Lock键转换码元字母的大小写。
[0011]2、键盘为小写字母输入状态下,是全拼输入模式,在输入法界面没显示的状态前,按Caps Lock,会转换为大写字母输入,输入的编码是大写码元,是双拼输入模式。
[0012]3、键盘为大写字母输入状态下,是双拼输入模式,在输入法界面没显示的状态前,按Caps Lock,会转换为小写字母输入,输入的编码是小写码元,是全拼输入模式。
[0013]输入法的界面由长条拼音编码输入框和候选汉字版面组成,笔画检索器开关设置在拼音编码输入框的一侧,候选汉字版面采用分栏式,分2列5行,显示10个候选汉字,用1、2、3、4、5、6、7、8、9、0标注候选汉字序号(图1、图2)。
[0014]当按下键盘上的字母时,会触发显示输入法的界面,在拼音编码输入框中输入汉字的拼音编码,候选汉字版面会显示汉字拼音编码下的重码字。
[0015]笔画检索器由笔画编码输入框、笔画按键、【过滤】/【编码】切换键、【分栏】/【矩阵】切换键组成(图3、图4、图5、图6)。
[0016]笔画按键有五个,分别为:横(一)、竖(丨)、撇(j )、点(、)、折(乙),对应的笔画输入代码为1、2、3、4、5,用鼠标点击检索器上的笔画按键,或者按笔画代码对应的键盘数字键1、2、3、4、5,按汉字书写顺序输入汉字的笔画,可以过滤重码字或者从系统字库中调取汉字(图3、图4、图5、图6)。
[0017]【过滤】/【编码】切换键,是一个可以切换状态的按键,按此键,可在重码过滤状态与汉字编码状态之间相互切换(图3、图4、图5、图6)。
[0018]【分栏】/【矩阵】切换键,是一个可以切换候选汉字显示方式的按键,按此键,可在分栏式候选汉字版面与矩阵式候选汉字版面之间相互切换,矩阵候选汉字版面,由5行X 10列的小方格组成矩阵,小方格里显示候选汉字(图3、图4、图5、图6)。
[0019]设定,{1}=系统字库全集,{A}=已经编码的汉字集合,{B}=尚未编码的汉字集合,则有:{I} = {A}U{B}。当选择【过滤】按键时,是从已经编码了的汉字集合{A}中过滤重码字,当选择【编码】时,是从系统字库{1}中调取没有编码的汉字,并给予自动编码。
[0020]当输入的拼音编码存在大量候选汉字重码时,或者当输入的拼音编码没有对应的候选汉字时,用鼠标点击笔画检索器开关,输入法界面的拼音编码输入框会转换为笔画检索器;也可以定义某功能键或者功能组合键,快捷开启检索器开关。
[0021]本方法设定【a/A】为笔画检索器开关标识符,可点击输入法界面上的【a/A】开启笔画检索器,或者利用键盘按键Caps lock作为快捷键来开启笔画检索器,并定义规则如下:
[0022]1、键盘为小写字母输入状态下,是全拼输入模式,在输入法界面显示(存在候选字)的状态下,按Caps lock键,不是转换为大写字母,而是开启笔画检索器。
[0023]2、键盘为大写字母输入状态下,是双拼输入模式,在输入法界面显示(存在候选字)的状态下,按Caps lock键,不是转换为小写字母,而是开启笔画检索器。
[0024]本方法过滤重码的操作方式是:当输入的拼音编码存在大量的候选汉字重码时,开启笔画检索器开关,输入法界面的拼音编码输入框会转换为笔画检索器,把检索器上的切换按键切换为【过滤】状态,点击检索器上的笔画键,按汉字笔画书写顺序在检索器的笔画编码输入框中逐笔输入汉字的笔画,过滤重码字,遴选所需的汉字,然后用鼠标点击该汉字上屏幕。
[0025]本方法编码汉字的操作方式是:当输入的拼音编码没有出现需要的候选汉字时,开启笔画检索器开关,输入法界面的拼音编码输入框会转换为笔画检索器,把检索器上的切换按键切换为【编码】状态,点击检索器上的笔画键,按汉字笔画书写顺序在检索器的笔画编码输入框中逐笔输入汉字的笔画,从系统字库中调取所需的汉字,然后用鼠标点击汉字,该汉字就自动在该拼音编码下保存,以后输入该拼音,就能显示该汉字。
[0026]本方法也可用于横向风格界面和纵向风格界面的拼音输入法。
[0027]横向风格界面,由长条拼音编码输入框和长条候选字版面组成,候选字版面以一行的方式横向显不η个候选字(η < 10,由输入法系统及用户设定),拼音编码输入框的一侧设置笔画检索器开关(图7)。
[0028]纵向风格界面,由长条拼音编码输入框和方形候选字版面组成,候选字版面以多行的方式纵向显示η个候选字(η < 10,由输入法系统及用户设定),拼音编码输入框的一侧设置笔画检索器开关(图12)。
[0029]横向风格的输入法检索器上有长条/矩阵候选汉字显示方式切换按键,按此键,可在长条式候选汉字版面与矩阵式候选汉字版面之间相互切换(图8、图9、图10、图11)。
[0030]纵向风格的输入法检索器上有方形/矩阵候选汉字显示方式切换按键,按此键,可在方形式候选汉字版面与矩阵式候选汉字版面之间相互切换(图13、图14、图15、图16)。
[0031]矩阵候选汉字版面,由η行Xm列的小方格组成矩阵(n、m值的大小,由输入法系统及用户设定),小方格里显示候选汉字。
[0032]当输入的汉字拼音编码出现大量重码字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,过滤重码字,遴选所需的汉字(图8-图11);或者当输入的汉字拼音编码没有对应的汉字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,从系统字库中调出所需的汉字,给予编码(图13-图16)。

【专利附图】

【附图说明】
[0033]图1:本方法描述的拼音输入法界面(全拼模式)。
[0034]图2:本方法描述的拼音输入法界面(双拼模式)。
[0035]图3:本方法描述的笔画检索器(分栏式过滤状态),假设【暹】字已被编码拼音。
[0036]图4:本方法描述的笔画检索器(矩阵式过滤状态),假设【暹】字已被编码拼音。
[0037]图5:本方法描述的笔画检索器(分栏式编码状态),假设【暹】字没被编码拼音。
[0038]图6:本方法描述的笔画检索器(矩阵式编码状态),假设【暹】字没被编码拼音。
[0039]图7:本方法在横向风格拼音输入法上的应用。
[0040]图8:本方法在横向风格拼音输入法上的应用(长条式过滤状态)。
[0041]图9:本方法在横向风格拼音输入法上的应用(矩阵式过滤状态)。
[0042]图10:本方法在横向风格拼音输入法上的应用(长条式编码状态)。
[0043]图11:本方法在横向风格拼音输入法上的应用(矩阵式编码状态)。
[0044]图12:本方法在纵向风格拼音输入法上的应用。
[0045]图13:本方法在纵向风格拼音输入法上的应用(方形式过滤状态)。
[0046]图14:本方法在纵向风格拼音输入法上的应用(矩阵式过滤状态)。
[0047]图15:本方法在纵向风格拼音输入法上的应用(方形式编码状态)。
[0048]图16:本方法在纵向风格拼音输入法上的应用(矩阵式编码状态)。
[0049]图17:本方法在触屏虚拟键盘拼音输入法上的应用。
[0050]图18:本方法在触屏虚拟键盘拼音输入法上的应用(分栏式过滤状态)。
[0051]图19:本方法在触屏虚拟键盘拼音输入法上的应用(矩阵式过滤状态)。
[0052]图20:本方法在触屏虚拟键盘拼音输入法上的应用(分栏式编码状态)。
[0053]图21:本方法在触屏虚拟键盘拼音输入法上的应用(矩阵式编码状态)。

【具体实施方式】
[0054]本方法在统一的输入法界面下采用全拼编码和双拼编码双体模式输入,并规定,全拼用小写字母编码(图1),双拼用大写字母编码(图2),大小写字母的转换,按键盘上的Caps lock 键。
[0055]本方法在输入法界面上长条拼音编码输入框的右侧设置一个笔画检索器开关【a/A】(图1、2),点击开关【a/A】可以开启笔画检索器(图3、图4、图5、图6)。
[0056]也可以按键盘的Caps lock键,来开启笔画检索器:在输入法界面显示(存在候选字)的状态下,按Caps lock键,如果当前使用的输入法是全拼模式(图1),不是转换为大写字母,而是开启笔画检索器(图3、图4、图5、图6);如果当前使用的输入法是双拼模式
(2),不是转换为大写字母,而是开启笔画检索器(图3、图4、图5、图6)。
[0057]笔画检索器由笔画编码输入框、笔画按键、【过滤】/【编码】切换键、【分栏】/【矩阵】切换键组成。
[0058]【过滤】/【编码】切换键,是一个可以切换状态的按键,按此键,可在重码过滤状态与汉字编码状态之间相互切换(图3、图4、图5、图6)。
[0059]【分栏】/【矩阵】切换键,是一个可以切换候选汉字显示方式的按键,按此键,可在分栏式候选汉字版面与矩阵式候选汉字版面之间相互切换(图3、图4、图5、图6)。
[0060]重码过滤(以全拼为例):【暹】,读音xian,假如该字被输入法编码了拼音,输入拼音xian,候选字版面上就会显示读音为xian的重码字(图1)。因为【暹】是偏僻汉字,在重码字中排序靠后,需要不停的往后翻页才会出现,这时可以开启笔画检索器,切换选择【过滤】,然后点击笔画键(也可以按键盘数字键)输入汉字笔画2511324111……,就把其他重码字过滤了,遴选出【暹】字(图3、图4),点击汉字就上屏幕。
[0061]汉字编码(以全拼为例):【暹】,读音xian,假如该字没被输入法编码拼音,输入拼音xian,候选字版面上显示读音为xian的重码字中没有发现【暹】字(原因是没有编码),这时可以开启笔画检索器,选择【编码】,然后点击笔画键(也可以按键盘数字键)输入汉字笔画2511324111……,就把【暹】字从系统大字库中调取出来了(图5、图6),点击汉字就上屏幕,并且保存汉字在读音xian编码下,以后,输入拼音xian就能打出【暹】字来。
[0062]手机上应用本方法(以全拼为例):在手机上输入拼音,横条候选字版面会显示读音为xian的重码字(图17)。因为【暹】是偏僻汉字,在重码字中排序靠后,需要不停的往后翻页才会出现,影响打字速度,这时可以点触开关【a/A】(或者点触键盘大小写转换按键a/A),开启笔画检索器(触屏虚拟键盘转换为候选汉字版面),切换选择【过滤】,然后点触笔画键,输入汉字笔画2511324111……,就把其他重码字过滤了,遴选出【暹】字(图18、19),点触汉字就上屏幕。
[0063]假如【暹】字没有编码拼音,在拼音xian下检索不到汉字时,这时可以点触开关【a/A】(或者点触键盘大小写转换按键a/A),开启笔画检索器(触屏虚拟键盘转换为候选汉字版面),切换选择【编码】,然后点触笔画键,输入汉字笔画2511324111……,就把【暹】字从系统大字库中调取出来了(图20、图21),点触汉字就上屏幕,并且保存汉字在读音xian编码下,以后,输入拼音xian就能打出【暹】字来。
【权利要求】
1.一种基于汉字拼音输入法的重码过滤及字库编码方法,包括重码过滤及字库编码两个方面,其特征是:拼音输入法的界面由长条拼音编码输入框和分栏式候选汉字版面组成,在长条拼音编码输入框的一侧设置笔画检索器开关,当输入的汉字拼音编码出现大量重码字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,过滤重码字,遴选所需的汉字;或者当输入的汉字拼音编码没有对应的汉字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,从系统字库中调出所需的汉字,给予编码; 该方法在统一的输入法界面下采用全拼编码和双拼编码双体模式输入,并定义规则如下: 全拼编码的码元为小写字母,双拼编码的码元为大写字母,按键盘上的Caps Lock键转换码元字母的大小写; 键盘为小写字母输入状态下,是全拼输入模式,在输入法界面没显示的状态前,按CapsLock,会转换为大写字母输入,输入的编码是大写码元,是双拼输入模式; 键盘为大写字母输入状态下,是双拼输入模式,在输入法界面没显示的状态前,按CapsLock,会转换为小写字母输入,输入的编码是小写码元,是全拼输入模式; 输入法的界面由长条拼音编码输入框和候选汉字版面组成,笔画检索器开关设置在拼音编码输入框的一侧,候选汉字版面采用分栏式,分2列5行,显示10个候选汉字,用1、2、3、4、5、6、7、8、9、0标注候选汉字序号; 当按下键盘上的字母时,会触发显示输入法的界面,在拼音编码输入框中输入汉字的拼音编码,候选汉字版面会显示汉字拼音编码下的重码字; 笔画检索器由笔画编码输入框、笔画按键、过滤/编码切换键、分栏/矩阵切换键组成; 笔画按键有五个,分别为:横(一)、竖(丨)、撇())、点(、)、折(乙),对应的笔画输入代码为1、2、3、4、5,点击检索器上的笔画按键,或者按笔画代码对应的键盘数字键1、2、3、4、5,按汉字书写顺序输入汉字的笔画,可以过滤重码字或者从系统字库中调取汉字;过滤/编码切换键,是一个可以切换状态的按键,按此键,可在重码过滤状态与汉字编码状态之间相互切换:当切换选择【过滤】时,是从已经编码了的汉字集合中过滤重码字;当切换选择【编码】时,是从系统字库中调取没有编码的汉字,并给予自动编码; 分栏/矩阵切换键,是一个可以切换候选汉字显示方式的按键,按此键,可在分栏式候选汉字版面与矩阵式候选汉字版面之间相互切换; 矩阵候选汉字版面,由5行X 10列的小方格组成矩阵,小方格里显示候选汉字; 当输入的拼音编码存在大量候选汉字重码时,或者当输入的拼音编码没有对应的候选汉字时,点击笔画检索器开关,输入法界面的拼音编码输入框会转换为笔画检索器; 该方法设定【a/A】为笔画检索器开关标识符,可点击输入法界面上的【a/A】开启笔画检索器,或者利用键盘按键Caps lock作为快捷键来开启笔画检索器,并定义规则如下: 键盘为小写字母输入状态下,是全拼输入模式,在输入法界面显示的状态下,按Capslock键,不是转换为大写字母,而是开启笔画检索器; 键盘为大写字母输入状态下,是双拼输入模式,在输入法界面显示的状态下,按Capslock键,不是转换为小写字母,而是开启笔画检索器; 该方法过滤重码的操作方式是:当输入的拼音编码存在大量的候选汉字重码时,开启笔画检索器开关,输入法界面的拼音编码输入框会转换为笔画检索器,把检索器上的切换按键切换为过滤状态,点击检索器上的笔画键,按汉字笔画书写顺序在检索器的笔画编码输入框中逐笔输入汉字的笔画,过滤重码字,遴选所需的汉字,然后点击该汉字上屏幕;该方法编码汉字的操作方式是:当输入的拼音编码没有出现需要的候选汉字时,开启笔画检索器开关,输入法界面的拼音编码输入框会转换为笔画检索器,把检索器上的切换按键切换为编码状态,点击检索器上的笔画键,按汉字笔画书写顺序在检索器的笔画编码输入框中逐笔输入汉字的笔画,从系统字库中调取所需的汉字,然后点击汉字,该汉字就自动在该拼音编码下保存,以后输入该拼音,就能显示该汉字。
2.如权利要求1所述的一种基于汉字拼音输入法的重码过滤及字库编码方法,包括重码过滤及字库编码两个方面,其特征是:该方法可用于横向风格界面和纵向风格界面的拼音输入法: 横向风格界面,由长条拼音编码输入框和长条候选字版面组成,候选字版面以一行的方式横向显不η个候选字,拼音编码输入框的一侧设置笔画检索器开关; 纵向风格界面,由长条拼音编码输入框和方形候选字版面组成,候选字版面以多行的方式纵向显示η个候选字,拼音编码输入框的一侧设置笔画检索器开关; 横向风格的输入法检索器上有长条/矩阵候选汉字显示方式切换按键,按此键,可在长条式候选汉字版面与矩阵式候选汉字版面之间相互切换; 纵向风格的输入法检索器上有方形/矩阵候选汉字显示方式切换按键,按此键,可在方形式候选汉字版面与矩阵式候选汉字版面之间相互切换; 矩阵候选汉字版面,由η行Xm列的小方格组成矩阵,小方格里显示候选汉字。 当输入的汉字拼音编码出现大量重码字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,过滤重码字,遴选所需的汉字;或者当输入的汉字拼音编码没有对应的汉字时,开启笔画检索器开关,把输入法界面的拼音编码输入框转换为笔画检索器,通过笔画检索,从系统字库中调出所需的汉字,给予编码。
【文档编号】G06F3/023GK104317422SQ201410596780
【公开日】2015年1月28日 申请日期:2014年10月28日 优先权日:2014年10月28日
【发明者】任文 申请人:任文
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1