直接输入辅助码的拼音输入法的制作方法

文档序号:6577893阅读:333来源:国知局
专利名称:直接输入辅助码的拼音输入法的制作方法
技术领域
本发明属于汉字输入法领域,特别涉及计算机通用键盘的汉字输入方法。
背景技术
使用拼音输入法输入汉字,在遇到不认识的字,无法使用拼音输入法输入汉字时, 只有切换至形码输入法才能输入汉字。在遇到重码的同音字词的时候,有时需要多次按下 翻页键,才能找到所需要输入的候选字词。为了解决这一问题,出现了拼音输入法的辅助码 输入方法。目前已有的辅助码输入方法,都无法做到与拼音输入完全兼容,都需要在输入过 程中按下辅助码切换键,先进入辅助码输入状态,才能使用辅助码输入汉字。

发明内容
为解决上述问题,本发明的目的在于提供一种无需按下辅助码切换键就能直接输 入辅助码,可以输入不认识的字,可以快速查找重码的同音字词,候选字词双栏显示,依据 编码位频率动态编码的汉字输入方法。本发明的目的是通过以下技术方案实现的(a)将《汉字部首表》中的201个主部首、99个附形部首做为单字字形编码的编码 码元,指定到计算机通用键盘的26个字母键上;依笔顺取汉字字形的第一个、第二个和最 后一个编码码元的代码进行编码;当汉字字形由两个编码码元组成时,在这两个编码码元 的代码之后添加分号“;”做为这个汉字的字形编码;当汉字字形只由一个编码码元组成 时,在这个编码码元的代码之后添加分号“;”做为这个汉字的字形编码;(b)将单字的汉语拼音编码定义为单字音码;将单字的字形编码定义为单字形 码;将在单字的单字音码之后加上其字形编码的编码,定义为该字的单字辅码;例如,“拼”字的汉语拼音是“pin”,其字形的第一个编码码元“ ”、第二个编码码 元“V”和最后一个编码码元“升”的代码分别为“k”、“r”、“k”,所以“拼”字的单字音码是 “Pin”,单字形码是“krk”、单字辅码是“pinkrk”。将词组的汉语拼音编码定义为词组音码;将在词组的词组音码之后,加上词组的 第一个字的字形的第一个编码码元的代码定义为词组辅码;例如,词组“拼音”的汉语拼音是“pinyin”,其第一个字“拼”字的字形的第一 个编码码元“ ”的代码是“k”,所以词组“拼音”的词组音码是“pinyin”,词组辅码是 "pinyink,,。(c)在汉字编码数据库中分别为单字的每一个输入编码记录使用频率;例如,分别为“拼”字的每一个输入编码“p”、“pin”、“pink”、“pinkr”、“pinkrk,,、 “k”、“kr”、“krk”记录使用频率。不记录编码“pi”的使用频率,因为“pi”是另外一个汉语
拼音全拼音节,不是“拼”字的有效输入编码。在汉字编码数据库中分别为词组的每一个输入编码记录使用频率;例如,分别为词组“拼音”的每一个输入编码“piny”、“pinyin”、“pinyink”、“py”
4记录使用频率。不记录“p”、“pi”、“pin”、“pinyi”的使用频率,因为这些编码不是词组“拼
音”的有效输入编码。将每一个输入编码的使用频率定义为编码位频率;编码位频率用来判断是否将辅候选栏中的单字辅码、词组辅码编码的候选字词显 示于主候选栏中。(d)输入法候选字词窗口,分为主候选栏和辅候选栏;主候选栏用于显示词组音 码、单字音码编码的候选字词;辅候选栏用于显示词组辅码、单字辅码、单字形码编码的候 选字词;1、2、3、4、5五个数字键定义为主候选字词选择键,用于选择主候选栏中的候选字 词;7、8、9、0四个数字键定义为辅候选字词选择键,用于选择辅候选栏中的候选字词;为辅码编码的候选字词设置以下数据结构候选字词音码辅码辅码在输入编码中的起始位置编码位频率……辅码在输入编码中的起始位置用于词组辅码编码自造词时,切分输入编码。(e)当辅候选栏中编码位频率最大的单字辅码编码的候选字的编码位频率,大于 主候选栏中编码位频率最大的候选词的编码位频率时,将该候选字显示于主候选栏中的第 一个候选位置;将原主候选栏中的候选字词,调整为从主候选栏中的第二个候选位置开始 显不;一般情况下,当单字辅码编码的候选字显示于主候选栏中的第一个候选位置时, 其后总是至少存在一个候选词,所以单字辅码编码的候选字和单字音码编码的该字的输入 不会发生冲突。当辅候选栏中编码位频率最大的词组辅码编码的候选词的编码位频率,大于主候 选栏中编码位频率最大的候选词的编码位频率时,将该候选词显示于主候选栏中的第一个 候选位置;将原主候选栏中的候选字词,调整为从主候选栏中的第二个候选位置开始显示。一般情况下,当词组辅码编码的候选词显示于主候选栏中的第一个候选位置时, 其字数总是小于第二个候选位置的候选词的字数,所以词组辅码编码的候选词和词组音码 编码的该词的输入不会发生冲突。将2009年5月1日实施的《汉字部首表》中规定的201个主部首、99个附形部首做 为对汉字字形编码的编码码元;可以将300个字形编码码元,按其首笔画及笔画数分成26 组,具体为一起笔一画、一起笔二画、一起笔三画、一起笔四画、一起笔五画及五画以上、丨 起笔一画、丨起笔二画、丨起笔三画、丨起笔四画、丨起笔五画及五画以上、J起笔一画、J 起笔二画、j起笔三画、j起笔四画、j起笔五画、j起笔六画及六画以上、、起笔一画、、 起笔二画、、起笔三画、、起笔四画、、起笔五画及五画以上、ι起笔一画、ι起笔二画、ι 起笔三画、ι起笔四画、ι起笔五画及五画以上;将26组字形编码码元指定到计算机通用 键盘的26个字母键上,具体为h —;j:十、厂、匚;k 干、工、土、士、才、廿、寸、升、大、兀、尤、弋;1 王、无、韦、夬、木、木、支、犬、歹、车、牙、戈、无、比、瓦;η 玉、示、甘、石、龙、耒、老、耳、臣、而、 、西、而、页、至、麦、县、走、赤、車、豆、酉、辰、豕、青、長、卓、雨、革、頁、面、髟、馬、鬲、黄、麥、鼓;g I 、 J ;f 卜、丨」、卜、门;d 小、、k、口、口、山、巾;S:止、支、、曰、曰、日、冃、贝、水、见;a:夕、业、氺、目、田、m、皿、严、虫、肉、卤、貝、見、里、足、足、邑、非、齿、虎、門、黾、 韭、骨、鬥、鹵、鼎、黑、黽、齒;y j ;U J、厂、八、人、入、、门、勹、几、儿、匕、几;i 才、彡、各、夕、欠、亇;ο 牛、手、尹、气、毛、夂、长、片、斤、爪、父、允、”、月、氏、欠、风、殳;ρ 、生、矢、禾、白、瓜、鸟;m:缶、舌、竹、、臼、自、血、舟、色、H、身、楚、采、谷、豸、龟、角、隹、阜、金j、鱼、 香、鬼、食、風、鳥、魚、黍、鼠、鼻、龜、龠;t 、;r ^^/、Wi ;e 片、广、门、?、个、 、!_ ;w 文、方、火、斗、川、、户、彳、心;q:广、立、穴、卒、齐、衣、卒、羊、、、米、言、辛、音、首、高、麻、鹿、齊、龍;b:”(所有折笔);ν :U> P、P (在左、在右)、刀、力、又、厶、l_、B;c :3、旦、尸、己、已、巳、弓、子、屮、少、女、飞、马、互、乡、幺、〈〈〈;X 肀、爿、毋;ζ:圭、I、疋、皮、W、矛、母、聿、圭、艮、艸、羽、糸、系、隶、韋、飛。还可以将在词组的词组音码之后,加上词组的第一个字的字形的第一个编码码元 的代码,再加上词组的第二个字的字形的第一个编码码元的代码定义为词组辅码;在两字词的词组音码之后加上两个形码,词组的编码空间达到1亿以上。而三字 词的词组音码有6千万以上的编码空间,加上两个形码之后,编码空间达到400亿以上,所 以再增加形码是冗余的。拼音输入法的重码大部分是单字重码和两字词重码,所以为单字 加上三个形码,为词组加上一到两个形码可以取得最好的技术效果。已有拼音输入法的辅助码输入方法,之所以需要先按下辅助码输入切换键,先进 入辅助码输入状态,然后才能输入辅助码。这是因为,从组成汉字的所有字根中选择确定 数量的特定字根作为编码码元,将这些编码码元依据一定规则指定到特定计算机键盘按键 上,这样a键、ο键、e键、i键、u键、ν键、r键、η键或g键就有可能会用于字形编码码元的 输入,当使用这些按键输入拼音的字形辅助码时,就有可能组合成有效的汉语拼音。例如 ao、ren、gan、hui等等。这样,就会和拼音输入发生冲突。例如,如果将e键用于辅助码输入,当用户输入“yue”的时候,输入法无法判断用 户是输入的汉语拼音“yue”,还是在输入完汉语拼音“yu”之后输入的辅助码“e”。传统的单栏显示候选字词的输入方法无法解决这一矛盾。本发明使用双栏显示候选字词以及编码位频率技术,成功解决了这一技术难题。 本发明将词组辅码、单字辅码、单字形码编码的候选字词显示于辅候选栏中,这样就不会和 主候选栏中的词组音码、单字音码编码的候选字词的输入发生冲突。本发明只将辅候选栏中,编码位频率最大的单字辅码编码的候选字或编码位频率 最大的词组辅码编码的候选词显示于主候选栏中。有效的屏蔽了冷僻字词,既提高了词组 辅码、单字辅码编码的候选字词的输入效率,又不影响词组音码、单字音码编码的候选字词 的输入效率。本发明首创了直接输入辅助码的拼音输入方法,解决了拼音输入法无法输入不认 识的字,解决了拼音输入法重码率高的技术难题,实现了快速查找重码的候选字词。由于省 去了按下辅助码切换键这一步骤,从而有效地提高了拼音输入法的输入效率,带来了显著 的技术进步。


图1是本发明字形编码码元的键位图;图2是本发明单字辅码输入单字的一个实施例;图3是本发明单字辅码输入单字的另一个实施例;图4是本发明词组辅码输入词组的一个实施例;图5是本发明词组辅码输入词组的另一个实施例;图6是本发明单字形码输入单字的一个实施例;图7和图8是本发明词组辅码输入自造词的一个实施例;图9和图10是本发明词组辅码输入自造词的另一个实施例;图11是本解决词组辅码输入自造词编码冲突的一个实施例。
具体实施例方式图1是本发明字形编码码元的键位图。下面举例说明本发明输入汉字的具体过程。1单字辅码输入单字例如,“拼”字的汉语拼音是“pin”,其字形的第一个编码码元“ ”、第二个编码码 元“V”和最后一个编码码元“升”的代码分别为“k”、“r”、“k”,所以“拼”字的单字辅码是 “pinkrk”。如图2所示,单字辅码编码的候选字显示于输入法候选窗口上半部分右面的辅 候选栏中,此时按下辅候选字词选择键7,完成“拼”字的输入。当辅候选栏中编码位频率最大的单字辅码编码的候选字的编码位频率,大于主候 选栏中编码位频率最大的候选词的编码位频率时,将该候选字显示于主候选栏中的第一 个候选位置;将原主候选栏中的候选字词,调整为从主候选栏中的第二个候选位置开始显 示;例如,用户经常使用单字辅码“pink”输入“拼”字,“拼”字的单字辅码“pink”的 编码位频率大于辅候选栏中其他单字辅码编码的候选字的编码位频率,而且“拼”字的单字 辅码“pink”的编码位频率大于主候选栏中编码位频率最大的候选词的编码位频率,此时将
7“拼”字显示于主候选栏中的第一个候选位置;将原主候选栏中的候选字词,调整为从主候 选栏中的第二个候选位置开始显示。如图3所示,此时按下主候选字词选择键1,完成“拼” 字的输入。在少数情况下,当单字辅码编码的候选字显示于主候选栏时,会出现主候选栏中 只有候选字的情况。例如某个汉字的汉语拼音是“pin”,其字形的第一个编码码元的代码是 “g”,此时主候选栏中只有单字音码“ping”编码的候选字。所以本发明只将编码位频率最 大的单字辅码编码的候选字显示于主候选栏中,并以其他颜色字体显示,和单字音码编码 的候选字加以区分。2词组辅码输入词组例如,词组“拼音”的汉语拼音是“pinyin”,词组的第一个字“拼”字的第一个编码 码元“ ”的代码是“k”,所以词组“拼音”的词组辅码是“pinyink”。如图4所示,词组辅 码编码的候选词显示于输入法候选窗口上半部分右面的辅候选栏中,此时按下辅候选字词 选择键7,完成词组“拼音”的输入。例如,用户经常使用词组辅码“pinyink”输入词组“拼音”,词组“拼音”的词组辅 码“pinyink”的编码位频率大于辅候选栏中其他词组辅码编码的候选词的编码位频率,而 且词组“拼音”的词组辅码“pinyink”的编码位频率大于主候选栏中编码位频率最大的候 选词的编码位频率,此时将词组“拼音”显示于主候选栏中的第一个候选位置;将原主候选 栏中的候选字词,调整为从主候选栏中的第二个候选位置开始显示。如图5所示,此时按下 主候选字词选择键1,完成词组“拼音”的输入。在少数情况下,当词组辅码编码的候选词显示于主候选栏时,会出现其字数和 第二个候选位置的候选词的字数相等的情况。例如某个词组的汉语拼音是“Pinyin”, 词组第一个字的字形的第一个编码码元的代码是“g”,此时就会和原主候选栏词组音码 “pinying”编码的候选词的字数相等。所以本发明只将编码位频率最大的词组辅码编码的 候选词显示于主候选栏中,并以其他颜色字体显示,和词组音码编码的候选词加以区分。3单字形码输入单字当用户遇到了不认识的字的时候,可以直接输入该字的字形编码输入该字。例如, “拼”字字形的第一个编码码元“ ”、第二个编码码元“V”和最后一个编码码元“升”的代 码分别为“k”、“r”、“k”,所以“拼”字的单字形码是“krk”。如图6所示,单字形码编码的候 选字显示于输入法候选窗口上半部分右面的辅候选栏中,此时按下辅候选字词选择键8,完 成“拼”字的输入。 4词组辅码输入自造词例如,用户输入词组音码“ shishi ”后,发现候选窗口主候选栏第一页没有自己想 要输入的候选词,此时用户可以输入词组的辅码“r”,以缩小候选字词范围。如图7所示, 辅候选栏中依然没有用户想要输入的候选词,此时用户可以按下辅候选字词选择键0,开始 进行自造词。如图8所示,此时用户可以按下主候选字词选择键2,完成自造词“诗士”的输 入。例如,用户输入词组音码“ shishi ”后,发现候选窗口主候选栏第一页没有自己想 要输入的候选词,此时用户可以输入词组的辅码“WO”,以缩小候选字词范围。如图9所示, 辅候选栏中依然没有用户想要输入的候选词,此时用户可以按下辅候选字词选择键8,开始进行自造词。如图10所示,此时用户可以按下辅候选字词选择键7,完成自造词“施氏”的 输入。在词组的词组音码之后添加多个形码,会给输入编码的切分带来困难。例如,用户 输入编码“pinyingu”,输入法无法判断用户是在词组音码“pinyin”之后添加的两个形码 “gu”,还是在词组音码“pinying”之后添加的一个形码“g”,还是词组音码“pingyingu”输 入的三字词。传统的单栏显示候选字词的输入方法无法解决这一问题。本发明为这样存在切分歧义的输入编码,预设了辅码在输入编码中的起始位置, 当用户选择了该候选字词时,意味着输入法预设的辅码在输入编码中的起始位置的输入编 码的切分是正确的,从而使输入编码得到了正确的切分。还存在着这样的输入编码“pinyirm”,在辅码输入自造词时,既可以是单字音码 “pin”和输入编码的第六个字母“η”输入的辅码候选字,也可以是单字音码“pin”和输入编 码的第七个字母“η”输入的辅码候选字。传统的单栏显示候选字词的输入方法无法解决这 一问题。本发明预先判断,如果是单字音码“pin”和输入编码的第七个字母“η”输入的辅 码候选字,那么主候选栏中应该显示的是单字音码“yin”编码的候选字;如果是单字音码 “pin”和输入编码的第六个字母“η”输入的辅码候选字,那么辅候选栏中应该是单字音码 “yi”和形码“η”编码的单字辅码候选字。如图11所示,如果用户是单字音码“pin”和输入 编码的第七个字母“η”输入的辅码候选字,那么其就会从主候选栏中选择单字音码“yin” 编码的候选字;如果用户是单字音码“Pin”和输入编码的第六个字母“η”输入的辅码候选 字,那么其就会从辅候选栏中选择单字辅码“yin”编码的候选字。本发明使用双栏显示候 选字词的方法,解决了这一技术难题。拼音输入法存在的最大问题就是重码率高,为拼音输入法添加辅码虽然可以降低 重码率,但是会与拼音编码发生冲突。本发明将辅码编码的候选字词显示于辅候选栏中,成 功解决了这一技术难题。由以上实施例得知,单字有多个输入编码,例如“拼”字有一个单字音码“pin”和 三个单字辅码、丨1^”、“?丨111^”、、丨1110^”;词组至少有一个词组音码和一个词组辅码。已 有输入法只为字词记录使用频率,所以无法消除这些重码。本发明为候选字词的每一个输 入编码记录使用频率,每一个输入编码的使用频率之间不发生影响,当候选字词重码时,用 户只需根据自己的输入习惯自行决定使用哪个编码进行输入。本发明不是静态的去消除汉 字重码,而使用编码位频率技术,为每一个特定用户,动态的确定编码。例如,用户可以使用单字音码“pin”输入“拼”字,使用单字辅码“pink”输入“拚” 字,使用词组音码“pinyin”输入词组“拼音”,使用词组辅码“pinyind”输入词组“品饮”。本发明辅助码输入与汉语拼音输入完全兼容,候选字词双栏显示,使用编码位频 率动态消除重码具有实质性特点。本发明解决了拼音输入重码率高、辅码输入与汉语拼音 输入编码冲突的技术难题,具有显著的技术进步。
9
权利要求
一种计算机汉字输入法,其特征在于(a)将《汉字部首表》中的201个主部首、99个附形部首做为单字字形编码的编码码元,指定到计算机通用键盘的26个字母键上;依笔顺取汉字字形的第一个、第二个和最后一个编码码元的代码进行编码;当汉字字形由两个编码码元组成时,在这两个编码码元的代码之后添加分号“;”做为这个汉字的字形编码;当汉字字形只由一个编码码元组成时,在这个编码码元的代码之后添加分号“;”做为这个汉字的字形编码;(b)将单字的汉语拼音编码定义为单字音码;将单字的字形编码定义为单字形码;将在单字的单字音码之后加上其字形编码的编码,定义为该字的单字辅码;将词组的汉语拼音编码定义为词组音码;将在词组的词组音码之后,加上词组的第一个字的字形的第一个编码码元的代码定义为词组辅码;(c)在汉字编码数据库中分别为单字的每一个输入编码记录使用频率;在汉字编码数据库中分别为词组的每一个输入编码记录使用频率;将每一个输入编码的使用频率定义为编码位频率;(d)输入法候选字词窗口,分为主候选栏和辅候选栏;主候选栏用于显示词组音码、单字音码编码的候选字词;辅候选栏用于显示词组辅码、单字辅码、单字形码编码的候选字词;1、2、3、4、5五个数字键定义为主候选字词选择键,用于选择主候选栏中的候选字词;7、8、9、0四个数字键定义为辅候选字词选择键,用于选择辅候选栏中的候选字词;为辅码编码的候选字词设置以下数据结构候选字词音码辅码辅码在输入编码中的起始位置编码位频率……(e)当辅候选栏中编码位频率最大的单字辅码编码的候选字的编码位频率,大于主候选栏中编码位频率最大的候选词的编码位频率时,将该候选字显示于主候选栏中的第一个候选位置;将原主候选栏中的候选字词,调整为从主候选栏中的第二个候选位置开始显示;当辅候选栏中编码位频率最大的词组辅码编码的候选词的编码位频率,大于主候选栏中编码位频率最大的候选词的编码位频率时,将该候选词显示于主候选栏中的第一个候选位置;将原主候选栏中的候选字词,调整为从主候选栏中的第二个候选位置开始显示。
2.根据权利要求1所述的汉字输入法,其特征在于将2009年5月1日实施的《汉字部首表》中规定的201个主部首、99个附形部首做为 对汉字字形编码的编码码元;可以将300个字形编码码元,按其首笔画及笔画数分成26组, 具体为一起笔一画、一起笔二画、一起笔三画、一起笔四画、一起笔五画及五画以上、丨起 笔一画、丨起笔二画、丨起笔三画、丨起笔四画、丨起笔五画及五画以上、J起笔一画、j起 笔二画、j起笔三画、j起笔四画、j起笔五画、j起笔六画及六画以上、、起笔一画、、起 笔二画、、起笔三画、、起笔四画、、起笔五画及五画以上、1起笔一画、1起笔二画、1起 笔三画、1起笔四画、1起笔五画及五画以上;将26组字形编码码元指定到计算机通用键 盘的26个字母键上,具体为h:—;j:十、厂、匚;k 干、工、土、士、才、夂、寸、升、大、兀、尤、弋;l王、无、韦、少、木、木、支、犬、歹、车、牙、戈、无、比、瓦;n 玉、示、甘、石、龙、耒、老、耳、臣、而、 、西、而、页、至、麦、县、走、赤、車、豆、酉、辰、 豕、青、長、卓、雨、革、頁、面、髟、馬、鬲、黄、麥、鼓;g I > J ;f:卜、丨J、卜、门;d 小、、”、口、口、山、巾;s 止、支、、曰、曰、日、冃、贝、水、见;a 步、业、氺、目、田、m、皿、严、虫、肉、卤、貝、見、里、足、足、邑、非、齿、虎、門、黾、韭、 骨、鬥、鹵、鼎、黑、黽、齒; Y:i ;u J、厂、八、人、入、、门、勹、几、儿、匕、几; i 才、彡、各、夕、欠、卞;o 牛、手、$、气、毛、夂、长、片、斤、爪、父、允、\月、氏、欠、风、殳; P 韦、生、矢、禾、白、瓜、鸟;m:缶、舌、竹、、臼、自、血、舟、色、M、身、楚、采、谷、豸、龟、角、隹、阜、金j、鱼、香、 鬼、食、風、鳥、魚、黍、鼠、鼻、龜、龠; t 、;r 产、7、Wi ;、广、门、?、个广丄; w 文、方、火、斗 户、彳、心;q 广、立、穴、卒、齐、衣、卒、羊、、、米、言、辛、音、首、高、麻、鹿、齊、龍;(所有折笔); v :U> P、P (在左、在右)、刀、力、又、厶、l_、Q; c 彐、1、尸、己、已、巳、弓、子、屮、少、女、飞、马、互、乡、幺、〈〈〈; X:肀、另、毋;Z:全、J、疋、皮、A、矛、母、聿、蚩、艮、艸、羽、糸、系、隶、韋、飛。
3.根据权利要求1所述的汉字输入法,其特征在于还可以将在词组的词组音码之后,加上词组的第一个字的字形的第一个编码码元的代 码,再加上词组的第二个字的字形的第一个编码码元的代码定义为词组辅码。
全文摘要
本发明公开了一种直接输入辅助码的拼音输入法,将单字的汉语拼音编码定义为单字音码;将单字的字形编码定义为单字形码;将在单字的单字音码之后加上其字形编码的编码,定义为该字的单字辅码。将词组的汉语拼音编码定义为词组音码;将在词组的词组音码之后,加上词组的第一个字的字形的第一个编码码元的代码定义为词组辅码。当辅候选栏中编码位频率最大的单字辅码编码的候选字的编码位频率,大于主候选栏中编码位频率最大的候选词的编码位频率时,将该候选字显示于主候选栏中的第一个候选位置。当辅候选栏中编码位频率最大的词组辅码编码的候选词的编码位频率,大于主候选栏中编码位频率最大的候选词的编码位频率时,将该候选词显示于主候选栏中的第一个候选位置。
文档编号G06F3/023GK101872248SQ20091013563
公开日2010年10月27日 申请日期2009年4月23日 优先权日2009年4月23日
发明者王雅弟 申请人:王雅弟
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1