汉语拼音输入系统及其方法

文档序号:6335639阅读:462来源:国知局
专利名称:汉语拼音输入系统及其方法
技术领域
本发明涉及一种汉语拼音输入系统及其方法,特别是指一种供使用者于进行拼音输入时输入声调,并根据使用者输入的声母、韵母及声调撷取汉语字元供使用者选取作为输入字元的汉语拼音输入系统及其方法。
背景技术
拼音输入法是一种利用罗马拼音来输入汉语字元的输入法,与注音输入法、仓颉输入法等需学习特定字元拼写的输入法不同的是,拼音输入法可以直接以英文字元的输入组合产生候选的汉语字元,因此除了汉语母语的使用者使用方便外,非汉语母语的使用者也可以在不需更换键盘装置的情况下轻松地进行汉语字元的输入。拼音输入法与注音输入法相似的部分是拼音主要是由声母和韵母两个部分构成。 声母包含:b(々)、p(^)、m(n)、f(C)、d(^)、t(ir)、n(10、l(S)、g(〈〈)、k(^)、 h(厂)、j( M)、q( < )、x(T)、zh(虫)、ch(才)、sh(尸)、r( Θ )、z(卩)、c(亏)及 s(厶)等21个声母。韵母与注音输入法类似,包含a(丫)、o(f )、e(亡)、i (一)...等共37个韵母。然而,汉语字元实际上除了声母和韵母外,声调更分为一声、二声、三声、四声及轻声,但由于拼音输入法当中一般无法结合声调进行输入,使得使用者在进行汉语输入时经常需要花费额外的时间自行判别拼音输入法撷取出来的汉语字元的声调才能够进行汉语输入,而系统所撷取的汉语字元也由于混合着各种声调,无法撷取出精确的汉语字元供使用者选取输入,因此有必要提出改进的技术手段,来解决此一问题。

发明内容
有鉴于现有技术存在的问题,本发明于是公开一种汉语拼音输入系统及其方法, 其中本发明所公开的汉语拼音输入系统,其包含汉语字库,预先储存有至少一汉语字元,其中各该汉语字元对应至少一拼音编码;解析模块,用以接收输入拼音,并自输入拼音中拆解出声母字串及声调韵母字串;编码转换模块,预先建立有韵母转换表,韵母转换表包含至少一声调韵母字串及与各声调韵母字串对应的韵母编码,编码转换模块用以根据韵母转换表将声调韵母字串转换为对应的韵母编码,并根据声母字串及韵母编码产生对应的拼音编码;撷取模块,用以至汉语字库中撷取对应拼音编码的至少一汉语字元;及显示模块, 用以显示撷取出的至少一汉语字元供使用者选择其中之一作为输入字元。本发明所公开的汉语拼音输入方法,其包含步骤预先于汉语字库储存至少一汉语字元,其中各汉语字元对应至少一拼音编码;预先建立韵母转换表,韵母转换表包含至少一声调韵母字串及与各声调韵母字串对应的韵母编码;接收输入拼音,并自输入拼音中拆解出声母字串及声调韵母字串;根据韵母转换表将声调韵母字串转换为对应的韵母编码, 并根据声母字串及韵母编码产生对应的拼音编码;根据拼音编码撷取对应的至少一汉语字元;及显示撷取的至少一汉语字元供使用者选择其中之一作为输入字元。
3
本发明所公开的系统与方法如上,与现有技术之间的差异在于本发明通过预先建立韵母转换表,并于接收输入拼音时根据韵母转换表将输入拼音中的声调韵母字串转换为韵母编码,并根据输入拼音中的声母字串及韵母编码产生拼音编码再撷取对应拼音编码的汉语字元供使用者选取作为输入字元。通过上述的技术手段,本发明可以达成提高拼音输入时汉语字元撷取的精确性的技术功效。


图1为本发明汉语拼音输入系统的方块图。图2为本发明汉语拼音输入方法的流程图。图3为本实施例韵母转换表的示意图。主要元件符号说明101汉语字库102解析模块103编码转换模块104撷取模块105显示模块106排序模块301韵母转换表
具体实施例方式在说明本发明之前,先对本发明的内容进行介绍以汉语字元“甲”为例,汉语字元 “甲”读做“M丨丫 ν ”,在以往的拼音输入法中,输入方式仅输入“jia”,因此最后撷取出的候选字元可能混合着各种不同声调(一声、二声、三声、四声或轻声)但声母韵母与“甲”相同的汉语字元,如“家”、“夹”、“架”...等,除了输入方式不够精确外,系统也不支援输入声调的判别,因此使用者往往需要自行花费额外的时间判别候选字元的声调。而本发明的汉语拼音输入系统中每一个汉语字元都会对应至少一拼音编码,每一个拼音编码都会对应一种读音,由于汉语字元有时会有多种不同读音,因此本发明可以借由比对拼音编码,撷取出对应的汉语字元。以下将配合图式及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。首先,请先参考图1,为本发明汉语拼音输入系统的方块图,其包含汉语字库 101、解析模块102、编码转换模块103、撷取模块104及显示模块105。汉语字库101,预先储存有至少一汉语字元,其中每一汉语字元对应至少一拼音编码,且每一个拼音编码都会对应一种读音。举例来说,汉语字元“假”由于读音可读做“ M
I 丫 ι及“M I Y γ”,因此“假”对应的拼音编码可以利用utf-8的字码“jid>”及“jia” 作为拼音编码。需要特别说明的是,拼音编码可以借由UTF-8中字元的特殊形式来表示不同的声调,例如拼音韵母“e”的一声、二声、三声、四声及轻声可以利用UTF-8字元的“ ”、 “ ”、“ ”、“ ”及“e”个别表示。因此,以汉字字元“舍”为例,其拼音编码可以利用UTF-8的拼音编码“sM”表示。由于汉语字元有时会有多种不同读音,因此系统借由比对拼音编码, 可以撷取出对应的汉语字元。解析模块102,用以接收使用者所输入的输入拼音,并自输入拼音中拆解出声母字串及声调韵母字串。举例来说,假设系统支援的声调韵母字串的形式为拼音加上1 4中的其中一个数字,其中1 4的数字用来表示声调,1表一声,2表二声,以此类推,轻声则不加任何数字,则当输入拼音为“she3”时,解析模块102将会将输入拼音拆解为声母字串“sh” 及声调韵母字串“e3”。编码转换模块103,预先建立有韵母转换表,韵母转换表包含至少一声调韵母字串及与各声调韵母字串对应的韵母编码。由于对于使用者来说输入UTF-8格式的字元较为不便,因此可以预先在编码转换模块103当中预先建立一个韵母转换表,使用者只要输入系统支援的声调韵母字串形式的输入拼音,例如一般字元及数字,此时编码转换模块103便可以自动产生对应输入拼音的拼音编码。由于韵母转换表中预先建立有系统可辨识转换的声调韵母字串及韵母编码的对应关系,因此承前面输入拼音为“she3”的例子,声调韵母字串“e3”将会被编码转换模块103转换为韵母编码,假设韵母转换表中“e3”韵母编码形式是以UTF-8字元的“ ”表示,则编码转换模块103将声调韵母字串“e3”转为韵母编码后, 将会根据声母字串“sh”及韵母编码“ ”产生拼音编码“吐§”。撷取模块104,负责至汉语字库101当中撷取对应拼音编码的至少一汉语字元。举例来说,假设拼音编码为“d0ng”,则撷取模块104将会撷取出“动”、“洞”、“栋”...等汉语字元,而撷取模块104撷取出的汉语字元,将会再通过显示模块105显示出来供使用者选择其中之一作为输入字元。此外,显示模块105显示撷取出的至少一汉语字元时,也可以同时显示拼音编码“ dong”,借此来提示使用者对应“ dong4,,的拼音编码。本发明的汉语拼音输入系统除了上述的模块之外,更可以包含一个排序模块106, 用以根据字元属性排列撷取模块104撷取的至少一汉语字元的显示顺序。字元属性可以是部首、笔划、使用频率或其他各种可以将汉语字元排列出不同显示顺序的属性。当排序模块 106排序显示顺序后,显示模块105可以再依据显示顺序显示该至少一汉语字元,借此也可以提高汉语字元撷取的精确性。接下来,请参考图2,为本发明汉语拼音输入方法的流程图,将用以说明本发明的实施流程。首先,预先于汉语字库储存至少一汉语字元(步骤201),举例来说,汉语字元“甲” 读做“M丨丫 ν ”,在以往的拼音输入法中,输入方式仅输入“jia”,因此最后撷取出的候选字元可能混合着各种声调但声母韵母与“甲”相同的汉语字元,如“家”、“夹”、“架”...等, 除了输入方式不够精确外,系统也不支援输入声调的判别,因此使用者往往需要自行花费额外的时间判别候选字元的声调。而本发明的汉语拼音输入系统中每一个汉语字元都会对应至少一拼音编码,每一个拼音编码都会对应一种读音,由于汉语字元有时会有多种不同读音,因此系统借由比对拼音编码,可以撷取出对应的汉语字元。需要特别说明的是,这个拼音编码可以依据UTF-8的编码格式进行编码,借由UTF-8中字元的特殊形式来表示不同的声调,例如拼音韵母“e”的一声、二声、三声、四声及轻声可以用UTF-8字元的“ ”、“ ”、 “ ”、“ ”及“e”个别表示。因此,汉字字元“舍”的拼音编码可以利用UTF-8的拼音编码 “ shS ”表示。
接着,预先建立韵母转换表(步骤20 ,韵母转换表中预先建立有系统可辨识转换的声调韵母字串及韵母编码的对应关系。由于拼音编码的字元输入不易,因此可以预先在韵母转换表建立系统可辨识转换的声调韵母字串及韵母编码的对应关系,使用者只要输入系统支援的声调韵母字串形式的输入拼音,系统便可以自动产生对应输入拼音的拼音编码。接着,接收输入拼音并自输入拼音中拆解出声母字串及声调韵母字串(步骤 203)。举例来说,假设系统支援的声调韵母字串的形式为拼音加上1 4中的其中一个数字,其中1 4的数字用来表示声调,1表一声,2表二声,以此类推,轻声则不加任何数字, 则当输入拼音为“she3”时,解析模块102将会将输入拼音拆解为声母字串“sh”及声调韵母字串“e3”。当自输入拼音中拆解出声母字串及声调韵母字串后,系统接着根据韵母转换表将声调韵母字串转换为对应的韵母编码,然后再根据声母字串及韵母编码产生对应的拼音编码(步骤204)。承前面输入拼音为“she3”的例子,假设韵母转换表中“e3”韵母编码形式是以UTF-8字元的“ ”表示,则系统将声调韵母字串“e3”转为韵母编码“ ”后,将会根据声母字串“sh”及韵母编码“ ”产生拼音编码“吐§”。撷取出拼音编码后,系统接着再根据拼音编码撷取对应的至少一汉语字元(步骤 205),并显示撷取的至少一汉语字元供使用者选择其中之一作为输入字元(步骤206)。步骤205与步骤206之间,更可以包含一个排序步骤,将撷取出的至少一汉语字元根据字元属性排列显示顺序,显示时再依照显示顺序显示汉语字元。字元属性可以是部首、 笔划、使用频率或其他各种可以将汉语字元排列出不同显示顺序的属性。此外,步骤206中显示至少一汉语字元时,也可以同时将拼音编码显示出来,借此提示对应输入拼音的拼音编码。接下来,将以一使用者使用应用有本发明的输入法程式的操作过程作为实施例来说明本发明的详细实施方式。首先输入法程式当中预先于汉语字库中储存至少一汉语字元,输入法程式当中预先也建立有一个韵母转换表。请参考图3,韵母转换表301当中举例说明了声调韵母字串与韵母编码之间的对应关系。声调韵母字串系输入法程式能够判别的输入形式,例如韵母“e”加上了 1 4的其中一个数字可以用来表示输入的声调,1表一声、2表二声...,以此类推,而轻声则不需再输入数字。韵母编码可以通过UTF-8的编码格式来进行编码,通过UTF-8的特殊字元来表示不同声调的韵母。假设使用者通过输入法程式输入了输入拼音“ she3 ”,首先输入法程式将会把输入拼音“she3”拆解为声母字串“sh”及声调韵母字串“e3”。接着输入法程式将会根据声调韵母字串“e3”查询韵母转换表301,假设查询出对应的韵母编码为“ ”,输入法程式接着将会将声母字串“sh”及韵母编码“ ”结合为拼音编码“sM”,接着再根据拼音编码“shS”至汉语字库当中撷取对应拼音编码“shS”的汉语字元,如“捨”、“舍”、“舎”,,,等,最后再将撷取出的汉语字元显示出来。需要特别说明的是,显示时除了可以显示撷取出的汉语字元外, 也可以同时显示拼音编码“ she ”,借此来提示使用者对应输入拼音的拼音编码。此外,撷取出的至少一汉语字元可以再根据部首、笔划、使用频率或其他各种可以将汉语字元排列出不同显示顺序的字元属性排列显示顺序后,再由显示模块根据显示顺序显示汉语字元。综上所述,可知本发明与现有技术之间的差异在于具有通过预先建立韵母转换表,并于接收输入拼音时根据韵母转换表将输入拼音中的声调韵母字串转换为韵母编码, 并根据输入拼音中的声母字串及韵母编码产生拼音编码再撷取对应拼音编码的汉语字元供使用者选取作为输入字元的技术手段,借由此一技术手段可以解决现有技术所存在的问题,进而达成提高拼音输入时汉语字元撷取的精确性的技术功效。 虽然本发明所公开的实施方式如上,只是所述的内容并非用以直接限定本发明的专利保护范围。任何本发明所属技术领域中普通技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作些许的更动。本发明的专利保护范围,仍须以所附的权利要求书所界定者为准。
权利要求
1.一种汉语拼音输入系统,其特征在于,其包含一汉语字库,预先储存有至少一汉语字元,其中各该汉语字元对应至少一拼音编码; 一解析模块,用以接收一输入拼音,并自该输入拼音中拆解出一声母字串及一声调韵母字串;一编码转换模块,预先建立有一韵母转换表,该韵母转换表包含至少一声调韵母字串及与各该声调韵母字串对应的该韵母编码,该编码转换模块用以根据该韵母转换表将该声调韵母字串转换为对应的该韵母编码,并根据该声母字串及该韵母编码产生对应的该拼音编码;一撷取模块,用以至该汉语字库中撷取对应该拼音编码的该至少一汉语字元;及一显示模块,用以显示撷取出的该至少一汉语字元供使用者选择其中之一作为输入字兀。
2.如权利要求1所述的汉语拼音输入系统,其特征在于,该韵母编码系为UTF-8编码格式。
3.如权利要求1所述的汉语拼音输入系统,其特征在于,该系统更包含一排序模块,用以根据一字元属性排列撷取的该至少一汉语字元的显示顺序再交由该显示模块依据显示顺序显示该至少一汉语字元。
4.如权利要求1所述的汉语拼音输入系统,其特征在于,该显示模块更用以于显示撷取出的该至少一汉语字元的同时显示该拼音编码。
5.一种汉语拼音输入方法,其特征在于,其包含下列步骤预先于一汉语字库储存至少一汉语字元,其中各该汉语字元对应至少一拼音编码; 预先建立一韵母转换表,该韵母转换表包含至少一声调韵母字串及与各该声调韵母字串对应的该韵母编码;接收一输入拼音,并自该输入拼音中拆解出一声母字串及一声调韵母字串; 根据该韵母转换表将该声调韵母字串转换为对应的该韵母编码,并根据该声母字串及该韵母编码产生对应的该拼音编码;根据该拼音编码撷取对应的该至少一汉语字元;及显示撷取的该至少一汉语字元供使用者选择其中之一作为输入字元。
6.如权利要求5所述的汉语拼音输入方法,其特征在于,该韵母编码系为UTF-8编码格式。
7.如权利要求5所述的汉语拼音输入方法,其特征在于,根据该拼音编码撷取对应的该至少一汉语字元的步骤与显示撷取的该至少一汉语字元供使用者选择其中之一作为输入的步骤之间,更包含根据一字元属性排列撷取的该至少一汉语字元的显示顺序再依据显示顺序显示该至少一汉语字元的步骤。
8.如权利要求5所述的汉语拼音输入方法,其特征在于,显示撷取的该至少一汉语字元供使用者选择其中之一作为输入的步骤中,更包含同时显示该拼音编码的步骤。
全文摘要
本发明公开了一种汉语拼音输入系统及其方法,其通过预先建立韵母转换表,并于接收输入拼音时根据韵母转换表将输入拼音中的声调韵母字串转换为韵母编码,并根据输入拼音中的声母字串及韵母编码产生拼音编码再撷取对应拼音编码的汉语字元供使用者选取作为输入字元的技术手段,借此可以达成提高拼音输入时汉语字元撷取的精确性的技术功效。
文档编号G06F3/023GK102467246SQ20101053962
公开日2012年5月23日 申请日期2010年11月9日 优先权日2010年11月9日
发明者王辉, 邱全成 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1