一种多语言混合输入的方法

文档序号:6459313阅读:272来源:国知局
专利名称:一种多语言混合输入的方法
技术领域
本发明涉及电子设备领域,特别涉及电子设备信息输入技术领域,具体是指一种电子设 备上实现多种语言混合输入的的方法。
背景技术
大部分的个人电脑和电子设备上都配备了本地语言的输入法。例如在中文操作系统中配 备有拼音输入法,在手机或其他便携设备上则配有简化键盘的输入法。在全球化不断推进的 今天, 一个用户需要同时输入两种或两种以上语言的情况4艮常见。例如,有时在中文的句子 里需要加入几个英文单词。目前大部分输入法通过提供切换语言的快捷键来解决这个问题。 例如,在一些个人电脑的中文输入法中,用SHIFT键可以在中文和英文输入之间进行切换; 在手机中,可以用某个特殊键进行语言切换。但是,这样的切换对于用户来说仍然显得不便, 因为用户经常会忘记切换,或者在一种主要语言的输入中,临时切换到另一种辅助语言后还 要切换回去。同时,增加一个切换键减慢了用户的输入速度,在一些手持设备上还占用了宝 贵的键盘空间。
一种中文输入方案中,当用户按空M确认时,将输入序列识别为拼音,当用户按回车键确 认时,将输入序列识别为英文。这种方式无需用户显式地切换语言,但限制是用户每次输入 的内容只能是一种语言,而不能实现在一次输入中多种语言的混合输入。同时,在手机等便 携电子设备的简化键盘上,由于每个键上对应了多个字母,击,列的含义是多义性的。因 此对于每一种语言都可能会有多个可能的单词对应,而此时这种方法就无能为力了 。
因而,研制一种适用于各种设备、各种语言的多语言混合输入系统对于那些经常使用两 种或多种语言的用户来说是十分有帮助的。事实上,从一个用户输入序列中推断出所代表的 语言是完全可行的。例如, 一个输入序列"fangfa"可以推断出其为中文拼音,而另一个输入 序列"method"可以推断出为英文单词。在这种过程中,无需用户的切换和确认,输入系统 即可智能地判断出用户在使用哪种语言。

发明内容
本发明提供一种适用于多语言混合输入的方法,该方法可采用以词或句子为单位的输入 方式,通过分析用户的输入序列,匹配所选语言的单词,并用候选词的方式供用户选择。在 该方法中,用户无需切换语言,只要连续地输入字符序列并根据系统提示选择对应的候选词, 即可输入一段或一句混有多种语言的文本。
根据本发明的一个方面,提供了一种多语言混合输入的方法,包括获取用户输入序列的
第1步骤;将待确认的输入序列送至多个语言释义模块分析,获得针对不同语言的候选词的 第2步骤;合并各语言的候选词,并根据优先级排序生成合并后的候选词列表的第3步骤; 输出生成的候选词列表,供用户选择确认的第4步骤。
根据本发明的另一个方面,提供了 一种采用本发明第一方面所述的多语言混合输入方法 的便携式电子设备。


附图1A是举例说明一台适于本发明的个人计算机;
附图1B是举例说明根据本发明实施例的屏幕上显示的内容;
附图2A是举例说明根据本发明实施例的屏幕上显示的初始用户界面;
附图2B是举例说明才艮据本发明实施例的屏幕上显示的一个进一步的用户界面;
附图2C是举例说明根据本发明实施例的屏幕上显示的另一个进一步的用户界面;
附图2D是举例说明4艮据本发明实施例的屏幕上显示的另一个进一步的用户界面;
附图2E是举例说明根据本发明实施例的屏幕上显示的另 一个进一步的用户界面;
附图3是举例说明根据本发明实施例的一个带有简化键盘的电子设备屏幕上显示的内
容;
附图4是举例说明适用于本发明的计算机设备或便携式终端设备的基本结构框附图5是举例说明根据本发明实施例的多语言混合输入软件流程附图6是举例说明根据本发明实施例的多个语言释义模块;
附图7是举例说明根据本发明实施例的一种多语言混合输入流程。
具体实施方式
1.系统操作方式
为了便于理解本发明的实施例及其系统结构原理,首先对本发明的一些实施例操作方式 和用户体验做简要说明。
参考图1A,该图描述了一台适用于本发明的配有键盘和显示屏幕的个人计算机100。用 户可以在键盘上输入字符序列,计算机中装载的输入法将其转化为对应语言的文字。
图1B是该计算机屏幕上的显示内容。110为文本区域,用户的输入经确认后进入文本区 域。120为输入序列,其中分为已确认序列121和待确认序列122。已确认序列显示已经由用 户确认的输入序列所对应的单词,待确认序列显示尚未确认的用户输入序列。130为候选词 区域,列出了待确认序列可能对应的多个候选词。在这个例子中,以中文拼音和英文的混合 输入为例,说明本发明系统的使用方法。
参考图2A,该图举例说明了依照本发明实施例的一个初始用户界面。当用户要输入一段 话,例如"支持中文和English的混合输入"时,用户首先在键盘上输入序列210 "zhi chi zhong wenheenglishdehunheshuru"。为了便于说明,本文用空格分隔各个词,但实际的用户输入 并不需要包含这些分隔符。在这个输入序列中,既包含了拼音,又包含了英文单词。在一开 始,该序列的所有部分都为待确认序列,在候选区域中列出了待确认序列前段所对应的候选 词。例如该序列的开头"zhichi"所对应的候选词有"支持","只吃","咫尺,,,"直尺"等, 显示在候选区域211中。
参考图2B,该图举例说明了依照本发明实施例的一个进一步的用户界面。按空,选择 第一个候选词"支持"后,"zhi chi"被替换为"支持",成为已确认序列221,而待确认序列 222变为"zhong wen he english de hun he shu ru"。此时,系统重新对待定序列进行分析并列 出新的候选词列表。由此可见,在该系统中,待确认序列从前到后不断地通过用户选定候选 词转变为已确认序列。
参考2C,该图举例说明了依照本发明实施例的另一个进一步的用户界面。,当用户确认 了输入序列"zhichizhongwenhe,,为231 "支持中文和"时,待确认序列为232 "englishdehun he shu ru"。此时,系统从内置的英文单词词典中找到English这个单词,将其加入到候选词 列表中。而同时由于待确认序列的开头"en"也可能是拼音,因此在候选词列表中也列出了"en,, 所对应的中文候选词。用户选择候选词"English"后将其加入到已确认序列中,如图2C所示。
以此类推,当用户确认了后续的输入序列"dehunhe,,之后,最后的待确定序列"shuru"所对应的候选词如图2D所示。当用户确认了候选词"输入"之后,所有的输入序列都得到 了确认,被输入到文本区域241中。同时输入序列区域和候选区域清空。
图3是另一个适用于本发明的便携式电子设备,带有一个简化键盘,每个键上对应了多 个英文字符。该键盘既可以是硬件键盘,也可以是显示在触摸屏上的软件键盘。在屏幕区域 同样有文本区域,输入序列和候选区域。与前一种实施例类似,用户同样是通过在键盘上输 入按键序列,并确认各个候选词。但不同的是,在该键盘上每一个按键对应于多个字符,因 此可能对应的候选词也相应增加。例如在用户先后掩建301 ( "ghi,,)和键302 ( "def,)后, 可能对应的序列组合有3*3=9种,而实际有效的拼音有"he"和"ge"。在这种具有多义性的 键盘上,本发明的系统仍然适用。因为系统可以将各种可能的序列组合所对应的候选词按优 选顺序排列(例如词频高低),供用户选择。在此例中,掩建301和键302对应的候选词的中 文可能有"和,个,合,,等,而对应的英文可能有"he"、 "if5等,因此全都根据优先顺序显 示在候选区域310中。
依照本发明的一个实施例,存在一个当前输入语言(如,中文),和一或多个备选输入语 言(如,英文)。因此候选词列表中会优先显示当前输入语言的候选词,而仅将备选输入语言 中的高词频的单词显示出来。例如,在图3所述的界面中,当用户输入了按键301和,302 后,由于当前输入语言是中文,备选输入语言是英文,因此候选词中仅显示出最高词频的英 文单词"if',而其余候选词都为当前输入语言中文的候选词。尽管英文单词"he"的词频和 其余中文候选词的词频相近,但由于其属于备选输入语言,因此并没有出现在候选词列表中。
2. 名词定义
本发明所涉及的名词定义如下 "已确认输入序列"已经由用户确认候选词的输入序列。 "待确认输入序列"尚未确认候逸词的输入序列。
3. 系统结构及原理
图4描述了本发明所涉及的一种多语言混合输入系统,包含输入装置410,处理器420, 存储装置440和显示装置430。其中,输入装置410接受用户的输入,可以是键盘、触摸板、 触摸屏等;存储装置440中存有本发明所对应的软件程序及相关的操作系统、文本编辑器以 及其他应用程序等,可以是任何记忆介质,例如随机访问内存(RAM),只读内存(ROM),闪 存(Flash),硬盘等;处理器420可以是CPU或专用集成电路芯片;显示装置430将系统的输 出显示给用户,可以是显示屏、液晶屏等。很多情况下,输入装置410也可能与显示装置430合成,如触摸屏。
本多语言混合输入的系统是由多语言混合输入软件500管理的。图5描述了该多语言混 合输入软件的主要流程,具备以下步骤等待用户输入(步骤501);判断本次输入是否为确 认候选词操作(步骤502):若是,跳转至步骤503,若否跳转至步骤504;将候选词所对应 的序列从待确认序列移至已确认序列(步骤503);将输入键序列加入到待确认序列尾部,并 跳转至步骤507 (步骤504 );判断待确认序列是否为空(步骤505 ),若是,跳转至步骤506, 若否,跳转至步骤507;将已确认的候选词序列输入至文本区域,完成一次输入并返回(步 骤506);将更新后的待确认序列送至各个语言释义模块分析(步骤507);综合各语言释义模 块分析结果,在候选词模块中合并生成候选词列表,并进行优先级排序(步骤508);输出更 新的候选词列表(步骤509 )。
对于步骤502,确认候选词操作可以是按确认键或空格键等输入默认候选词,或是用方向 键选中候选词后按确认键输入某个候选词,或是在触摸屏上点击某个候选词等。
对于步骤507,各语言释义模块是根据输入的待确定序列,结合本语言的词库,寻找出可 能的本语言候选词,并将其输入至候选词模块中。在本发明中,语言的种类和数量可以任意 指定而不影响发明的本质。例如, 一种实施例可以包含中文拼音和英文的释义模块,分别查 找待确认序列针对中文拼音和英文的候选词;另一种实施例可以包含日文、英文和德文的释 义模块,分别查找针对日文、英文和德文的候选词。对于同一种语言的不同输入方法,也可 能对应不同的释义模块,例如中文拼音和笔画输入可以对应不同的释义模块。
对于步骤508,候选词模块将各个语言释义模块输出的候选词按优先级顺序进行排列,并 最终输出给用户。该优先级可根据候选词的词频、上下文关联性等因素决定。
依照本发明的一种优选实施例,各语言释义模块可包含一个当前输入语言和一或多个备 选输入语言,当前输入语言的候选词在优先级排序中比备选输入语言的候选词具有更高的优 先级。例如,在中文为当前输入语言时,中文候选词便具有更高的优先级,这样可确保候选 词列表中大部分为中文。在某些实施例中,可以仅将备选输入语言的最高优先级候选词输出, 减少对用户选词的干扰。当前输入语言是可以动态切换的,例如,用户可以通过某个特定操 作,将当前输入语言从中文切换至英文,而中文则变为备选输入语言。
4.释义模块的工作原理
下面具体介绍所述释义模块的工作原理。为了实现多语言混合输入的目的,同一个待确 认序列被输入到多个语言释义模块中进行解析。如图6所示。在每个释义模块中,都根据各自的语言对待确认序列进行独立的分析。每个释义模块可 包含一个该语言的词典,可以快速地将字符序列映射到可能的单词。释义模块根据该语言的 词典,寻找出待确认序列及其开头的各子序列所对应的候选词。例如,对于英语释义模块, 待确i人序歹'J "namecardde"可对应的l美选词为"namecard"和"name"。但"card"并不作为i亥 待确认序列的候选词,因为其位于待确认序列的中间,而非开头。又例如,对于中文拼音释 义模块,待确认序列"namecardde,,可对应的候选词为"那么"、"那"、"拿"等等,因为该 序列的开头子序列"narae"可以对应为词语"那么",而开头子序列"na"可以对应与字"那"、 "拿"等。
对于每个按键对应多个字符的简化键盘,待确认序列可以是一个多义性的序列,即对应 于多种可能的字符序列。此时,释义模块仍然可以根据各种可能的字符序列找出对应的候选 词。例如,对于英语释义模块,在图3所示手机键盘布局中,当用户先后输入键303 ("jkl"), 键302 ("def7),键304 ( "tuv")时,可对应的候选词有"jet" , "let"等。在这种情况下, 可能的候选词会比普通键盘输入所对应的候选词更多,但并不影响本发明的实质。
5.候选词模块的工作原理
对于每一个释义模块,都会产生各自的候选词列表。而候选词模块则将它们合并成一个 候选词列表并输出给用户。在合并过程中,候选词模块根据优选顺序从高到低将候选词排序, 优先级最高的候选词排在最前。优先级可以有很多因素综合决定,包括候选词的词频、长度、 与上下文的关联度等等。 一般来说,在同种语言中候选词越长,其优先级就越高。例如当英 文中namecard和name同为候选词时,namecard的优先级就更高。而在不同语言中, 一般来 说,候选词所对应的字符序列越长,则优先级越高。例如候选词"那么"对应的字符序列是"na me",因此其优先级低于候选词"namecard"。
依照本发明的一个实施例,当前输入语言的候选词优先级高于备选输入语言的候选词优 先级。例如,当前输入语言为中文,备选输入语言为英文时,中文候选词的优先级高于英文 候选词。因此在候选词列表中,只有最高词频的英文单词才会排在前面。
需要指出的是,尽管本发明的实施例以中文和英文混合输入为例,但其可同样运用与其 他语言的混合输入。例如,要实现英文、德语和法语的混合输入,只需将它们对应的语言释 义模块加入系统。
图7描述了本发明所涉及的一种多语言混合输入的方法700,包含以下步骤获取用户输入序列(步骤701);将待确认的输入序列送至多个语言释义模块分析,获得针对不同语言的 候选词(步骤702);合并各语言的候选词,并根据优先级排序生成合并后的候选词列表(步 骤703 );输出生成的候选词列表,供用户选择确认(步骤704 )。
对于步骤701,用户输入序列可包含已确认序列和待确认序列。已确认序列为已经由用户 确认候选词的输入序列,待确认序列为尚未确认候选词的输入序列。
对于步骤702,各语言释义模块是根据输入的待确定序列,结合本语言的词库,寻找出可 能的本语言候选词,并将其输入至候选词模块中。在本发明中,语言的种类和数量可以任意 指定而不影响发明的本质。例如, 一种实施例可以包含中文拼音和英文的释义模块,分别查 找待确认序列针对中文拼音和英文的候选词;另一种实施例可以包含日文、英文和德文的释 义模块,分别查找针对日文、英文和德文的候选词。对于同一种语言的不同输入方法,也可 能对应不同的释义模块,例如中文拼音和笔画输入可以对应不同的释义模块。
对于步骤703,候选词模块将各个语言释义模块输出的候选词按优先级顺序进行排列。该 优先级可根据候选词的词频、上下文关联性等因素决定。
可选地,各语言释义模块可包含一个当前输入语言和一或多个备选输入语言,且当前输 入语言的候选词在优先级排序中比备选输入语言的候选词具有更高的优先级。例如,在中文 为当前输入语言时,中文候选词便具有更高的优先级。在某些实施例中,可以仅将备选输入 语言的最高优先级候选词输出。当前输入语言是可以动态切换的,例如,用户可以通过某个 特定操作,将当前输入语言从中文切换至英文,而中文则变为备选输入语言。
对于步骤704,用户可通过某些特定操作确认候选词。例如,按空M输入默认候选词, 移动光标选中候选词后按确认键,或直接点击触摸屏上的候选词。经用户确i人的候选词所对 应的输入序列变为已确认输入序列,剩余的序列为待确认输入序列。
权利要求
1、一种多语言混合输入的方法,其特征在于,包括获取用户输入序列的第1步骤;将待确认的输入序列送至多个语言释义模块分析,获得针对不同语言的候选词的第2步骤;合并各语言的候选词,并根据优先级排序生成合并后的候选词列表的第3步骤;输出生成的候选词列表,供用户选择确认的第4步骤。
2、 如权利要求l所述的方法,其特征在于,所述用户输入序列包含已确认序列和待确认 序列。
3、 如权利要求l所述的方法,其特征在于,所述多个语言释义模块可包含同一语言的不 同输入方法。
4、 如权利要求l所述的方法,其特征在于,包含一个当前输入语言和一或多个备选输入 语言,在其他条件相同时,当前输入语言候选词的优先级高于备选输入语言候选词的优先级。
5、 如权利要求l所述的方法,其特征在于,所述优先级判断因素中包含词频,上下文关 联性。
6、 如权利要求l所述的方法,其特征在于,所迷优先级判断因素中包含候选词的长度, 且在其他条件相同时,候选词越长,优先级越高。
7、 如权利要求2所述的方法,其特征在于,所述用户输入序列可以句子为单位。
8、 如权利要求4所述的方法,其特征在于,所述当前输入语言为中文,所述备选输入语 言包含英文。
9、 一种便携式电子设备,其特征在于, 采用了如权利要求1-8中任一项所述的方法。
全文摘要
一种可实现多语言混合输入的方法,在无需切换输入语言的条件下,智能判断用户输入序列,并根据词频、上下文关联性、单词长度、当前输入语言等多种因素决定候选词的优先级,并将合并后的候选词列表显示给用户。
文档编号G06F3/023GK101587471SQ20081003759
公开日2009年11月25日 申请日期2008年5月19日 优先权日2008年5月19日
发明者戴静芬, 赵艳姣, 黄晓凤 申请人:黄晓凤;赵艳姣;戴静芬
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1