基于输入法的词库更新装置及方法

文档序号:6613937阅读:307来源:国知局
专利名称:基于输入法的词库更新装置及方法
技术领域
本发明涉及基于输入法的词库更新技术,尤其涉及一种基于输入法实现 实时同步词库的词库更新装置及方法。
背景技术
用户要将汉字输入到电脑中,需要釆用基于中文输入法的中文输入技
术。目前,中文输入技术分为基于键盘输入、和非键盘输入两种方式。其 中,尤其以基于键盘输入方式的应用较为广泛。这里,中文输入技术的具体 实现为通过运行于操作系统上的一个中文输入软件,把键盘输入的编码、 或其他非键盘输入的数据转换成汉字。
具体来说,针对基于键盘输入方式的中文输入软件而言,由于汉字的字 数有几万个,而且它们和键盘没有任何对应关系,因此,为了实现向电脑中 输入汉字,必须设置编码规则对汉字进行编码,并将这些编码与键盘上的按 键联系起来。这样,用户通过键盘输入某个汉字的编码后,就可以根据该编 码规则转换成相对应的汉字。其中,编码规则的设置方法通常为将表述汉 字的音、形和义与特定的按键相联系,再根据不同汉字进行组合来实现汉字 的输入。
针对基于非键盘输入方式的中文输入软件而言,非键盘中文输入软件包 括手写输入软件、语音输入软件、和光学字符识别(OCR)输入软件。
其中,手写输入软件是一种笔式环境下的手写中文识别输入软件,符合 中国人用笔写字的习惯,只要在手写板上按平常的习惯写字,电脑就能将其 识别显示出来。在硬件方面,手写输入软件的要求是需要配套手写板。在配 套的手写板上用任何类型的硬笔来书写并录入汉字,不仅方便和快捷,而且错字率也比较低。另外,用鼠标在指定区域内也可以书写并录入汉字,但是 需要使用手写软件转换成汉字,而且对鼠标操作的熟练性要求较高。
语音输入软件是通过话简输入声音后,再转换成文字的输入软件。在硬 件方面,语音输入软件的要求是用户的电脑必须配备能进行正常录音的声 卡。在调试好麦克风后,用户通过麦克风能录入普通话语音,从而实现文字 的录入。虽然使用起来很方便,但是错字率比较高,特别是一些未经训练的 专业名词以及生僻字。如果你的普通话口音不标准,你还需要用提供的语音 训练程序,进行一段时间的训练,让语音输入软件熟悉你的口音后,才能很 好地实现文字的录入。
由于OCR输入软件是将要输入的文稿通过扫描仪转化为图形后,才能
进行识别,因此,在硬件方面,OCR输入软件的要求是必须配备扫描仪。 而且,原稿的印刷质量越高,识别的准确率就越高。 一般最好是印刷体的文 字,比如图书和杂志等。如果原稿的纸张较薄,那么有可能在扫描时纸张背 面的图形、文字也透射过来,干扰最后的识别效果。
综上所述,目前,虽然实现汉字输入采用的中文输入软件各不相同,但 是,中文输入软件更新用户词库的方式不外乎两种。
一种方式是用户手动上传用户词库到服务器。由于不便于用户快捷地 实现文字的录入,因此主要作为备份功能来使用。另一种方式是每隔一定 时间,中文输入软件从服务器上自动地下载用户词库,合并进当前的用户词 库;再将合并后的用户词库上传至服务器。由于中文输入软件与服务器之间 的交互具有非实时性,因此,每次传输的数据量大,并导致用户词库更新速 度很慢,也不便于用户快捷地实现文字的录入。

发明内容
有鉴于此,本发明的主要目的在于提供一种基于输入法的词库更新装置, 能实时地同步词库,便于用户快捷地实现文字的录入。
本发明的另一目的在于提供一种基于输入法的词库更新方法,能实时地同
步词库,便于用户快捷地实现文字的录入。
为达到上述目的,本发明的技术方案是这样实现的
一种基于输入法的词库更新装置,该装置包括配备中文输入软件的本地
计算机和异地存储设备;其中,
配备中文输入软件的本地计算机,用于通过所述中文输入软件获取用户当
前的文字输入,上传并更新到异地存储设备;并且,所述中文输入软件的用户 词库通过用户账号与所述用户进行绑定;
异地存储设备,用于接收并存储所述文字输入。
其中,所述异地存储设备包括异地的服务器/计算机;并且,所述服务器 /计算机的用户词库与所述用户账号一一对应。
其中,所述异地存储设备,进一步用于根据所述用户账号,将异地所述更 新后的用户词库合并到所述本地计算机中文输入软件的用户词库。
其中,该装置还包括配备中文输入软件的异地计算机,并且,所述异地计 算机中文输入软件的用户词库与所述用户账号 一 一 对应;
所述异地存储设备,进一步用于根据所述用户账号,将异地所述更新后的 用户词库合并到所述异地计算机中文输入软件的用户词库。
一种基于输入法的词库更新方法,该方法包括以下步骤
A、 通过用户账号将用户与本地中文输入软件的用户词库绑定;
B、 所述中文输入软件获取所述用户当前的文字输入,并根据所述用户账
号将所述文字输入更新到异地的用户词库。 其中,步骤A具体为
Al、通过所述本地中文输入软件预先设置的密钥或算法,将所述用户账号 和用户登录密码加密后发送到验证服务器;所述验证服务器用所述密钥或算法 对加密后的所述用户账号和所述用户登录密码解密,并进行用户账号与用户登 录密码的一致性验证;
A2、当一致性验证通过时,验证服务器将包含用户账号的验证成功信息进 行数字签名,并返回本地中文输入软件;之后,执行步骤B;当一致性验证失
败时,结束当前绑定流程。
其中,步骤B中将所述文字输入更新到异地的用户词库具体为
Bl、基于所述数字签名,将用户当前的文字输入加密后上传并更新到异地
服务器/计算机上的用户词库;并且,所述服务器/计算机的用户词库与所述数字
签名中的用户账号一一对应。
其中,步骤B1后还包括
根据所述用户账号,将异地所述更新后的用户词库合并到所述本地中文输 入软件的用户词库。
其中,步骤B1后还包括
根据所述用户账号,将异地所述更新后的用户词库合并到异地中文输入软 件的用户词库。
其中,所述用户账号为同一形式或基于账号信息互通的不同形式。 其中,所述用户账号包括所述用户的邮箱地址或者所述用户的登录号码。 本发明通过用户账号将用户与中文输入软件进行绑定,中文输入软件获取 该用户当前的文字输入,并根据该用户账号将当前的文字输入更新到异地的用 户词库。釆用本发明具有实时性和便利性,并能将该用户使用中文输入软件的 用户词库实时同步更新到异地存储设备,比如服务器或者绑定同一账号的另一 台异地计算机,从而使用户能快捷地实现文字的录入。


图1为本发明装置的组成结构示意图; 图2为本发明方法的实现流程示意图。
具体实施例方式
本发明的核心思想是通过用户账号将用户与中文输入软件进行绑定,中 文输入软件获取该用户当前的文字输入,并根据该用户账号将当前的文字输入 更新到异地的用户词库。采用本发明具有实时性和便利性,使用户能快捷地实 现文字的录入。
为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照 附图,对本发明进一步详细说明。
如图1所示, 一种基于输入法的词库更新装置,该装置包括配备中文输 入软件的本地计算机1和异地存储设备2。
其中,配备中文输入软件的本地计算机1用于通过本地的中文输入软件获 取用户当前的文字输入,上传并更新到异地存储设备2。并且,本地中文输入 软件的用户词库通过用户账号与所述用户进行绑定。异地存储设备2用于从配 备中文输入软件的本地计算机1,接收并存储所述用户当前的文字输入。
这里,异地存储设备2包括异地的服务器/计算机。并且,异地服务器/ 计算机的用户词库与所述用户账号一一对应。也就是说,通过所述用户账号, 将异地服务器/计算机的用户词库与所述用户进行绑定。并且,异地存储设备2, 进一步用于根据所述用户账号,将异地所述更新后的用户词库合并到所述本地 计算机中文输入软件的用户词库。
一种基于输入法的词库更新装置,该装置还包括配备中文输入软件的异地 计算机3,并且,该异地计算机中文输入软件的用户词库与所述用户账号一一 对应。那么,异地存储设备2,进一步用于根据所述用户账号,将异地所述更 新后的用户词库合并到该异地计算机中文输入软件的用户词库。
从而,用户使用互联网中任一台计算机,只要釆用同样的用户账号登录中 文输入软件,那么,由于所述用户使用中文输入软件的用户词库,都是基于该 用户的每次文字输入、和基于用户账号绑定进行的更新,因此,能够快捷地实 现用户的文字输入。
如图2所示, 一种基于输入法的词库更新方法,该方法包括以下步骤
步骤101、客户端通过用户账号将用户与本地中文输入软件的用户词库绑定。
这里,用户账号包括用户注册的邮箱地址;或者用户注册的登录号码, 比如登录MSN系统的登录号码。
这里,用户账号为同一形式或基于账号信息互通的不同形式。针对用户账 号为同一形式而言,比如当同一用户登录二台不同的计算机时,用户账号都为 用户注册的邮箱地址,那么,用户都釆用该邮箱地址登录这两台计算机上的中 文输入软件。针对用户账号为基于账号信息互通的不同形式而言,比如当同一 用户登录二台不同的计算机时,用户采用用户注册的邮箱地址登录一台计算机 上的中文输入软件,并釆用用户注册的登录号码登录另 一 台计算机上的中文输 入软件。
这里,步骤IOI的处理过程具体为
步骤101a、当前用户通过输入用户账号和用户登录密码登录客户端的本地
中文输入软件;同时,客户端的本地中文输入软件获取了用户账号和用户登录密码。
为了阐述方便,以下以用户信息指代包括用户账号和用户登录密码在内的 情况。
步骤101b、客户端的本地中文输入软件预先设置密钥或算法,将获取的用
户信息加密后发送到验证服务器。
这里,该预先设置的密码是客户端的本地中文输入软件与服务器端的验证 服务器事先约定的。而且,该密码是固定的,每一个登录本地中文输入软件用 户的用户信息都采用该密码加密。该算法可以是哈希算法,釆用哈希算法可以 无需密钥直接将用户信息加密。
步骤101c、验证服务器收到加密后的用户信息后,用事先约定的同一密钥
或算法对该加密后的用户信息进行正确解密,并获得用户信息。
步骤101d、根据验证服务器中存储的用户账号和登录密码的对应关系,验
证服务器査询并验证用户账号与用户登录密码的一致性。
如果一致性验证通过,则用户登录成功,验证服务器将包含用户账号的验 证成功信息进行数字签名,并返回客户端的本地中文输入软件,完成客户端通 过用户账号将用户与本地中文输入软件的用户词库绑定的过程。之后,执行步
骤102。 否则,用户登录失败,验证服务器将包含用户账号的验证失败信息返回客 户端的本地中文输入软件,结東当前绑定流程。
步骤102、用户通过用户账号成功登录客户端的本地中文输入软件后,该 本地中文输入软件获取用户当前的文字输入,并根据用户账号,将用户当前的 文字输入更新到异地的用户词库。
这里,用户当前的文字输入是指用户的一次确定操作,表现为该确定的 输入结果显示到中文输入软件的操作屏幕上。更新到用户词库是指根据用户 当前的文字输入,不仅更新相对应的词组,而且也更新相对应词组的词频信息。
具体来说,用户执行完每次确定操作,并将该确定的输入结果显示到中文 输入软件的搡作屏幕上后,根据用户账号,中文输入软件会把用户的相关词组 和其最新的词频信息发送到异地存储设备,比如异地的服务器进行实时更新。 比如,用户输入拼音yonghu,并在中文输入软件的搡作屏幕选择拥护后,中文 输入软件会调整拥护的词频,然后,把拥护这个词组和拥护这个词组的词频信 息发送到异地的服务器进行更新。
步骤102中,客户端的本地中文输入软件获取用户当前的文字输入具体为
在Windows系统中,通常先采用Windows的输入法编辑器(IME, I叩ut Method Editor),实现中文输入软件对用户当前按键输入的获取搡作。当中文输 入软件获得按键输入后,根据按键输入的组合,给出与用户当前的文字输入相 匹配的候选词。之后,用户再进行选择确定,中文输入软件也就获取到用户当 前的文字输入。
步骤102中,客户端的本地中文输入软件根据用户账号将用户当前的文字 输入更新到异地的用户词库具体为
步骤1021、基于本地中文输入软件从验证服务器接收的数字签名,将用户 当前的文字输入加密后上传并更新到异地服务器/计算机上的用户词库;并且, 所述服务器/计算机的用户词库与所述数字签名中的用户账号一一对应。
这里的异地服务器指业务服务器,即词库服务器。并且需要指出的是,只 要在服务器端,无论是之前提到的验证服务器,还是业务服务器都可以对数字
签名加密的信息进行解密,原因在于,数字签名通常是由服务器端来设定。并 且业务服务器与验证服务器事先约定了解密密码,该解密密码用于对数字签名 加密的信息进行解密。
这里,当同一用户在同一台计算机,即本地计算机进行输入时,步骤1021 后还包括客户端根据用户账号将异地所述更新后的用户词库合并到本地计算 机中文输入软件的用户词库。
当同一用户在不同计算机之间进行输入,即相对于本地计算机而言,用户
换了一台异地计算机进行输入时,步骤1021后还包括客户端根据用户账号将
异地所述更新后的用户词库合并到异地计算机的中文输入软件的用户词库。也
可以理解为服务器端根据用户账号将异地所述更新后的用户词库,更新至各 个登录同 一用户账号的客户端,并合并到所述各客户端中文输入软件的用户词 库中。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
权利要求
1、一种基于输入法的词库更新装置,其特征在于,该装置包括配备中文输入软件的本地计算机和异地存储设备;其中,配备中文输入软件的本地计算机,用于通过所述中文输入软件获取用户当前的文字输入,上传并更新到异地存储设备;并且,所述中文输入软件的用户词库通过用户账号与所述用户进行绑定;异地存储设备,用于接收并存储所述文字输入。
2、 根据权利要求i所述的装置,其特征在于,所述异地存储设备包括异 地的服务器/计算机;并且,所述服务器/计算机的用户词库与所述用户账号一一 对应。
3、 根据权利要求1或2所述的装置,其特征在于,所述异地存储设备,进 一步用于根据所述用户账号,将异地所述更新后的用户词库合并到所述本地计 算机中文输入软件的用户词库。
4、 根据权利要求1或2所述的装置,其特征在于,该装置还包括配备中文 输入软件的异地计算机,并且,所述异地计算机中文输入软件的用户词库与所 述用户账号一一对应;所述异地存储设备,进一步用于根据所述用户账号,将异地所述更新后的 用户词库合并到所述异地计算机中文输入软件的用户词库。
5、 一种基于输入法的词库更新方法,其特征在于,该方法包括以下步骤A、 通过用户账号将用户与本地中文输入软件的用户词库绑定;B、 所述中文输入软件获取所述用户当前的文字输入,并根据所述用户账 号将所述文字输入更新到异地的用户词库。
6、 根据权利要求5所述的方法,其特征在于,步骤A具体为Al、通过所述本地中文输入软件预先设置的密钥或算法,将所述用户账号 和用户登录密码加密后发送到验证服务器;所述验证服务器用所述密钥或算法 对加密后的所述用户账号和所述用户登录密码解密,并进行用户账号与用户登 录密码的一致性验证;A2、当一致性验证通过时,验证服务器将包含用户账号的验证成功信息进 行数字签名,并返回本地中文输入软件;之后,执行步骤B;当一致性验证失 败时,结束当前绑定流程。
7、 根据权利要求5所述的方法,其特征在于,步骤B中将所述文字输入 更新到异地的用户词库具体为Bl、基于所述数字签名,将用户当前的文字输入加密后上传并更新到异地 服务器/计算机上的用户词库;并且,所述服务器/计算机的用户词库与所述数字签名中的用户账号一一对应。
8、 根据权利要求7所述的方法,其特征在于,步骤B1后还包括根据所述用户账号,将异地所述更新后的用户词库合并到所述本地中文输 入软件的用户词库。
9、 根据权利要求7所述的方法,其特征在于,步骤B1后还包括 根据所述用户账号,将异地所述更新后的用户词库合并到异地中文输入软件的用户词库。
10、 根据权利要求5至9中任一项所述的方法,其特征在于,所述用户账 号为同一形式或基于账号信息互通的不同形式。
11、 根据权利要求IO所述的方法,其特征在于,所述用户账号包括所述 用户的邮箱地址或者所述用户的登录号码。
全文摘要
本发明公开了一种基于输入法的词库更新装置,该装置包括配备中文输入软件的本地计算机和异地存储设备;其中,配备中文输入软件的本地计算机,用于通过所述中文输入软件获取用户当前的文字输入,上传并更新到异地存储设备;并且,所述中文输入软件的用户词库通过用户账号与所述用户进行绑定;异地存储设备,用于接收并存储所述文字输入。本发明还公开了一种基于输入法的词库更新方法。采用本发明的装置及方法,能实时地同步词库,便于用户快捷地实现文字的录入。
文档编号G06F17/30GK101169789SQ20071017854
公开日2008年4月30日 申请日期2007年11月30日 优先权日2007年11月30日
发明者李伟杰 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1