生成编码频、输入字符编码的方法、装置和输入文字装置的制作方法

文档序号:6464551阅读:174来源:国知局
专利名称:生成编码频、输入字符编码的方法、装置和输入文字装置的制作方法
技术领域
本发明涉及输入法技术领域,特别是涉及生成编码频、输入字符编码的 方法、装置和输入文字装置。
背景技术
现有的拼音排序,是按照26字母顺序进行自然排列。由于小键盘上按键 的数量有限,每个按键都可能代表几个字母。所以在小键盘上按键后会出现 字母组合,例如在手机小键盘上输入"4ghi, 3def",则对应的待选拼音顺序为 'dge, 2he"。也就是说在输入拼音串的时候,系统把所有在此编码串下的对 应可能拼音组合罗列出来,按照字母顺序来进行排列。
由于手机中通常是包含9个数字的键盘,通常的数字键盘包含2~9个数 字键,每个数字键都对应着3~4个字母。所以,在进行拼音输入时, 一般均 会出现较高的重码音节。如在小键盘上输入(4-2-6),相应的会有如下的拼音 供用户进行选择
HAO GAN GAO HAN
当然,在有的输入法下,也可以是其他的顺序或内容。 现有技术中要进行输入,首先需要选择相应的拼音,其次才能在相应的 拼音下选择对应的汉字。如假设用户需要输入"搞"字,他首先点击4-2-6, 然后从"HAO、 GAN、 GAO、 HAN,,中选择"GAO",再从"搞、高、告、稿,, 等中选中"搞"。
为了能够更快地帮助用户输入汉字,现有技术进行了一些改进。主要集 中在如何帮助用户迅速找到对应的汉字上,对字词的排序进行了优化。将常 见字的顺序排在非常见字之前。
也就是说现有技术主要是通过字词的使用频率来进行排序的。在音节或 者文字的编码上没有进行相应的频率调整和排序工作。

发明内容
有鉴于此,本发明一个或多个实施例的目的在于提供生成编码频、输入 字符编码的方法、装置和输入文字装置,以实现通过获取字符编码的使用频 率,进行编码频的调整,帮助用户尽快查找到需要的编码,进而提高输入效率。
为解决上述问题,本发明实施例提供了一种生成编码频的方法,包括
获取字符编码的使用频率;
根据所述字符编码的使用频率,生成编码频。还提供了一种输入文字的 方法,包括
获取字符编码的使用频率;
根据所述字符编码的使用频率,生成编码频;
接收用户输入字符编码后,根据所述编码频,显示待输入字符编码,供 用户选择。
还才是供了一种生成编码频的装置,包括
第一获取单元,用于获取字符编码的使用频率;
第一生成单元,用于根据所述字符编码的使用频率,生成编码频。
还提供了一种输入文字的装置,包括
第三获取单元,用于获取字符编码的使用频率;
第二生成单元,用于根据所述字符编码的使用频率,生成编码频;
第一显示单元,用于接收用户输入后,根据所述编码频,显示待输入字
符编码,供用户选择。
还提供了 一种输入文字的系统,包含本发明所公开的任一项输入文字的装置。
与现有^f支术相比,本发明实施例具有以下优点
利用本发明实施例,通过获取字符编码的使用频率,根据所述字符编码 的使用频率,生成编码频,接收用户输入字符编码后,根据所述编码频,显 示待输入字符编码,供用户选择。从而实现了
首先,可以根据字符编码的使用频率生成对应的编码频;
其次,用户在输入编码时,可以根据编码频显示使用频率高的编码供用 户选择,减少了用户选择编码的次数,提高了输入效率。


图l所示,是本发明的生成编码频的方法的实施例一的流程图2所示,是本发明的输入文字的方法的实施例一的流程图3所示,是本发明的输入文字的方法的实施例二的流程图4所示,是本发明的生成编码频的装置的实施例一的框图5所示,是本发明的生成编码频的装置的实施例二的框图6所示,是本发明的输入文字的装置的实施例一的框图7所示,是本发明的输入文字的装置的实施例二的框图8所示,是本发明的输入文字的系统的实施例一的框图。
具体实施例方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当前的输入法,尤其是手机输入法, 一般只对待选的字词做排序和频率 调整;没有对拼音做排序和频率调整;本发明主要是引入音节排序的概念以 及进行处理的有效的方法。本发明实施例主要应用在键位少、重码率高的输 入硬件上,比如手机小键盘,家用游戏机手柄,或者其他可以输入文字的非 全键盘上。
本发明的基本原理在于,通过有效的音节的统计,将中文对应的所有音 节进行合理的排序,就能够有效的为重码的音节进行有效的排序,从而能减 少用户选择的次数,极大提高输入速度。
同时也可以根据各用户本身的使用习惯,有效的调整音节排序,也能有 效的将常用音节优先排列。
由于在9键手机上,出现拼音重码的几率非常高。用户进行拼音输入时, 往往需要首先选择拼音,其次再选择对应的汉字。由于每个数字键代表几个
字母,使得几个字母的组合会得到几个拼音的组合,这就需要用户选择好几 次才能得到相应的字词。因此,如果能把用户最可能选、最想要的拼音最优 位置显示,将有助于提高输入效率。当然,拼音可以包括全拼、双拼等等各 种方式。
互联网语料库拥有庞大的用户语料,利用搜狗搜索引擎等技术,能准确 的统计到具体汉字的使用频率,通过"汉字-拼音转换",将汉字的使用频率 作为与其对应的拼音的使用频率,从而得到了拼音的使用频率;根据各拼音
的使用频率形成音节频,在出现拼音重码时,将音节频高的拼音优先提供给 用户选择,将有利于用户快速选择并定位到拼音。
本发明的一个重点在于,准确的统计各音节的使用频率。通过借助巨大 的用户语津牛,将有助于进行准确统计。
以一个形象的例子来说明本发明的技术方案的技术效果,例如,通过语 料分析和统计,得到"he"的音节频比"ge"的音节频要高,那么,当用户 输入"4ghi, 3 def"时,就将待选的拼音顺序变成'"he, 2ge,,。从而使得用户 可以直接选中高频率的he,而不是先排除低频率的ge,再选择he,如果重码 的拼音越多,则本发明的输入效率提升就越明显。
通过对字词进行统计,得到频率和排序,然后通过字词到拼音(或其他 编码)的转换得到拼音(或其他编码)的排序,如果有相同编码的情况出现, 比如,拼音码"he"对应的文字和、喝、合、何等所统计出来的频率会采 用统一的累加算法都计算成"he"的频率,其他的编码也是同样处理,这样 所统计出来的编码的排序是综合了所有这个编码下的所有字词的词频而得到 的,具有普遍的统计和实用意义。其他编码通常可以包括五笔、自然码、奔 腾码、双拼等各种编码。对于非汉字输入环境,凡是需要先输入字符编码, 再选择字符编码,最后从字符编码对应的文字中选择需要的方案的输入法, 都完全可以应用本发明的技术方案,获得相同的技术效果。
当然,对于所属领域的技术人员而言,通过应用将上述例子应用于日文、 英文等语言的输入,不仅仅能应用于单字输入,同样也可以应用于词的输入。
参考图l所示,是本发明的生成编码频的方法的实施例一,包括
101、 获取字符编码的使用频率;单字和词组都可以应用本发明的方法。
其中,在获取字符编码的使用频率之前,还可以包括 获取字词的使用频率,将所述字词的使用频率作为与所述字词对应的字 符编码的使用频率。
所述获取字词的使用频率具体为统计定向语料库,获取字词的使用频率。
其中,所述获取字词的使用频率可以具体为
统计定向语料库,获取字词的使用频率。定向语料库可以包括论坛语 料、用户聊天语料或网页语料。
102、 根据所述字符编码的使用频率,生成编码频。 其中,所述获取字符编码的使用频率具体为
根据用户的个性化选择记录,调整与所述字词对应的字符编码的使用频率。
其中,所述获取字符编码的使用频率具体为
根据单个用户的个性化选捧记录,调整所述字符编码的使用频率;或
对若干用户的个性化选择记录进行累加,根据累加结果,调整所述字符 编码的使用频率;或
对网络中所有用户的个性化选择进行累加,根据累加结果,调整所述字 符编码的使用频率。
其中,如果所述字符编码为拼音,则所述编码频为音节频。
为了对相同的拼音的音节频进行合并,所述根据所述拼音的使用频率, 生成音节频具体为
对于相同的拼音,将所述拼音的使用频率累加,根据累加后的所述拼音 的使用频率,生成音节频。
利用本发明实施例,通过获取字符编码的使用频率,根据所述字符编码 的使用频率,生成编码频,以用于接收用户输入字符编码后,根据所述编码 频,显示待输入字符编码,供用户选择。从而实现了
首先,可以根据字符编码的使用频率生成对应的编码频;
其次,用户在输入编码时,可以根据编码频显示使用频率高的编码供用 户选择,减少了用户选择编码的次数,提高了输入效率。
参考图2所示,是本发明的输入文字的方法的实施例一,包括
201、 获取字符编码的使用频率;
其中,在获取字符编码的使用频率之前,还包括
获取字词的使用频率,将所述字词的使用频率作为与所述字词对应的字 符编码的使用频率。
其中,所述获取字词的使用频率具体为 统计定向语料库,获取字词的使用频率。
202、 根据所述字符编码的使用频率,生成编码频;
203、 接收用户输入后,根据所述编码频,显示待输入字符编码,供用户 选择。
其中,所述根据所述编码频,显示待输入字符编码具体为 按照所述编码频中字符编码的使用频率高低,顺序显示待输入字符编码;

按照所述编码频中字符编码的使用频率高低,逆序显示待输入字符编码;

才艮据长词优先的原则,显示待输入字符编码;或
首选长词优先原则,其次是按照所述编码频中字符编码的使用频率高低, 顺序显示待输入字符编码。
在实际运用中,就拼音排序而言,可以有多个规则。例如首先是长词优 先,优先将长词排列,其次按音节频排序,而且是只有首拼音的选择。如输 入"326426",提供的4并音待选为"fang 2dang 3fan 4dan 5dao……,,用户 选择"fang"后,字词待选项会有"方案方放"等所有"fang"的词和字。
其中,在所述显示待输入字符编码,供用户选择之后,还包括
用户在所述待输入字符编码中选择字符编码。
其中,在所述用户在所述待输入字符编码中选择字符编码之后,还包括 根据所述用户的选择记录,调整所述字符编码的使用频率; 才艮据所述调整后的字符编码的使用频率,生成编码频。
其中,所述用户的选4^记录具体为 单个用户的个性化选择记录;或, 若干用户的个性化选择记录累加结果;或, 网络中所有用户的个性化选择累加后的结果。
其中,如果所述字符编码为拼音,则所述编码频为音节频。 其中,所述根据所述拼音的使用频率,生成音节频具体为 对于相同的拼音,将所述拼音的使用频率累加,根据累加后的所述拼音
的使用频率,生成音节频。
利用本发明实施例,通过获取字符编码的使用频率,根据所述字符编码
的使用频率,生成编码频,接收用户输入后,根据所述编码频,显示待输入
字符编码,供用户选择。从而实现了
首先,可以才艮据字符编码的#_用频率生成对应的编码频; 其次,减少了用户选择的次数,提高了输入效率。
参考图3所示,是本发明的输入文字的方法的实施例二,包括 301、中文语料收集利用搜索引擎技术,根据互联网网页内容,生成输 入法互联网词库,能够覆盖所有类别的流行词汇,形成中文语料库; 中文语料的收集通常可以包括以下过程
首先,从互联网中抓取包括网络新闻,论坛,博客,聊天室等网络内容 的中文网页(例如40亿个);
其次,对所抓取的网页设定相应的权重值。例如,对重复网页、垃圾网 页以及黄色网页等赋予较低的权重值,去除权重值较低的网页,从而得到质 量较高的被分析网页集合(例如10亿个)。或者通过权重值降低一些网页对 词频统计的影响;
再次,通过网页页面分析技术以及中文分词技术,对该网页集合中的信 息进行分词处理,对词条进行词频统计,得到满足互联网信息分布的词频库; 用所得到的词频库来更新或者生成使用者的系统词频库。这样使用者的系统 词频库的词频能够与互联网上字词的词频信息保持一致,当使用者输入中文 信息或其他字词信息时,尤其是在互联网上输入时,候选词的排序就能够与 互联网上的字词词频信息保持一致,从而提高首选词的命中率。对于非互联网领域,则可以根据保留的定向语料库,输出相应的优选字词对应的编码。
302. 汉字一一〉音节转换将收集的中文语料进行汉字到音节的转换, 形成音节库;
汉字到音节的转换,是通过标准注音表把语料库中的字词都转成拼音形 式,然后就对4并音进4于统计并合并一部分4并音。
当然,对于非-汫音输入法而言,相应地得到与汉字对应的编码。其他语 种的文字也可以采用类似的方式,获得对应的编码库。
303. 音节排序,形成音节频通过数量庞大的音节库统计,根据各音节 的使用频率的高低,形成准确的音节频;
形成音节频的方式可以包括
1) 、单个用户的个性化选择记录
用户的个性化选择记录可以作为个性化的数据影响到本人的音节频排 序;将用户选择的各拼音的使用频率高低,作为生成音节频的依据。
2) 多用户的个性化选择记录加权
将若干个用户的个性化选择记录通过网络上传到服务器端, 一并分析其 他用户的个性化选择记录,合并形成新的音节频;
3) 将全网统计的音节频合并,作为备用音节频。
同一个音节会有若干个的汉字词与其对应,这个音节的频率是由这些汉 字词的频率经过加权相加而形成的。通常有以下方式来形成音节频
1) 根据统计形成的固定音节频的方式来进行排序,不通过用户输入来调 整音节频。
2) 以统计得到的固定音节频作为基础,利用用户选择次数的多少对原有 固定音节频的排序进行调整,选择次数多的音节就往前排,反之就往后排。
3) 完全根据用户输入后,选择的音节的频率作为排序的依据。
4) 通过为上下文相关的方式调整音节频,例如用户在上屏一个字词后, 下面再输入的音节的排序由已经上屏的词来决定,比如已经上屏了 "学",下 面用户要输入的字是"历"。
如果不具备上下文调整音节频功能,现有的技术方案中会出现"ji"排在 "li,,前面。所以,用户只能先进行横向选择拼音"li,,,然后才能在"li"对
应的汉字中选择汉字。
如果具备上下文调整音节频功能,那么,"学"字后面更大的可能性是输 入"li"而不是"ji"。相应地,"ji"所代表的音节的次序就会排到"li"的后 面。对用户而言,就不需要进行二次选择,直接从缺省选择顺序中就选择到 需要的音节,提高了输入效率。
当然,对于非拼音输入法而言,相应地得到与汉字对应的编码的使用频
率编码频。
304. 用户输入拼音用户进行正常的拼音输入;
当然,对于非拼音输入法而言,用户需要输入汉字对应的编码。
305. 重码音节排序输入法根据用户输入的拼音,检索出相对应的音节, 并根据音节频对重码的音节进行排序;将使用频率高的音节优先显示,将使 用频率低的音节居后显示。例如,如果提供3个备用拼音,则将使用频率高 的音节放在排序的前面,可以供用户缺省选择或优先选择。
对于非拼音输入法而言,此时需要对重码的各个编码进行排序。
306. 用户选择音节用户根据需要选择想要的音节;并相应地选择对应 的字词;
对于非拼音输入法而言,此时用户需要选择对应的编码。
307. 音节频调整输入法将用户选择的音节进行记录,并根据用户的选 择频次和时间先后顺序,调节音节频。通过动态调整,达到音节频排序的最 优化。更好地符合用户的使用习惯,提高了输入效率。
调整音节频的方式可以采用常用的策略,将用户的选择频率累加到系统 的音节频率排序中去,得到新的音节频。
对于非4并音豸#入法而言,此时则可以调整相应的编码频,改变其出现的 优先顺序。
参考图4所示,是本发明的生成编码频的装置的实施例一的框图,包括 第一获取单元401,用于获取字符编码的使用频率; 第一生成单元402,用于根据所述字符编码的使用频率,生成编码频。 利用本发明实施例,通过获取字符编码的使用频率,根据所述字符编码 的使用频率,生成编码频,接收用户输入后,根据所述编码频,显示待输入
字符编码,供用户选4奪。从而实现了
首先,可以根据字符编码的使用频率生成对应的编码频;
其次,用户在输入编码时,可以根据编码频显示使用频率高的编码供用
户选择,减少了用户选择编码的次数,提高了输入效率。
参考图5所示,是本发明的生成编码频的装置的实施例二的框图,还包

第二获取单元501,用于在获取字符编码的使用频率之前,获取字词的使
其中,上述实施例中,所述第二获取单元还用于
统计定向语料库,获取字词的使用频率。
其中,上述实施例中,所述第一获取单元还用于
根据用户的个性化选择记录,调整与所述字词对应的字符编码的使用频率。
其中,上述实施例中,所述第一获取单元还用于
根据单个用户的个性化选择记录,调整所述字符编码的使用频率;或
对若干用户的个性化选择记录进行累加,根据累加的结果,调整所述字 符编码的使用频率;或
对网络中所有用户的个性化选择进行累加,根据累加的结果,调整所述 字符编码的使用频率。
其中,上述实施例中,如果所述字符编码为拼音,则所述编码频为音节频。
其中,所述第一生成单元还用于
对于相同的拼音,将所述拼音的使用频率累加,根据累加后的所述拼音 的使用频率,生成音节频。
参考图6所示,是本发明的输入文字的装置的实施例一的框图,包括 第三获取单元601,用于获取字符编码的使用频率; 第二生成单元602,用于根据所述字符编码的使用频率,生成编码频; 第一显示单元603,用于接收用户输入后,根据所述编码频,显示待输入 字符编码,供用户选择。
利用本发明实施例,通过获取字符编码的使用频率,根据所述字符编码 的使用频率,生成编码频,接收用户输入后,根据所述编码频,显示待输入
字符编码,供用户选择。从而实现了
首先,可以根据字符编码的使用频率生成对应的编码频;
其次,用户在输入编码时,可以根据编码频显示使用频率高的编码供用
户选择,减少了用户选择编码的次数,提高了输入效率。
参考图7所示,是本发明的输入文字的装置的实施例二的框图,还包括 第四获取单元701,用于在获取字符编码的使用频率之前,获取字词的使
其中,上述实施例中,所述第二获取单元还用于
统计定向语料库,获取字词的使用频率。
其中,上述实施例中,所述第一显示单元还用于
按照所述编码频中字符编码的使用频率高低,顺序显示待输入字符编码;


按照所述编码频中字符编码的使用频率高低,逆序显示待输入字符编码;
根据长词优先的原则,显示待输入字符编码;或
首选长词优先原则,其次是按照所述编码频中字符编码的使用频率高低, 顺序显示待输入字符编码。
其中,上述实施例中,还包括
述输入单元可以为键盘或虚拟键盘、触摸屏。 其中,上述实施例中,还包括
之后,根据所述用户的选择记录,调整所述字符编码的使用频率;
第二调整单元,用于在所述用户在所述待输入字符编码中选择字符编码
之后,才艮据所述调整后的字符编码的使用频率,生成编码频。 其中,上述实施例中,所述用户的选择记录具体为 单个用户的个性化选择记录;或,
若干用户的个性化选择记录的累加结果;或,
网络中所有用户的个性化选择的累加结果。
其中,上述实施例中,如果所述字符编码为拼音,则所述编码频为音节频。
参考图8所示,是本发明的输入文字的系统的实施例一的框图,包含本
发明的输入文字的装置实施例中所公开的任一 项装置。
其中,在实际运用中,所述具有文字输入功能的系统具体为 手机或游戏机或ATM交换机或手持智能终端或机顶盒或电视。当然其他
类型的利用小键盘输入文字的终端也都可以实现本发明。
本发明的输入文字的系统的实施例具有与方法实施例具有相应的工作过
程和优点。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本 发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件 方式来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发 明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形 式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以 使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行 本发明各个实施例所述的方法。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何 在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本 发明的保护范围之内。
权利要求
1、一种生成编码频的方法,其特征在于,包括获取字符编码的使用频率;根据所述字符编码的使用频率,生成编码频。
2、 如权利要求l所述的方法,其特征在于,在获取字符编码的使用频率 之前,还包括获取字词的使用频率,将所述字词的使用频率作为与所述字词对应的字 符编码的使用频率。
3、 如权利要求2所述的方法,其特征在于,所述获取字词的使用频率具 体为统计定向语料库,获取字词的使用频率。
4、 如权利要求2所述的方法,其特征在于,所述获取字符编码的使用频 率具体为根据用户的个性化选择记录,调整与所述字词对应的字符编码的使用频率。
5、 如权利要求l所述的方法,其特征在于,所述获取字符编码的使用频 率具体为根据单个用户的个性化选择记录,调整所述字符编码的使用频率;或 对若干用户的个性化选择记录进行累加,根据累加结果,调整所述字符编码的使用频率;或对网络中所有用户的个性化选择进行累加,根据累加结果,调整所述字符编码的使用频率。
6、 如权利要求l所述的方法,其特征在于,如果所述字符编码为拼音, 则所述编码频为音节频。
7、 如权利要求6所述的方法,其特征在于,所述根据所述拼音的使用频 率,生成音节频具体为对于相同的拼音,将所述拼音的使用频率累加,根据累加后的所述拼音 的使用频率,生成音节频。
8、 一种输入文字的方法,其特征在于,包括 获取字符编码的使用频率;根据所述字符编码的使用频率,生成编码频;接收用户输入字符编码后,根据所述编码频,显示待输入字符编码,供 用户选择。
9、 如权利要求8所述的方法,其特征在于,在获取字符编码的使用频率 之前,还包括符编码的使用频率。
10、 如权利要求9所述的方法,其特征在于,所述获取字词的使用频率 具体为统计定向语料库,获取字词的使用频率。
11、 如权利要求8所述的方法,其特征在于,所述纟艮据所述编码频,显 示待输入字符编码具体为按照所述编码频中字符编码的使用频率高低,顺序显示待输入字符编码;或按照所述编码频中字符编码的使用频率高低,逆序显示待输入字符编码;或根据长词优先的原则,显示待输入字符编码;或首选长词优先原则,其次是按照所述编码频中字符编码的使用频率高低, 顺序显示待输入字符编码。
12、 如权利要求8所述的方法,其特征在于,在所述显示待输入字符编 码,供用户选4奪之后,还包括用户在所述待输入字符编码中选择字符编码。
13、 如权利要求12所述的方法,其特征在于,在所述用户在所述待输入 字符编码中选择字符编码之后,还包括才艮据所述用户的选择记录,调整所述字符编码的使用频率; 根据所述调整后的字符编码的使用频率,生成编码频。
14、 如权利要求13所述的方法,其特征在于,所述用户的选择记录具体为单个用户的个性化选择记录;或,若干用户的个性化选择记录累加结果;或, 网络中所有用户的个性化选择累加后的结果。
15、如权利要求8所述的方法,其特征在于,如果所述字符编码为拼音:则所述编码频为音节频。
16、如权利要求15所述的方法,其特征在于,所述根据所述拼音的使用 频率,生成音节频具体为对于相同的拼音,将所述拼音的使用频率累加,根据累加后的所述拼音 的使用频率,生成音节频。
17、 一种生成编码频的装置,其特征在于,包括 第一获取单元,用于获取字符编码的使用频率; 第一生成单元,用于根据所述字符编码的使用频率,生成编码频。
18、 如权利要求17所述的装置,其特征在于,还包括 第二获取单元,用于在获取字符编码的使用频率之前,获取字词的使用
19、 如权利要求18所述的装置,其特征在于,所述第二获取单元还用于 统计定向语料库,获取字词的使用频率。
20、 如权利要求18所述的装置,其特征在于,所述第一获取单元还用于 根据用户的个性化选择记录,调整与所述字词对应的字符编码的使用频率。
21、 如权利要求17所述的装置,其特征在于,所述第一获取单元还用于 根据单个用户的个性化选择记录,调整所述字符编码的使用频率;或对若干用户的个性化选择记录进行累加,根据累加结果,调整所述字符 编码的^^用频率;或对网络中所有用户的个性化选择进行累加,根据累加结果,调整所述字 符编码的使用频率。
22、 如权利要求17所述的装置,其特征在于,如果所述字符编码为拼音, 则所述编码频为音节频。
23、 如权利要求22所述的装置,其特征在于,所述第一生成单元还用于 对于相同的拼音,将所述拼音的使用频率累加,根据累加后的所述拼音
24、 一种输入文字的装置,其特征在于,包括 第三获取单元,用于获取字符编码的使用频率; 第二生成单元,用于根据所述字符编码的使用频率,生成编码频; 第一显示单元,用于接收用户输入后,根据所述编码频,显示待输入字符编码,供用户选择。
25、 如权利要求24所述的装置,其特征在于,还包括 第四获取单元,用于在获取字符编码的使用频率之前,获取字词的使用频率,将所述字词的使用频率作为与所述字词对应的字符编码的使用频率。
26、 如权利要求25所述的装置,其特征在于,所述第四获取单元还用于 统计定向语料库,获取字词的使用频率。
27、 如权利要求24所述的装置,其特征在于,所述第一显示单元还用于 按照所述编码频中字符编码的使用频率高低,顺序显示待输入字符编码;或按照所述编码频中字符编码的使用频率高低,逆序显示待输入字符编码;或根据长词优先的原则,显示待输入字符编码;或首选长词优先原则,其次是按照所述编码频中字符编码的使用频率高低, 顺序显示待输入字符编码。
28、 如权利要求24所述的装置,其特征在于,还包括输入单元,用于接收用户在所述待输入字符编码中选择的字符编码。
29、 如权利要求24所述的装置,其特征在于,还包括 第一调整单元,用于在所述用户在所述待输入字符编码中选择字符编码之后,根据所述用户的选择记录,调整所述字符编码的使用频率;第二调整单元之后,用于在所述用户在所述待输入字符编码中选择字符编码之后,根据所述调整后的字符编码的使用频率,生成编码频。
30、 如权利要求29所述的装置,其特征在于,所述用户的选择记录具体为单个用户的个性化选择记录;或,若干用户的个性化选择记录的累加结果;或, 网络中所有用户的个性化选择的累加结果。
31、 如权利要求24所述的装置,其特征在于,如果所述字符编码为拼音, 则所述编码频为音节频。
32、 一种输入文字的系统,其特征在于,包含如权利要求24 —31任一项 所述的装置。
33、 如权利要求32所述的系统,其特征在于,所述具有文字输入功能的 系统具体为手机或游戏机或ATM交换机或手持智能终端或机顶盒或电视或电视遥控器。
全文摘要
本发明实施例公开了一种生成编码频的方法,包括获取字符编码的使用频率;根据所述字符编码的使用频率,生成编码频。还提供了一种输入文字的方法,包括获取字符编码的使用频率;根据所述字符编码的使用频率,生成编码频;接收用户输入字符编码后,根据所述编码频,显示待输入字符编码,供用户选择。还提供了一种生成编码频的装置、输入文字的装置、系统,利用本发明的技术方案,能够显著地提升用户体验和输入效率。
文档编号G06F3/023GK101344888SQ20081011656
公开日2009年1月14日 申请日期2008年7月11日 优先权日2008年7月11日
发明者洋 姜, 李培强, 郁晶源, 顾宏伟 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1