一种基于环境信息进行文字关联输入的方法和装置的制作方法

文档序号：6468697阅读：226来源：国知局

专利名称：一种基于环境信息进行文字关联输入的方法和装置的制作方法
技术领域：
本发明涉及根据环境信息进行关联输入的方法和装置。具体而言，本发明涉及将
环境信息用于引导文字输入过程，提高文字输入处理速度的方法和装置。本发明不仅可以应用于象汉字这种象形文字的输入，还可以应用于英文这种拼音文字的输入。
背景技术：
尽管拼音文字的输入不需要进行转换，象形文字的输入过程通常是用户用键盘按
照输入法的编码方式输入代码，输入法模块将用户输入的代码转换成文字代码，例如区位
码。文字的输入也可能是通过语音识别来进行，用户将语音信息输入计算机，语音识别软件
据此判断用户实际想输入的文字，获得文字代码。除了利用键盘之类输入拼音文字以外，通
常这种代码会对应有很多字、词，这些字、词构成输入过程中的重码。由于重码的存在，输入
过程常常需要用户进行进一步选择，从重码中找出用户真正需要输入的字、词。在用户输入完拼音文字，或者用户输入完象形文字的代码并从重码中选择出重码
之一时，当前文字的输入过程完成。为了提高输入速度，常常利用当前文字来查询联想词
库，根据当前文字来联想用户即将输入的词。这些联想词也可能有多个，也是一种重码。将
这些联想词重码显示出来，然后用户从中选择联想词之一。在文字的输入过程中，以及在文字的联想过程中，都会获得多个文字重码。用合适的顺序显示这些文字重码能够提高输入速度。这个顺序可以根据文字出现频度的语言学统计结果来确定，也可以根据用户的历史输入情况来情况，或者这两者综合起来，从而将"最有可能"接近用户意图的文字重码显示在最前面。当前输入法存在如下缺陷只有统计数据和历史数据，无法确定用户的当前需求。例如，用户使用网络搜索引擎查询"草原旅游"，在结果中有"锡林格勒"字样。用户对"锡林格勒"感兴趣，想进一步了解关于"锡林格勒"的情况，选择以"锡林格勒"为关键词进一步进行检索，于是在关键词栏中输入这几个文字时。如果用户是首次输入这个词，按照现有的输入法推荐方法，不大可能一次成功，因为这个词出现频度很低，词库里没有，并且用户也从来没有输入过这个词，因而用户必须逐字输入。又例如，如果用户对"草原旅游"查询结果中的"石屋"好奇，想进一步查询关于"石屋"的信息，于是要在关键词栏中输入"石屋"。但是，尽管词库里已经有了"石屋"这个词，但是因为这个词很少出现，而相同发音的词特别多，"石屋"排在最后面，用户必须一页一页地翻看，最后才找到"石屋"。
又例如，如果用户收到的一封电子邮件，提到FBES项目的项目负责人的名字比如 Gallodesh。接下来，用户要制作一份项目计划书，需要输入这个项目名称和负责人。由于 FBES和Gallodesh都是非字典既有词汇，所以，用户可能不得不来回切换窗口，小心抄写，或者选中拷贝，再粘贴到项目计划书中，这一操作还需要应用软件支持。
又例如，用户收到好友的短信，提到周六一起去东直门凤凰餐厅聚餐。用户想查询一下东直门凤凰餐厅的位置。在手机地图应用中，用户必须逐字输入"东直门凤凰餐厅"几个字。即使因为"东直门"、"凤凰"、"餐厅"几个词相对常用而排在前面，也需要完整或部分地输入这三个词的编码并选择三次，具体情况取决于所用输入法。又比如正在手机上浏览获得的信息时，想在台式电脑上做进一步的查询。这时，只要用户拥有一个统一的帐号，登录后就可以在多台电子设备间共享这个手机浏览获得的环境信息。此外，这些环境信息不仅能用作输入法提示，还可以用于记录用户当前的动态、兴趣点，用于瞬时搜索辅助，或者广告推送，比如酒店、旅游、出行信息推送。
同样，如果用户旅游到达"爨底下"，站在"爨底下"路牌下面，准备用手持台输入 "爨底下"这几个字。这种手持台可以是手机，用户正在输入短信；也可以是手持GPS接收机，用户正在记录航迹点。一般情况下词库里没有"爨底下"这个词，用户需要逐字输入。
在以上情况下，如果将用户要输入的字、词正在屏幕上，或者就在用户眼前的路牌上这种情况考虑在内，在文字输入的过程中将它们挑选出来并排在前面，那么这些文字的输入速度就会非常迅速。

发明内容
为了解决现有技术中存在的上述问题，本发明提供一种环境关联文字输入方法，其中在用户输入文字信息后，确定用户输入的文字信息所对应的多个文字重码，并按照重码的出现频度对文字重码进行排序，按排序结果将文字重码显示出来供用户选择，该方法的特征在于还包括以下步骤获取环境信息；在对文字重码进行排序的过程中，将与环境信息相关联的文字重码排在前面。在一个实施例中，获取环境信息还包括获取屏幕文字作为环境文字；或者获取环境图像，然后对获取的环境图像进行文字识别获得环境文字，其中，将与环境信息相关联的文字重码排在前面包括将环境文字中出现过的文字重码排在前面。在另一个实施例中，获取环境信息包括获取环境图像，然后对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，将与环境信息相关联的文字重码排在前面包括将与环境关键词相关联的文字重码排在前面。
在另一个实施例中，用户输入文字信息包括通过键盘输入文字输入法编码；或者通过麦克风输入语音信号，其中确定多个文字重码包括对语音信号进行语音识别。
在另一个实施例中，环境信息包括环境中曾经出现过的信息。本发明还提供一种环境关联文字输入设备，包括用户输入装置，用于由用户输入文字信息，其中在用户输入文字信息后，确定用户输入的文字信息所对应的多个文字重码，并按照重码的出现频度对文字重码进行排序，按排序结果将文字重码显示出来供用户选择；获取装置，用于获取环境信息；以及关联处理器，用于在对文字重码进行排序的过程中，将与环境信息相关联的文字重码排在前面。
在一个实施例中，获取装置包括屏幕文字获取装置，用于获取屏幕文字作为环境
文字；或者环境图像获取和文字识别装置，用于获取环境图像，并对获取的环境图像进行文
字识别来获得环境文字，其中，关联处理器将环境文字中出现过的文字重码排在前面。在另一个实施例中，获取装置包括环境图像获取和模式识别装置，用于获取环境
图像，并对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，
关联处理器将与环境关键词相关联的文字重码排在前面。
在另一个实施例中，用户输入装置包括键盘；或者麦克风，其中确定多个文字重码包括对语音信号进行语音识别。在另一个实施例中，环境信息包括环境中曾经出现过的信息。本发明还提供一种环境联想文字输入方法，在用户输入文字信息并选择了重码文字之一以后，查询联想词库，将该重码文字的联想词重码显示出来供用户选择，其特征在于获取环境信息；将环境信息添加到联想词库中，构成扩展联想词库，与扩展前联想词库中的联想文字相比，给环境文字赋予较高优先级。在一个实施例中，获取环境信息还包括获取屏幕文字作为环境文字；或者获取环境图像，然后对获取的环境图像进行文字识别获得环境文字，其中，将环境信息添加到联想词库中包括将环境文字添加到联想词库中，并赋予它们较高优先级。在另一个实施例中，获取环境信息包括获取环境图像，然后对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，将环境信息添加到联想词库中包括将与环境关键词相关联的联想词赋予较高优先级。在另一个实施例中，用户输入文字信息包括通过键盘输入文字输入法编码；或者通过麦克风输入语音信号，其中的重码文字包括对语音信号进行语音识别的识别结果。
在另一个实施例中，环境信息包括环境中曾经出现过的信息。本发明还提供一种环境联想文字输入设备，包括选择装置，用于在用户选择了文字重码之一，显示出该文字重码之一对应的联想词重码以后，供用户选择联想词重码之一；获取装置，用于获取环境信息；以及关联处理器，用于将环境信息与联想词相关联。在一个实施例中，获取装置包括屏幕文字获取装置，用于获取屏幕文字作为环境文字；或者环境图像获取和文字识别装置，用于获取环境图像，并对获取的环境图像进行文字识别来获得环境文字，其中，将环境信息与联想词相关联包括将环境文字添加到联想词库中，并赋予环境文字较高优先级。在另一个实施例中，获取装置包括环境图像获取和模式识别装置，用于获取环境图像，并对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，将环境信息与联想词相关联包括将与环境关键词相关联的联想词赋予较高优先级。
在另一个实施例中，环境信息包括环境中曾经出现过的信息。

通过阅读下面的详细说明、权利要求和附图，将会更加全面地理解本发明的这些特征和优点，以及其它特征和优点。在这些附图中图1说明本发明一个实施例中环境关联文字输入系统的示例性组成和信号流程；
图2说明本发明一个实施例中环境关联文字输入系统里环境信息输入装置和识别装置的示例性组成和信号流程；图3说明本发明一个实施例中环境关联文字输入系统里环境信息输入装置和识别装置的另一种示例性组成和信号流程；图4说明本发明一个实施例中环境关联文字输入系统里用户信息输入装置和识别装置的一种示例性组成和信号流程；图5说明本发明一个实施例中环境关联文字输入系统里文字重码和环境信息进
6行关联处理的关联处理器的一个示例性组成和信号流程；图6说明本发明一个实施例中环境关联文字输入系统里示例性的系统词库、用户词库和上下文词库；图7说明本发明一个实施例中环境关联文字输入系统里文字输入过程的一个示例性流程；图8说明本发明一个实施例中环境关联文字输入系统里上下文词库的一个示例性更新过程；图9说明本发明的另一个具体实施例；以及
图10说明本发明的另一个具体实施例。为了清楚起见，一些附图可能被简化。因此，这些附图可能没有描述给定装置(例如设备)或方法的所有组件。还有，在整个说明书和附图中相似的标号可能被用于表示相似的特征。
具体实施例方式
以下描述和附图充分说明本发明的具体实施例，以便本领域技术人员能够实践它们。其它实施例可以结合结构、逻辑、电气、工艺和其它变化。实例仅仅用于给出可能变化的典型。各个组件和功能是可选的，除非明确需要；操作顺序也可以改变。一些实施例的部分特征可以包括在其它实施例中或者替换其它实施例中的特征。权利要求中给出的本发明的实施例囊括这些权利要求的所有可能等同替换。本发明的实施例在这里可以被单独或一起称为"发明"仅仅是为了方便，而不是要将这一申请的范围限制于任何单个发明或发明思想，如果事实上公开了一个以上的。在本发明的环境信息关联输入方法中，要充分利用环境信息来加快文字的人工输入速度。这种环境信息可以是计算机屏幕上当前或曾经显示的文字、图像。曾经显示的环境信息可能是曾经显示的窗口，例如可能已经最小化，或者可能已经关闭的窗口。例如用户正在利用搜索引擎进行搜索，屏幕上显示了搜索结果，此时用户想输入信息，比如进行进一步搜索，或者用户想将搜索情况记录到Word文档(或者其它文档，例如Excel、PowerPoint、 Email、 SMS、 Outlook联系人)中去，或者在Word文档中引用搜索结果。在这种情况下，搜索引擎产生的搜索结果就是这种人工输入过程中的环境信息。也有可能是这种情况，用户正在拍摄照片，然后给照片输入文字说明。此时，照片就是的环境信息，用户输入的文字很有可能与照片内容相关，甚至有可能用户想输入的文字就出现在照片中。对于环境信息中的文字，可以在文字的输入过程中利用屏幕文字捕获软件进行捕获，然后利用常用手段，提取其中出现的词，获得环境文字。获得环境文字以后，在进一步的文字输入过程中，可以将这些环境文字用于引导用户输入的文字重码的排序过程，将环境文字中出现过的文字重码排在前面供用户选择。也可以将这些环境文字和常规联想词库一起构成扩展联想库，作为联想输入处理的基础。与常规联想词相比，可以给这些环境文字更高的联想优先级，将环境文字中出现的联想词排在前面供用户选择。在说明书的说明中，关联这个词在很多地方也包括联想，不一定再明确，例如发明名称中就是这样。对屏幕文字的捕获处理，可以是在这种环境信息一出现就由系统内驻留的程序在
7后台完成，包括文本形式的环境文字的提取，将环境文字与常规联想词库的合并，等等。在后台处理可以使用户察觉不到，使用户不必为此分心。当然，也可以在以后的文字输入过程中进行处理。很多情况下，屏幕上显示的并不是文本文字，而是图形文字。例如，送入显示缓存
的是位图而不是文字编码信息。此时，简单的屏幕文字捕获常常无法捕获这种以图形方式
显示的图形文字。一般情况下，这种图形文字常常是网页上更加关键的文字，例如网站的名
称，风景名胜介绍中风景名胜的名称等等。在这种情况下，获得这些信息有时更为重要。为
了捕获这些图形文字，需要对这些图形进行文字识别，将图形转换成编码的文字。关于文字
识别的方法有很多，所述领域的技术人员已经非常熟悉，这里不再赘述。经过了文字识别，
得到编码文字以后，剩下的处理就和屏幕上文本文字被捕获以后的处理相同。对屏幕文字的捕获处理，可以由用户通过输入法设置中的开关来进行控制，由用
户选择是否将屏幕文字作为关联输入的基础，并且由用户选择屏幕文字在关联处理过程中
的优先级。屏幕环境信息可以是常用计算机屏幕上的屏幕信息，例如PC机上Windows操作系统下的屏幕信息，也可以是其它装置上的屏幕信息，例如个人数字助理、便携式微型网络终端上的屏幕信息。除了屏幕环境信息以外，这种环境信息还可以是通过视频捕获设备捕获的视频图像。例如，可以是摄像头捕获的图像或者扫描仪捕获的图像，此外，环境信息还可以是照相机拍摄的照片。摄像头可以是计算机上安装的摄像头，也可以是手机上的摄像头，或者GPS 接收机上安装的摄像头。扫描仪常常与计算机连接，可以是台式扫描仪，也可以是手持式扫描仪，或者是笔式扫描仪。利用扫描仪将用户关心的图像扫描下来，也可以用摄像头将用户关心的图像或环境拍摄下来。当然，完全可以将摄像头当作扫描仪来使用，这两者在本质上都是捕获可视图像，因此，用任何图像捕获设备捕获到的图像都可以成为这里用户所关心的环境图像信息。同样，GPS测到的地理位置，以及由此带来的当前地点地理相关的信息也可以是环境信息。与屏幕上的图形环境信息一样，用图像捕获装置捕获到的图像中同样可能包括文字信息。这样的图像与屏幕图像本质相同，但是因为捕获下来的时候就仅仅是图像，因此必须经过文字识别过程，才能将其中的文字提取出来。同样，常规文字识别方法对于所属技术领域的技术人员而言都是公知技术，因而在此不再赘述。经过了文字识别，就能够得到编码文字，这些文字就是充分反映环境情况的环境文字。获得了这些环境文字以后，剩下的处理就和屏幕上文本文字被捕获以后的处理相同。可以用它们来弓I导文字重码的排序，将环境文字中出现的文字重码排在前面。也可以将它们与输入法的联想词库进行合并，合并处理过程中可以给环境文字设置较高的联想优先级，从而当用户输入这些文字的时候，这些文字会显示在重码清单的前头，方便用户选择。同样，可以设置在文字输入过程中是否将环境文字纳入关联和联想范围，并且在关联和联想过程中可以给环境文字设置不同的优先级。
除了从环境视频等等中捕获环境文字以外，包括利用文字识别手段对环境图像进行处理来获得环境文字，还可能存在另一种情况。这种情况也就是所捕获的图像中根本没有任何文字。例如，手机拍摄下来的仅仅是青山，或者是蔚蓝的大海。在这种情况下，不可能从中捕获到任何文字。但是这个时候，不论用户是在进行屏幕输入，使用手机输入短信，还是在使用GPS接收机输入航迹点，或者是在给照相机拍摄的照片输入文字说明，用户想输入的文字很有可能是与当前环境密切相关的。例如，用户想告诉朋友正在山上、海边，或者用户想记录下来山上或海边的航迹点，或者用户想说明拍摄的照片是山景或者海景。
在这种情况下，可以在输入法模块中增加图像的模式识别功能，让捕获的图像信息经过模式识别处理，识别出当前的图像涉及的是什么对象，是山地、大海，还是城市。经过了这些模式识别处理以后，能够得到对象的属性信息，这些属性信息就可以作为环境关键词。有了这些环境关键词，就可以在关联和联想处理过程中，将与这些关键词有关的字、词纳入优先考虑的范围，从而提高输入速度。通过这种方式，即便环境信息中没有文字，也一样能够帮助用户输入信息。利用以上方法，用户就可以在输入过程中提高输入速度，因为与所关心的主题有关的文字总是优先出现在重码清单和联想词清单中。除此之外，用户还可以在输入文字之前现将相关材料输入计算机，让计算机进行预先学习，了解与用户要输入文字有关的主题。这样一来，计算机就能够了解用户想输入什么内容，从而将相关文字优先显示在重码清单和联想词清单中。当然，捕获了环境文字或环境关键词以后，完全可以在用户还没有输入输入法编码的时候就将环境文字或环境关键词显示出来，供用户选择。换句话说，例如用户用搜索引擎完成检索以后，点击搜索栏准备进一步搜索的时候，输入法模块就立即将"锡林格勒"等显示出来，用户可以直接进行选择，而不必等待输入了例如"xilingele"以后。如果用户正在用手机输入短信，或者正在用GPS接收机输入航迹点的名称，在用手机或GPS接收机拍摄下"爨底下"几个字，并经过文字识别以后，在短信输入屏幕上就立即显示出"爨底下"几个字，用户可以直接选择"爨底下"几个字，而不必等待用户输入例如"cuandixia"。有些情况下，用户可能无法输入这些输入法代码，因为用户可能根本不认识这几个字，因而无法确定其拼音代码。或者用户根本就不知道如何拆分这几个字的笔划，因而无法使用笔划输入法进行输入。有了这种环境关联输入手段，这些问题迎刃而解。显然，利用环境信息来实现关联和联想输入的上述方法包括如下步骤获取环境信息。这一获取过程包括捕获计算机屏幕或其它显示装置的屏幕，或者是拍摄图像或扫描文件，然后进行文字识别来获取环境或环境图像中的文字，或者进行图像的模式识别处理，获取环境关键词。利用环境信息来实现关联和联想输入的上述方法还包括如下步骤将环境信息和文字重码一起进行关联处理。这些操作包括将环境信息中出现过的环境文字重码排在前面，方便用户选择。还包括将环境文字与联想词库进行合并，给予环境文字更高的联想优先级，从而在用户选择了输入文字，然后根据输入文字查询联想词库，获得联想词以后，对联想词重码进行排序的过程中，将环境中出现的环境文字排在重码清单的前头。
也可以利用环境关键词来挑选用户输入以后获得的输入文字重码中与环境关键词相匹配的文字重码，将它们排列在前面显示出来供用户选择。还可以在联想过程中，利用环境关键词来挑选联想词中与环境关键词匹配的联想词重码，将它们排在联想词清单的前面，方便用户选择。其中对重码排序时，除了利用环境信息以外，还利用文字的语言学统计结果和历史信息。在语言学统计结果中保存了统计过的字、词和对应的得分，得分表示字、词出现的频度。历史信息是用户输入文字的输入历史信息。历史信息记录了用户最近输入过哪些词，每个词输入过多少次，从而据此给出字、词在输入历史中的出现频度。利用环境信息来实现关联和联想输入的上述方法最后将关联处理结果显示出来供用户选择，或者提供给系统做后续处理。作为关联处理结果的文字重码的显示可以是在用户输入了文字的输入法代码以
后，例如输入了文字的拼音以后，也可以是在输入之前就显示出来，用户不必输入代码就能
够看到关联结果，从而进行选择，进一步提高输入速度。例如，用户拍摄了"爨底下"的路标
照片，用户一打开文字输入框，就把这几个字显示出来，用户可以直接选择。
当然，文字的输入过程不仅包括键盘输入，还可以是语音输入。语音输入同样有类
似重码的模糊问题，环境信息同样可以帮助选出最相关的重码或进一步解决语音输入的模
糊问题。以上方法可以在软件中实现，编写成程序，或者子程序。可以独立于已有的输入法，比如拼音输入法、笔划输入法、语音输入法、手写输入法，也可以结合在这些输入法以内。这样获得的软件可以驻留在系统内，比如说主流在计算机工作内存中；也可以记录在记录介质上，例如记录在光盘上、闪存上；还可以通过有线或无线网络来进行传输，例如通过因特网进行下载。以上软件还可以作为固件，例如照相机、手机、GPS接收机里的固件。以上方法可以在一个模块内实现，也可以分开在不同的模块中实现。例如，将环境信息上传到中心服务器，由服务器来完成环境信息处理，获得环境关键词。如图1所示，为了实现本发明的环境信息关联和联想方法，本发明提供一种系统 100，这个系统100除了包括储存信息112和用来读取储存信息的读取装置114以外，还包括用来对环境信息122进行处理的输入装置124和进行识别的识别装置126。此外，还包括用来对用户信息132进行处理的输入装置134和进行识别的识别装置136。储存信息112 包括文字的语言统计学结果和文字的输入历史记录，用于常规的文字输入过程。用户信息 132和环境信息122经过处理以后在关联处理器102中进行关联处理，然后提供重码选项 104供用户进行选择。在一个具体实施例中，如图2所示，输入装置124可以包括摄像头212、扫描仪 214、屏幕画面图像捕获装置216和屏幕画面文字捕获装置218中的任何一个或多个。摄像头212可以安装在计算机、手机、GPS接收机、个人数字助理上，也可以是照相机、摄像机自身的摄像头。扫描仪214可以是与计算机连接的台式扫描仪，也可以是手持式扫描仪、笔式扫描仪等等。屏幕画面图像捕获装置216可以是驻留在计算机或手机、照相机、GPS接收机、个人数字助理上的一个程序模块，当然也可以是利用上面提到的摄像头212来充当屏幕画面图像捕获装置216。屏幕画面文字捕获装置218也可以是驻留在计算机或手机、照相机、 GPS接收机、个人数字助理上的一个程序模块，当然也可以利用上面提到的摄像头212来充当屏幕画面文字捕获装置218，不过此时还需要加上文字识别模块。经过输入装置124捕获到的文字可以直接作为识别装置126中的环境文字204，也可以经过更多的处理，例如剔除其中明显无关的信息，然后才作为识别装置126中的环境文字204。经过输入装置124捕获到的环境图像，例如屏幕上显示的画面，拍摄到的照片，扫描得到的文件图像，可以经过文字识别处理，找出其中的文字。然后剔除掉明显不相关的文字以后，作为识别装置126中的环境文字204。针对环境中没有文字信息这种特定情况，环境信息的输入装置和识别装置也可以采用另一种配置。如图3所示，这时的输入装置124'包括摄像头312、扫描仪314和屏幕画面图像捕获装置316中的一个或多个。摄像头312可以安装在计算机、手机、GPS接收机、个人数字助理上，也可以是照相机、摄像机自身的摄像头。扫描仪214可以是与计算机连接的台式扫描仪，也可以是手持式扫描仪、笔式扫描仪等等。屏幕画面图像捕获装置316可以是驻留在计算机或手机、照相机、GPS接收机、个人数字助理上的一个程序模块，当然也可以是利用上面提到的摄像头312来充当屏幕画面图像捕获装置316。针对环境中没有文字信息这种特定情况，环境信息的识别装置可以包括图像识别装置302，并通过处理生成环境关键词304。经过输入装置124'捕获到的图像可以直接作为识别装置302的输入，由识别装置302进行图像模式识别，识别出图像的类型，从而确定用户所希望的文字输入环境。在这种情况下，可以在输入法模块中增加图像的模式识别功能，也可以在输入法模块以外增加图像的模式识别功能，让捕获的图像信息经过模式识别处理，识别出当前的图像涉及的是什么对象，是山地、大海，还是城市。经过了这些模式识别处理以后，能够得到对象的属性信息，这些属性信息就可以作为环境关键词。有了这些环境关键词，就可以在关联和联想处理过程中，将与这些关键词有关的字、词纳入优先考虑的范围，从而大大提高输入速度。通过这种方式，即便环境信息中没有文字，也一样能够帮助用户输入信息。经过模式识别获得的环境关键词还可以经过更多的处理，例如剔除其中明显无关的信息，然后才作为识别装置126'中的环境关键词304。在本发明中，人工输入信息可以是多种多样的。作为例子，这种人工输入信息的方式可以包括通过键盘412、手写板414和语音输入装置416的输入方式中的任何一种或多种方式，如图4所示。键盘412可以是计算机键盘，也可以是计算机上的软键盘、小键盘，还可以是手机或GPS接收机上的小键盘，或者是屏幕上的软键盘。手写板414可以是真正的手写板硬件，也可以是在屏幕上实现的手写板，当然也包括计算机、个人数字助理等等中的触摸屏。经过上述输入装置输入的信息可以是拼音输入法的编码，笔划输入法的编码，等等。输入的信息要经过输入法模块进行处理，获得与输入的信息对应的重码清单。图4中的语音输入装置416可以是麦克风、头戴式耳机、耳麦等等。如果采用语音输入装置416，当然应该有相应的语音识别装置404。这种语音识别装置404可以是驻留在计算机、个人数字助理、照相机、手机、GPS接收机等等内的语音识别软件模块，当然这种软件模块也可以驻留在服务器上，通过有线网络或无线网络来传递语音波形信号和识别结果。
图1所示的关联处理器102用于将用户信息132 (文字重码)和环境信息122 (环境文字、环境信息)在处理以后进行关联处理，然后提供重码选项供用户进行选择104。例如，如图5所示，关联处理器102可以包括加权处理器502和排序处理器504。其中加权处理器502用于给用户信息132和环境信息122进行加权处理，控制用户信息132和环境信息122在最后结果中出现的优先级。比如说，用户确认现在输入的信息是与当前环境密切相关的，此时，可以选择环境信息122的优先级最高，在加权处理器502中给环境信息122 最大的权。如果用户确认现在输入的信息与当前环境无关，就可以选择环境信息122的优先级最低，甚至将它设成零。一般情况下，可以给用户信息132和环境信息122确定一个预定的默认权值。在用户输入了文字代码，并选择了文字重码之一时，联想处理器106可以根据这个文字重码来查询联想词库108，找出联想词并显示出来，供用户选择。在这里使用"联想词库108"的目的是为了说明联想功能，在一些其它实施例中，可以没有单独的"联想词库"，而只有系统词库和用户词库，却涵盖了这样的联想功能或者说涵盖了 "联想词库"。此时，联想功能的实现体现在词库如何根据用户的'查询请求'来处理并输出，以及有重码时，以何种顺序输出查询结果。还应当说明，在一些实施例中，比如现在的有些输入法，系统词库可以包括不同类型的子词库。比如娱乐词库、人名词库、特定行业词库、地理信息词库等等。联想处理器106根据用户选择的文字重码，从联想词库108查询联想词供用户选择。可以在查询联想词时，将环境文字与联想词库108 —起构成扩展的联想词库用于查询联想词。与从扩展前的联想词库108中的词相比，可以给从环境文字得到的联想词赋予更高的优先级，然后进行排队，使得与环境文字对应的联想结果排在前面。如果经过模式识别得到了环境关键词，就可以用环境关键词来对联想结果的排序进行调整，将与环境关键词对应的联想词排在前面供用户选择。例如，如果用户正在山上，经过模式识别得到"山上"这样的环境关键词。此时，将联想词中与"山"有关的文字排列在前面供用户选择。这样就能够提高输入速度。联想处理可以重复进行。也就是说，用户选择了联想词以后，还可以继续根据这个联想词进一步联想，获得进一步的联想词供用户选择。在这进一步的联想过程中继续利用环境信息调整进一步的联想词的显示顺序。需要特别注意，这里给出关联处理器的结构102仅仅是作为一个实例，用来说明本发明中输入文字时进行环境关联的一种实现原理，而不是说一定要按照这种方式来实现。具体如何实现，需要结合文字输入法的具体情况来进行选择，还要结合操作系统等软件平台以及软件所处的硬件平台来加以确定。同样，图l所示的结构和方法也仅仅是用于说明本发明的原理，而不是说本发明一定要按照这种具体方式来实现。要知道，本发明的实质在于利用环境信息来优化文字输入的输入过程，加快输入速度。在前面的描述中，环境信息的关联和联想是自动进行的，或者是用户输入了环境图像以后自动进行的。环境信息的关联和联想以及环境文字和环境关键词的生成也可以不采用这种方式，而是采用另一种方式。对于这种情况，下面参考图6 8说明本发明更加具体的实施例。如图6所示，本发明的环境信息联想文字系统中包括系统词库602、用户词库604 和上下文词库606。上下文词库606相当于前面所说的环境词库。其中的系统词库602是经过语言学统计获得的词的一个数据库，其中除了词本身以外，还包括每个词的分数，这些分数反映了词的出现频度，也就是用这样一个频度来力图接近用户真实需要的概率。这个频度用于排序，然后将排序结果按先后显示出来，供用户选择。用户词库储存用户的自造词，自造词也可以是用户使用过程中系统根据用户的输入情况自动生成的。根据用户使用的次数不同，自造词具有不同的分数。一般而言，自造词的分数高于系统词库中词的分数，当然也可以不这样。上下文词库606中储存了与上下文相关的信息。例如，前面提到的环境文字204、环境关键词304，它们反映的是输入文字的用户当前所处的环境，或者用户希望文字输入系统优选的环境。当用户通过键盘、麦克风输入文字时，文字输入系统可以发出查询请求612，查询系统词库602，得到查询结果622。系统词库返回的结果中除了字、词以外，还有对应的分数。图7是环境信息联想文字输入过程一个具体实施例的一个流程图。利用图7来说明用户利用环境信息联想文字输入法输入文字的一个具体过程。在步骤702中接受用户输入。接受用户输入的可以是键盘、小键盘、手写板、触摸屏、麦克风。采用麦克风进行语音输入的时候，还要对语音信号进行语音识别。在接受了用户输入以后，形成词库查询请求，步骤704。然后在步骤706中，向系统词库602发送查询请求，返回的每个字都有对应的分数 SysScore。在步骤708中，向用户词库604发送查询请求，返回的每个字都有对应的分数 UserScore。在步骤710中，向上下文词库606发送查询请求，返回的每个字都有对应的分数ContextScore。在步骤712中，对返回的所有字结合各个分数的权重，计算出综合分数。计算公式可以是 FinalScore = SysScoreXSysWeight+UserScoreXUserWeight+ContextScoreX ContextWeight 在步骤714中，根据FinalScore，对所有符合条件的字排序，得分最高的意味着用户最可能用到，排在最前面。然后，将排序结果显示出来，供用户选择。接下来，在步骤716 中判断用户是否发现了他想要的那个字。如果答案是否定的，就会到步骤702继续接受用户输入，重复上述过程。如果用户找到了他想要的那个字，就会执行步骤722，也就是说，用户选中他想要的那个字。在步骤720中，根据用户选择，更新用户词库中对应条目的分值。在步骤722中，根据用户选择，生成联想词库查询请求。在图8中进一步说明上下文词库811更新成上下文词库812的流程。首先，在步骤802中，用户切换到新的页面。在步骤804中，调整上下文词库中的每个词条的分值。在步骤806中，从新页面提取字、词组。每一字、词组依据在此页面的出现情况赋予相应的分值。在步骤808中，将这些字、词组及其分值合并入上下文词库。在步骤810中，把上下文词库中，分值在某一范围外的字条，词条删除。下面结合图9说明本发明的另一个实施例。用户输入分为几个步骤，通常情况下，形成完整的输入需要把这一步骤重复几次。图中以汉字完整拼音输入编码为例，具体步骤如下第一步用户输入。用户输入对应文字的编码。
第二步生成"查询请求"。根据用户输入编码字符串，生成"查询请求"。
要注意，通常的"查询请求"包括两个相关部分确定部和未确定部。确定部为用户在同一次输入中已经确认了的字词。未确定部为用户尚未确认的输入编码。现有的输入法会利用确定部和未确定部生成"查询请求"。还要注意，依赖于具体实现，现有的输入法中有很多并没有将确定部用于生成"查询请求"。
第三步词库查询。将"查询请求"发到词库系统，经过处理后，生成查询结果，交
给下一步骤。第四步重码提示。如果查询结果不止一个，就将查询结果按照一定的先后次序呈现给用户。第五步用户选择确认。用户从提示的查询结果中选择自己需要的一个查询结果，选择确认，从而完成字词的输入。
如果还有未确定的输入，则将上述步骤再重复一轮。图10为本发明一个实施例的另一个示例性实施例。要注意，实际的应用场合可能更多。相对于图9，增加的部分是"上下文词库"。也就是
13
第三步词库查询。将"查询请求"发到词库系统，通过查询上下文词库、用户词库
以及系统词库，并将所有查询结果综合处理后，生成最终查询结果，交给下一步骤。
在前面的详细说明中，在单个实施例中有时将各种特征组合在一起，以便使这一
说明更加流畅。但是，本发明的方法不应当被解释为反映了技术方案需要比每个权利要求
中明确提到的还要多的特征。相反，如同权利要求所反映的一样，本发明不一定需要所公开
的单个实施例中的所有特征。因此，将下面的权利要求结合进详细说明，每个权利要求本身
就是一个单独的优选实施例。除非这里具体说明，处理、计算、判断、显示之类术语可以指一个或多个处理或计算系统或操纵和变换数据的类似设备的动作、处理，这些数据可以被表示为处理系统寄存器和存储器中的物理量，这些数据被操纵并变换成其它数据，这些其它数据被表示为处理系统的寄存器或存储器或其它这种信息存储、传输或显示设备中的物理量。此外，如同这里使用的一样，计算设备包括与计算机可读存储器连接的一个或多个处理单元，这些存储器可以是易失性存储器或者非易失性存储器或者两者的组合。本发明的一些实施例可以被实现为硬件、固件和软件之一或者它们的任意组合。本发明的一些实施例还可以被实现为机器可读介质上储存的指令，它们可以被至少一个处理器读出并执行，来完成这里描述的操作。机器可读介质可以包括用来以机器(例如计算机)可读形式储存或传输信息的任何机制。例如，机器可读介质可以包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光盘存储介质、闪存设备，电、光、声或其它形式的传播信号(例如载波、红外信号、数字信号等)等。
权利要求
一种环境关联文字输入方法，其中在用户输入文字信息后，确定用户输入的文字信息所对应的多个文字重码，并按照重码的出现频度对文字重码进行排序，按排序结果将文字重码显示出来供用户选择，该方法的特征在于还包括以下步骤获取环境信息；在对文字重码进行排序的过程中，将与环境信息相关联的文字重码排在前面。
2. 如权利要求1所述的方法，其中获取环境信息还包括获取屏幕文字作为环境文字；或者获取环境图像，然后对获取的环境图像进行文字识别获得环境文字，其中，将与环境信息相关联的文字重码排在前面包括将环境文字中出现过的文字重码排在前面。
3. 如权利要求1所述的方法，其中获取环境信息包括获取环境图像，然后对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，将与环境信息相关联的文字重码排在前面包括将与环境关键词相关联的文字重码排在前面。
4. 如权利要求1所述的方法，其中用户输入文字信息包括通过键盘输入文字输入法编码；或者通过麦克风输入语音信号，其中确定多个文字重码包括对语音信号进行语音识别。
5. 如权利要求1所述的方法，其中所述环境信息包括环境中曾经出现过的信息。
6. —种环境关联文字输入设备，包括用户输入装置，用于由用户输入文字信息，其中在用户输入文字信息后，确定用户输入的文字信息所对应的多个文字重码，并按照重码的出现频度对文字重码进行排序，按排序结果将文字重码显示出来供用户选择；获取装置，用于获取环境信息；以及关联处理器，用于在对文字重码进行排序的过程中，将与环境信息相关联的文字重码排在前面。
7. 如权利要求6所述的设备，其中获取装置包括屏幕文字获取装置，用于获取屏幕文字作为环境文字；或者环境图像获取和文字识别装置，用于获取环境图像，并对获取的环境图像进行文字识别来获得环境文字，其中，关联处理器将环境文字中出现过的文字重码排在前面。
8. 如权利要求6所述的设备，其中获取装置包括环境图像获取和模式识别装置，用于获取环境图像，并对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，关联处理器将与环境关键词相关联的文字重码排在前面。
9. 如权利要求6所述的设备，其中的用户输入装置包括键盘；或者麦克风，其中确定多个文字重码包括对语音信号进行语音识别。
10. 如权利要求6所述的设备，其中所述环境信息包括环境中曾经出现过的信息。
11. 一种环境联想文字输入方法，在用户输入文字信息并选择了重码文字之一以后，查询联想词库，将该重码文字的联想词重码显示出来供用户选择，其特征在于获取环境信息；将环境信息添加到联想词库中，构成扩展联想词库，与扩展前联想词库中的联想文字相比，给环境文字赋予较高优先级。
12. 如权利要求11所述的方法，其中获取环境信息还包括获取屏幕文字作为环境文字；或者获取环境图像，然后对获取的环境图像进行文字识别获得环境文字，其中，将环境信息添加到联想词库中包括将环境文字添加到联想词库中，并赋予它们较高优先级。
13. 如权利要求11所述的方法，其中获取环境信息包括获取环境图像，然后对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，将环境信息添加到联想词库中包括将与环境关键词相关联的联想词赋予较高优先级。
14. 如权利要求11所述的方法，其中用户输入文字信息包括通过键盘输入文字输入法编码；或者通过麦克风输入语音信号，其中的重码文字包括对语音信号进行语音识别的识别结果。
15. 如权利要求11所述的方法，其中所述环境信息包括环境中曾经出现过的信息。
16. —种环境联想文字输入设备，包括选择装置，用于在用户选择了文字重码之一，显示出该文字重码之一对应的联想词重码以后，供用户选择联想词重码之一；获取装置，用于获取环境信息；以及关联处理器，用于将环境信息与联想词相关联。
17. 如权利要求16所述的设备，其中获取装置包括屏幕文字获取装置，用于获取屏幕文字作为环境文字；或者环境图像获取和文字识别装置，用于获取环境图像，并对获取的环境图像进行文字识别来获得环境文字，其中，将环境信息与联想词相关联包括将环境文字添加到联想词库中，并赋予环境文字较高优先级。
18. 如权利要求16所述的设备，其中获取装置包括环境图像获取和模式识别装置，用于获取环境图像，并对获取的环境图像进行图像模式识别，确定环境类型，从而获得环境关键词，其中，将环境信息与联想词相关联包括将与环境关键词相关联的联想词赋予较高优先级。
19. 如权利要求16所述的设备，其中所述环境信息包括环境中曾经出现过的信息。
全文摘要
本发明涉及利用环境信息提高文字输入速度的一种环境信息关联和联想输入方法和装置。这种方法利用环境信息捕获装置捕获环境信息，从中提取与环境有关的文字或关键词，然后在接下来的文字输入过程中充分利用这些文字或关键词，将用户最需要的词语排在输入重码或联想重码的前面供用户选择，从而提高文字输入速度。
文档编号G06F3/16GK101751202SQ20081018565
公开日2010年6月23日申请日期2008年12月17日优先权日2008年12月17日
发明者徐国栋, 李相研, 殷律, 罗栋元申请人:爱思开电讯投资(中国)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐国栋;殷律;罗栋元;李相研
技术所有人：爱思开电讯投资（中国）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。