姿势适应选择的制作方法_2

文档序号:8367429阅读:来源:国知局
生的连续输入可指示单手指输入姿势的较高概率。也就是说,使用单手指输入姿势执行的输入可遵循的是在UI设备4的目标位置处提供输入所需的时间是从用于输入的起始位置到目标位置的距离和目标位置的尺寸的函数。相反地,使用双拇指输入姿势执行的输入不遵循在UI设备4的目标位置处提供输入所需的时间是从用于输入的起始位置到目标位置的距离和目标位置的尺寸的函数。
[0032]在图1的示例中,用户可使用双拇指输入姿势向计算设备2提供输入。使用双拇指输入姿势,用户可提供一个或多个手势以录入单词“狐狸”。例如,用户可使用他或她的右拇指来在接近于“O”键30的UI设备4的第一位置处提供第一输入,并且随后使用他或她的左拇指来在接近于“X”键28的Π设备4的第二位置处提供第二输入。预测模块14可从手势模块10接收信息,其指示例如提供第一输入的第一时间和提供第二输入的第二时间。预测模块14还可从手势模块10接收信息,其指示在该处检测到将提供第一和第二输入的对准点。对准点可包括与在该处UI设备4检测到用户的输入的UI设备4的位置相对应的坐标。
[0033]预测模块14确定第一输入和第二输入的对准点之间的距离。也就是说,在图1的示例中,预测模块14可确定接近于“O”键30的第一输入与接近于“X”键20的第二输入之间的记录距离。预测模块14还确定在UI设备4处检测到第一输入的第一时间与检测到第二输入的第二时间之间所流逝的时间。使用第一和第二输入之间的记录距离和所流逝的持续时间,预测模块14确定指示输入姿势是单手指姿势还是双手指姿势的至少一个概率。在本示例中,第一和第二输入的对准点之间的记录距离可以是6个像素,并且第一和第二输入之间所流逝的时间可以是100毫秒。预测模块14可基于对准点之间所流逝的时间和记录距离来确定用户正在使用双拇指输入姿势。
[0034]如图2中进一步描述的,预测模块14可使用一个或多个分类器来基于对准点之间所流逝的时间和距离来确定用户正在使用哪个输入姿势。例如,预测模块14可使用两个连续按键之间所流逝的时间和记录距离作为用以确定输入姿势的特征。为了补偿单独键入速度差,预测模块14还可使用在连续按键之间流逝的归一化时间作为特征。可根据以下等式来计算所流逝的归一化时间:所流逝的归一化时间=用于最后η次按键的所流逝时间/所流逝平均时间,其中,η可以是某个整数(例如,η = 10) ο
[0035]预测模块14可使用输入姿势的确定来选择一个或多个空间模型。预测模块14使用一个或多个空间模型以基于第一和第二输入的对准点来确定图形键盘24的特定键已被用户选择的一个或多个概率。在某些示例中,空间模型包括用于特定键的二变量高斯模型。用于键的二变量高斯模型可包括与显示给定键的UI设备4的位置相对应的坐标(例如,(x,y)坐标对)的分布。更具体地,在某些示例中,用于键的二变量高斯模型可包括与当用户意图选择给定键时被用户最频繁地选择的UI设备4的位置相对应的坐标的分布。虽然在图1的示例中描述为二变量高斯模型,但可将任何适当的统计模型用于键。
[0036]在某些示例中,本公开的技术可基于姿势、键以及用户而使用不同的空间模型。每个不同的空间模型可具有与针对一个或多个姿势、键以及用户信息的给定的集合被最频繁地选择的UI设备4的位置相对应的不同坐标的分布。例如,用户在使用双拇指输入姿势时可在选择键时显示出偏差,即与用于单手指输入姿势的坐标的分布相比,坐标的分布可在一个或多个方向上略微移位。因此,与用于给定键的不同姿势相关联的一个或多个空间模型可包括用于与给定键相关联的输入的更准确的坐标的分布。如图2和3中进一步描述的,可基于姿势、键以及用户信息的可用性和/或充分性来分级地适配和选择空间模型。使用本公开的技术,预测模块14因此可如上所述地确定输入姿势,选择对应于所确定姿势的一个或多个空间模型,并且使用空间模型来预测用户意图选择的键。在图1的示例中,预测模块14可选择与双拇指输入姿势相关联的空间模型并测试接近于第二输入的一个或多个键以确定用户意图选择哪个键。使用一个或多个空间模型,预测模块14可确定用户意图选择与字母“X”相关联的“X”键28。预测模块14因此可选择字母“X”以便在文本编辑器控制装置22处显示。
[0037]图2是图示出根据本公开的一个或多个方面的图1中所示的计算设备的一个示例的更多细节的框图。图2仅图示出计算设备2的一个特定示例,并且在其他情况下可使用计算设备2的许多其他示例。
[0038]如在图2的特定示例中所示,计算设备2包括一个或多个处理器40、一个或多个输入设备42、一个或多个通信单元44、一个或多个输出设备46、一个或多个存储设备48和用户界面(UI)设备4。图2的示例中的计算设备2包括Π模块6、键盘模块8、手势模块10、操作系统48、预测模块14、空间模型50以及语言模型52。预测模块14还可包括单输入分类器54、时间窗分类器56、选择模块58以及用户模块60。可将组件40、42、44、46和48中的每一个互连(在物理上、在通信上和/或在操作上)以用于组件间通信。在某些示例中,通信信道50可包括系统总线、网络连接、进程间通信数据结构或用于传送数据的任何其他信道。作为图2中的一个示例,可用一个或多个通信信道50将组件40、42、44、46和48親接。UI模块6、键盘模块8、手势模块10、应用模块12、操作系统48、预测模块14及其相应的组件(例如,单输入分类器54)、空间模型50以及语言模块52还可相互地以及与计算设备2中的其他组件传送信息。
[0039]在一个示例中,处理器40被配置成实现功能和/或处理指令以便在计算设备2内执行。例如,处理器40可能能够处理存储在存储设备48中的指令。处理器40的示例可包括微处理器、控制器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或等效分立或集成逻辑电路中的任何一个或多个。
[0040]可将一个或多个存储设备48配置成在操作期间在计算设备2内存储信息。在某些示例中,存储设备48被描述为计算机可读存储介质。在某些示例中,存储设备48是临时存储器,意味着存储设备48的主要目的并不是长期存储。在某些示例中,将存储设备48描述为易失性存储器,意味着存储设备48在计算机被关掉时不保持存储的内容。易失性存储器的示例包括随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)以及本领域中公知的其他形式的易失性存储器。在某些示例中,使用存储设备48来存储程序指令以便由处理器40执行。在一个示例中,存储设备48被在计算设备2上运行的软件或应用(例如,应用48)用来在程序执行期间临时地存储信息。
[0041 ] 在某些示例中,存储设备48还包括一个或多个计算机可读存储介质。可将存储设备48配置成比易失性存储器存储更大量的信息。可进一步将存储设备48配置成用于信息的长期的存储。在某些示例中,存储设备48包括非易失性存储元件。此类非易失性存储元件的示例包括磁性硬盘、光盘、软盘、闪速存储器,或者电可编程存储器(EPROM)或电可擦可编程(EEPROM)存储器的形式。
[0042]在某些示例中,计算设备2还包括一个或多个通信单元44。在一个示例中,计算设备2利用通信单元44经由诸如一个或多个无线网络之类的一个或多个网络来与外部设备通信。通信单元44可以是网络接口卡(诸如以太网卡)、光学收发机、射频收发机或可以发送和接收信息的任何其他类型的设备。此类网络接口的其他示例可包括蓝牙、3G以及WiFi无线电计算设备以及通用串行总线(USB)。在某些示例中,计算设备2利用通信单元44来与被操作地耦接到计算设备2的另一计算设备无线地通信。
[0043]在一个示例中,计算设备2包括一个或多个输入设备42。在某些示例中,输入设备42被配置成通过触觉、音频或视频反馈从用户接收输入。输入设备42的示例包括存在敏感显示器、鼠标、键盘、语音响应系统、摄像机、扩音器或用于检测来自用户的命令的任何其他类型的设备。在某些示例中,存在敏感显示器包括触摸敏感屏幕。
[0044]还可在计算设备2中包括一个或多个输出设备46。在某些示例中,输出设备46被配置成使用触觉、音频或视频刺激向用户提供输出。在一个示例中,输出设备46包括存在敏感显示器、声卡、视频图形适配卡、光学投影仪或用于将信号转换成人类或机器可理解的适当形式的任何其他类型的设备。输出设备46的附加示例包括扬声器、阴极射线管(CRT)监视器、液晶显示器(LCD)或可以向用户生成可理解输出的任何其他类型的设备。
[0045]在某些示例中,UI设备4可包括输入设备42和/或输出设备46的功能。在图2的示例中,Π设备6可以是存在敏感显示器。在某些示例中,存在敏感显示器可检测存在敏感显示器的屏幕处和/或附近的对象。作为一个示例范围,存在敏感显示器可检测在存在敏感显示器的物理屏幕的2英寸或以下内的诸如手指或触针之类的对象。存在敏感显示器可确定在该处检测到对象的存在敏感显示器的位置(例如,(x, y)坐标)。在另一示例范围内,存在敏感显示器可检测距离存在敏感显示器的物理屏幕6英寸或以下的对象,并且还可以有其他示例性范围。存在敏感显示器可使用电容、电感和/或光学识别技术确定由用户的手指选择的显示器的位置。在某些示例中,存在敏感显示器使用触觉、音频或视频刺激向用户提供输出,如关于输出设备46所述。
[0046]计算设备2可包括操作系统48。在某些示例中,操作系统48控制计算设备2的组件的操作。例如,在一个示例中,操作系统48促进UI模块6、键盘模块8、手势模块10、应用12、预测模块14、空间模型50以及语言模型52与处理器40、通信单元44、存储设备48、输入设备42、输出设备46和UI设备4的通信。包括UI模块6、键盘模块8、手势模块10、应用模块12、操作系统48、预测模块14、空间模块50以及语言模块52的存储设备48的一个或多个组件每个可包括可由计算设备2执行的程序指令和/或数据。作为一个示例,Π模块6可包括使计算设备2执行在本公开中所述的操作和动作中的一个或多个的指令。在某些示例中,可用硬件和/或软件和硬件的组合来实现存储设备48中的所示的组件中的一个或多个。
[0047]如图2中所示,预测模块14还包括单输入分类器54、时间窗分类器56、选择模块58以及用户模块60。单输入分类器54从UI模块6和手势模块接收指示输入UI设备4的信息。例如,单输入分类器54接收指示由用户选择的Π设备4的位置的信息。在某些示例中,单输入分类器54还可指示每个位置被选择的时间的信息。在其他示例中,单输入分类器54在从手势模块10和/或UI模块4中的一个或多个接收到信息时确定每个位置被选择的时间。
[0048]可使用一个或多个分类器技术来实现单输入分类器54。示例技术可包括支持向量机、神经网络、贝叶斯分类器等。使用指示由用户选择的UI设备4的所检测位置之间的距离和输入之间所流逝的时间的信息来选择位置,单输入分类器54可生成给定输入姿势的概率。也就是说,单输入分类器54可生成输入姿势是双拇指输入姿势的概率。单输入分类器54还可生成输入姿势是单手指输入姿势的概率。在其他示例中,单输入分类器54可生成对于任何数目的输入姿势的概率。
[0049]为了生成姿势的概率,单输入分类器54确定在时间1\处接收到的坐标(Xl,yi)与在时间1~2处接收到的坐标(x2,y2)之间的欧几里德距离。单输入分类器54还确定在时间T1和时间T 2之间流逝的时间。使用该距离和流逝时间,单输入分类器54生成输入姿势的一个或多个概率。
[0050]在某些示例中,预测模块14还包括时间窗分类器56。时间窗分类器56还可实现如上文关于单输入分类器54所述的一个或多个分类器技术。时间窗分类器54可将每个输入分类并假设用户不会快速地改变姿势。在此类示例中,时间窗分类器56确定10个输入(例如,可接近大约2个单词的10次键敲击)的滑动时间窗来生成用户正在针对给定输入姿势提供输入的概率。在某些示例中,时间窗分类器56针对由单输入分类器54确定的每个输入(例如,每次敲击或连续挥扫手势的一部分)从单输入分类器54接收输入的概率分数和指示。如下面进一步描述的,时间窗分类器56可基于随时间推移而确定且从单输入分类器54接收到的一组的一个或多个概率而生成使用给定输入姿势录入该输入的概率。
[0051]在一个示例中,针对每个时间窗,时间窗分类器56可使用包括以下各项的特征来确定输入姿势的概率:(I)两个输入之间所流逝时间与记录距离之间的相关性,(2)每个输入是单手指输入姿势的平均概率,(3)每个输入是单手指输入姿势的平均概率,(4)被分类为使用单手指输入姿势的输入的平均数目,和(5)被分类为使用双拇指输入姿势的输入的平均数目。时间窗分类器56还可给出对于每个姿势的概率分数。
[0052]如图2中所示,预测模块14包括选择模块58。选择模块58可从时间窗分类器56和/或用户模块60接收信息。来自时间窗分类器56的信息可指示时间窗内的对于给定输入姿势的概率。用户模块60可指示给定用户正在提供输入的概率。基于从选择模块时间窗分类器56和用户模块60接收到的信息,选择模块58可从空间模型50选择空间模型。如图3中进一步描述的,空间模型50可以是分级适应空间模型,其由可由选择模块58基于键、用户以及姿势信息选择的子模型组成。
[0053]作为一个不例,选择模块58可从时间窗分类器56接收单输入分类器54正在使用双拇指输入姿势来提供输入的概率。选择模块58可进一步从用户模块60接收特定用户正在提供输入的概率。基于此信息,选择模块58可选择空间模型50中的一个并确定输入对应于与空间模型相关联的图形键盘24的给定键的概率。选择模块58可针对每个与不同键相关联的多个不同空间模型确定哪个键具有被用户的输入选择的最高概率。响应于确定与最高概率相关联的键,选择模块56可向UI模块6发送与该键相关联的字符。UI模块6进而可使Π设备4输出字符以用于显示。
[0054]在某些示例中,计算设备2包括语言模型52。语言模型52可包括字典。在某些示例中,字典可包括单词列表,并且可包括关于所列单词的附加信息。可用一些的数据结构,诸如阵列、列表和/或树,来表示字典。例如,语言模型52可包括存储在特里(trie)数据结构中的字典。字典特里数据结构可包含多个节点,每个节点可表示字母。可将字典特里中的第一节点称为入口节点,其可不对应于字母。在其他示例中,入口节点可对应于字母。每个节点可具有一个或多个子节点。例如,入口节点可具有二十六个子节点,每个对应于英语字母表的字母。
[0055]字典特里中的节点的子集每个可包括指示节点是终端节点的标志。字典特里的每个终端节点可指示完整单词(例如,候选单词)。由沿着从入口节点到终端节点的节点路径的节点所指示的字母可拼写出终端节点所指示的单词。在某些示例中,语言模型52可以是安装在计算设备2上的默认词典。在其他示例中,语言模型52可包括多个字典源,其可存储在计算设备2处或者存储在一个或多个远程计算设备处且可被计算设备2经由一个或多个通信信道访问。
[0056]在某些示例中,可在计算设备2的固件中实现语言模型52。语言模型52可包括语言模型频率信息,诸如n元语言模型。η元语言模型可基于序列(即,P (Xi I Xi_(n_D,Xi^1))中的先前项目而提供对于项目的连续序列中的项目Xi(字母或单词)的概率分布。例如,二元语言模型(η元模型,其中,η = 2)可提供字母“X”在序列“FOX”之后的概率。在某些示例中,
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1