使用电话机键盘构成字母数字消息的方法

文档序号:7586089阅读:832来源:国知局
专利名称:使用电话机键盘构成字母数字消息的方法
技术领域
本发明涉及使用电话机键盘输入字母数字消息的方法,特别涉及对于每个消息字符,使用一次按键的方法。
能够显示并响应字母数字消息的高级个人通信设备(PCD),例如寻呼机的使用正变得越来越常见。要发送给这种PCD的字母数字消息由机器或个人产生。机器产生的消息的例子是最新新闻资料和最新证券市场资料。使用与网络相连的计算机,或者通过使用标准的电话设备,或者通过使用另一PCD,可构成并发送由个人产生的消息。通过利用标准电话设备构成字母数字消息的能力是非常需要的,因为电话设备无处不在,并且为绝大多数人所熟悉,但是由于电话机键盘是为数字输入,而不是为字母数字输入设计的,因此采用电话机键盘构成字母数字消息需要创造力。存在使用标准电话机键盘构成字母数字字符的已知技术。已知技术的一个例子涉及由使用者识别一个按键上的三个或四个字母数字字符中的哪一个将被输入消息中。例如,在一种方法中,在短时间内按下按键一到四次,以指示四个字符中的哪个字符将被输入。在另一方法中,使按键保持压下状态,同时以每次一个字符的形式,使该按键所代表的字符呈现给(通过视觉或听觉)使用者,当所需的字符出现时,释放该按键。虽然这两种技术能够成功地构成字母数字消息,不过对于许多呼叫者来说,这两种技术不自然并且较困难。
于是,需要一种可靠并且自然的,用标准电话机键盘构成字母数字消息的技术。


图1表示了根据本发明的优选实施例和五个备选实施例的消息接发系统的方框图。
图2根据本发明的优选实施例和五个备选实施例,表示了消息接发系统的消息接发终端中使用的,用于产生词汇数据库的方法的流程图。
图3和4根据本发明的优选实施例和五个备选实施例,表示了消息接发终端中使用的,利用电话构成字母数字消息的方法的流程图。
图5根据本发明的优选实施例和五个备选实施例,表示了消息接发终端中使用的,用于产生字格架(trellis)的方法的流程图。
图6根据本发明的优选实施例和五个备选实施例,表示了消息接发终端中使用的,用于执行键盘错误校正的方法的流程图。
图7根据本发明的优选实施例和第一、第四及第五备选实施例,表示了消息接发终端中使用的,用于确定最可能的短语的方法的流程图。
图8根据本发明的优选实施例和第一、第二、第四及第五备选实施例,表示了消息接发终端中使用的,进行编辑的方法的流程图。
图9根据本发明的第三备选实施例,表示了用候选字子集产生字母数字消息的方法的流程图。
图10根据本发明的第四备选实施例,表示了响应操作者的输入,进行最可能的消息的编辑的方法的流程图。
图11根据本发明的第五备选实施例,表示了进行最可能的消息的编辑的方法的流程图。
参见图1,根据本发明的优选实施例和第一、第二及第三备选实施例的消息接发系统100接收来自于几个外部信息源,例如电话102,寻呼输入装置(page entry device)104及源计算机107的寻呼或消息接发请求。这里所示的源计算机107实质上是示范性的,并可起消息接发客户机,万维网客户机,信息系统主机的作用,或者可起检索并向其它客户机提供信息的万维网主机的作用。
通常通过公用或专用电话网络108的电话网络输入接收寻呼或消息接发请求,公用或专用电话网络108最好具有连接局域网(LAN)或广域网(WAN),以便实现与诸如源计算机107之类的设备的高速网络连接的能力。公用或专用电话网络108使来自于外部信息源之一(即,语音消息或计算机消息发生器)的寻呼请求与消息接发终端处的自动电话输入端110或网络输入端117耦合。公用或专用电话网络108,以及专用输入端通过支持TCP/IP或类似连接的一个或多个网络连接装置123,例如调制解调器或高速网络接口,例如IEEE802.3等,与因特网和内部网连接。
消息接发终端112包括网络连接装置123,自动电话输入端110,网络输入端117和处理器109,处理器109包括与词汇数据库135耦合的电话消息处理器130。消息接发终端112最好是由IL的Schaumburg的Motorola公司生产的常规WMGTMAdministrator!型消息接发终端。自动电话输入端110以常规方式提供接收的电话的自动呼叫连接,并使来自电话呼叫的数字化音频与处理器109耦合。由于中央处理器按照存储在常规的大容量存储器(例如硬盘及随机存取存储器(RAM))中的一组独特的电话消息处理程序指令进行工作,电话消息处理器130包括常规中央处理器(CPU)的分时部分和相关的处理器外围设备。该组独特的程序指令控制处理器109的工作,以便执行下面将描述的独特功能。要认识到,通过利用常规的任务分享技术,其它多组常规程序指令提供可与电话消息处理器130基本同时运行的处理器109的其它功能。
在收到寻呼请求之后,消息接发终端112把包含选择呼叫地址的选择呼叫消息,可能还有录音消息送到射频(RF)控制器114,以便传输给选择呼叫接收器(更一般地称为个人消息接发装置)。RF控制器114按照协议,例如Motorola公司许可的众所周知的FLEXTM协议配置该消息,RF控制器114最好是由Motorola公司生产的Conductor!TM型RF控制器,并与发射器116耦合,发射器116最好是由Motorola公司生产的SymphonyTM型发射器。常规的消息接发系统可借助多种消息格式把信息从呼叫者传送给寻呼机使用者。每种消息格式可表示发送给寻呼机的一种数据模式(例如字符,数字,音频,图形,或者“仅仅是蜂鸣声”)。图1图解说明了能够从消息接发终端112接收信息消息的许多个人消息接发装置,或者称为选择呼叫接收器,用户装置(subscriber)和个人消息接发装置。图中所示的个人消息接发装置是字母数字消息接发装置118,数字显示寻呼机120,语音消息寻呼机121和只能发出单音的单音寻呼机122,字母数字消息接发装置118是常规的具有双向消息接发能力的选择呼叫接收器。在单音寻呼机的情况下,单音寻呼机122(即,不向使用者提供任何消息)提醒(例如可听见的蜂鸣声)使用者,呼叫者希望该寻呼机使用者通过呼叫预先安排的电话号码,例如传达员电话号码进行应答。另外,RF控制器114与常规的消息接发接收器115耦合,接收器115从字母数字消息接发装置118接收入站信令信息(例如确认返回响应和返回信道消息),并将其送到消息接发终端112。字母数字消息接发装置最好是由IL的Schaumburg的Motorola公司生产的PagewriterTM双向寻呼机,该寻呼机具有字母数字显示器。消息接发接收器115最好是由Motorola公司生产的AudienceTM型接收器。消息接发终端112,RF控制器114,发射器116和消息接发接收器115也可以是不同的型号和不同的制造商生产的产品。
参见图2,根据本发明的优选实施例和备选实施例,表示了产生词汇数据库的方法。词汇数据库135为候选字的恢复及与候选字相关的概率的恢复创造条件。在消息接发终端112的初始化操作过程中产生词汇数据库135,词汇数据库135被存储在常规的大容量存储器的一部分之中。通过在步骤205获得预计将在新的消息中使用的该类型的字序列的一个较大样本;在步骤210,根据由该较大样本确定的字的概率,确定并在词汇数据库135中存储所有单字(unigram)和将包含的所有单字的概率;并在步骤215确定并在词汇数据库135中存储多字(multigram),根据本发明的优选实施例,多字是双字(bigram),不过也可以是直到预定的最大长度为止的更大的字序列。多字具有根据样本确定的,超过预定的最小概率的概率。按照常规的方式组织词汇数据库135,以便当键盘代码序列(或子序列)由电话消息处理器130提供给词汇数据库135时,电话消息处理器130有效地恢复候选字集(或子集)。候选字集合(或子集)包括数据库中所有由该键控代码序列(或子序列)提供的单字。还通过按照常规方式存储多字字序列和相关概率,组织词汇数据库135,以便当电话消息处理器130在前向条件概率请求中向词汇数据库135提供查找字(lookupword)和在前的字(直到预定的最大字序列长度为止),电话消息处理器130有效地恢复查找字的前向条件概率。恢复的概率值是开始于查找字,并包括尽可能多的连续的在先字的多字的概率,对于所述连续在先字,找到了多字匹配。词汇数据库135还被组织成,当电话消息处理器130向词汇数据库135提供查找字和后续字(直到预定的最大字序列长度为止),并请求后向条件概率查找时,电话消息处理器130有效地恢复字的后向条件概率。恢复的概率值是开始于查找字,并包括尽可能多的连续后续字的多字的概率,对于所述连续后续字,找到了多字匹配。
当对于键控代码序列(或子序列)找到匹配时,恢复非空的候选字集合(或子集)。当对于提供给词汇数据库135的键控代码序列,没有发现任何匹配时,恢复一个空的候选字集合(或子集),并且电话消息处理器130假定一个键盘错误。
当对于前向查找中的给定查找字和在先字,或者对于后向查找中的给定查找字和后续字,没有存储任何条件概率时,电话消息处理器130从词汇数据库135恢复候选字的无条件单字概率。
在本发明的第一备选实施例中,词汇数据库135只存储单字概率,并且存储前向或后向条件概率之一。在本发明的第二备选实施例中,只存储单字概率。在本发明的第三备选实施例中,词汇数据库135不存储任何概率。这样,在本发明的第三备选实施例中,当键控代码序列被提供给词汇数据库135时,一组候选字被返回,但是不提供该组候选字的任何概率。
参见图3和4,根据本发明的优选实施例和第一、第二及第三备选实施例,表示了消息接发终端112中使用的,通过利用电话构成字母数字消息的方法的流程图。在步骤305,电话呼叫被接收,电话消息处理器130按照常规方式与呼叫者交互作用,从而确定呼叫者打算把消息发给哪一个特定的个人消息接发装置。在步骤310,电话消息处理器130确定个人消息接发装置的类型。当在步骤315确定该个人消息接发装置不是字母数字消息接发装置时,则在步骤330,电话消息处理器130停止进行该方法。当在步骤315确定个人消息接发装置是字母数字消息接发装置时,电话消息处理器130在步骤320指令呼叫者,按照两种模式数字模式和文本模式之一,利用电话机键盘输入消息。除非首先按下预定的键(最好是“0”键),否则将以文本模式开始消息输入。对于每个字母字符,通过对于消息的每个字符,利用电话机键盘上包括消息的该个字符的按键,按下该按键,不过对于该消息的每个字符只按压按键一次,呼叫者拼出该消息。还指令呼叫者使用预定的按键,最好是用“#”标记的按键,下文称为#键,作为各个字之间的间隔(即#键是字母字的分隔符)。为了在数字模式后进入文本模式,呼叫者还要按下#键。为了进入数字模式,呼叫者按下用“0”标记的按键。随后,对于每个数字,呼叫者按下所需的数字键。数字序列(或数字“字”)的终止用#键控代码表示。呼叫者通过按下#键两次,结束消息。这样预定的按键(“0”,“#”)产生表示字边界的预定键控代码,除了第一个字之外,以文本模式输入的每个字都开始于#键控代码,并终止于#键控代码。在认识到,在备选实施例中,可使用两个或更多的按键序列来代替上面说明的单个预定按键(“0”,“#”)。例如,在需要更多功能的系统中,可使用#键和另一按键的组合。更一般地说,一组预定的键控代码用于表示字边界,其中该组预定的键控代码具有至少为一个键控代码的长度。
当呼叫者输入消息时,在步骤325,产生一系列常规的双音频多频DTMF键控代码,该序列双音频多频DTMF键控代码通过自动电话输入端110与电话消息处理器130耦合,并在步骤405,由电话消息处理器130接收和存储。该序列键控代码识别电话机键盘上实际被按下的按键序列,并给出呼叫者所需的字符序列(即字母数字消息)。要认识到,由于输入错误的缘故,在任何给定的键控代码序列中,偶而存在多余的键控代码或者遗漏的键控代码。举例来说,如下所述输入“Can you go to IBM tomorrow morning at 10。”(按键上的数字用于识别编号按键)键226#968#46#86#426#86667769#6676464#28#010##CAN YOU GO TO IBM TOMORROW MORNING AT 10。
在步骤410,电话消息处理器130确定接收的键控代码序列的N个子序列(于是,N是整数)。N个子序列是在接收的键控代码序列内,利用#键的预定键控代码分隔的键控代码子序列。在上面给出的例子中,N个子序列将是按键226,968,46,86,426,86667769,6676464和28的键控代码。在步骤415,电话消息处理器130产生包括候选字的至少一个子集的字格架,在该例中,它将是候选字的八个字集(即,N=8)。
参见图5,根据本发明的优选实施例和第一、第二及第三备选实施例,表示了由消息接发终端112中的电话消息处理器130使用的,用于产生步骤415的字格架的方法的流程图。电话消息处理器130通过在步骤505,每次向词汇数据库135提供N个子序列中的一个子序列,产生字格架。对于N个子序列的每个子序列,在步骤510,电话消息处理器130确定是否恢复了空子集。当没有恢复空子集时,在步骤515,电话消息处理器135从词汇数据库135恢复候选字子集。空子集的恢复表示没有候选字匹配给出的键控代码子序列,在步骤520,该序列被认别为出错的序列。电话消息处理器130在步骤525利用出错的序列,进行键盘错误校正。
参见图6,根据本发明的优选实施例和第一、第二及第三备选实施例,表示了由消息接发终端112中的电话消息处理器130使用的,用于在步骤525执行键盘错误校正的方法的流程图。在步骤605,键盘错误校正例程接收出错的序列。在步骤610,建立一个循环程序,对于该循环程序,选择并使用一次出错序列的每个键控代码。在步骤615,建立一个子循环程序,在该子循环程序中,通过用各个不同的键控代码代替选择的键控代码,产生新的子序列。在步骤620,进行测试,以确定新的子序列是否恢复了任何候选字。当新的子序列恢复任何候选字时,在步骤625,把新的子序列积存在新子序列存储器中。当新的子序列没有恢复任何候选字时,在步骤610开始子循环的下一次重复。当所有不同的键控代码已代替出错序列中的所有键控代码,并都已被测试时,则在步骤630建立新的循环程序,对于该新的循环程序,出错序列的每个键控代码被选择并被使用一次。在步骤635,通过删除在步骤630中选择的键控代码,产生一个新的子序列。在步骤640,进行测试,以确定新的子序列是否恢复了任何候选字。当新的子序列恢复任何候选字时,在步骤645,把新的子序列积存在新子序列存储器中。当新的子序列没有恢复任何候选字时,在步骤630开始循环的下一次重复。当出错子序列中的每个键控代码已被单独删除时,则在步骤650建立一个新的循环程序,在该循环程序中,出错序列的两个连续键控代码之间的每个插入点被选择并被使用一次。在步骤655,建立一个子循环程序,其中通过在选择的插入点插入每个键控代码,产生一个新的子序列。在步骤660,进行测试,以确定新的子序列是否恢复了任何候选字。当新的子序列恢复任何候选字时,在步骤665,把新的子序列积存在新子序列存储器中。当新的子序列没有恢复任何候选字时,在步骤655开始子循环的下一次重复。当对于出错子序列中的所有插入点,所有键控代码都已被插入并进行测试之后,则在步骤670进行测试,以确定新子序列存储器中是否积存有任何子序列。
当确定在新子序列存储器中不存在任何新的子序列时,在步骤675建立一个新的循环程序,在该循环程序中,出错序列的每个插入点被选择并被使用一次,通过在选择的各个插入点,把出错子序列分离成两个子序列,产生两个新的子序列。在步骤680,进行测试,以确定这两个新的子序列中的每个子序列是否恢复了至少一个候选字。当新的子序列恢复了候选字时,则在步骤685把这两个新的子序列积存在新子序列存储器中。当在步骤685,这两个新的子序列都没有恢复任何候选字时,则在步骤675开始进行循环的下一次重复。当步骤675的所有重复都完成时,在步骤676进行测试,以确定在步骤685是否积存了任何子序列。当确定没有积存任何子序列时,则在步骤677执行拼写编辑程序(下面将更详细地说明)。当在步骤676或步骤670,确定已在新子序列存储器中积存有任何子序列时,则在步骤690开始新的循环程序,在该循环程序中,积存在新子序列存储器中的每个新的子序列(或者在执行步骤685的情况下,为一组两个新的子序列)被使用一次。对于每个新的子序列(或者一组两个新的子序列),在步骤695确定和该新的子序列(或者一组两个新的子序列)匹配的所有候选字的单字概率中的最高单字概率。该最高单字概率为该新子序列的得分。对每个新的子序列(或者一组两个新的子序列)重复上述过程。在步骤696,选择具有最高子序列得分的新的子序列(或者一组两个新的子序列),并用其代替出错的子序列。要认识到在步骤525的键盘错误校正之后,由于步骤675的序列分离的缘故,在某些情况下,子序列的数目将增大,于是在步骤525之后,把子序列的数目标记为Q,Q≥N。
参见图4,当在步骤415产生字格架时,则根据本发明的优选实施例和第一及第二备选实施例,在步骤420确定具有最大组合概率的最可能短语。根据本发明的第三备选实施例,当在步骤415产生字格架时,该方法将按照下面参考图9所述那样继续下去。根据本发明的优选实施例和第一备选实施例,按照下面参考图7所述的内容,根据存储在词汇数据库135中的单字概率、前向条件概率和后向条件概率等确定最大组合概率。最可能短语由来自于各个候选字子集的一个候选字的组合构成。根据本发明的第二备选实施例,在步骤420确定最可能短语,以便用各个候选字子集简单地构成最可能的候选字的组合,其中最可能的候选字是候选字子集中具有最大单字概率的候选字;图7的步骤705-730和本发明的这一方面无关。
参见图7,根据本发明的优选实施例和第一备选实施例,表示了由消息接发终端112中的电话消息处理器130使用的,用于确定最可能的短语的方法的流程图。在步骤705,建立一个双重循环,其中对于第一重循环中的i=1,2,…Q,和第二重循环中的j=1,2,…Mi,递归计算部分前向概率αi,j,第二重循环为第一重循环的子循环。Mi是第i个候选字子集中,候选字的数目,是一个整数。对于i和j的每个值,如下计算部分前向概率αi,jαi,j=max(αi-1,kP(wi,j|WI-10,W1-20,···W10)),1≤k≤Mi-1]]>在该公式中,表达式wi,j|Wi-10,W1-20,···W10]]>表示对其计算部分概率αi,j的候选字wi,j的前向条件概率,假定一组可能的字Wi-10,W1-20,···W10]]>与用于计算αi,j的αi-1,k相关。如同前面参考图2说明的那样,通过电话消息处理器130向词汇数据库135发出请求,提供候选字wi,j和与αi-1,k相关的该组可能字作为查找字和在先字,获得候选字wi,j的前向条件概率。
当通过选择Mi-1乘积(在先部分前向乘积和相关的前向条件概率)的最大值,确定了部分前向概率αi,j时,通过把该候选字加入与产生αi,j的αi-1,k相关的一组可能字中,并使该组新的可能字与αi,j相关,从而使一组候选字和部分前向概率αi,j相关。
当在步骤710和715计算了所有的部分前向概率时,则在步骤720建立一个新的双重循环,其中对于第一重循环中的i=Q,Q-1,…1,和第二重循环中的j=1,2,…Mi,递归计算部分组合概率βi,j,第二重循环为第一重循环的子循环。对于i和j的每个值,如下计算部分组合概率βi,jβi,j=max(αi,jβi+1,k(wi,j|WI+10,W1+20,···WQ0)),1≤k≤Mi+1]]>在该公式中,表达式wi,j|Wi+10,W1+20,···WQ0]]>表示对其计算部分概率βi,j的候选字wi,j的后向条件概率,假定一组可能的字Wi+10,W1+20,···WQ0]]>与用于计算βi,j的βi+1,k相关。如同前面参考图2说明的那样,通过电话消息处理器130向词汇数据库135发出请求,提供候选字wi,j和与βi+1,k相关的该组可能字作为查找字和后续字,获得候选字wi,j的后向条件概率。
当通过选择Mi+1乘积(相关的部分前向概率,在先部分组合乘积和相关的后向条件概率)的最大值,确定了部分组合概率βi,j时,通过把该候选字加入与产生βi,j的βi+1,j相关的该组可能字中,并使该组新的可能字与βi,j相关,从而使一组新的候选字和部分组合概率βi,j相关。
当在步骤725和730计算了所有的部分组合概率,则在步骤735,通过查找与最大组合概率max(β1,j),`1≤j≤M1相关的一组可能字,选择最可能的短语。
对于本领域中的普通技术人员来说,显然可借助基本上类似并且将产生近似相同的结果的其它方法来实现上面的递归计算。例如,在对步骤705-730中所示的公式进行显而易见的改变后,可在步骤705-715中计算部分后向概率,而不是部分前向概率。
根据本发明的第一备选实施例,前向或后向条件概率之一并不包括在词汇数据库135中。在本发明的这一方面,由于前向或后向条件概率之一不被使用,因此步骤705-715,或者步骤720-730被删除。
再次参见图4,根据本发明的优选实施例和第一及第二备选实施例,在步骤425,产生最可能的消息,并将其呈现给呼叫者。最好通过使最可能的短语和在步骤405中,呼叫者以数字模式输入的数字重新组合,产生最可能的消息。利用字和数字的常规计算机合成方法,把最可能的消息提供给呼叫者。当最可能的消息已被呈现给呼叫者时,随后在步骤430确认最可能的消息是否是字母数字消息。当呼叫者在步骤430做出肯定的指示时,确认最可能的消息是字母数字消息,并导致在步骤435,利用最可能的消息,完成字母数字消息的构成,随后将其发送给希望的字母数字消息接发装置。当呼叫者在步骤430做出否定的指示时,确认最可能的消息不是所需的字母数字消息,并导致在步骤440对最可能的消息进行编辑。
参见图8,根据本发明的优选实施例和第一及第二备选实施例,表示了由消息接发终端112中的电话消息处理器130使用的,用于执行步骤440的编辑的方法的流程图。依据来自于呼叫者的响应,呼叫者在步骤805识别不正确的最可能消息,其结果是呈现下一个最可能的消息。根据本发明的优选实施例和第一备选实施例,在步骤810,多达R个下一最可能的消息被呈现给呼叫者,每次呈现一个最可能的消息。R个下一最可能的消息被选择为与部分组合概率β1,k,1≤k≤M1相关的各组可能字,并按照值的降序分类,数字和字母已与之重新组合(如同步骤425中一样),其中β1,k是当完成步骤725和730时,如上所述确定的β1,k(根据第一备选实施例,当只使用前向条件概率时,则在前一句子中,用α代替β,用步骤710和715代替步骤725和730)。根据本发明的优选实施例和第一备选实施例,R为1,不过R也可为更大的值。在步骤815,当呼叫者选择下一最可能的短语之一时,则在步骤820,把该最可能的短语发送给希望的字母数字消息接发装置。当在步骤815,呼叫者没有把任意下一最可能消息确定为字母数字消息时,则再次把最可能的消息呈现给呼叫者,呼叫者可在步骤825选择候选字之一进行编辑。当呼叫者选择候选字之一时,电话消息处理器130从词汇数据库取回对应于根据其确定选择的候选字的子序列的其它候选字,并在步骤830,按照它们的单字概率,把它们呈现给呼叫者。当在步骤835,呼叫者选择这些候选字之一时,在步骤840,选择的字被用于代替最可能的短语中的候选字。当呼叫者在步骤835没有选择任何候选字作为校正字时,则在步骤845,电话消息处理器130呈现由该子序列中的每个键控代码代表的所有字母,每次呈现一个字母,并且呼叫者确认对应于每个键控代码的正确字母,从而产生在步骤850中用在最可能短语中的编辑字。例如,当呼叫者按下由数字3,6,7标识的按键时,消息接发终端112利用表述“当说出正确的字母时,请按下pound键。“D”“E”“F”“M”“N”“O”“P”“R”“S”的语音消息做出响应。当一个以上的候选字错误时,根据需要重复步骤825-850,校正所有候选字。随后使数字和字母与在步骤820、840和850之一最终产生的最可能短语重新组合,产生最可能的消息。
和上面描述的包括步骤805-850的方法无关,步骤845和850也被用作执行上面参考图6说明的步骤677的方法。
根据本发明的第二备选实施例,当在步骤430没有确认最可能的消息时,则没有如同上面参考步骤805-820说明的那样,向呼叫者呈现任何下一可能的短语,并在步骤825(图8)确定不正确的候选字。随后该方法按照上面参考步骤830-850描述的那样继续下去。根据需要,确定另外的不正确候选字,并为这些不正确的候选字重复步骤830-850。
参见图9,根据本发明的第三备选实施例,流程图表示了用候选字子集产生字母数字消息的方法。当在步骤415产生了字格架(图4)时,则根据本发明的第三备选实施例,在步骤905,把候选字子集中的所有候选字呈现给呼叫者,其中按照子序列的接收顺序,把每个候选字子集的所有候选字呈现给呼叫者,每次呈现一个候选字。呼叫者在步骤405中,以数字模式输入的数字被插入这些数字在候选字子集之间的原始位置中,并且也被呈现给呼叫者。通过利用常规的字和数字合成方法,把候选字和数字呈现给呼叫者。在步骤910,依据呈现所有候选字的步骤中的一个或多个呼叫者响应(口头或键盘输入),关于第一候选字子集确认候选字,或者第一子集不被确认。响应步骤910的非确认结果,在步骤915呈现把由接收的键控代码序列的一个子序列中的所有键控代码表现的所有字母。该子序列对应于第一候选字子集。所有的字母被呈现给呼叫者,每次呈现一个字母。在步骤920,依据呈现所有字母的步骤中的一个或多个呼叫者响应,确定每个键控代码的确认字母。当子序列的所有字母都被确认时,拼出一个单词。当所有候选字子集的所有候选字或者被确认,或者被拼出时,则产生了字母数字消息。
参见图10,根据本发明的第四备选实施例,流程图表示了响应操作者的输入,编辑最可能的消息的方法。操作者是监视和帮助呼叫者,并通过字母数字键盘和显示器,以及扬声器和麦克风,与消息接发终端112通信的人员。扬声器和麦克风最好是电话机耳机或听筒的一部分。当在步骤430确定消息不一致时(图4),或者当在步骤510,没有为子序列找到任何候选字(空的子集)时(图5),则在步骤1005,以常规的方法确定最可能的消息的一个或多个不正确的候选字,例如,通过向呼叫者提供语音合成消息,以便激活电话机键盘上的,指示字母数字消息内的一个或多个不正确候选字中的每个候选字的位置的一个或两个按键,或者通过要求呼叫者说出每个不正确候选字的位置编号,并利用消息接发终端112内的微小语音识别器(该语音识别器以这种数字编号的不依赖于扬声器的识别为基础)来确定最可能的消息的一个或多个不正确的候选字。剩余的所有候选字被确认为候选字,剩余候选字最低可以少至为零。在步骤1010,向呼叫者提出请求,要求呼叫者说出字母数字消息的,对应于在步骤1005确定的一个或多个不正确候选字中的每个候选字的口语字。在步骤1015,记录口语字,例如以数字化音频的形式记录在消息接发终端112的随机存取存储器(RAM)中。在步骤1020,在确定步骤1005确认的字母数字消息的候选字和在记录步骤1015中记录的口语字呈现给操作者。向操作者提供确认的候选字的工作,最好是在字母数字显示器上完成,而通过重放录音,基本上再现呼叫者的语音,把口语字提供给操作者。在第四备选实施例的第一变型中,在步骤1020把候选字和口语字提供给操作者之后,由操作者完成对消息接发终端112的输入。
当操作者有把握已确定口语字时,操作者完成输入,这些输入被用于在步骤1025产生操作者编辑版本的字母数字消息。要认识到,和消息接发终端112相比,操作者的优点在于能够根据上下文,快速地解译口语字。输入最好是键盘输入,不过也可以是操作者说出的单词的语音识别,或者是操作者说明的,表达口语字的一系列字母,在这种情况下,相对于操作者训练的依赖于说话者的语音识别系统通常相当可靠,而且相当快速。随后,当呼叫者在步骤430确认或否定消息时,过程相应地继续进行下去。
在第四备选实施例的第二变型中,在步骤1020把确认的候选字和口语字提供给操作者之后,在步骤1030,消息接发终端112自动在呼叫者和操作者之间建立起语音链路。代替步骤1025,执行步骤1030。随后在步骤1035,操作者直接与呼叫者联系,以便确定在步骤430(图4)或510(图5)识别的不正确的候选字的正确候选字。响应在步骤1030建立语音链路,和在步骤1035与呼叫者联系之后,操作者进行的输入,消息接发终端112在步骤1040产生操作者编辑版本的字母数字消息。和上面一样,操作者输入为键盘输入或者语音识别输入。
在第四备选实施例的第三变型中,借助发给消息发送终端112的操作者命令,手动开始步骤1030,而不是由消息发送终端自动开始步骤1030。通常当操作者对在步骤1020呈现的口语字没有把握时,操作者启动该命令。在步骤1030之后,如同上面参考第四实施例的第二变型描述的一样,进行步骤1035和1040。
要认识到本发明的第四实施例的第一、第二或第三变型的使用,提供了以自然的方式校正未被确认的消息,而不会要求呼叫者在电话机键盘上重新键入任何内容,加重呼叫者的负担。
参见图11,根据本发明的第五备选实施例,表示了进行最可能的消息的编辑的方法。在步骤1105,当在步骤430(图4)确定消息不一致时,或者当在步骤510(图5)没有为子序列找到任何候选字(空的子集)时,或者在其它适当的时候,消息接发终端112在步骤1105利用语音合成的提示,提示呼叫者说出编辑命令。在步骤1110,消息接发终端112把口头的编辑命令识别为存储在消息接发终端112中的一组预定的编辑命令之一。消息接发终端112使用独立于说话者的语音识别系统,该语音识别系统是基于一组预定的编辑命令的常规微小语音识别器。编辑命令被识别为消息编辑命令,字编辑命令或者拼写编辑命令。消息编辑命令包括一个较小的命令子集,例如Add AnotherMessage;Done;Send;Insert,Delete,Change,Go Forward#Words,Go Back#Words和Play message。当在步骤1110,编辑命令被识别为消息编辑命令时,消息接发终端112在步骤1115执行命令。当在步骤1110,编辑命令被识别为字编辑命令时,在先前由呼叫者或消息接发终端112识别的键控代码序列的子序列的控制下,进行编辑。例如,在步骤1110,当识别出字编辑命令时,识别可以是对呼叫者的口语字“编辑字三”(edit word three)的响应。响应这些口语字,消息接发终端112识别与消息的第三个字相关的键控代码序列的子序列。在另一例子中,当没有找到匹配子序列(例如字三)的任何子集时,消息接发终端112可在步骤510识别键控代码序列的子序列。随后消息接发终端112在步骤1120提示呼叫者口头输入单词,并在步骤1125记录口头输入的单词。消息接发终端112在步骤1130,通过利用使记录的口头输入单词与对应于识别的子序列的每个候选字子集的小单词识别器,执行语音识别,以便找出匹配的一个候选字。要认识到通过使口头输入的单词与对应于识别的子序列的候选字子集的候选字相匹配,字识别器能够以独立于说话者的方式,进行非常精确的匹配,因为先前识别的键控代码子序列把该组可能字的大小减小到仅仅是候选字。
当在步骤1110,编辑命令被识别为拼写编辑命令时,在先前由呼叫者或消息接发终端识别的键控代码序列的子序列的控制下,进行编辑。例如,在步骤1110,当识别出拼写编辑命令时,识别可以是对呼叫者的口语字“拼写字三”的响应。响应这些口语字,消息接发终端112识别与第三个字相关的键控代码序列的子序列。随后消息接发终端112在步骤1135提示呼叫者口头输入一系列字母,并在步骤1140记录口头输入的一系列字母。消息接发终端112把每个字母记录为口头输入的。消息接发终端112通过利用使记录的字母与对应于识别的子序列中的下一键控代码的字母相匹配的微小字母识别器,在步骤1145进行每个字母的语音识别。第一个口头输入字母一被记录,消息接发终端112就开始步骤1145,以便使过程加速。要认识到通过使口头输入的字母与识别的子序列相匹配,字母识别器可以独立于说话者的方式,进行非常准确的匹配,因为先前识别的键控代码子序列,把与记录的口头输入字母相比较的该组可能字母的大小,从整个字母表减小到在每次匹配中,对应于键控代码之一的字母的数目。
另一方面,在步骤1130,当语音识别不能足够可靠地把候选字子集的任何候选字识别为口语字时,将自动调用拼写编辑命令。这种情况下,响应步骤1130,如上说明的一样进行步骤1135-1145。
要认识到当执行编辑字命令或编辑拼写命令时,其中进行的语音识别只受呼叫者使用电话机键盘输入的键控代码序列的子序列控制。在字编辑命令的情况下,子序列控制是通过根据子序列确定的候选字进行的。在拼写编辑命令的情况下,子序列控制是通过根据子序列的键控代码确定的字母进行的。
要认识到根据本发明的优选实施例,利用电话机构成字母数字消息的交互式方法,使用可在USA的大多数电话机上找到的标准电话机键盘,根据备选实施例,本发明可容易地被使用。例如,键盘可按照通常用在便携式电话机中的常规方式,借助并行信号与处理器直接相连。在这样的实施例中,产生对应于键盘上的按键被键入的顺序的一系列键控代码,不过,该键控代码是并行二进制代码,而不是DTMF代码。另外,键盘不必是标准的USA电话机键盘,可以是具有另外的按键或者其它语言的字母的键盘。当键盘包括分别代表一个以上的字母数字字符的按键时,可实现本发明的好处。为简便起见,这里把这种键盘称为电话机风格的键盘。当使用另一种语言时,相应地改变词汇数据库。
要认识到按照上面参考图3和4说明的方式存储所需的字母数字消息的整个键控代码序列的操作,允许以一种提供比现有实时解码装置更好的结果的独特方式,例如语音识别,利用前向和后向条件概率确定最可能的短语。另外还要认识到已描述了一组独特的消息校正技术,该组技术提供高效并且自然的消息语音编辑,从而产生呼叫者构造的字母数字消息。
权利要求
1.一种呼叫者利用电话机键盘构成字母数字消息的交互式方法,在消息终端中包括下述步骤存储词汇数据库,从词汇数据库可恢复若干字的单字概率,前向条件概率和后向条件概率;存储接收的键控代码序列,该键控代码序列识别为了输入字母数字消息,按下电话机键盘上的按键的顺序;根据键控代码序列,产生字格架,字格架包括至少一个从词汇数据库恢复的候选字子集;确定具有由存储在词汇数据库的单字概率,前向条件概率和后向条件概率确定的最大组合概率的最可能短语,最可能短语由来自于至少一个候选字子集中的每个候选字子集的一个候选字的组合构成;根据最可能的短语产生最可能的消息,并把该最可能的消息提供给呼叫者;和确认最可能的消息是字母数字消息。
2.按照权利要求1所述的方法,其中由键控代码序列产生字格架的步骤包括下述步骤确定接收的键控代码序列的N个子序列,其中N个子序列是在接收的键控代码序列内,用预定的一组键控代码分离的键控代码子序列;和根据对于N个子序列之一的词汇数据库的输入,从词汇数据库恢复至少一个候选字子集。
3.按照权利要求2所述的方法,其中预定的一组键控代码包括代表标记为#的按键的代码。
4.按照权利要求1所述的方法,其中在确定最可能短语的步骤中,利用下述递归步骤确定最大组合概率计算αi,j,αi,j=max(αi-1,kP(wi,j|WI-10,W1-20,···W10)),1≤k≤Mi-11≤j≤Mi;]]>使每个αi,j和一组可能的i个候选字相联系;计算βi,j,βi,j=max(αi,jβi+1,k(wi,j|WI+10,W1+20,···WQ0)),1≤k≤Mi+11≤j≤Mi;]]>和使每个βi,j和一组可能的Q个候选字相关,其中i标识至少N个子序列之一,j标识至少一个候选字子集之一,其中Q≥N,其中在对于j=1,2,…,Q,执行计算αi,j,并使每个αi,j与一组可能的i个候选字相关的递归步骤之后,对于i=Q,Q-1,…1,执行计算βi,j,并使βi,j与一组可能的Q个候选字相关的递归步骤。
5.按照权利要求4所述的方法,还包括把最可能的短语确定为与max(βi,j),1≤j≤M1相关的该组可能的Q个候选字。
6.一种用呼叫者利用电话机键盘输入的字母数字消息,产生字格架的交互式方法,在消息终端中包括下述步骤存储包括多个字的词汇数据库;存储接收的键控代码序列,该键控代码序列识别为了输入字母数字消息,按下电话机键盘上的按键的顺序;根据键控代码序列,产生字格架,字格架包括至少一个从词汇数据库恢复的候选字子集,产生步骤包括下述步骤确定接收的键控代码序列的N个子序列,其中N个子序列是在接收的键控代码序列内,用预定的一组键控代码分离的键控代码子序列;和根据对于N个子序列之一的词汇数据库的输入,从词汇数据库恢复至少一个候选字子集,当从词汇数据库恢复空的子集时,把N个子序列之一识别为出错子序列,利用出错子序列,执行键盘错误校正。
7.按照权利要求6所述的方法,其中执行键盘错误校正的步骤包括下述步骤通过用一个不同的键控代码代替出错子序列中的键控代码之一,用出错子序列产生一个新的子序列;和在产生步骤之后,根据新的子序列,从词汇数据库恢复一个候选字子集。
8.按照权利要求6所述的方法,其中执行键盘错误校正的步骤包括下述步骤通过删除出错子序列内的键控代码之一,用出错子序列产生一个新的子序列;和在产生步骤之后,根据新的子序列,从词汇数据库恢复一个候选字子集。
9.按照权利要求6所述的方法,其中执行键盘错误校正的步骤包括下述步骤通过在出错子序列内,选择邻近键控代码的插入点,用出错子序列产生一个新的子序列;在插入点插入键控代码;和在插入步骤之后,根据新的子序列,从词汇数据库恢复一个候选字子集。
10.按照权利要求6所述的方法,其中执行键盘错误校正的步骤包括下述步骤选择出错子序列内的两个连续键控代码之间的插入点;在该插入点,把出错子序列分成两个新的子序列;和根据这两个新的子序列,从词汇数据库恢复两个候选字子集。
11.一种呼叫者利用电话机键盘,构成字母数字消息的交互式方法,在消息终端中包括下述步骤存储包括多个字的词汇数据库;存储接收的键控代码序列,该键控代码序列识别为了输入字母数字消息,按下电话机键盘上的按键的顺序;根据键控代码序列,产生字格架,字格架包括至少一个从词汇数据库恢复的候选字子集;确定具有由存储在词汇数据库的概率确定的最大组合概率的最可能短语,最可能短语由来自于至少一个候选字子集中的每个候选字子集的一个候选字的组合构成;根据最可能的短语产生最可能的消息,并把该最可能的消息提供给呼叫者;确认最可能的消息是字母数字消息;和响应确认步骤,当从呼叫者收到消息不是所需的字母数字消息的信息时,编辑该最可能的消息。
12.按照权利要求11所述的方法,其中编辑最可能的消息的步骤还包括下述步骤依据呼叫者的响应,从最可能的消息中确定不正确的候选字,其中该不正确候选字在第一候选字子集中;和按照单字概率的降序,把包括该不正确候选字的第一候选字子集中的其它候选字呈现给呼叫者,每次呈现一个候选字,直到所有候选字都被呈现给呼叫者,或者从呼叫者收到字确认信息时为止。
13.按照权利要求12所述的方法,其中编辑最可能的消息的步骤还包括下述步骤呈现由接收的键控代码序列的子序列中的每个键控代码代表的字母,其中该子序列对应于包括不正确候选字的第一候选字子集,其中每次呈现一个字母地把所有字母呈现给呼叫者;和在呈现所有字母的步骤中,依据一个或多个呼叫者响应,确定每个键控代码的确认字母。
14.按照权利要求11所述的方法,其中编辑最可能的消息的步骤还包括下述步骤呈现下一个可能的消息。
15.按照权利要求11所述的方法,其中编辑最可能的消息的步骤还包括下述步骤首先依据呼叫者的响应,从最可能的消息中确定不正确的候选字,其中该不正确候选字在第一候选字子集中;和按照单字概率的降序,把包括该不正确候选字的第一候选字子集中的其它候选字呈现给呼叫者,每次呈现一个候选字,直到所有候选字都被呈现给呼叫者,或者从呼叫者收到字确认信息时为止。
16.按照权利要求15所述的方法,其中编辑最可能的消息的步骤还包括下述步骤其次当在呈现候选字步骤中,所有的候选字都被呈现给呼叫者时,依据呼叫者的响应,确定候选字的不正确字母;和把和对应于在首次确定步骤中确定的不正确字母的键控代码相关的字母呈现给呼叫者,每次呈现一个字母,直到和该键控代码相关的所有字母都被呈现给呼叫者,或者从呼叫者收到字母确认信息时为止。
17.按照权利要求11所述的方法,其中编辑最可能的消息的步骤还包括下述步骤提示呼叫者说出编辑命令;把该编辑命令识别为一组预定的编辑命令之一;和利用由键控代码序列的子序列控制的语音识别,执行编辑命令。
18.按照权利要求17所述的方法,其中识别编辑命令的步骤包括识别字编辑命令的步骤,其中执行编辑命令的步骤还包括下述步骤响应字编辑命令,提示口头输入单词;记录口头输入的单词;利用使口头输入的单词与对应于该子序列的至少一个候选字子集的候选字匹配的微小字识别器,执行语音识别。
19.按照权利要求18所述的方法,其中执行编辑命令的步骤还包括下述步骤当不能使口头输入的单词与对应于该子序列的至少一个候选字子集的任意候选字相匹配时,提示口头输入一系列字母;记录口头输入的一系列字母;和利用使口头输入的一系列字母与键控代码序列的子序列相匹配的字母识别器,执行语音识别。
20.按照权利要求17所述的方法,其中识别编辑命令的步骤包括识别关于字母数字消息的单词的拼写命令的步骤,其中执行编辑命令的步骤还包括下述步骤响应拼写命令,提供口头输入一系列字母;记录口头输入的一系列字母;和利用使口头输入的一系列字母与键控代码序列的子序列相匹配的字母识别器,执行语音识别。
21按照权利要求11所述的方法,其中在编辑最可能的消息的步骤中,响应操作者的输入,执行编辑。
22.按照权利要求21所述的方法,其中编辑最可能的消息的步骤包括下述步骤响应确认步骤,当从呼叫者收到消息不确认信息时,确定最可能的消息的一个或多个不正确候选字,并把剩余的所有候选字确定为最可能的消息确认候选字;响应确定一个或多个不正确候选字的步骤,要求呼叫者讲出字母数字消息的,对应于一个或多个不正确候选字中的每个候选字的口语字;记录该口语字;和把确认的候选字和口语字呈现给操作者。
23.按照权利要求22所述的方法,其中编辑字母数字消息的步骤还包括下述步骤响应在把候选字和口语字呈现给操作者的步骤之后,操作者做出的输入,产生操作者编辑后的字母数字消息。
24.按照权利要求23所述的方法,其中操作者输入是键盘输入。
25.按照权利要求22所述的方法,其中编辑字母数字消息的步骤还包括下述步骤在把确认的候选字和口语字提供给操作者的步骤之后,在呼叫者和操作者之间建立语音链接;和响应语音链接建立步骤之后,操作者做出的输入,产生操作者编辑后的字母数字消息。
26.按照权利要求25所述的方法,其中在把确认的候选字和口语字呈现给操作者的步骤之后,消息接发终端自动建立语音链接。
27.按照权利要求25所述的方法,其中依据操作者产生的命令,建立语音链接。
28.一种呼叫者利用电话机键盘,构成字母数字消息的交互式方法,在消息终端中包括下述步骤存储包括多个字的词汇数据库;存储接收的键控代码序列,该键控代码序列识别为了输入字母数字消息,按下电话机键盘上的按键的顺序;根据键控代码序列,产生字格架,字格架包括至少一个从词汇数据库恢复的候选字子集;用候选字子集产生字母数字消息,包括下述步骤呈现所有候选字子集中的所有候选字,其中把来自于每个候选字子集的所有候选字呈现给呼叫者,每次呈现一个候选字,以及下述步骤之一依据呈现步骤中的一个或多个呼叫者响应,从第一候选字子集确认候选字,和依据呈现步骤中的一个或多个呼叫者响应,不确认第一候选字子集。
29.按照权利要求28所述的方法,其中产生字母数字消息的步骤还包括下述步骤响应不确认步骤,呈现由接收的键控代码序列的子序列中的所有键控代码代表的所有字母,其中该子序列对应于第一候选字子集,其中每次一个字母地把所有字母呈现给呼叫者;和依据呈现所有字母的步骤中的一个或多个呼叫者响应,确定每个键控代码的确认字母。
全文摘要
一种呼叫者利用电话机键盘构成字母数字消息的交互式方法,包括存储(215)词汇数据库(135)的步骤,可从词汇数据库(135)恢复多个单词;存储接收的键控代码序列(405)的步骤,该键控代码序列代表电话机键盘上的按键被键入的顺序;和产生包括源于该序列和词汇数据库的候选字(415)的字格架的步骤。在本发明的一个方面中,利用存储在词汇数据库中的条件概率,由候选字格架形成最可能的短语(420)。在另一方面中,当在词汇数据库中找不到候选字时,进行键盘错误校正。在另一方面中,当候选字子集的所有候选字都不正确时,呼叫者响应被用于确定正确的单词。
文档编号H04MGK1518829SQ99807356
公开日2004年8月4日 申请日期1999年4月7日 优先权日1998年5月14日
发明者苏伦德拉·皮雷拉, 张路, 黄建成, 罗伯特·J·什温德曼, J 什温德曼, 苏伦德拉 皮雷拉 申请人:摩托罗拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1