移动通信终端、用于其的语音识别方法和记录媒体的制作方法

文档序号:2837429阅读:309来源:国知局
专利名称:移动通信终端、用于其的语音识别方法和记录媒体的制作方法
背景技术
本发明涉及一种移动通信终端、一种用于移动通信终端的语音识别方法以及一种存储用于语音识别程序的记录媒体,通过它可以容易地通过利用语音识别技术(它被通常用于改善移动通信终端的可操作性)搜索和调用用于起动通信的个人详细资料(电话号码、通讯地址、URL(统一资源定位器)等等),保持高的语音识别率。
相关技术的描述近来,语音识别技术被用于移动通信终端(诸如蜂窝电话、PHS电话(在日本)等等),使用户容易地搜索和调用个人详细资料(电话号码、通讯地址、URL等等用于起动和个体等等的通信)。以这样的一种利用语音识别技术的移动通信终端,用户发出命令声音(对应于一个用户想要拜会的个体)给移动通信终端的麦克风等等,借此对应于该个体的电话号码或者电话号码薄被自动地搜索和调用。通过利用语音识别技术,用户避免了为进行呼叫所必需的麻烦的键操作。


图1是一个示出利用语音识别技术的传统的移动通信终端组成的例子的方框图。用户发出姓名等等的语音由语音输入部分1(包括听筒、麦克风或者外部增加的语音输入设备)接收,并且由语音输入部分1输出的语音信号输入给语音识别部分2。语音识别部分2分析和确认该语音信号,并且借此输出语音数据。
由语音识别部分2输出的语音数据由语音搜索处理部分5与语音模式51相比较,从而已经存储在语音搜索处理部分5中而且与该语音数据最相似的语音模式51被恢复。如果相配的语音模式51成功恢复,语音数据对应列表50由存储搜索处理部分3查阅,从而已经在移动通信终端上登记而且和恢复的语音模式51相配的电话号码52被搜索和恢复。搜索电话号码52的结果可以显示在显示部分4上。此后,用户可以使用恢复的电话号码52并且经通信控制部分6、发送/接收部分7和天线8进行呼叫。
然而,上述已经解释的传统的移动通信终端包含下面的问题或者缺点。
第一,当登记和存储在移动通信终端中的语音模式51的数目变大时,迫使移动通信终端的语音识别率恶化。当大量的语音模式51已经在移动通信终端上登记,并且一个被搜索的语音模式51和由用户发出的语音相配时,错误恢复(错误地恢复一个不同的和类似的语音模式)的概率变得很高。因此,为了确保高的语音识别率,必须安排在移动通信终端上登记的语音模式51数目的某个上限。
第二,当今移动通信终端的应用是多样化的,并且移动通信终端不仅正用于进行打电话,而且用于发送电子邮件、进行访问因特网等等。在这样的情况下,正在探求免除用户麻烦的键操作的措施。为了解决该问题,假若上述的语音识别技术被用于移动通信终端,并且假若仅使用一种语音数据对应列表,用于连接到因特网和电子邮件的个人详细资料(URL和电子邮件地址)连同电话号码被运用,仍然有很多的语音模式必须在语音数据对应列表上登记,迫使语音识别率被进一步恶化。为了保持高的语音识别率,必须大大降低登记的语音模式(或者登记的个体)的数目。
第三,语音模式不能与两个或多个措词或功能有关。如果两个或多个功能被分配给一个语音模式,在该功能之间可能出现冲突。
发明概述因此本发明的主要目的是提供一种移动通信终端、一种用于移动通信终端的语音识别方法以及一种存储用于语音识别程序的记录媒体,通过它可以容易地通过利用语音识别技术搜索和调用于起动通信的个人详细资料(电话号码、通讯地址、URL等等),保持高的语音识别率。
按照本发明的第一个方面,提供有一种包括语音模式/电话号码薄登记装置(5)、语音输入装置(1)、语音识别装置(2)以及存储器搜索处理装置(3)的移动通信终端。在语音模式/电话号码薄登记装置(5)中,登记电话号码薄(55),其每个电话号码薄包括各种型式用于起动和目标通信的数据(52、53、54),以及对应于电话号码薄(55)登记语音模式。语音输入装置(1)接收用户指定通信目标的语音,并且从而输出语音信号。语音识别装置(2)分析和确认由语音输入装置(1)输出的语音信号 ,并且从而获得语音数据,比较获得的语音数据和已经在语音模式/电话号码薄登记装置(5)中登记的语音模式(51),以及从而搜索和恢复与获得的语音数据相配或者接近匹配的语音模式(51)。存储器搜索处理装置(3)调用已经在对应于语音模式(51)由语音识别装置(2)取回的语音模式/电话号码薄登记装置(5)上登记的电话号码薄(55)。
按照本发明的第二个方面,在第一个方面中,电话号码薄(55)至少包括电话号码52)、通讯地址(53)和URL(统一资源定位器)(54)。
按照本发明的第三个方面,在第一个方面中,移动通信终端进一步包括一个数据类型指定装置(92、93、94)。该数据类型指定装置(92、93、94)使用户指定从电话号码薄(55)的各种型式的数据(52、53、54)中被调用的数据的类型。
按照本发明的第四个方面,在第一个方面,存储器搜索处理装置(3)基于移动通信终端的操作激活状态自动地指定被从电话号码薄(55)的各种型式的数据(52、53、54)中调用数据的类型。
按照本发明的第五个方面,在第一个方面中,该移动通信终端进一步包括用于显示由存储器搜索处理装置(3)调用的电话号码薄(55)的数据的显示装置(4)。
按照本发明的第六个方面,在第一个方面中,移动通信终端进一步包括一个用于自动地起动和由用户通过利用由存储器搜索处理装置(3)调用的电话号码薄的数据指定的目标的通信的通信起动装置(6、7、8)。
按照本发明的第七个方面,提供了一种包括语音模式/数据登记装置(5)、数据类型指定装置(92、93、94 3)、语音输入装置(1)、语音识别装置(2)以及存储器搜索处理装置(3)的移动通信终端。在语音模式/数据登记装置(5)中,登记用于起动和目标通信的各种型式的数据(52、53、54),并且对应于每个数据(52、53、54)的语音模式对于每个数据类型(52、53、54)独立地登记。数据类型指定装置(92、93、94、3)用于指定被调用的数据的类型(52、53、54)。语音输入装置(1)接收用户指定通信目标的语音,并且从而输出语音信号。语音识别装置(2)分析和确认由语音输入装置(1)输出的语音信号,并且从而获得语音数据,以通过数据类型指示装置(92、93、94、3)指定的数据类型(52、53、54)已经在语音模式/数据登记装置中登记的语音模式(51)比较获得的语音数据,以及从而搜索和取回与获得的语音数据相配或者接近匹配的语音模式(51)。存储器搜索处理装置(3)调用由已经在对应于由语音识别装置(2)取回的语音模式(51)的语音模式/数据登记装置(5)上登记的数据类型指定装置(92、93、94、3)指定的数据(52、53、54)的类型。
按照本发明的第八个方面,在第七个方面中,各种型式的数据(52、53、54)至少包括电话号码(52)、通讯地址(53)和URL(统一资源定位器)(54)。
按照本发明的第九个方面,在第七个方面中,数据类型指定装置(92、93、94)使用户指定被调用数据的类型。
按照本发明的第十个方面,在第七个方面中,数据类型指定装置(92、93、94)基于移动通信终端的操作激活状态自动地指定被调用数据的类型。
按照本发明的第十一个方面,在第七个方面中,移动通信终端进一步包括用于显示由存储器搜索处理装置(3)调用的数据的显示装置(4)。
按照本发明的第十二个方面,在第七个方面中,移动通信终端进一步包括一个用于自动地起动和由用户通过利用由存储器搜索处理装置(3)调用的数据指定的目标的通信的通信起动装置(6、7、8)。
按照本发明的第十三个方面,提供了一种用于移动通信终端的语音识别方法,包括语音模式/电话号码薄登记步骤、语音输入步骤、语音识别步骤以及存储器搜索步骤。在语音模式/电话号码薄登记步骤中,登记电话号码薄(55),其中每个包括用于起动和通信目标通信的各种型式的数据(52、53、54),以及登记对应于电话号码薄(55)的语音模式(51)。在语音输入步骤中,接收用户指定通信目标的语音,并且从而产生语音信号。在语音识别步骤中,分析和认可在语音输入步骤产生的语音信号,并且从而获得语音数据,获得的语音数据与已经在语音模式/电话号码薄登记步骤中登记的语音模式(51)相比较,以及从而搜索和取回与获得的语音数据相配或者接近匹配的语音模式(51)。在存储器搜索步骤中,呼叫对应于在语音识别步骤取回的语音模式(51),已经在语音模式/电话号码薄登记步骤上登记的电话号码薄(55)。
按照本发明的第十四个方面,在第十三个方面中,电话号码薄(55)至少包括电话号码(52)、通讯地址(53)和URL(统一资源定位器)(54)。
按照本发明的第十五个方面,在第十三个方面中,用于移动通信终端的语音识别方法进一步包括一个数据类型指定步骤。在数据类型指定步骤中,从电话号码薄(55)的各种型式的数据(52、53、54)中调用的数据的类型由用户指定。
按照本发明的第十六个方面,在第十三个方面中,在存储器搜索步骤中,从电话号码薄(55)的各种型式的数据(52、53、54)中调用的数据的类型基于移动通信终端的操作激活状态被自动地指定。
按照本发明的第十七个方面,在第十三个方面中,用于移动通信终端的语音识别方法进一步包括一个显示步骤。在显示步骤中,显示在存储器搜索步骤调用的电话号码薄(55)的数据。
按照本发明的第十八个方面,在第十三个方面中,用于移动通信终端的语音识别方法进一步包括一个通信起动步骤。在通信起动步骤中,通过利用在存储器搜索步骤调用的电话号码薄(55)的数据自动地起动和由用户指定的目标的通信。
按照本发明的第十九个方面,提供了一种用于移动通信终端的语音识别方法,包括语音模式/数据登记步骤、数据类型指定步骤、语音输入步骤、语音识别步骤以及存储器搜索步骤。在语音模式/数据登记步骤中,登记用于起动和目标通信的各种型式的数据(52、53、54),并且对应于每个数据(52、53、54)的语音模式对于每个数据类型(52、53、54)独立地登记。在数据类型指定步骤中,指定被调用的数据的类型(52、53、54)。在语音输入步骤中,接收用户指定通信目标的语音,并且从而产生语音信号。在语音识别步骤中,分析和认可在语音输入步骤产生的语音信号,并且从而获得语音数据,获得的语音数据对于在数据类型指定步骤指定的数据类型(52、53、54)与已经在语音模式/电话号码薄登记步骤中登记的语音模式(51)相比较,以及从而搜索和取回与获得的语音数据相配或者接近匹配的语音模式(51)。在存储器搜索步骤中,调用在数据类型指示步骤指定的数据(52、53、54)的类型,该数据类型已经在语音模式/数据登记步骤登记,对应于在语音识别步骤恢复的语音模式(51)。
按照本发明的第二十个方面,在第十九方面中,各种型式的数据(52、53、54)至少包括电话号码(52)、通讯地址(53)和URL(统一资源定位器)(54)。
按照本发明的第二十一个方面,在第十九个方面中,被调用的数据的类型是由用户在数据类型指定步骤指定的。
按照本发明的第二十二个方面,在第十九方面中,被调用的数据的类型是基于移动通信终端的操作激活状态在数据类型指定步骤自动地指定的。
按照本发明的第二十三个方面,在第十九方面中,用于移动通信终端的语音识别方法进一步包括一个显示步骤。在显示步骤中,显示在存储器搜索步骤调用的数据。
按照本发明的第二十四个方面,在第十九方面中,用于移动通信终端的语音识别方法进一步包括一个通信起动步骤。在通信起动步骤中,通过利用在存储器搜索步骤调用的数据自动地起动和由用户指定的目标的通信。
按照本发明的第二十五个至第三十六个方面,提供了存储用于命令移动通信终端的计算机、MPU(Microprocessor Unit微处理机单元)等等去执行本发明的第十三个至第二十四个方面的语音识别方法的程序的机器可读的记录介质。
附图的简要说明从下面结合伴随的附图的详细说明中,本发明的目的和特点将变得更明显,其中图1是一个示出利用语音识别技术的传统的移动通信终端组成的例子的方框图;图2是一个示出按照本发明的第一个实施例的移动通信终端的组成例子的方框图;图3是一个示出用于第一实施例的移动通信终端的语音数据对应列表例子的列表;图4是一个示出按照本发明的第二个实施例的移动通信终端的组成例子的方框图;和图5是一个示出用于第二实施例的移动通信终端的语音数据对应列表例子的列表。
优选实施例的详细说明现在参考附图将给出按照本发明的优选实施例的详细说明。图2是一个示出按照本发明的第一个实施例的移动通信终端的组成例子的方框图。第一个实施例的移动通信终端包括语音输入部分1、语音识别部分2、存储器搜索处理部分3、显示部分4、语音搜索处理部分5、通信控制部分6、发送/接收部分7、天线8以及按键操作部分9。
包括听筒、麦克风或者外部地增加的语音输入设备的语音输入部分1具有电传送用户的语音给语音识别部分2的功能。换句话说,语音输入部分1接收用户的语音,并且输出语音信号给语音识别部分2。语音识别部分2接收来自语音输入部分1的语音信号,通过分析和认可该语音信号获得语音数据,并且以一个或多个已经登记和存储在语音搜索处理部分5中语音模式51比较该获得的语音数据。
存储器搜索处理部分3从多个已经登记和存储在语音搜索处理部分5中的电话号码薄55当中搜索电话号码薄55(专用个人的数据)。对于每个个体产生各自的电话号码薄55,并且在每个电话号码薄55中,登记诸如电话号码52、通讯地址(电子邮件地址)53、URL(统一资源定位器)54等等个人专用的数据。
为了应付用于和个人通信的措施的多样化,电话号码薄55被提供给移动通信终端。虽然用于和个人通信的措施过去限于电话、邮政邮件等等,随因特网、电子邮件和主页(在个人的主页上留下消息)的爆炸发展已经作为通信措施风靡。因此,各种各样的个人详细资料(电话号码52、通讯地址53、URL 54等等)必须作为每个个体的联络地址登记。如在现有技术中,如果语音模式51直接与一块个人详细资料(电话号码52、通讯地址53或者URL 54)有关,在移动通信终端上登记的语音模式51的数目容易超出上述的确保高的语音识别率的上限。另一方面,通过利用电话号码薄55,获得在语音模式51和一个个体之间的一一对应的关系,从而可以降低必须在移动通信终端上登记的语音模式51的数目。
语音搜索处理部分5存储在语音模式51(它将稍后详细说明)和电话号码薄55之间一对一的语音数据对应列表。语音搜索处理部分5也存储电话号码薄55,每个对应于每个个体。每个电话号码薄55对应于一个包括如先前提到的电话号码52、通讯地址(电子邮件地址)53、URL 54等等的个体。如将在下面解释的,被搜索和调用的个人详细资料(电话号码52、通讯地址53、URL 54等等)的类型由用户对按键操作部分9的键操作(按键操作)确定。对应于由语音识别部分2恢复的语音模式51的搜索电话号码薄55的结果由存储器搜索处理部分3显示在显示部分4上。
按键操作部分9装备有电话机按键92、邮件按键93和因特网按键94。语音搜索处理部分5被通知按键92、93和94(或者由于按键操作,移动通信终端的状态的变化)的开/关状态。通过使用按键92、93和94,可以指定被调用的数据的类型(电话号码52、通讯地址53、URL 54等等)。如果它们可以独立地操作,电话机按键92、邮件按键93和因特网按键94可以分配给移动通信终端的任意按键。
数据类型的指定还可以不使用按键92、93和94,也就是说,通过使语音搜索处理部分5知道移动通信终端当前的工作方式。例如,当移动通信终端处于其标准模式之中时,电话号码52被自动地指定和调用。当已经激活一个邮件软件时,通讯地址53被自动地指定和调用。当已经激活一个浏览器时,URL54被自动地指定和调用。基于搜索个人详细资料的结果,通过利用通信控制部分6、发送/接收部分7和天线8起动通信(呼叫方,发送电子邮件或者访问因特网)。
在下文中,将参考图2和图3解释一种使用这个实施例的移动通信终端的语音识别方法。图3是一个示出用于第一实施例的移动通信终端的语音数据对应列表例子的列表。
首先,移动通信终端的用户发出一个用户想要接通的人的姓名等等声音。用户的语音由语音输入部分1的听筒、麦克风等等接收,并且接收的语音信号被转送到语音识别部分2。语音识别部分2通过分析和认可该语音信号获得语音数据,并且以一个或多个已经登记和存储在语音搜索处理部分5中的语音模式51比较该获得的语音数据。
具体地,语音识别部分2利用基于FFT(Fast Fourier Transform快速傅里叶变换)、LPC(Linear Predictive Coding线性预测编码)等等的数字信号处理从语音波形信号中提取特征,以及借助于随机的/统计方法和准备的语音模式51比较该提取的特征。
准备的语音模式51是对应于“假名”(日文音节)、字母等等的标准的和用作参考的语音模式。标准的语音模式是通过从很多扬声器的语音采样中估计HMM(隐藏的马尔可夫模型)随机参数产生的。
用户先前对应于诸如“SATO”、“SUZUKI”、“WATANABE”"等等姓名登记文本信息。由用户说的话以及先前登记的语音模式51不局限于准确的姓名,还可以是绰号等等。如果提供给语音搜索处理部分5编辑功能,对应于一个个体已经登记的语音模式51可以容易地被改变。当两个或更多个体具有相同的附加的姓名(或者教名)必须登记时,这样一个编辑功能是有用的。
先前在语音搜索处理部分5中登记的语音模式51还可以通过利用在语音搜索处理部分5中的词典(它包括音标)产生。在这样的情况下,对应于登记的文本信息(诸如“Johnson”)的音标被从词典中取回,并且对应于该文本信息的语音模式51被使用该音标产生,使得在语音搜索处理部分5上登记。如果用于话的语音模式被固有地包括在词典中,对应于文本信息的语音模式51可以直接被从该词典中取回。通过记录用户发出姓名等等的声音的语音直接获得语音模式51,同样可能实现语音模式51的登记。
在由语音识别部分2的对比中,如果获得的语音数据和已经在语音搜索处理部分5上登记的语音模式51相配或者几乎相配,在图3中示出的语音数据对应列表50被使用语音模式51查阅。通过查阅语音数据对应列表50,一个登记的电话号码薄55被调用。从语音数据对应列表50中恢复的电话号码薄55由存储器搜索处理部分3传导。搜索电话号码薄55的结果由显示部分4显示给用户。偶然地,在语音模式51和电话号码薄55之间存在一一对应的关系,因此不存在两个或更多被调用的电话号码薄55用于一个语音模式51这样的情况。
如何从语音模式51中调用上述的各种各样的个人详细资料将参考图3解释。在这个实施例中,每个语音模式51对应于电话号码薄55的姓名。在通过利用语音模式51经语音数据对应列表50的检索找到的电话号码薄55中,电话号码52、通讯地址53和URL 54已经作为个人详细资料登记。
当按钮操作部分9的电话机按键92由用户按下时,语音被输入给语音输入部分1,对应于该语音的电话号码52被搜索和调用。例如,如果用户发出“SATO”声音,定名为“SATO”的电话号码薄55被搜索和找出,因此电话号码52“XXXXXX-XXXX”被调用。在这种情况下,对应于“SATO”的其他类型的个人详细资料(通讯地址53、URL 54)不被调用。如果对应于“SATO”在已经取回的电话号码薄55中没有登记的电话号码52,由显示部分4显示一条诸如“没有登记的电话号码”的消息。同样当邮件按键93或者因特网按钮94被由用户按下时,对应于该按钮的特定的数据的类型(通讯地址53、URL 54)被类似地调用。
虽然在上述的解释中,用于指定被调用的个人详细资料类型的“电话机按键”92、“邮件按键”93和“因特网按键”94被提供给移动通信终端,但是按键的名称和被调用的个人详细资料的类型是未特别地限制的。按键不局限于开/关闭按键。如果数据类型指定是合理的,分配任意类型的按键是可允许的。如在以前提到的,基于当前的移动通信终端(例如当已经激活浏览器时调用URL 54)的操作方式(操作激活状态),同样可允许的实现自动地数据类型指定。在此情况下,对于数据类型指定的按键操作变成为不必要的。
在特定的类型的个人详细资料被调用以后,该个人详细资料可以显示在显示部分4上。按照呼叫或者取回的个人详细资料,通过利用通信控制部分6、发送/接收部分7和天线8起动通信(呼叫方,发送电子邮件或者访问因特网)。在下文中,将参考附图解释按照本发明的第二个实施例的移动通信终端。图4是一个示出按照本发明的第二个实施例的移动通信终端的组成例子的方框图。第二个实施例的移动通信终端具有一个与第一个实施例的语音搜索处理部分5不同的语音搜索处理部分5A。该移动通信终端的其他的部分是与第一个实施例的那些相同的,因此为了简便起见省略其重复说明。
在第二个实施例的语音搜索处理部分5A中,语音模式是存储在三个列表中列表512存储用于呼叫电话号码52的语音模式#1;列表513存储用于呼叫通讯地址53的语音模式#2;以及列表514存储用于呼叫URL 54的语音模式#3。在一个列表(512、513、514)中登记(存储)两个或多个同样的语音模式51是禁止的。在不同的列表中登记两个或多个同样的语音模式51是可允许的。
图5是一个示出用于第二实施例的移动通信终端的语音数据对应列表例子的列表。参考图5,基于由用户对按键操作部分9的按键操作,选择包括在语音数据对应列表50A中的列表512、513和514的一个,因此想要的个人详细资料(电话号码52、通讯地址53或者URL 54)被调用。虽然在第一个实施例中仅使用一个列表,在第二实施例中使用N个(N≥2)列表,N个列表对应于N个类型(N个数据类型)。在图5的例子中,对应于电话号码52、通讯地址53和URL 54使用三个列表。搜索个人详细资料旨在一次选择一个列表,因此可以保持高的语音识别率。
例如,当按钮操作部分9的邮件按键93被用户按下时,存储语音模式2的列表513被激活。如果用户对语音输入部分1发出“SUZUKI”声音,可以调用通讯地址“suzuki@yy.ne.jp”。如先前提到的,基于移动通信终端的当前的操作方式(操作激活状态)还可以进行数据类型指定(从列表512、513和514选择列表),而无需使用按键操作部分9(例如当已经激活一个电子邮件软件时,激活存储语音模式2的列表513)。
在第一个实施例中,通过搜索对应于一个个体的电话号码薄55被调用,因此,存在没有个人详细资料被调用的情况(如果呼叫的电话号码薄55的三个数据类型的一个或多个是空的,作为在图3的电话号码薄“SUZUKI”没有URL54)。另一方面,在第二个实施例中,其中语音模式对于每个数据类型登记,如果语音模式可以通过语音识别选择和取回,个人详细资料是必须地调用的。因此,与第一个实施例相比可以登记为语音呼叫目标的数据的总数可以增加。
在第二个实施例中,因为语音模式通过利用多个列表达成,可以在移动通信终端上登记的语音模式的总数是大于第一个实施例的那些的。类似于第一个实施例,当保持高的语音识别率时,第二个实施例的移动通信终端可以管理大量的个人详细资料。与传统的利用语音识别技术的移动通信终端相比本实施例的移动通信终端已经改善了可操作性,因为可以降低在语音识别中的误差概率或者错误恢复(错误地取回不同的和类似的语音模式),因此可以可靠地起动通信。
已经如上所述的语音识别方法可以通过利用计算机程序实施。通过利用磁记录介质、光学记录介质、半导体记录介质等等,这样的程序可以分配和提供给移动通信终端,或者可以通过利用FTPs(文件传送协议)经网络下载给移动通信终端。
虽然参考特定的说明性的实施例已经描述了本发明,不限制于那些实施例,而是仅仅借助于附加的权利要求。应该理解,那些本领域技术人员可以改变或者修改实施例,而不脱离本发明的范围和精神。
例如,在上述的实施例中,虽然三个项目(电话号码、通讯地址和URL)包括在个人详细资料类型中,近来许多人除了安装在家庭中的固定电话之外拥有诸如蜂窝电话的移动通信终端。因此,同样允许分解项目“电话号码62”为“固定电话号码”和“蜂窝电话号码”,因此利用四个项目(固定电话号码、蜂窝电话号码、通讯地址和URL)。
同样允许让用户在项目“电话号码52”中既登记固定电话号码又登记蜂窝电话号码,并且当电话机按钮92被用户按下时,让两个电话号码都调用。在这种情况下,这两个电话号码显示在显示部分4上,由用户选择的一个电话号码被拨号。如果对于呼叫方没有响应,如果用户想要的话,可以拨另一个电话号码。当使用第一个电话号码(由用户选择的)对于呼叫方没有响应时,同样允许使用第二个电话号码自动地执行呼叫方。
虽然在上述的说明中已经使用措词“个体”、“个人”、“个人详细资料”等等,数据登记和通信的目标当然不限于个体。公司、政府机关、商店、学院、团体等等的数据(电话号码52、通讯地址53、URL 54等等)同样可以在按照本发明的移动通信终端中登记和使用,用这些数据允许通信。
如在上文中提出的,在按照本发明用于移动通信终端的移动通信终端和语音识别方法中,用于起动通信的两个或更多的数据的类型可以通过利用语音模式调用。借助于按键操作或者基于移动通信终端的操作激活状态,想要的数据类型(电话号码、通讯地址、URL等等)的数据可以有选择地和独立地被调用。因此,用户免除了麻烦的操作和具有多样化通信功能的移动通信终端低的可操作性。
即使在移动通信终端上登记的个体等等的数据数目变得很大,由于必须在移动通信终端上登记的语音模式数目被产生相对很小,可以保持高的语音识别率。在第一个实施例中,必须在移动通信终端上登记的语音模式数目通过在一一对应的关系中登记每个语音模式(它用于语音识别)和包括各种型式数据的电话号码薄。在第二个实施例中,语音模式对于每个数据类型独立地登记。
权利要求
1.一种移动通信终端,包括一个语音模式/电话号码薄登记装置,其中登记有电话号码薄,并且语音模式对应于登记的电话号码薄;一个语音输入装置,用于接收用户指定通信目标的语音,并且从而输出语音信号;一个语音识别装置,用于分析和认可由语音输入装置输出的语音信号,并且从而获得语音数据,以已经在语音模式/电话号码薄登记装置中登记的语音模式比较获得的语音数据,以及从而搜索和恢复和获得的语音数据相配或者接近匹配的语音模式;和一个存储搜索处理装置,用于调用对应于由语音识别装置恢复的语音模式已经在语音模式/电话号码薄登记装置上登记的电话号码薄。
2.一种根据权利要求1要求的移动通信终端,其中电话号码薄至少包含电话号码、邮件地址以及URL(统一资源定位器)。
3.一种根据权利要求1要求的移动通信终端,进一步包括一个数据类型指示装置,用于使用户指定从电话号码薄的各种型式的数据中调用的数据的类型。
4.一种根据权利要求1要求的移动通信终端,其中存储搜索处理装置基于移动通信终端的应用激活状态自动地指定从电话号码薄的各种型式数据调用的数据的类型。
5.一种根据权利要求1要求的移动通信终端,进一步包括一个显示装置,用于显示由存储搜索处理装置调用的电话号码薄的数据。
6.一种根据权利要求1要求的移动通信终端,进一步包括一个通信起动装置,用于通过利用由存储搜索处理装置调用的电话号码薄数据自动地起动和由用户指定的目标的通信。
7.一种移动通信终端,包括一个语音模式/数据登记装置,其中登记用于起动和目标通信的各种型式的数据,并且语音模式独立地对应于对于每个数据类型登记的每个数据;一个数据类型指示装置,用于指示被调用的数据的类型;一个语音输入装置,用于接收用户指定通信目标的语音,并且从而输出语音信号;一个语音识别装置,用于分析和认可由语音输入装置输出的语音信号,并且从而获得语音数据,以通过数据类型指示装置指定的数据类型已经在语音模式/数据登记装置中登记的语音模式比较获得语音数据,以及从而搜索和恢复和获得的语音数据相配或者接近匹配的语音模式;和一个存储搜索处理装置,用于调用由数据类型指示装置指定的数据的类型,数据的类型对应于由语音识别装置恢复的语音模式已经在语音模式/数据登记装置上登记。
8.一种根据权利要求7要求的移动通信终端,其中各种型式的数据至少包含电话号码、邮件地址以及URL(统一资源定位器)。
9.一种根据权利要求7要求的移动通信终端,其中数据类型指示装置使用户指定被调用的数据的类型。
10.一种根据权利要求7要求的移动通信终端,其中数据类型指示装置基于移动通信终端的应用激活状态自动地指定被调用数据的类型。
11.一种根据权利要求7要求的移动通信终端,进一步包括一个显示装置,用于显示由存储搜索处理装置调用的数据。
12.一种根据权利要求7要求的移动通信终端,进一步包括一个通信起动装置,用于通过利用由存储搜索处理装置调用的数据自动地起动和由用户指定的目标的通信。
13.一种用于移动通信终端的语音识别方法,包括步骤一个语音模式/电话号码薄登记步骤,其中登记电话号码薄,每个包含登记用于起动和通信目标通信的各种型式数据,以及登记对应于电话号码薄的语音模式;一个语音输入步骤,其中接收用户指定通信目标的语音,并且从而产生语音信号;一个语音识别步骤,其中分析和认可在语音输入步骤产生的语音信号,并且从而获得语音数据,以已经在语音模式/电话号码薄登记步骤中登记的语音模式比较获得的语音数据,以及从而搜索和恢复与获得的语音数据相配或者接近匹配的语音模式;和一个存储搜索步骤,其中调用对应于在语音识别步骤恢复的语音模式已经在语音模式/电话号码薄登记步骤上登记的电话号码薄。
14.一种如在权利要求13要求的用于移动通信终端的语音识别方法,其中电话号码薄至少包含电话号码、邮件地址以及URL(统一资源定位器)。
15.一种如在权利要求13要求的用于移动通信终端的语音识别方法,进一步包括一个数据类型指示步骤,其中被调用数据的类型由用户从电话号码薄的各种型式数据中指定。
16.一种如在权利要求13要求的用于移动通信终端的语音识别方法,其中在存储搜索步骤中,基于移动通信终端的应用激活状态从电话号码薄的各种型式数据中自动地指定被调用的数据的类型。
17.一种如在权利要求13要求的用于移动通信终端的语音识别方法,进一步包括显示步骤,其中显示在存储搜索步骤调用的电话号码薄数据。
18.一种如在权利要求13要求的用于移动通信终端的语音识别方法,进一步包括一个通信起动步骤,其中通过利用在存储搜索步骤调用的电话号码簿数据自动地起动和由用户指定的目标的通信。
19.一种用于移动通信终端的语音识别方法,包括步骤一个语音模式/数据登记步骤,其中登记用于起动和目标通信的各种型式的数据,并且语音模式独立地对应于对于每个数据类型登记的每个数据;一个数据类型指示步骤,其中指示被调用的数据的类型;一个语音输入步骤,其中接收用户指定通信目标的语音,并且从而产生语音信号;一个语音识别步骤,其中分析和认可在语音输入步骤产生的语音信号,并且从而获得语音数据,以对于在数据类型指示步骤中指定的数据类型已经在语音模式/数据登记步骤登记的语音模式比较获得的语音数据,以及从而搜索和恢复与获得的语音数据相配或者接近匹配的语音模式;和一个存储搜索处理步骤,其中调用在数据类型指示步骤指定的数据类型,该数据类型已经在语音模式/数据登记步骤登记,对应于在语音识别步骤恢复的语音模式。
20.一种如在权利要求19要求的用于移动通信终端的语音识别方法,其中各种型式的数据至少包含电话号码、邮件地址以及URL(统一资源定位器)。
21.一种如在权利要求19要求的用于移动通信终端的语音识别方法,其中被调用的数据的类型由用户在数据类型指示步骤指定。
22.一种如在权利要求19要求的用于移动通信终端的语音识别方法,其中数据类型指示步骤中基于移动通信终端的应用激活状态自动地指定被调用数据的类型。
23.一种如在权利要求19要求的用于移动通信终端的语音识别方法,进一步包括显示步骤,其中显示在存储搜索步骤调用的数据。
24.一种如在权利要求19要求的用于移动通信终端的语音识别方法,进一步包括一个通信起动步骤,其中通过利用在存储搜索步骤调用的数据自动地起动和由用户指定的目标的通信。
25.一种存储用于命令移动通信终端的计算机、微处理器单元(Microprocessor Unit)等等去执行语音识别处理的机器可读的记录媒体,其中语音识别处理包括步骤一个语音模式/电话号码薄登记步骤,其中登记电话号码薄,每个包含登记用于起动和通信目标通信的各种型式数据,以及登记对应于电话号码薄的语音模式;一个语音输入步骤,其中接收用户指定通信目标的语音,并且从而产生语音信号;一个语音识别步骤,其中分析和认可在语音输入步骤产生的语音信号,并且从而获得语音数据,以已经在语音模式/电话号码薄登记步骤中登记的语音模式比较获得的语音数据,以及从而搜索和恢复与获得的语音数据相配或者接近匹配的语音模式;和一个存储搜索步骤,其中调用对应于在语音识别步骤恢复的语音模式已经在语音模式/电话号码薄登记步骤上登记的电话号码薄。
26.一种如在权利要求25要求的机器可读的记录媒体,其中电话号码薄至少包含电话号码、邮件地址以及URL(统一资源定位器)。
27.一种如在权利要求25要求的机器可读的记录媒体,其中语音识别处理进一步包括一个数据类型指示步骤,其中被调用的数据的类型由用户从电话号码薄的各种型式的数据中指定。
28.一种如在权利要求25要求的机器可读的记录媒体,其中在存储器查找步骤中,基于移动通信终端的应用激活状态从电话号码薄的各种型式数据中自动地指定被调用的数据的类型。
29.一种如在权利要求25要求的机器可读的记录媒体,其中语音识别处理进一步包括显示步骤,其中显示在存储搜索步骤调用的电话号码薄数据。
30.一种如在权利要求25要求的机器可读的记录媒体,其中语音识别处理进一步包括一个通信起动步骤,其中通过利用在存储搜索步骤调用的电话号码薄数据自动地起动和由用户指定的目标的通信。
31.一种存储用于命令移动通信终端的计算机、微处理器单元(Microprocessor Unit)等等去执行语音识别处理的机器可读的记录媒体,其中语音识别处理包括步骤一个语音模式/数据登记步骤,其中登记用于起动和目标通信的各种型式的数据,并且语音模式独立地对应于对于每个数据类型登记的每个数据;一个数据类型指示步骤,其中指示被调用的数据的类型;一个语音输入步骤,其中接收用户指定通信目标的语音,并且从而产生语音信号;一个语音识别步骤,其中分析和认可在语音输入步骤产生的语音信号,并且从而获得语音数据,以对于在数据类型指示步骤中指定的数据类型已经在语音模式/数据登记步骤登记的语音模式比较获得的语音数据,以及从而搜索和恢复与获得的语音数据相配或者接近匹配的语音模式;和一个存储搜索处理步骤,其中调用在数据类型指示步骤指定的数据类型,该数据类型已经在语音模式/数据登记步骤登记,对应于在语音识别步骤恢复的语音模式。
32.一种如在权利要求31要求的机器可读的记录媒体,其中各种型式的数据至少包含电话号码、邮件地址以及URL(统一资源定位器)。
33.一种如在权利要求31要求的机器可读的记录媒体,其中被调用的数据的类型由用户在数据类型指示步骤指定。
34.一种如在权利要求31要求的机器可读的记录媒体,其中数据类型指示步骤中基于移动通信终端的应用激活状态自动地指定被调用数据的类型。
35.一种如在权利要求31要求的机器可读的记录媒体,其中语音识别处理进一步包括显示步骤,其中显示在存储搜索步骤调用的数据。
36.一种如在权利要求31要求的机器可读的记录媒体,其中语音识别处理进一步包括一个通信起动步骤,其中通过利用在存储搜索步骤调用的数据自动地起动和由用户指定的目标的通信。
全文摘要
一个语音输入部分接收指定姓名等等的用户的语音,并且输出语音信号给语音识别部分。语音识别部分分析和确认语音信号,以及借此获得语音数据。语音数据与已经在移动通信终端上对应于个体等等登记的语音模式相比较,并且借此最和该语音数据相匹配的语音模式被搜索和恢复。如果成功恢复一个相配的语音模式,存储搜索处理部分查阅语音数据对应列表,并且借此相应于恢复的语音模式调用已经登记的电话号码薄。在每个电话号码薄中,一个个体等的各种型式的数据(电话号码、邮件地址、URL等等)用于起动先前已经登记的通信。被调用数据的类型通过按钮操作等等来指定。当电话号码薄被调用时,指定的数据类型被从电话号码薄调用,并且用于起动通信。通过电话号码薄的使用,即使登记的数据数目增加,可以保持高的语音识别率,借此可以改善移动通信终端的可操作性。
文档编号G10L15/00GK1371228SQ01130188
公开日2002年9月25日 申请日期2001年12月24日 优先权日2000年12月25日
发明者长岛由寿 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1