带有可下载话音命令集的话音控制的遥控装置的制作方法

文档序号：71268阅读：558来源：国知局

专利名称:带有可下载话音命令集的话音控制的遥控装置的制作方法
技术领域：
本发明总地涉及一个具有语音接口的遥控装置，以及更具体地涉及一个用于观看和收集信息及电影的电视机或者电子设备的遥控装置。
背景技术：
必须在遥控装置中实施的特征(诸如实施的语音识别)的数目不断增加。今天遥控装置不再控制仅仅一个电子设备。而是一个遥控装置被用于去控制不同的电子设备，诸如电视机、VCR和圆盘式卫星接收机。那些电子设备通过实施更有价值的、类似例如图文电视和互联网通信能力的特征而正变得越来越复杂。因而遥控装置可执行的命令数目也不断增加。特征和命令的增加一般会导致键盘上越来越多的键，这会使遥控装置更大和更笨重。
语音识别看来是对上述问题的解决方案。而语音识别本身的问题是语音识别算法非常消耗存储空间。所以遥控装置仅能够识别几个口头命令。近来已经开发出一种话音操作的遥控系统，它采用话音控制命令，以取代通过键输入的控制命令。该话音操作的遥控系统有一个装在发送器上用于将话音命令转换成电子话音信号的话筒，以及用于生成对应于由话音信号代表的话音模式的遥控信号的语音识别LSI(大规模集成)电路。这样生成的遥控信号被传送到受控电子设备中的接收器。在该系统中，事先登记有对应于由操作员给出的话音命令的标准模式数据。这个系统有一个与说话者无关的识别且在美国专利第5,774,859号中描述。对于与说话者无关的识别系统，模板已经被存储在语音识别器的存储器中(“预训练”)。该模板正常地通过对大量的说话者进行平均，覆盖不同的音调、方言等而获得。这种解决方案的很大的优点在于不同的使用者可以使用该话音命令。其缺陷是缺乏个性化和固定的语言。命令是由遥控装置制造者选定的。对于诸如“静音”、“调大音量”或者“一频道”的标准命令而言，这可能是便利的，但是它可能不允许用户选择多个宏。当命令被预训练(这意味着语言是固定的)时，必须为不同的国家生产不同的遥控装置，从而导致更大和更昂贵的多样性。
另一种概念是与说话者有关的识别。这种遥控装置在美国专利第5,199,080号中给出。该话音操作的遥控系统传送一个遥控信号以响应话音命令，该话音命令由所实施的语音识别来辨别。该语音识别电路有一个标准模式数据存储单元用于存储相对各个话音命令的多个标准模式数据。输入的话音命令被与多个标准模式数据比较以便进行精确的语音识别。该系统包括一个学习单元，用于自动地更新所存储的标准模式数据以响应新输入的话音命令的模式数据中的改变。该系统还可以被训练用于新说出的命令。诸如美国专利第5,199,080号中所描述系统的、与说话者相关的识别的主要优点是用户可以训练他想要用作话音命令的、以他希望的任何语言给出的单词。通常地，这以两次发出一个单词的音为基础。然后语音识别器从捕获的单词中提取特征，并且将该模式作为模板存储在一个非易失性的存储器中。与说话者相关的识别的另一个优点是高度的个性化。语音识别器将以很高的可靠性识别训练它们的用户的命令。但它将几乎总是拒绝由另一个说话者说出的相同的命令。因而与说话者相关的识别的缺点在于该系统在能够使用话音命令之前必须被训练，这总是很费时间的，以及不允许诸如家庭成员的不同用户使用该遥控装置。由不同用户训练该遥控装置是不可能的，因为每个被训练的单词用完了有限存储空间。

发明内容
本发明将一个语音识别接口添加到一个遥控装置，后者将与说话者有关和与说话者无关的语音识别的优点组合起来。
一个完整的话音数据库可能例如运行在一个PC、电视机、机顶盒(STB)上或者通过例如互联网或者任何其它的广域网的网络可接入。该数据库可存储在供应给该遥控装置的一个光盘(CD-ROM)或者其它存储介质上。在这种情况下，将经由一个本地下载设备，例如PC、电视机、机顶盒(STP)或者受控电子设备，来进行下载。
使用网络来接入该数据库，则首先经由一个类似受控电子设备或者PC、电视机、机顶盒(STB)的接入设备来从网络取回模板，并且接着下载该模板到该遥控装置—可能在该模板已经经由一个本地通信系统从互联网接入设备分发到该下载设备之后。
该数据库类似多语言的字典，存储所有种类的不同命令或者单词。通过便利的用户接口，通过搜索功能等，用户可以从他优选语言的字典中选择一组单词。该数据库以话音模板的数据库为特征，并且查找所选单词的声音的模板。这些模板接着通过一条有线或者无线的链路被传递给遥控装置。作为从一个基于PC的字典软件中选择单词的替代，也可能使用一个由受控电视机显示的互联网业务数据库。所需要的话音命令然后可以通过该遥控装置选择，并且接着从通过互联网接收该模板数据的电视机传递给该遥控装置。
本发明的优点是用户有很高的自由度来通过选择语言、挑选单词、改变单词而快速地定制遥控装置，用户可以总是或者自动地下载最复杂的模板用于他需要的话音命令。该系统是一个与说话者无关的系统，这意味着所有家庭成员可以使用该选定的话音命令而无需训练语音识别。该遥控装置可以作为一个在所有国家都相同的“空”设备被销售。
本发明的另一个方面是用户可以下载一个单词的字母代表，它属于一个或者多个话音模板，可以在遥控装置的LCD上显示。这可能帮助用户滚动被训练命令的列表，以擦除某些不再被需要的命令。

当结合其中借助说明性示例显示本发明优选实施例的附图时，本发明上述的目的、特征和优点将从以下说明中变得更明显。
图1是一个可编程遥控装置的框图；图2是该可编程遥控装置的详细框图。
具体实施方式
图1显示了一个可编程遥控装置1的框图。可编程意味着可以从一个数据库2、2a或者20下载一组模板(数据)到该遥控装置1的存储器中，以便使得该遥控装置1能够识别特定的口头命令。编程可用通过PC4来完成，PC4在类似光盘(CD)或者硬盘驱动器的本地存储装置上存储该数据库2。PC4从数据库2通过数据总线3接收数据。用户可以通过一个便利的用户接口选择例如一个运行在PC4上的程序、代表该口头命令的一组单词，并且将它们链接到在语音识别已经识别所述口头命令之后应由该遥控装置生成并且传送到某个电子设备的信号。该模板数据可以通过使用红外光的无线链路11或者通过一个传输电缆(未显示)从PC4传递到遥控装置1。
作为对使用一个本地数据库的替代，数据库2a、20可以是外部的，并且可以通过互联网和/或电话线路9或者其它类似电视广播7、21的通信信道接入。数据库2的项可以从由可编程遥控装置1控制的远程PC10、电视机8或者机顶盒19中选择。PC10、电视机8或者机顶盒19之间的通信是无线地实现的，这由参考数字11指示。
很多不同的设备被利用来对该遥控装置1编程。有可能遥控装置的存储的话音可激活命令由遥控装置自身的显示器来显示以便擦除、添加或者改变该链接和命令。也可能是该遥控装置的存储的话音可激活命令在PC4、10或者电视机8上显示。所以，存储的数据首先被传递给所使用的显示设备。在按了该遥控装置的某个键或者一个特定的口头命令之后。这个特定命令的模板数据可能是非用户可擦除的。在对可检测命令集重新编程之后，该新模板数据以及如果希望，对于各个可检测口头命令的字母数字表示被在该遥控装置1的存储器中传递。显然，那些未改变的可检测命令的模板数据没有被传递，以便缩短传送该模板数据所需的时间。
图2显示了该可编程遥控装置1的详细框图。该遥控装置包括一个发送单元12，用于使用红外(IR)或者RF将遥控命令无线地传送给诸如电视机、VCR、机顶盒或者PC的受控电子设备。该遥控装置可以包括一个单独的模板接收器22，它可能也例如经由IR或者RF而无线地操作。该遥控装置用模板接收器22从外部数据库接收模板数据。在本发明的另一个优选实施例中，该遥控装置使用一个发送器12来接收该模板数据并且将控制命令传送给受控的电子设备。
该遥控装置1的操作由一个中央处理单元(CPU)13来控制。接收的模板数据和类似用于该可检测口头命令的字母数字表示的额外数据由CPU13存储在存储器15中。该CPU13生成用于控制外部电子设备的远程信号，该信号对应于由话筒16检测并由语音识别处理器14分析的话音信号代表的话音模式。语音识别处理器14比较该话音模式和所存储的模板数据，以便检测该口头命令。该遥控装置1可以包括一个键盘18和一个显示器17。
本发明可以以其它特定形式实现，而不偏离其精神或者必要特性。本实施例因而被认为是在各方面都是说明性的而非限制的。
权利要求
1.用于控制一个电子设备的遥控装置，包括用于检测口头命令数据的话筒；用于执行使用模板数据来识别由所述话筒检测的口头命令的语音识别算法和控制所述电子设备的处理器；接收来自一个数据库的模板数据以使得该遥控装置能够识别口头命令的接收器；以及存储所述接收的模板数据的存储器，由此识别新的口头命令所需的新模板数据被首先从一组存储在该数据库中的命令中选出，然后被下载和存储到该遥控装置中；其特征在于，该数据库可以由一个被链接到互联网的电视机显示，并且该选出的模板被通过互联网下载以及从电视机无线地发送到该遥控装置。
2.按照权利要求
1的遥控装置，其中该用户可以滚动可检测口头命令的显示列表并删除不再被需要的命令，由此该附属的模板数据被从所述存储器中擦除。
3.用于控制电子设备的方法，包括以下步骤检测口头命令数据的检测步骤；执行使用模板数据来识别由所述检测步骤检测的口头命令和控制所述电子设备的执行步骤；接收来自一个数据库的模板数据以使得能够识别口头命令的接收步骤；以及将所述接收的模板数据存储在存储器中的存储步骤，由此识别新的口头命令所需的新模板数据被首先从一组存储在该数据库中的命令中选出，然后被下载和存储到该存储器中；其特征在于，该数据库可以由一个被链接到互联网的电视机显示，并且该选出的模板被通过互联网下载以及从电视机无线地发送到该存储器。
4.按照权利要求
3的方法，其中用户可以滚动可检测口头命令的显示列表并删除不再被需要的命令，由此该附属的模板数据被从所述存储器中擦除。
专利摘要
用于控制电子设备的遥控装置，包括用于检测口头命令数据的话筒，用于执行使用模板数据来识别由所述话筒检测的口头命令的语音识别算法和控制所述电子设备的处理器，用于从外部存储装置或网络接收模板数据以便使得该遥控装置能够识别口头命令的接收器，用于存储所述选定的和接收的模板数据的存储器。
文档编号H04N5/445GKCN1196324SQ01802485
公开日2005年4月6日申请日期2001年8月10日
发明者W·勒梅, J·M·诺瓦克申请人:皇家菲利浦电子有限公司导出引文BiBTeX, EndNote, RefMan

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：W.勒梅;J.M.诺瓦克
技术所有人：皇家菲利浦电子有限公司
我是此专利的发明人

上一篇：显示装置及其驱动方法
上一篇：设置信息终端中的通信参数的装置和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。