电视语音点播器的制作方法

文档序号:6703099阅读:285来源:国知局
专利名称:电视语音点播器的制作方法
技术领域
本实用新型涉及一种遥控器,更具体的涉及一种用于控制电视机的电视语音点播器。
背景技术
电视机的控制由早期的旋钮式、按键式,逐渐演变为遥控方式,遥控器这种方便且能远端控制的产品,已成为电视机无法缺少的附属品。目前电视遥控器主要为按键式,并有两种类型一种是固定码型,每个键对应一种或几种码型,生产厂家预先设定,用户不能更改;另一种是学习型,具有自我学习遥控码的功能,用户可以定义遥控器的每个键对应的码型,它能够将多种遥控器集于一身,用一个遥控器就可控制其他多个家电,又可以作为原配电视遥控器的备份,电视机的商机也随遥控功能的丰富而提高。由于现代电视功能不断增加,上述两种遥控器都有按键过多,用户不易记住每个键的含义等问题。
语音识别技术的充分发展,为解决上述问题提供了可能。将语音识别技术应用于遥控器,利用语音命令代替按键,制成语音控制的遥控器,这样,既方便了使用者对命令的记忆和使用,同时省去了大量按键,缩小了遥控器的体积。现有数种语音识别技术可用来识别用户的口语命令,其中一种是基于大词汇语音检索的连续语音识别系统,而另一种则是基于子词(Sub Word)索引单元或基于关键词的发现(Spotting)的单一语音识别模式。如广东科龙电器股份有限公司2001.05.09公开的实用新型专利“可语音控制的智能冰箱”(2429801)、2001.01.24公开的实用新型专利“可语音控制的空调器”等语音识别遥控器主要采用了单一语音识别模式。
然而,电视机能收看到的节目频道数不断增加,各个广播电视播放单位播出的节目内容及质量有所差异,用户不想看的内容如广告等较多,用户的选择余地较大。目前大部分厂商均未能提供电视机附属遥控器的语音控制方式,人们经常在不同节目频道间反复手动切换,使得人们想完整地收看到想看节目内容有些困难。语音识别的重要标志是对识别内容主题的关键词的听觉特征、语义特征的分析基础上语音控制命令的有效性,由于广播电视节目内容主题的丰富多彩、变化快和发展性限制了利用语音识别技术正确产生控制指令,使正确识别率大大降低,甚至出现错误识别。
实用新型内容本实用新型针对现有技术的上述缺陷,提供一种能够通过语音命令快速检索节目内容并能锁定频道的电视语音点播器。
本实用新型还提供一种用于选择电视或多媒体等音像传媒设备播出节目内容的语音智能遥控器。
本实用新型的技术方案如下一种电视语音点播器,包括语音传感元件、滤波器、模数转换器、动态存储器、扬声器、数模转换器、控制器、电源管理器、控制键盘、数字信号处理器和静态存储器,其特征在于所述静态存储器内电连接有音像信息检索装置和含有语音命令识别表的语音样板卡。
所述控制器还连接有红外发送装置和红外接收装置。
所述语音传感元件配备有语音消噪、定向接收的麦克风阵列装置和红外跟踪系统。
所述语音样板卡内的语音命令识别表可以更新或更换,并且可以用方言或外语来设置。
所述语音样板卡为两个或两个以上,均带有活动式插接接口,各自的语音命令识别表分别与所述静态存储器内的音像信息检索数据相对应。
一种语音智能遥控器,包括语音传感元件、滤波器、模数转换器、动态存储器、扬声器、数模转换器、控制器、电源管理器、控制键盘、数字信号处理器和静态存储器,其特征在于所述静态存储器内电连接有音像信息检索装置和含有语音命令识别表的语音样板卡。
本实用新型电视语音点播器的技术效果是通过用户的语音命令,能够快速检索并锁定用户想看的节目;操作简便,能够保持原有广播电视播放设备整机的完整性,对电视机而言,仅对附属产品如遥控器部分进行改进,以使目前更多的用户能接受并使用。
由于本实用新型的电视语音点播器与用户使用的语言种类无关,其操作可由用户说出的可闻密码来开启、锁定。
本实用新型的电视语音点播器可以供多人使用,不同使用者可以设置各自的语音命令识别表及含有该识别表的语音样板卡。
本实用新型的语音智能遥控器,由于设置了音像信息检索装置,可以利用用户语音输入来设定某一周期内的点播节目单来控制诸如电视机、多媒体等音像传媒播出设备进行自动切换播出,减少用户对遥控器控制键的操作,也可消除用户凭印象繁琐操作的烦恼。


图1为本实用新型电视语音点播器的方框图;图1中标记列示如下12--语音传感元件 14--滤波器 16--模数转换器 18--动态存储器20--扬声器 22--数模转换器 24--数字信号处理器26--音像信息检索装置 28-语音样板卡 30--静态存储器32--控制器 34--电源管理器 36-外接收装置 38-红外发送装置40-控制键盘具体实施方式
以下结合附图对本实用新型作进一步的详细说明。
现在参考图1,通过按下控制键盘40上的电源接通键来接通电视语音点播器的电源。电视语音点播器放置在用户的嘴的前面,通过用户靠得足够近说话、以便被语音传感元件12拾取来提供控制电视语音点播器的语音输入命令。语音传感元件12将用户的语言转换为模拟信号。连接到语音传感元件12的是滤波器14,该滤波器14将语音传感元件12产生的模拟信号中非属人声频率范围内的杂音信号滤除。连接到滤波器14的是模数转换器16,该模数转换器16将滤波器14滤除的模拟信号转换成数字信号。数字信号由模数转换器16发送到数字信号处理器24,该数字信号处理器24将信号存入与该数字信号处理器24相连接的动态存储器18。然后,在本实用新型的最佳实施例中,数字信号处理器24调用存储在本实用新型的静态存储器30中的音像信息检索装置26中的音像信息检索数据,以便对存储在动态存储器18内的数字信号进行一系列频率域变换。音像信息检索装置26产生识别模型,该识别模型是频谱变换,与存储在静态存储器30的含有语音命令识别表的语音样板卡28内的命令的识别模型(也是频谱变换)相比较。本专业的技术人员会知道,用来识别语音模型的任何其他适当方法都可以用在本实用新型中取代频谱变换。如果有匹配项,那么数字信号处理器24访问连接到命令识别模型的含有语音命令识别表的语音样板卡28内的指令集。那么,相关的指令集就通过控制器32、红外发送装置38和红外接收装置36而被执行。
为了启动本实用新型电视语音点播器的动作,比如利用遥控器的切换频道动作,用户接通电视语音点播器的电源,然后输入语音控制输入命令“中一”,该语音控制输入命令“中一”被电视语音点播器通过位于电视语音点播器内的语音传感元件拾取。电视语音点播器在识别命令“中一”之后,遥控器将电视机屏幕准备切换中央电视台一套所在的频道上,这通过可听标准语音“中一”的重复来提示用户。一旦电视语音点播器识别命令,它就进行所需的操作。如果电视语音点播器处理语音输入命令而未发现匹配项时,就将可听标准语音等无匹配项提示输出给用户。然后,语音点播器等候接收下一个语音控制输入命令。
当某两个或两个以上的播出节目在同一时间内相同时或当某一节目播放尚未结束、而另一后续设定播出节目已经开始时,电视语音点播器可以在这些播出节目间自动切换、播出,每个节目停留一段时间,如一分钟。用户可以用确认语音命令锁定需看的播出节目。这个操作延时到该节目内容播出结束后自动取消,电视语音点播器则按照预先设定的播出节目单自动切换播出后续设定的节目内容。
通过使用口头密码,语音控制输入使得供电视语音点播器向特定的用户启动。一旦电视语音点播器接通电源,在接收并处理正确的密码之前,它不会动作。只要用户的密码没被偷听,就可以避免防止用户之外的人使用电视语音点播器。
对于非标准语音的用户,本实用新型的电视语音点播器在使用前必须先加以训练,以使数字信号处理器24能识别用户下达的语音命令。通过把语音操作命令输入到电视语音点播器中来控制电视机,在此类情况下,语音点播器必须放置在用户的嘴的前面。数字信号处理器24将用户的语音信号存储在静态存储器30中,作为往后接收语音命令对比的依据;若有多人使用者,则下一个使用者进行上述训练、输入其语音信号。
在本实施例中,本实用新型的电视语音点播器通过音像信息检索装置26中的音像信息检索数据,被训练来识别用户的口头语音控制输入命令。在训练方式中使用音像信息检索装置26及其数据时,要把电视语音点播器可以通过语音控制输入命令执行的预定节目预告单给予用户。例如,命令1可以表示执行切换电视机屏幕到第一频道的指令集。在选择命令1进行训练和分析时,音像信息检索装置26将提示用户调用切换第一频道功能指令集的电视台名。然后,将提示用户所选的电视台名。合乎逻辑的选择应该是选择命令“电视台名”,但用户所选的任何切换方式都是可行的。“电视台名”的每次重复都被电视语音点播器拾取,并被音像信息检索装置26作数据系统分析,以便产生包含用户发出“电视台名”命令的语音的变化和音调的识别模型。用户所选用来调用各种功能的语音命令的识别模型都存储在电视语音点播器的静态存储器30的含有语音命令识别表的语音样板卡28内。在含有语音命令识别表的语音样板卡28内的识别模型各自链接预定的、也存储在静态存储器30内的各种功能的指令集。因此当口头语音输入命令被电视语音点播器接收和识别时,与该命令关键词相关的指令集就被执行。由于功能的指令集取决于节目的关键词选择和随后用户对那个关键词选择的训练和语音分析,所以本实施例是与语言种类无关的,使得可以将外语用作语音控制输入命令关键词。
在这个例子中,口语命令首先被检测为声音信号,通常由一个或多个语音传感元件拾取,然后,将用户语音信号输入到动态存储器18中存储并被馈送到音像信息检索装置26,音像信息检索装置26对动态存储器18中的语音命令的听觉特征、语义特征进行基于声音模型和语音模型的分析识别。声音模型采用大量的的语音图形、所用的数学算法指明声学上与口语命令最匹配的词。而语音模型是基于分析的,该分析使用多个关键词,这样的含音像信息检索数据的音像信息检索装置26不仅识别单个的字并且能够高识别率地识别连续口语句子。
含有语音命令识别表的语音样板卡28的识别模型是预定的,并与用户必须使用的特定关键词相关。例如,用户可以必须修正他或她的命令关键词“电视剧”的发音,直到语音点播器可以识别像用户那样说出的命令。因此,在该实施例中,电视语音点播器要先对准一种特定的语言,在该语言中,命令关键词表示所引起的动作。可以为使用表示所引起的动作的外文关键词的用户制作该设备的外语形式。
电视语音点播器具有由数字信号处理器24控制的语音声频输入/输出系统。当接收语音控制输入命令时,数字信号处理器24将数字化的语音输入存储在动态存储器18内。然后数字信号处理器24处理命令,并且把命令识别模型与存储在静态存储器30中含有语音命令识别表的语音样板卡28内的识别模型进行比较。当找到匹配项之后,开始执行与识别模型相关的指令集。特定命令的指令集可以包括通过输出命令名称的可闻播放,向用户认可命令。特定命令也可以具有内嵌在指令集中的延时,让用户有时间取消命令。如果用户对刚发出的命令改变主意,或者,如果电视语音点播器未正确理解命令,用户可以通过遥控器上的控制键盘40,或者通过可以取消所接收的先前命令的语音控制输入命令,在命令执行之前将其取消。否则,如果没有接收到取消命令的输入,就会执行该命令的指令集。
同一个电视语音点播器供多人使用时,可以将静态存储器30存储的含有语音命令识别表的语音样板卡28更换,语音样板卡28中的语音命令识别表也可以更换或者更新,语音样板卡做成活动插接形式。如果检测到多个可能的用户,那么各种不同的处理是可以想象的。根据实施例,电视语音点播器总是适应首先所检测的用户,所以电视语音点播器跟随这个用户。同样,电视语音点播器也跟随首先完成语音输入的用户。此外,在各种可能的用户之间,完成经常的转换是可能的。这里还比较有利的是,电视并不会仅仅因为他人在谈话中提到了命令关键词而改变频道。
预播节目语音命令表的输入、更新的过程,首先是用户口语密码启动电视语音点播器,电视语音点播器处于待机状态;语音识别软件认为用户可以进行输入、更新静态存储器30中预播节目语音样板卡28中的语音命令识别表的语音输入操作;语音检测即判断是否有语音输入;判断到有语音输入后,对该语音进行两方面的处理,一是提取该语音的特征,即计算其MFCC参数,二是对语音数据进行压缩编码;若用户键入信息表示不满意语音命令的质量,则重复以上操作,若用户键入信息表示满意语音质量,则提示用户键入语音命令的编码,然后把输入的语音命令的特征参数(即模板)和压缩后的语音节目预告单及其编码存储静态存储器30中,这时候完成了一次训练的操作。
由于各个广播电视播出机构的节目版块安排及节目预告单在一段时间内具有相对的稳定性,因此,预播节目语音命令表也具有相对稳定的格式和模板。电视语音点播器中的预播节目语音命令表的建立可以由各个广播电视播出机构统一进行;也可以由用户从相应的网站上下载;用户也可以用电视语音点播器从电视节目预告中录音输入;用户也可以从下一时间段的广播电视节目预告单中获取后语音输入。对于说非标准普通话或外语的用户来说,电视语音点播器中的预播节目语音命令表的建立只能由用户也可以从下一时间段的广播电视节目预告单中获取后语音输入,电视语音点播器中有一个标准普通话的预播节目语音命令表,还有一个或多个用户的预播节目语音命令表。
由于各个广播电视播出机构在一段时间内播出的节目内容各不相同,仅对于预播节目语音命令表发生变化的节目部分需要及时的修正及更新。这里分为两种情况对于说标准普通话的用户来说,可以由各个广播电视播出机构统一进行;也可以由用户从相应的网站上下载;用户也可以用电视语音点播器从电视节目预告中录音输入;用户也可以从下一时间段的广播电视报中获取后语音输入。对于说非标准普通话或外语的用户来说,只能由用户也可以从下一时间段的广播电视节目预告单中获取后语音输入。
语音传感元件12将用户语音信号转换成电信号,数字信号处理器24把这些电信号转换成操作指令,输入到动态存储器18中存储,语音命令馈送到语音识别单元、该单元把电信号转换成关键词。语音识别软件对语音关键词的听觉特征、语义特征进行分析识别,并与静态存储器30中的语音样板卡28内的语音命令识别表进行单元词匹配、选择,识别无误即通过数字信号处理器24控制电视语音点播器连接的电视机或计算机进行相关的关键词部分的点播。语音命令的集合可以保证在某一周期内定时观看预先设定的系列收视节目。
由此可见,语音识别的过程首先进行语音检测,判断是否有语音输入;若有则对该语音进行特征提取,即提取输入语音的MFCC参数;参数提取后进行参数比较,即把输入语音的特征参数与存储在静态存储器30中语音样板卡28内的语音命令的特征参数(即模板)进行比较,确定是否与其中的某个模板匹配,这里有两种情况,第一种情况是完全匹配,则被匹配的模板即为输入的语音命令,这时候匹配模板对应的编码即为语音输入的编码,通过数据线输入到组合逻辑,然后去控制电视机。第二种情况是不完全匹配,这时候找到三个最接近的语音命令模板,并把它们的图像分别在电视机上播放切换,让使用者判断,若其中有一个是输入的语音命令,则由用户确认后去控制电视机;若三个都不是输入的语音命令,则提示让用户重新输入一次语音命令,重复上述的语音识别过程。
利用用户语音输入定期更新预播节目语音样板卡28中的语音命令识别表,使其与诸如用户电视机或计算机之类的广播电视播放设备目前播放的节目预告单相一致、并存储于静态存储器30中。输入含有语音命令识别表的语音样板卡28,并存储于静态存储器30中。使用标准话的用户不须训练就可直接使用预播节目语音命令识别表来语音控制诸如电视机或计算机多媒体等广播电视播出设备。
本实用新型电视语音点播器还可连接到用户电视机或计算机之类的广播电视播放设备上,以便训练电视语音点播器识别用户的语音控制命令,输入、修正、更新预播节目语音样板卡28中的语音命令识别表并存储于静态存储器30中。
以上所述,仅为本实用新型的优选实施方式。应当指出,对于本领域的技术人员来说,基于本实用新型同样的发明创造原理,还可以做出若干变型和改进,以及本技术方案在其他相似领域的应用,但这些均落入本实用新型的保护范围之中。
权利要求1.一种电视语音点播器,包括语音传感元件(12)、滤波器(14)、模数转换器(16)、动态存储器(18)、扬声器(20)、数模转换器(22)、控制器(32)、电源管理器(34)、控制键盘(40)、数字信号处理器(24)和静态存储器(30),其特征在于所述静态存储器(30)内电连接有音像信息检索装置(26)和含有语音命令识别表的语音样板卡(28)。
2.根据权利要求1所述的一种电视语音点播器,其特征在于所述控制器(32)还连接有红外发送装置(38)和红外接收装置(36)。
3.根据权利要求2所述的一种电视语音点播器,其特征在于所述语音传感元件(12)配备有语音消噪、定向接收的麦克风阵列装置和红外跟踪系统。
4.根据权利要求3所述的一种电视语音点播器,其特征在于所述语音样板卡(28)内的语音命令识别表可以更新或更换,并且可以用方言或外语来设置。
5.根据权利要求4所述的一种电视语音点播器,其特征在于所述语音样板卡(28)为两个或两个以上,均带有活动式插接接口,各自的语音命令识别表分别与所述静态存储器(30)内的音像信息检索数据相对应。
6.一种语音智能遥控器,包括语音传感元件(12)、滤波器(14)、模数转换器(16)、动态存储器(18)、扬声器(20)、数模转换器(22)、控制器(32)、电源管理器(34)、控制键盘(40)、数字信号处理器(24)和静态存储器(30),其特征在于所述静态存储器(30)内电连接有音像信息检索装置(26)和含有语音命令识别表的语音样板卡(28)。
专利摘要本实用新型提供一种能够通过语音命令快速检索节目内容并能锁定频道的电视语音点播器,包括语音传感元件、滤波器、模数转换器、动态存储器、扬声器、数模转换器、控制器、电源管理器、控制键盘、数字信号处理器和静态存储器,所述静态存储器内电连接有音像信息检索装置和含有语音命令识别表的语音样板卡。本实用新型还提供一种用于选择电视或多媒体等音像传媒设备播出节目内容的语音智能遥控器。
文档编号G08C23/00GK2681491SQ0323647
公开日2005年2月23日 申请日期2003年1月22日 优先权日2003年1月22日
发明者程国庆 申请人:程松林, 程国庆
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1