一种机顶盒的控制方法、机顶盒及计算机可读介质与流程

文档序号:17299699发布日期:2019-04-03 04:49阅读:145来源:国知局
一种机顶盒的控制方法、机顶盒及计算机可读介质与流程

本发明涉及通信领域,特别涉及一种机顶盒的控制方法、机顶盒及计算机可读介质。



背景技术:

随着语音技术的发展,语音控制成为可能,也是未来的重要发展方向。例如亚马逊amazon的echo设备,就可以通过自然语言进行交互,可以问天气,查询简要信息,播放音乐,订购amazon商品等。

通过人离拾音设备的距离,语音控制分为近场和远场两种方式。近场是指拾音设备在人的0.5m范围之内,驱动方式主要通过手按设备来实现;而远场是指拾音设备在人的4~5m的范围内,可以通过语言来控制,通过唤醒词的方式来驱动。

机顶盒是一种重要的家庭设备,为家庭提供电影电视服务。现在,机顶盒的主要控制方式为遥控器,少数的语音控制方案也以近场方式为主,通过遥控器上集成麦克拾音设备来实现。



技术实现要素:

为了实现对机顶盒业务的更好的体验,本发明提供了一种机顶盒的控制方法、机顶盒及计算机可读介质。

本发明提供了一种机顶盒的控制方法,应用于机顶盒,所述方法包括:

将用户语音信息进行语义识别;

按照与所述语义识别结果相匹配的控制方式,对所述机顶盒进行控制。

可选的,在本发明所述的机顶盒的控制方法中,所述将用户语音信息进行语义识别,包括:将用户语音信息发送至服务器侧进行语义识别。

可选的,在本发明所述的机顶盒的控制方法中,在将用户语音信息发送至服务器侧进行语义识别之前,还包括:

采集声音信息;

获取所述机顶盒输出的音频信息;

在剔除掉所述音频信息的声音信息中得到用户语音信息。

可选的,在本发明所述的机顶盒的控制方法中,在剔除掉所述音频信息的声音信息中得到用户语音信息之前,还包括:对所述声音信息进行噪声抑制处理。

可选的,在本发明所述的机顶盒的控制方法中,所述在剔除掉所述音频信息的声音信息中得到用户语音信息,包括:

在所述声音信息中剔除所述音频信息,得到回声抵消后的声音信息;

对回声抵消后的声音信息进行定向拾音得到用户语音信息。

可选的,在本发明所述的机顶盒的控制方法中,所述按照与所述服务器侧的语义识别结果相匹配的控制方式,对所述机顶盒进行控制包括:

接收所述服务器侧反馈的语义识别结果,根据所述语义识别结果匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制;

或者,接收所述服务器侧反馈的与所述语义识别结果相匹配的控制指令,根据接收到的控制指令对所述机顶盒进行控制。

本发明还提供了一种机顶盒,包括:处理器、存储器及通信总线;所述通信总线用于实现所述处理器和所述存储器之间的连接通信;所述处理器用于执行所述存储器中存储的机顶盒的控制的程序,以实现以下步骤:

将用户语音信息进行语义识别;

按照与所述语义识别结果相匹配的控制方式,对所述机顶盒进行控制。

可选的,在本发明所述的机顶盒中,所述处理器还用于执行所述存储器中存储的机顶盒的控制的程序,以实现以下步骤:

采集声音信息;

获取所述机顶盒输出的音频信息;

在剔除掉所述音频信息的声音信息中得到用户语音信息。

可选的,在本发明所述的机顶盒中,所述处理器在执行在剔除掉所述音频信息的声音信息中得到用户语音信息的步骤时,具体包括:

在所述声音信息中剔除所述音频信息,得到回声抵消后的声音信息;

对回声抵消后的声音信息进行定向拾音得到用户语音信息。

本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有机顶盒的控制程序,所述机顶盒的控制程序被处理器执行时实现如上所述的机顶盒的控制方法的步骤。

本发明的有益效果如下:

本发明实施例提供的机顶盒的控制方法、机顶盒及计算机可读介质,使用户在远场仅凭说话就能够完成对机顶盒的控制,增加了用户对机顶盒业务的更好的体验。

附图说明

图1是本发明方法实施例机顶盒控制方法的流程示意图;

图2是本发明实例1的机顶盒的结构示意图;

图3为实例1中远场语音控制机顶盒的方法的流程示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

为了实现对机顶盒业务的更好的体验,本发明提供了一种机顶盒的控制方法、机顶盒及计算机可读介质,以下结合附图对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。

根据本发明的方法实施例,提供了一种机顶盒的控制方法,图1是本发明方法实施例机顶盒控制方法的流程示意图,如图1所示,本发明方法实施例的机顶盒的控制方法,包括以下步骤:

s101:将用户语音信息进行语义识别。

具体的,步骤s101为将用户语音信息发送至服务器侧进行语义识别。

s102:按照与所述语义识别结果相匹配的控制方式,对所述机顶盒进行控制。

具体的,步骤s102为按照与所述服务器侧的语义识别结果相匹配的控制方式,对所述机顶盒进行控制。

更加具体的,在本发明所述的机顶盒的控制方法中,按照与所述服务器侧的语义识别结果相匹配的控制方式,对所述机顶盒进行控制包括以下两种方案:接收所述服务器侧反馈的语义识别结果,根据所述语义识别结果匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制;或者,接收所述服务器侧反馈的与所述语义识别结果相匹配的控制指令,根据接收到的控制指令对所述机顶盒进行控制。

具体的,所述服务器侧反馈的语义识别结果为文字信息,根据所述语义识别结果匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制,例如关机、搜索电影等。

具体的,在本发明所述的机顶盒的控制方法中,将所述用户语音信息发送至服务器的语音识别和语义分析服务:语音识别可以将语音信息识别为文字,语义分析模块可以从文字识别用户意图,技术上,这两个服务模块运行在云上。此模块属于整个控制系统的必须部分,但是不属于本发明的范围,写在这里只是为了更好的理解本发明。

进一步的,在本发明方法实施例的机顶盒控制方法中,在步骤s101之前还包括以下步骤:采集声音信息;获取所述机顶盒输出的音频信息;在剔除掉所述音频信息的声音信息中得到用户语音信息。

具体的,机顶盒有内置麦克风阵列,可以采集远场的声音信息。所述声音信息包括用户说话的声音和电视机发出的声音。机顶盒主要应用在电影电视播放中,电视机输出的声音对麦克风阵列声音采集质量是一个重大干扰源,影响后续语音识别质量,需要在采集到的声音信息中剔除掉电视机发出的声音。

为了在采集到的声音信息中剔除掉电视机发出的声音,需要获取所述机顶盒输出的音频信息,具体的,可以在机顶盒输出的hdmi信息中提取出音频信息,所述音频信息即为电视机发出的声音。

在剔除掉所述音频信息的声音信息中得到用户语音信息的目的是为了分离出高质量的用户语音信息,具体包括以下步骤:在所述声音信息中剔除所述音频信息,得到回声抵消后的声音信息;对所述回声抵消后的声音信息进行定向拾音得到用户语音信息。

进一步的,在本发明所述的机顶盒的控制方法中,在剔除掉所述音频信息的声音信息中得到用户语音信息之前,还包括:对所述声音信息进行噪声抑制处理。

本发明实施例提供的机顶盒的控制方法,使用户在远场仅凭说话就能够完成对机顶盒的控制,增加了用户对机顶盒业务的更好的体验。

与本发明的方法实施例相对应,本发明还提供了一种机顶盒,包括:处理器、存储器及通信总线;所述通信总线用于实现所述处理器和所述存储器之间的连接通信;所述处理器用于执行所述存储器中存储的机顶盒的控制的程序,以实现以下步骤:

将用户语音信息进行语义识别;

按照与所述语义识别结果相匹配的控制方式,对所述机顶盒进行控制。

具体的,在本发明所述的机顶盒中,所述处理器在执行将用户语音信息进行语义识别的步骤时,具体包括:将用户语音信息发送至服务器侧进行语义识别。

具体的,在本发明所述的机顶盒中,所述处理器还用于执行所述存储器中存储的机顶盒的控制的程序,以实现以下步骤:

采集声音信息;

获取所述机顶盒输出的音频信息;

在剔除掉所述音频信息的声音信息中得到用户语音信息。

具体的,在本发明所述的机顶盒中,所述处理器在执行在剔除掉所述音频信息的声音信息中得到用户语音信息的步骤时,具体包括:

在所述声音信息中剔除所述音频信息,得到回声抵消后的声音信息;

对回声抵消后的声音信息进行定向拾音得到用户语音信息。

具体的,在本发明所述的机顶盒中,所述处理器还用于执行所述存储器中存储的机顶盒的控制的程序,以实现以下步骤:

在剔除掉所述音频信息的声音信息中得到用户语音信息之前,对所述声音信息进行噪声抑制处理。

具体的,在本发明所述的机顶盒中,所述处理器在执行按照与所述服务器侧的语义识别结果相匹配的控制方式,对所述机顶盒进行控制的步骤时,具体包括:

接收所述服务器侧反馈的语义识别结果,根据所述语义识别结果匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制;

或者,接收所述服务器侧反馈的与所述语义识别结果相匹配的控制指令,根据接收到的控制指令对所述机顶盒进行控制。

本发明装置实施例提供的机顶盒,使用户在远场仅凭说话就能够完成对机顶盒的控制,增加了用户对机顶盒业务的更好的体验。

本发明进一步提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有机顶盒的控制程序,所述机顶盒的控制程序被处理器执行时实现上述机顶盒的控制方法的步骤。

为了更加详细的说明本发明方法实施例和装置实施例,给出实例1。

图2是本发明实例1的机顶盒的结构示意图,如图2所示,本发明实例1的机顶盒,包括:远场拾音模块21、音频提取模块22、语音处理模块23、接口模块24、及控制模块25。

所述远场拾音模块21,用于采集声音信息。

具体的,所述远场拾音模块21的主要功能是完成对外部声音的收集,在本发明的场景中,主要是用户说话的声音和电视机发出的声音。对于本发明,电视机声音是重要干扰源,在后续过程中,需要去除,这也是本发明的一个重要发明点。技术上远场拾音模块21一般采用麦克阵列的方式,更好的获取远处人说话的语音信息。麦克阵列结合后端的降噪、定向、回声抵消等方式,可以获取高质量的远场语音信息,保证后续语音识别等处理的正常。

所述音频提取模块22,用于获取所述机顶盒输出的音频信息。

具体的,远场拾音模块21在拾取到用户语音信息的同时,不可避免会拾取到电视机的声音,所以必须对电视机的声音进行回声抵消的处理。而电视机的声音不算小,其影响巨大,所以必须进行回声抵消处理。音频提取模块22提取到的音频信息送给语音处理模块23,用于回声抵消处理。

所述语音处理模块23,用于在剔除掉所述音频信息的声音信息中得到用户语音信息。

所述语音处理模块23具体用于:在所述声音信息中剔除所述音频信息,得到回声抵消后的声音信息;对所述回声抵消后的声音信息进行定向拾音得到用户语音信息。进一步的,所述语音处理模块23还用于:对所述声音信息进行噪声抑制处理。

所述语音处理模块23用到的算法包括以下的一种或几种:寻向算法、波束成型算法、激活唤醒算法、语音激活检测算法(vad)、及回声抵消算法(aec)。一般的,这些算法都是作为通用算法运行在机顶盒的主cpu上,但是处于性能、成本等其它考虑,也可以运行在dsp、gpu上,甚至可以是专有的硬件芯片处理。语音处理模块23的信息输入来自于远场拾音模块21和音频提取模块22,其最终目的是分类出高质量的用户语音信息。

所述接口模块24,用于将所述用户语音信息发送至服务器侧进行语义识别。

接口模块24接收来自语音处理模块23输出的用户语音信息,将其发送给语音识别和语义分析服务26进行语义识别。

进一步的,接口模块24获取还用于接收与用户语音信息对应的语义识别结果或者与所述语义识别结果相匹配的控制指令。

特别说明:图2中的语音识别和语义分析服务26提供语音识别和语义分析服务,属于整个语音控制系统运行的必须模块,但是不属于本发明的范围,写在这里只是为了更好的理解本发明。

在语音识别和语义分析服务26中,语音识别可以将语音信息识别为文字,语义分析模块可以从文字识别用户意图,技术上,这两个服务模块运行在云上。

所述控制模块25,用于按照与所述服务器侧的语义识别结果相匹配的控制方式,对所述机顶盒进行控制。

具体的,所述控制模块25具体用于:接收所述服务器侧反馈的语义识别结果,根据所述语义识别结果匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制;或者,接收所述服务器侧反馈的与所述语义识别结果相匹配的控制指令,根据接收到的控制指令对所述机顶盒进行控制。例如通过接口模块24接收来自服务器的语义识别结果,根据所述语义识别结果匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制,例如关机、搜索电影等。

图3为实例1中远场语音控制机顶盒的方法的流程示意图,如图3所示,包括以下步骤:

步骤301:远场拾音模块获取到外部声音信息并送给语音处理模块,同时音频提取模块也将分离出的视频节目中的音频信息送给语音处理模块。

步骤302:语音处理模块对远场拾音模块和音频提取模块送过来的声音信息和音频信息进行处理,通过寻向算法,波束成型算法,激活唤醒算法,语音激活检测算法(vad),回身消除算法(aec)等算法,提取到高质量的用户语音信息,并将此语音信息输出给接口模块。

步骤303:接口模块将接收到的用户语音信息发送给外部语音识别和语义分析服务进行语义识别,并接受其的文字表示的用户行为意图信息(即语义识别结果)。此步骤,外部语音识别和语义分析服务可以是合并的,也可以是分开的各自独立服务,所以,技术上,语音处理模块可能和外部一个,或者多个服务进行交互,但是在功能上,外部的语音识别和语义分析是必须的。

步骤304:接口模块将语音识别和语义分析服务返回的文本化的用户行为意图信息(即语义识别结果)发送给控制模块。

步骤305:控制模块根据所述用户行为意图信息匹配对应的控制指令,并按照所述控制指令对所述机顶盒进行控制。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1