一种语音控制智能电视的方法、系统及存储介质与流程

文档序号:24154676发布日期:2021-03-05 10:41阅读:151来源:国知局
一种语音控制智能电视的方法、系统及存储介质与流程

[0001]
本发明涉及一种电数字数据处理技术,尤其涉及一种语音控制智能电视的方法、系统及存储介质。


背景技术:

[0002]
随着智能电视技术的发展,语音控制技术已经开始在智能电视领域大面积应用,给人们提供了一种更便捷地操控智能电视的方式。但由于智能电视本身的电视系统属于嵌入式实时系统,硬件资源有限。用户在使用语音控制过程中,语音识别差,语音响应慢。同时现有技术实现全场景控制,也是通过本机虚拟遥控码进行模拟操作,但是智能电视自带的语音识别界面,同样属于用户界面的范畴,因此很容易拦截响应,干扰用户的操作。这样,用户往往还是需要遥控器进行辅助操作。
[0003]
因此,现有技术还有待于改进和发展。


技术实现要素:

[0004]
鉴于上述现有技术的不足之处,本发明为解决现有技术缺陷和不足,提出了一种语音控制智能电视的方法。
[0005]
本发明解决技术问题所采用的技术方案如下:
[0006]
一种语音控制智能电视的方法,包括如下步骤:
[0007]
移动终端获取用户语音数据;
[0008]
移动终端检测相同网络下的智能电视进行匹配握手;
[0009]
移动终端将所述用户语音数据转换成与所述智能电视约定的遥控功能协议,并将所述用户语音数据和所述遥控功能协议封装为数据包推送至所述智能电视端;
[0010]
所述智能电视将接收到的数据包解码,同时根据所述遥控功能协议响应相应的遥控功能。
[0011]
作为进一步的改进技术方案,所述移动终端检测相同网络下的智能电视,并进行匹配握手具体包括如下步骤:
[0012]
移动终端启动多屏互动应用,并检测处于相同网络下的智能电视;
[0013]
所述移动终端向检测到的所述智能电视发送匹配数据;
[0014]
所述智能电视响应所述移动终端进行匹配握手。
[0015]
作为进一步的改进技术方案,所述移动终端将所述用户语音数据转换成与所述智能电视约定的遥控功能协议,并将所述用户语音数据和所述遥控功能协议封装为数据包推送至所述智能电视端具体包括如下步骤:
[0016]
所述移动终端获取所述语音内容后,识别出对应的操作命令;
[0017]
所述移动终端将所述操作命令转换为所述智能电视的遥控功能协议;
[0018]
所述移动终端的多屏互动应用建立一个rtp会话,根据与所述智能电视匹配握手结果确定智能电视的目的地址,其中,目的地址包含一个网络地址和一对udp端口;
[0019]
所述移动终端将所述语音内容通过rtp包发送到所述智能电视一对udp端口的偶数端口,将所述遥控功能协议通过rtcp包发送到所述智能电视一对udp端口的奇数端口,其中,所述遥控功能协议包含遥控协议标识头、功能、参数和终止码。
[0020]
作为进一步的改进技术方案,所述智能电视将接收到的数据包解码,同时根据所述遥控功能协议响应相应的遥控功能具体包括如下步骤:
[0021]
所述智能电视通过所述一对udp端口接收到所述移动终端发送的数据包并进行解码;
[0022]
所述智能电视解析出所述移动终端发送过来的所述rtcp包中的uid数据,与所述智能电视的uid数据匹配;
[0023]
如果所述rtcp包中的uid数据与所述智能电视的uid数据匹配,所述智能电视解析对应的rtp包,播放所述rtp包中的语音内容,并根据所述遥控功能协议执行相应的遥控功能。
[0024]
本发明还提供一种语音控制智能电视的系统,所述系统包括:语音识别模块、检测匹配模块、语音数据推送模块、语音数据控制模块;
[0025]
所述语音识别模块用于对移动终端接收到的用户语音进行语音识别,并获取用户语音数据;
[0026]
所述检测匹配模块用于移动终端检测相同网络下的智能电视,并进行匹配握手;
[0027]
所述语音数据推送模块用于将所述语音识别模块获取的用户语音数据转换成与所述智能终端约定的遥控功能协议,并将所述用户语音数据和所述遥控功能协议进行数据包封装,推送至所述智能电视;
[0028]
所述语音数据控制模块用于将所述智能电视接收到的所述数据包解码,并根据所述遥控功能协议响应相应的遥控功能。
[0029]
作为进一步的改进技术方案,所述语音识别模块用于对移动终端接收到的用户语音进行语音识别,是利用隐马尔可夫模型进行自动语音识别得到用户语音数据的。
[0030]
作为进一步的改进技术方案,所述检测匹配模块在检测相同网络下的智能电视,并进行匹配握手的具体功能包括:
[0031]
启动所述移动终端的多屏互动应用,并检测处于相同网络下的智能电视;
[0032]
所述移动终端向检测到的所述智能电视发送匹配数据;
[0033]
所述智能电视响应所述移动终端进行匹配握手。
[0034]
作为进一步的改进技术方案,所述语音数据推送模块将所述语音识别模块获取的用户语音数据转换成与所述智能终端约定的遥控功能协议,并将所述用户语音数据和所述遥控功能协议进行数据包封装,推送至所述智能电视具体包括如下功能:
[0035]
根据所述语音识别模块获取移动终端接收的所述语音内容,并识别出对应的操作命令;
[0036]
将所述操作命令转换为所述智能电视的遥控功能协议;
[0037]
启动所述移动终端的多屏互动应用建立一个rtp会话,根据与所述智能电视匹配握手结果确定智能电视的目的地址,其中,目的地址包含一个网络地址和一对udp端口;
[0038]
将所述移动终端接收到的所述语音内容通过rtp包发送到所述智能电视一对udp端口的偶数端口,将所述遥控功能协议通过rtcp包发送到所述智能电视一对udp端口的奇
数端口,其中,所述遥控功能协议包含遥控协议标识头、功能、参数和终止码。
[0039]
作为进一步的改进技术方案,所述语音数据控制模块将所述智能电视接收到的所述数据包解码,并根据所述遥控功能协议响应相应的遥控功能具体包括如下功能:
[0040]
通过所述智能电视的一对udp端口接收到所述移动终端发送的数据包并进行解码;
[0041]
通过所述智能电视解析出所述移动终端发送过来的所述rtcp包中的uid数据,与所述智能电视的uid数据匹配;
[0042]
如果所述rtcp包中的uid数据与所述智能电视的uid数据匹配,所述智能电视解析对应的rtp包,播放所述rtp包中的语音内容,并根据所述遥控功能协议执行相应的遥控功能。
[0043]
本发明还提供一种存储介质,所述存储介质存储有语音控制智能电视的程序,该语音控制智能电视的程序被处理器执行时实现上述的语音控制智能电视的方法步骤。
[0044]
与现有技术因嵌入式实时系统硬件资源的限制而使语音识别差、速度慢、容易冲突相比较,本发明利用高性能的移动终端进行语音识别,大大提高了识别的准确性和速度,将识别结果转换成与智能电视遥控协议对应的虚拟遥控器键值,并进行编码打包推送,智能电视解码出对应平台的虚拟遥控器键值,实现对应的语音操作,避免了界面冲突,提高了用户体验。
附图说明
[0045]
下面结合附图对本发明的具体实施方式作进一步的说明,其中:
[0046]
图1是本发明一种语音控制智能电视的方法优选实施例的流程图。
[0047]
图2是本发明一种语音控制智能电视的系统优选实施例的结构图。
具体实施方式
[0048]
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0049]
智能电视系统属于嵌入式实时系统,也就决定其硬件资源有限,对于语音识别就会存在响应时间长、识别语音性能差的问题。现有技术智能电视要实现全场景控制是通过本机虚拟遥控码进行模拟操作实现的,智能电视自带的语音识别界面,同样属于用户界面的范畴,因此会产生容易拦截响应,干扰用户的操作。为了解决这些问题,本发明提供了一种全场景环境下的语音控制智能电视的方法,利用移动终端,优选采用智能手机,进行语音识别,通过多屏互动功能将语音命令转换为与智能电视约定的遥控功能协议并发送给智能电视对智能电视进行语音控制。如图1是本发明一种语音控制智能电视的方法优选实施例流程图,本发明方法优选实施例包括如下步骤:
[0050]
步骤s100,移动终端获取用户语音数据。
[0051]
具体而言,本实施例中,移动终端接收用户的语音,对接收到的语音进行语音识别,是利用隐马尔可夫模型进行自动语音识别(asr,automatic speech recognition),获取用户输入的语音数据。利用基于隐马尔可夫模型进行语音识别技术为现有技术,此处不
赘述。比如,用户通过移动终端的语音识别应用接收到用户语音输入“打开中央电视台新闻频道”,移动终端通过asr技术获取用户的语音内容为“打开中央电视台新闻频道”文本。
[0052]
步骤s200,移动终端检测相同网络下的智能电视进行匹配握手。
[0053]
具体而言,本实施例中,所述移动终端检测相同网络下的智能电视进行匹配握手具体包括如下步骤:移动终端启动多屏互动应用,并检测处于相同网络下的智能电视,所述移动终端向检测到的所述智能电视发送匹配数据,所述智能电视响应所述移动终端进行匹配握手。
[0054]
移动终端要与智能电视端实现匹配握手,即实现双向通信握手,采用在移动终端上启动多屏互动应用来进行,启动多屏互动应用后,移动终端会检测处于相同网络下的智能电视,检测到相同网络下的智能电视后,移动终端就可以向该相同网络下的智能电视发送匹配数据,发送匹配数据是通过向所述智能电视发送匹配数据包实现的,所述匹配数据的格式为:
[0055]
headnamemaceventcustomcrc
[0056]
其中:head表示匹配数据包的表头名称,name表示智能电视的名称;mac表示网卡唯一标识地址,或者其它唯一标识符,比如产品的序列号;event表示请求的服务内容,例如观看智能手机的a视频;custom表示自定义数据;crc为匹配数据的校验位。
[0057]
步骤s300,移动终端将所述用户语音数据转换成与所述智能电视约定的遥控功能协议,并将所述用户语音数据和所述遥控功能协议封装为数据包推送至所述智能电视端。
[0058]
具体而言,本实施例中,所述移动终端获取所述语音内容后,识别出对应的操作命令,如上述步骤s100中用户的语音操作命令“打开中央电视台新闻频道”;所述移动终端将所述操作命令转换为所述智能电视的遥控功能协议,比如,用户的语音操作命令为“打开中央电视台新闻频道”,移动终端从该语音操作命令中抽象出与智能电视遥控功能协议中与打开中央电视台新闻频道相对应的功能代码,以便于所述智能电视能够根据该功能代码准确识别从移动终端传来的用户语音操作命令。
[0059]
为了将用户的语音操作命令传输给智能电视,移动终端的多屏互动应用建立一个rtp(real-time transport protocol,实时传输协议)会话,根据与智能电视的匹配结果,确定一对目的传输地址(即智能电视的地址),所述目的传输地址由一个网络地址和一对端口组成,rtp(real-time transport protocol,实时传输协议)包和rtcp(real-time transport control protocol,实时传输控制协议)包各使用一个端口,其中,rtp包发向偶数的udp(user datagram protocol用户数据报协议)端口,rtcp包发向奇数udp端口,移动终端根据握手协议反馈的智能电视的特征uid(user identification用户身份证明),将所述uid数据封装进rtcp包中的源描述字段中,并将所述rtcp包发往udp端口对中的奇数端口,移动终端根据uid包中的event字段,将对应的流媒体数据(或其它服务)封装成rtp包,发往udp端口对中的偶数端口,移动终端进行虚拟遥控操作,则将与智能电视之间约定的遥控码,即虚拟遥控键值封装进rtcp包中的app字段中。
[0060]
其中,遥控功能协议格式如下:
[0061]
遥控功能协议标识头功能参数终止码
[0062]
例如:需要将智能电视的音量调至50,相对上述移动终端接收到的并发送给用户的语音操作命令为“音量调节”,假设遥控功能协议标识头为0x29 0xff,功能音量约定为
0x38,参数为0x32,终止码为0x99 0x78;则数据包为0x29,0xff,0x38,0x32,0x99,0x78。
[0063]
数据包示例如下:
[0064]
rtpcontent
ꢀꢀ
rtcpuidrcu [0065]
传输ip数据包的格式如下:
[0066]
ip首部udp首部rtp首部rtp数据部分
[0067]
步骤s400,所述智能电视将接收到的数据包解码,同时根据所述遥控功能协议响应相应的遥控功能。
[0068]
具体而言,本实施例中,所述智能电视通过所述一对udp端口接收到所述移动终端发送的数据包并进行解码。智能电视解析出移动终端发送过来的rtcp包中的uid数据,与所述智能电视本身的uid数据匹配,匹配成功后,解析对应的rtp包,播放所述rtp包中的语音内容,若有对应遥控码,解析其中的相关功能和参数,同步执行遥控协议,根据所述遥控功能协议执行相应的遥控功能。
[0069]
例如:步骤s300中,需要将智能电视的音量调至50,移动终端发送的数据包为0x29,0xff,0x38,0x32,0x99,0x78,则智能电视接收到的数据包也为0x29,0xff,0x38,0x32,0x99,0x78;匹配遥控功能协议标识头(0x29,0xff)成功,查找遥控功能协议标识头与终止码(0x99,0x78)之间的数据,解析出需要调整的音量值50,最后,将智能电视音量调整到50。
[0070]
本发明方法实施例利用高性能的移动终端进行语音识别,大大提高了语音识别的准确性和速度,利用移动终端与智能电视双向握手通信后,将移动终端获取的用户语音操作命令以及将该语音操作命令对应智能电视的遥控功能协议的功能代码,及虚拟遥控键值发送到智能电视,使得智能电视避免了其嵌入式设备识别语音性能差、速度差的弱点,智能电视只需要接收移动终端发送过来的用户语音操作命令和相对应的遥控功能协议识别的遥控代码进行解码,其中,遥控代码为移动终端和智能电视握手通信后协议中约定的虚拟遥控键值,遥控代码解码后再直接播放用户语音及控制对应的功能操作即可,既解决了智能电视多个页面接收虚拟按键消息时容易冲突的问题,又提高了语音识别的速度,提高了用户体验。
[0071]
本发明还提供一种语音控制智能电视的系统,用于解决智能电视语音识别差、速度慢,多个页面接收虚拟按键消息时,容易冲突的问题。如图2本发明一种语音控制智能电视的系统优选实施例的结构图所示,本发明优选实施例优选移动终端为智能手机,所述语音控制智能电视的系统80包括:语音识别模块10、检测匹配模块20、语音数据推送模块30、语音数据控制模块40。
[0072]
所述语音识别模块10用于对移动终端接收到的用户语音进行语音识别,并获取用户语音数据;
[0073]
本实施例中,所述语音识别模块10用于对移动终端接收到的用户语音进行语音识别,是利用隐马尔可夫模型进行自动语音识别,获取出语音内容,具体识别功能与上述方法优选实施例中步骤s100相同,此处不赘述。
[0074]
所述检测匹配模块20用于移动终端检测相同网络下的智能电视,并进行匹配握手;
[0075]
本实施例中,所述检测匹配模块20在检测相同网络下的智能电视,并进行匹配握手的具体功能包括:启动所述移动终端的多屏互动应用,并检测处于相同网络下的智能电视;所述移动终端向检测到的所述智能电视发送匹配数据;所述智能电视响应所述移动终端进行匹配握手。具体检测匹配功能与上述方法优选实施例中步骤s200相同,此处不赘述。
[0076]
所述语音数据推送模块30用于将所述语音识别模块获取的用户语音数据转换成与所述智能终端约定的遥控功能协议,并将所述语音内容和所述遥控功能协议进行数据包封装,推送至所述智能电视。
[0077]
本实施例中,所述语音数据推送模块30具体包括如下功能:
[0078]
根据所述语音识别模块10获取移动终端接收的所述语音内容,并识别出对应的操作命令;将所述操作命令转换为所述智能电视的遥控功能协议;
[0079]
启动所述移动终端的多屏互动应用建立一个rtp会话,根据与所述智能电视匹配握手结果确定智能电视的目的地址,所述目的地址包含一个网络地址和一对udp端口;将所述移动终端接收到的所述语音内容通过rtp包发送到所述智能电视一对udp端口的偶数端口,将所述遥控功能协议通过rtcp包发送到所述智能电视一对udp端口的奇数端口,其中,所述遥控功能协议包含遥控协议标识头、功能、参数和终止码。具体语音数据推送功能与上述方法优选实施例中步骤s300相同,此处不赘述。
[0080]
所述语音数据控制模块40用于将所述智能电视接收到的所述数据包解码,并根据所述遥控功能协议响应相应的遥控功能。
[0081]
本实施例中,所述语音数据控制模块40具体包括如下功能:
[0082]
通过所述智能电视的一对udp端口接收到所述移动终端发送的数据包并进行解码;通过所述智能电视解析出所述移动终端发送过来的所述rtcp包中的uid数据,与所述智能电视的uid数据匹配;如果所述rtcp包中的uid数据与所述智能电视的uid数据匹配,所述智能电视解析对应的rtp包,播放所述rtp包中的语音内容,并根据所述遥控功能协议执行相应的遥控功能。具体语音数据控制功能与上述方法优选实施例中步骤s400相同,此处不赘述。
[0083]
同理,本发明系统利用高性能的移动终端进行语音识别,大大提高了语音识别的准确性和速度,利用移动终端与智能电视双向握手通信后,将移动终端获取的用户语音操作命令以及将该语音操作命令对应智能电视的遥控功能协议的功能代码发送到智能电视,使得智能电视避免了其嵌入式设备识别语音性能差、速度差的弱点,智能电视只需要接收移动终端发送过来的用户语音操作命令和相对应的遥控功能协议识别的遥控代码进行解码,其中,遥控代码为移动终端和智能电视握手通信后协议中约定的虚拟遥控键值,遥控代码解码后再直接播放用户语音及控制对应的功能操作即可,既解决了智能电视多个页面接收虚拟按键消息时容易冲突的问题,又提高了语音识别的速度,提高了用户体验。
[0084]
另外,本发明还提供一种存储介质,存储介质为计算机可读存储介质,所述存储介质存储有语音控制智能电视的程序,该语音控制智能电视的程序被处理器执行时实现上述的语音控制智能电视的方法步骤,具体操作过程步骤与上述方法优选实施例相同,此处不赘述。
[0085]
应当理解的是,以上所述仅为本发明的较佳实施例而已,并不足以限制本发明的技术方案,对本领域普通技术人员来说,在本发明的精神和原则之内,可以根据上述说明加
以增减、替换、变换或改进,而所有这些增减、替换、变换或改进后的技术方案,都应属于本发明所附权利要求的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1