一种语音控制的系统、遥控器及服务器的制造方法

文档序号:9728464阅读:517来源:国知局
一种语音控制的系统、遥控器及服务器的制造方法
【技术领域】
[0001]本发明涉及语音处理技术领域,尤其涉及一种语音控制的系统、遥控器及服务器。
【背景技术】
[0002]语音识别技术,也被称为自动语音识别(Automatic Speech Recognit1n,ASR),其目标为将人类的语音中的语义内容转换为计算机可读的信息输入,比如二进制编码或者字符序列。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。通过与其他自然语音处理技术结合使用,比如机器翻译及语音合成技术,语音识别技术可以构建更加复杂的应用,例如语音至语音的翻译应用。语音特征信息是语音识别中的一种基本因素,语音识别系统常用的语音特征信息有线性预测系数、倒频谱系数、平均过零率、能量、短时频谱、共振峰频率及带宽等。而作为一种非常方便有效的控制方法,语音控制一直是许多智能设备的优选控制方法。
[0003]但是,当前的语音识别存在误识别且识别率较低的情况,会影响语音控制在智能设备控制上的广泛应用,因而智能语音识别率及效率低的问题亟待解决。

【发明内容】

[0004]本发明解决的问题是如何提高语音识别的效率及成功率。
[0005]为解决上述问题,本发明提供一种语音控制的系统,所述系统包括:遥控器、主机及服务器,其中:
[0006]所述遥控器,适于对用户进行身份特征识别以获取所述用户的识别码,接收来自所述用户的语音数据,将所述用户的识别码添加至所述用户的语音数据并传输至所述主机;
[0007]所述主机,适于接收来自所述遥控器的具有所述用户的识别码的语音数据,并将所述具有识别码的语音数据传输至所述服务器,接收来自所述服务器的语音识别结果,将所述语音识别结果转化为语音控制指令,并按照所述语音控制指令相应地执行操作;
[0008]所述服务器,适于接收来自所述主机的语音数据,解析得到用户的识别码,根据所述用户的识别码确定所述用户是否为新用户,当所述用户为新用户时,建立所述用户的数据库,并对所述数据库进行语音学习,当所述用户非新用户时,对已建立的所述用户的数据库进行语音学习,并根据所述用户的数据库对所述语音数据进行语音识别,得到语音识别结果,将所述语音识别结果传输至所述主机。
[0009]可选地,所述遥控器,适于利用以下至少一种方式对用户进行身份特征识别:人脸识别及指纹识别。
[0010]可选地,所述遥控器,通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。
[0011]本发明实施例提供一种遥控器,所述遥控器包括:
[0012]识别单元,适于对用户进行身份特征识别,并获取所述用户的识别码;
[0013]第一接收单元,适于接收来自所述用户的语音数据;
[0014]添加单元,适于将所述识别单元获取的所述用户的识别码添加至所述第一接收单元接收的所述用户的语音数据;
[0015]第一传输单元,适于把所述添加单元处理后的带有所述用户识别码的用户的语音数据传输至主机。
[0016]可选地,所述识别单元,包括以下至少一个子单元:人脸识别子单元及指纹识别子单元,其中:
[0017]所述人脸识别子单元,适于对对用户的人脸特征进行识别;
[0018]所述指纹识别子单元,适于对对用户的指纹特征进行识别。
[0019]可选地,所述遥控器通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。
[0020]可选地,所述遥控器为手机。
[0021 ]本发明实施例提供了一种服务器,所述服务器包括:
[0022]第二接收单元,适于接收来自主机的语音数据;
[0023]解析单元,适于解析得到用户的识别码,并根据所述用户的识别码确定所述用户是否为新用户;
[0024]数据库建立单元,适于当所述解析单元确定所述用户为新用户时,建立所述用户的数据库;
[0025]语音学习单元,适于当所述解析单元确定所述用户为新用户时,对所述数据库建立单元建立的所述用户的数据库进行语音学习,并根据所述用户的数据库对所述语音数据进行语音识别,得到语音识别结果;并适于当所述解析单元确定所述用户非新用户时,对已建立的所述用户的数据库进行语音学习,并根据所述用户的数据库对所述语音数据进行语音识别,得到语音识别结果;
[0026]第二传输单元,适于将所述语音学习单元得到的语音识别结果传输至所述主机。
[0027]与现有技术相比,本发明的技术方案具有以下优点:
[0028]通过遥控器对用户进行身份特征识别以获取所述用户的识别码,并将所述用户的识别码添加至所述用户的语音数据并传输至主机,再由所述主机将所述具有识别码的语音数据转发至服务器,接着由所述服务器解析得到用户的识别码,根据所述用户的识别码确定所述用户是否为新用户。当所述用户为新用户时,所述服务器建立所述用户的数据库,并对所述数据库进行语音学习,当所述用户非新用户时,所述服务器对已建立的所述用户的数据库进行语音学习,并根据所述用户的数据库对所述语音数据进行语音识别,得到语音识别结果,将所述语音识别结果传输至所述主机,以控制所述主机执行与所述语音数据对应的操作。由于可以有针对性的对用户的语音进行学习并识别,故可以了解关于每个用户更多的语音特征信息,从而可以提高语音控制的效率及成功率。
【附图说明】
[0029]图1是本发明实施例中的一种语音控制的系统的结构示意图;
[0030]图2是本发明实施例中的一种语音控制的系统的信令流程示意图;
[0031 ]图3是本发明实施例中的一种遥控器的结构示意图;
[0032]图4是本发明实施例中的一种服务器的结构示意图。
【具体实施方式】
[0033]作为一种非常方便有效的控制方法,语音控制一直是许多智能设备的优选控制方法。但是,当前的语音识别存在误识别且识别率较低的情况,会影响语音控制在智能设备控制上的广泛应用,因而智能语音识别率及效率低的问题亟待解决。
[0034]为解决上述问题,本发明实施例提供了语音控制的系统,通过有针对性的对用户的语音进行学习并识别,故可以得到关于每个用户更多的语音特征信息,从而可以提高语音控制的效率。
[0035]为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0036]图1示出了本发明实施例中的一种语音控制的系统的结构示意图,所述系统可以包括:遥控器1、主机2及服务器3,其中:
[0037]所述遥控器1,适于对用户进行身份特征识别以获取所述用户的识别码,接收来自所述用户的语音数据,将所述用户的识别码添加至所述用户的语音数据并传输至所述主机2;
[0038]所述主机2,适于接收来自所述遥控器1的具有所述用户的识别码的语音数据,并将所述具有识别码的语音数据传输至所述服务器3,接收来自所述服务器3的语音识别结果,将所述语音识别结果转化为语音控制指令,并按照所述语音控制指令相应地执行操作;
[0039]所述服务器3,适于接收来自所述主机2的语音数据,解析得到用户的识别码,根据所述用户的识别码确定所述用户是否为新用户,当所述用户为新用户时,建立所述用户的数据库,并对所述数据库进行语音学习,当所述用户非新用户时,对已建立的所述用户的数据库进行语音学习,并根据所述用户的数据库对所述语音数据进行语音识别,得到语音识别结果,将所述语音识别结果传输至所述主机2。
[0040]在具体实施中,所述遥控器1可以通过多种方式与用户进行身份特征识别,比如可以通过人脸这种身份特征对用户进行识别,也可以通过指纹这种身份特征对用户进行识另IJ,还可以通过把人脸及指纹这两种身份特征结合对用户进行识别。
[0041]在具体实施中,所述遥控器1可以通过多种方式与所述主机2进行短距离的通讯,比如可以通过蓝牙和所述主机2连接并进行短距离的通讯,也可以通过紫蜂(Zigbee)协议与所述主机2建立连接并通讯。
[0042]为使得本领域的技术人员更好地理解和实现本发明,图2示出了本发明实施例中的一种语音控制的系统的工作流程图,以下结合图2对所述系统的工作原理进行详细介绍。
[0043]S21:遥控器对用户进行身份特征识别以获取所述用户的识别码。
[0044]在具体实施中,如图2所示,当用户4使用所述遥控器1语音控制所述主机2时,首先所述遥控器1可以设置相关的功能键,用以采集所述用户4的身份特征,并对所述身份特征进行识别,从而获取所述用户4的专属的识别码。
[0045]S22:用户发送语音数据。
[0046]S23:遥控器将所述用户的识别码添加至所述用户的语音数据。
[0047]在具体实施中,所述遥控器1可以接收来自所述用户4的语音数据,然后将所述用户4的识别码添加到所述用户4的语音数据上。
[0048]S24:遥控器将具有所述用户的识别码的所述用户的语音数据传输至所述主机。
[0049]为了节约成本,所述遥控器1无需具备无线连接功能,而所述遥控器1可以与所述主机2进行近距离的通讯,故所述遥控器1通过所述近距离的通讯方式可以把所述带有所述用户的专属的识别码的语音数据发送给所述主机2。
[0050]需要说明的,所述遥控器1可以利用以下至少一种方式对用户进行身份特征识别:人脸识别及指纹识别。并且,也可以通过以下至少一种方式与所述主机2连接:蓝牙或基于紫蜂协议的通讯。本领域技术人员可以根据实际需要进行选择,具体所述遥控器1使用哪种方式对用户进行身份识别,还是使用哪种方式与所述主机2连接,均不对本发明构成任何限制。
[0051]S25:主机接收来自所述遥控器的具有所述用户的识别码的语音数据,并将所述具有识别码的语音数据传输至所述服务器。
[0052]所述电视等主机2可以接收来自所述遥控器1的具有所述用户的识别码的语音数据,由于现在的电视等主机2设备一般均具备无线传输功能,且可以支持云端服务器3,故所述主机2可以将所述具有识别码的语音数据传输至所述服务器3,使得所述服务器3可以对所述语音数据做相应的处理。
[0053]S26:服
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1