本发明涉及远程语音控制领域,尤其涉及一种基于电话网络的远程语音控制系统。
背景技术:
现有的语音控制系统普遍采用近距离的语音控制模式对待控制设备进行控制,控制范围受限,且存在指令复杂难记,不利于用户理解操作,交互效果差。
技术实现要素:
针对现有的电话控制系统存在的上述问题,现提供一种旨在实现可远距离进行控制的基于电话网络的远程语音控制系统。
具体技术方案如下:
一种基于电话网络的远程语音控制系统,包括:
信号转换单元,用于将电话网络中的信号转换为承载音频的模拟信号;
收发单元,连接所述信号转换单元,用于接收模拟信号或发送模拟信号,所述模拟信号包括验证信息、音频信号和请求信号;
模拟数字转换器,连接所述收发单元,用以将所述音频信号转换为数字信号并输出;
控制单元,连接所述模拟数字转换器;
语音处理单元,连接所述控制单元,用以将所述数字信号转为文本格式与预设的多个控制指令进行匹配,每个所述控制指令对应一反馈信号,以获取相应的控制指令及与所述控制指令对应的所述反馈信号并输出;
执行单元,连接所述控制单元,用以根据所述控制指令执行相应的操作;
数字模拟转换器,分别连接所述收发单元和所述控制单元,用以将所述反馈信号转换为模拟信号并输出。
优选的,还包括:
检测单元,分别连接所述收发单元和所述控制单元,用以检测所述请求信号是否为预设请求信号,获取检测结果并输出;
控制单元用以将通过检测的所述信号输出至所述语音处理单元,或将接收到的所述反馈信号发送至所述数字模拟转换器。
优选的,还包括:
验证单元,分别连接所述收发单元和所述控制单元,用以将接收到的所述验证信息与预设验证信息匹配,获取匹配结果并输出;
所述控制单元用以将通过检测及验证的所述信号输出。
优选的,所述验证信息包括模拟信号和/或数字信号,所述验证单元根据接收到的验证信息进行相应的验证。
优选的,所述验证单元包括:
声纹识别模块,包括有预设语音模式,所述声纹识别模块用以将所述模拟信号与所述语音模式匹配,以获取匹配结果。
优选的,所述验证单元包括:
口令识别模块,包括有预设文本口令,所述口令识别模块用于将所述模拟信号转换为数字信号,并将所述数字信号转换为文本数据,匹配所述文本数据与所述文本口令,以获取匹配结果。
优选的,所述验证单元包括:
双音多频识别模块,包括有预设解码值,所述双音多频识别模块用以将所述数字信号进行解码,并将解码后的数据与所述解码值进行匹配,以获取匹配结果。
优选的,所述语音处理单元包括:
语音识别模块,用以将所述数字信号转换为所述文本格式。
优选的,所述语音处理单元还包括:
语义处理模块,包括有预设的多个所述控制指令,所述语义处理模块连接所述语音识别模块,用以将所述文本格式与多个所述控制指令进行匹配,以获取相应的控制指令及与所述控制指令对应的反馈信号并输出。
优选的,还包括:
拨号控制单元,连接所述信号转换单元,用于接通承载音频的所述模拟信号或挂断承载音频的所述模拟信号或进行拨号。
上述技术方案的有益效果:
本技术方案,通过电话网络进行语音控制,实现了可远距离传输控制信号的目的,控制范围广且操作简单。
附图说明
图1为本发明所述基于电话网络的远程语音控制系统的一种实施例的模块图;
图2为用户端的身份验证识别的流程图;
图3为声纹识别验证流程图;
图4为口令识别验证流程图;
图5为双音多频识别验证流程图;
图6为远程语音控制的流程图;
图7为远程语音输出的流程图;
图8为本发明所述基于电话网络的远程语音控制系统的另一种实施例的模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
如图1所示,一种基于电话网络的远程语音控制系统,包括:
信号转换单元,用于将电话网络中的信号转换为承载音频的模拟信号;
收发单元,连接所述信号转换单元,用于接收模拟信号或发送模拟信号,所述模拟信号包括验证信息、音频信号和请求信号;
模拟数字转换器,连接收发单元,用以将音频信号转换为数字信号并输出;
控制单元,连接模拟数字转换器;
语音处理单元,连接控制单元,用以将数字信号转为文本格式与预设的多个控制指令进行匹配,每个控制指令对应一反馈信号,以获取相应的控制指令及与控制指令对应的反馈信号并输出;
执行单元,连接控制单元,用以根据控制指令执行相应的操作;
数字模拟转换器,分别连接收发单元和控制单元,用以将反馈信号转换为模拟信号并输出。
在本实施例中,通过电话网络进行语音控制,实现了可远距离传输控制信号的目的。采用的信号转换单元可以是固定电话的电话线,通过听筒线将电话网络中的信号转换为承载音频的模拟信号,也可以是移动电话通过听筒上的无线接收模块将电话网络中的信号转换为承载音频的模拟信号。语音处理单元可将用户发送的音频模拟信号转换为控制指令,并获取相应的反馈信号,通过收发单元将反馈的模拟信号反馈至用户使用户了解该远程语音控制系统的下一步操作,丰富了用户体验,并根据控制指令对相应的设备进行相应的控制,该控制方式操作简单,交互方式便于用户使用。特别是可使孩子或者老人自如使用,操作简单。
如图1和2所示,在优选的实施例中,还可包括:
检测单元,分别连接收发单元和控制单元,用以检测请求信号是否为预设请求信号,获取检测结果并输出;
控制单元用以将通过检测的信号输出至语音处理单元,或将接收到的反馈信号发送至数字模拟转换器。
该基于电话网络的远程语音控制系统在没有接收到请求信号之前处于待机状态,当接收到请求信号后,通过检测单元进行来电检测,以判断接收的请求信号是否为预设的请求信号,若是,则允许用户端进行远程控制,若否,则该系统仍处于待机状态。
如图1和2所示,在优选的实施例中,还可包括:
验证单元,分别连接收发单元和控制单元,用以将接收到的验证信息与预设验证信息匹配,获取匹配结果并输出;
控制单元用以将通过检测及验证的信号输出。
在本实施例中,通过验证单元对用户端发送的验证信息进行验证,以达到加密远程控制的目的。
如图2所示,在优选的实施例中,验证信息包括模拟信号和/或数字信号,验证单元根据接收到的验证信息进行相应的验证。
当用户端提供的信号通过检测单元检测后,可根据系统验证信息选择相应的验证识别模式,进行验证信息识别。
如图2和3所示,在优选的实施例中,验证单元可包括:
声纹识别模块,包括有预设语音模式,声纹识别模块用以将模拟信号与语音模式匹配,以获取匹配结果。
当验证信息为声纹验证信息时,采用声纹识别模块进行识别验证,如图3所示具体识别流程为:扫描声纹信号,判断在预定时间内是否接收到声纹的模拟信号,若有,则将模拟信号转换为数字信号,并进行声纹验证,依据声纹是否匹配预设语音模式,以获取验证结果,若是验证成功,若否则验证失败;当在预设时间内没有接收到模拟信号时,判断该扫描次数是否在预设次数内,或是,则验证失败,若否则发送离线提示,重新进行扫描。
如图2和4所示,在优选的实施例中,验证单元还可包括:
口令识别模块,包括有预设文本口令,口令识别模块用于将模拟信号转换为数字信号,并将数字信号转换为文本数据,匹配文本数据与文本口令,以获取匹配结果。
当验证信息为口令验证信息时,采用口令识别模块进行识别验证,如图4所示具体识别流程为:扫描口令模拟信号,判断在预定时间内是否接收到口令的模拟信号,若有,则将模拟信号转换为数字信号,在将数字信号转换为文本数据,进行口令验证,依据文本口令是否匹配预设文本口令,以获取验证结果,若是验证成功,若否则验证失败;当在预设时间内没有接收到模拟信号时,判断该扫描次数是否在预设次数内,或是,则验证失败,若否则发送离线提示,重新进行扫描。
如图2和5所示,在优选的实施例中,验证单元还可包括:
双音多频识别模块,包括有预设解码值,双音多频识别模块用以将数字 信号进行解码,并将解码后的数据与解码值进行匹配,以获取匹配结果。
当验证信息为数字验证信息(DTMF按键验证)时,采用双音多频识别模块进行识别验证,按键密码以#号结束,当用户在用户端按下按键后,通过双音多频识别模块将按键解码,得到用户输入结果,如图5所示具体识别流程为:扫描数字信号,判断在预定时间内是否接收到数字信号,若有,则将数字信号进行解码,判断解码后的数据与预设解码值是否匹配,若匹配,则验证成功,若不匹配,则验证失败;当在预设时间内没有接收到数字信号时,则验证失败。
进一步地,其中,声纹验证识别的优先级高于口令验证识别和多音多频验证识别,口令验证识别的优先级高于多音多频验证识别。
在优选的实施例中,语音处理单元可包括:
语音识别模块,用以将数字信号转换为文本格式。
如图1、6、7和8所示,在优选的实施例中,语音处理单元还可包括:
语义处理模块,包括有预设的多个控制指令,语义处理模块连接语音识别模块,用以将文本格式与多个控制指令进行匹配,以获取相应的控制指令及与控制指令对应的反馈信号并输出。
如图6所示,在本实施例中,系统接收用户端发送的控制指令的控制流程为:接收信号,将接收到的音频信号转换为数字信号,通过语义处理模块将数字信号转换为文本格式,以识别该文本对应的控制指令,控制单元根据该控制指令控制执行单元进行相应的操作。进一步地,收发单元采用电话线接口,例如:用户在电话远端说了“把外面的路灯关掉”,通过模拟数字转换器将“把外面的路灯关掉”语音转成数字信号;采用语音识别模块(ASR模块)进行自动语音识别,如果语音处理单元连接了互联网,该数字语音信号会优先传给云端语音处理单元;通过语音识别模块(ASR模块)将数字信号“把外面的路灯关掉”转换成文本格式的“把外面的路灯关掉”;该文本数据会优先发送至云端自然语意处理模块来处理;根据自然语义处理模块 (NLP模块)的识别,系统得到具体语意所对应的业务控制指令,通过控制单元将业务控制指令传给执行单元执行以执行相应的操作。
如图7所示,系统根据接收到的用户端发送的控制指令输出相应反馈语音的流程为:通过语义处理模块根据控制指令获取相应的反馈信号,将反馈信号转换为模拟信号,并通过收发单元将转换后的模拟信号输出至用户端。例如:用户通过电话说“把灯关掉”,系统接到该语音后,会向用户反馈“好的,这就关。”,具体地语义处理模块可根据当时的设备的状况及控制指令生成输出文本,此处为“好的,这就关。”;然后将文本转化成语音流格式的“好的,这就关”,通过数字模拟转换器将数字语音流转化成模拟信号,通过电话网络,传给电话远端用户的听筒,从而实现用户可通过电话听筒听到“好的,这就关。”的语音反馈。
在优选的实施例中,还可包括:
拨号控制单元,连接所述信号转换单元,用于接通承载音频的所述模拟信号或挂断承载音频的所述模拟信号或进行拨号。
在本实施例中,若拨号控制单元采用固定电话可通过指令线控制AT指令;若拨号控制单元采用移动电话则采用软件指令控制电话的接通或挂断或拨号。
如图8所示,执行单元可包括:电视和/或热水器和/或电灯和/或空调和/或摄像头和/或门锁。
其中热水器、电灯、电视和空调可由第一类控制器进行控制,第一类控制器可采用第三方家电互联网技术;门锁和摄像头可采用第二类控制器控制,第二类控制器可采用Rokid智能设备控制器。
例如,当用户出门后发现门没有锁,用户可通过手机拨打家中的电话,接通后,先通过身份识别,然后在电话中说“Roki,查看下门有没有锁”,系统根据用户指令及当时的设备状况,在电话里语音回复说“主人,你又忘锁门了”或者“门已经锁好”等,用户听到系统回答后,可直接挂断电话。
用户还可以直接用单位电话打到家里,电话接通后,先通过身份识别,在电话中说“把热水器打开,晚上要回来洗澡。天黑了就把房间的灯开起来。”,系统根据用户语音指令及当时的设备状况,在电话里语音回复“okay,热水器现在已经打开,设置温度50度,灯过会开。你还有吩咐吗”,用户听到系统回答后,可直接挂断电话。
用户出门后,看到家门口的路灯还亮着,忘记关了,通过手机拨打家中的电话,接通后,先通过身份识别,然后在电话中说“Roki,把路灯关掉”,系统根据用户指令及当时的设备状况,在电话里语音回复“好的,这就关。”用户听到Roki系统回答后,可直接挂断电话。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。