本发明涉及语音交互控制技术,特别涉及一种基于语音交互控制设备的系统及方法。
背景技术:
随着人工智能技术的迅猛发展,基于语音识别技术的语音交互控制变得日益普及。语音交互控制解放了人们的双手,也让人们真正摆脱了遥控器的束缚,极大的提升了用户交互体验。由于语音交互技术涉及到语音的收发两端,需要从软件和硬件的层面进行支持实现,因此针对没有搭载语音收发硬件的老旧或低端设备,语音交互控制功能就无法实现,用户也就无法享受语音交互控制带来的良好体验。
技术实现要素:
本发明所要解决的技术问题是:提出一种基于语音交互控制设备的系统及方法,解决传统技术中由于老旧或低端设备的语音硬件配置缺失而造成的无法实现语音交互控制功能的问题,从而提升用户的交互体验。
本发明解决上述技术问题所采用的技术方案是:
基于语音交互控制设备的系统,包括可通过网络建立连接的至少一个语音发送端设备和至少一个语音接收端设备;所述语音发送端设备用于对用户的语音进行拾取及编码,将编码后的语音数据通过网络发送至语音接收端设备;所述语音接收端设备用于接收来自语音发送端设备的语音数据,并进行解析处理,获取对应交互控制指令并执行。
作为进一步优化,所述语音发送端和语音接收端设备处于同一局域网内。
通过局域网可以建立语音发送端和语音接收端的快速相互发现和连接,从而满足即时语音控制的需求。
作为进一步优化,所述语音接收端设备为具备联网功能而未搭载语音收发硬件的设备。
对于具备联网功能未搭载语音收发硬件的设备,采用本方案可以扩展出其语音交互功能,从而提升对这类设备的交互控制体验。
作为进一步优化,所述语音接收端设备还用于在执行对应交互控制指令后,通过网络向语音发送端设备反馈执行结果,语音发送端设备对执行结果进行显示或者语音播放。
若语音接收端设备为电视机类的显示设备,则用户可以直观地看到设备对交互控制指令的执行情况,而若语音接收端为空调、冰箱等设备,则用户无法直观知晓设备对交互控制指令是否执行成功,因此这里需要向语音发送端设备反馈一个执行结果,让用户知晓指令的执行状态。
作为进一步优化,所述语音发送端设备包括:
第一连接建立模块,用于与语音接收端设备建立连接;
语音拾取模块,用于拾取用户的语音输入;
编码模块,用于对用户的输入语音进行统一格式的编码;
发送模块,用于将编码后的语音数据发送给语音接收端设备;
所述第一连接建立模块具体包括:
网络接入模块,用于在语音发送端设备开机后,加入至语音接收端设备所处局域网;
侦听模块,用于侦听语音接收端设备的上线报文;
搜索模块,用于构建设备搜索请求报文,并向接入的局域网进行广播该请求报文;
列表模块,用于将发现的语音接收端设备以列表形式展示;
连接请求模块,用于在从列表中选择语音接收端设备后,向选择的语音接收端设备发送连接请求。
作为进一步优化,所述语音接收端设备包括:
第二连接建立模块,用于与语音发送端设备建立连接;
接收模块,用于从语音发送端设备接收编码后的语音数据;
解析模块,用于对收到的语音数据进行解码和相关解析处理,获得对应交互控制指令;
执行模块,用于执行交互控制指令;
所述第二连接建立模块具体包括:
联网模块,用于在语音接收端设备开机后自动联网;
上线通知模块,用于在内部局域网络按一定频率发送设备上线报文,宣告设备上线;
侦听模块,用于侦听语音发送端设备的设备搜索请求报文;
反馈模块,用于在侦听到设备搜索请求报文后,向对应语音发送端设备反馈响应报文;
连接模块,用于在收到语音发送端设备的连接请求后,接受该请求与对应语音发送端设备建立连接。
作为进一步优化,所述语音发送端设备为智能手机。
由于智能手机为用户最广泛使用的手持设备,且具有拾音、录音、编码、联网等功能,因此能够满足本方案对老旧或低端设备的语音交互功能扩展的需求。
此外,基于上述系统,本发明还提供了一种基于语音交互控制设备的方法,包括:
语音发送端设备和语音接收端设备建立网络连接;
语音发送端设备对用户的语音进行拾取及编码,将编码后的语音数据通过网络发送至语音接收端设备;
语音接收端设备接收来自语音发送端设备的语音数据,并进行解析处理,获取对应交互控制指令并执行。
作为进一步优化,所述语音发送端设备和语音接收端设备通过局域网建立连接,方法为:
步骤1、语音接收端设备上线通知:
语音接收端设备开机后自动联网,并在内部局域网络按一定频率发送设备上线报文,宣告设备上线,同时开启设备搜索请求报文的侦听;
步骤2、语音发送端设备上线并搜索接收端设备:
语音发送端设备开机后,加入语音接收端设备所在的局域网络,启动侦听语音接收端设备的上线报文,并发送设备搜索请求报文;
步骤3、语音发送端设备获取语音接收端设备列表;
步骤4、从语音接收端设备列表中选择接收端,语音发送端设备向选择的接收端发出连接请求;
步骤5、语音接收端设备接受连接请求并建立连接,从而实现双向通信的建立。
语音接收端设备可以自动在其局域网内发送上线报文,该报文可以被加入同一局域网的语音发送端设备侦听,并且,语音发送端设备也可以发送设备搜索请求报文,该请求报文被处于同一局域网的语音接收端设备获取;从而建立语音发送端设备与语音接收端设备之间的快速相互发现;发现的语音接收端设备以列表的形式展现,从而便于快速选择要连接的语音接收端设备。
作为进一步优化,步骤1中,语音接收端设备在侦听到语音发送端设备的设备搜索请求报文后,向该语音发送端设备反馈响应报文;
步骤3中,所述语音发送端设备通过收到的语音发送端设备反馈的响应报文或者侦听到的语音接收端设备的上线报文来发现语音接收端设备,并将发现的语音接收端设备以列表形式进行展示。
本方案中,对语音发送端设备发现语音接收端设备的方式有两种:即通过反馈的响应报文或者侦听到的语音接收端设备的上线报文来发现,两种发现方式可以提高设备发现的效率和准确性。
作为进一步优化,步骤1中,所述语音接收端设备通过网络广播方式发送udp报文格式的设备上线报文,上线报文中包含:接收端设备的名称、接收端设备在局域网络的ip地址,接收端设备侦听服务的端口port信息。
本方案中,通过网络广播方式发送udp报文格式的设备上线报文,能够让处于同一局域网内的一个或多个语音发送端设备能够快速发现该语音接收端设备。
本发明的有益效果是:
不需要对语音接收端设备进行硬件改动,而只需要采用第三方的语音发送端设备通过网络建立与语音接收端设备之间的连接,即可在不增加任何硬件配置及成本的前提下,通过纯软件的方式,为未搭载语音收发硬件的老旧设备和低端设备增加语音交互控制功能,提升这类设备交互控制的体验,给用户带来交互体验的升级。通过本发明的实施,可以极大提升用户对产品的粘性,形成品牌及产品的口碑效应。
附图说明
图1为基于语音交互控制设备的系统结构框图;
图2为语音发送端设备的结构框图;
图3为语音接收端设备的结构框图;
图4为语音发送端设备和语音接收端设备的连接建立和交互流程图。
具体实施方式
本发明旨在提供一种基于语音交互控制设备的系统及方法,解决传统技术中由于老旧或低端设备的语音硬件配置缺失而造成的无法实现语音交互控制功能的问题,从而提升用户的交互体验。
在具体实现上,如图1所示,本发明中基于语音交互控制设备的系统包括:语音发送端设备和语音接收端设备,语音发送端设备和语音接收端设备之间可通过局域网快速建立连接;所述语音发送端设备用于对用户的语音进行拾取及编码,将编码后的语音数据通过局域网发送至语音接收端设备;所述语音接收端设备用于接收来自语音发送端设备的语音数据,并进行解析处理,获取对应交互控制指令并执行。
其中,所述语音发送端设备为独立于语音接收端设备的第三方设备,要求其具有拾音、编码和网络连接功能;如图2所示,其包括:
第一连接建立模块,用于与语音接收端设备建立连接;
语音拾取模块,用于拾取用户的语音输入;
编码模块,用于对用户的输入语音进行统一格式的编码;
发送模块,用于将编码后的语音数据发送给语音接收端设备;
所述第一连接建立模块具体包括:
网络接入模块,用于在语音发送端设备开机后,加入至语音接收端设备所处局域网;
侦听模块,用于侦听语音接收端设备的上线报文;
搜索模块,用于构建设备搜索请求报文,并向接入的局域网进行广播该请求报文;
列表模块,用于将发现的语音接收端设备以列表形式展示;
连接请求模块,用于在从列表中选择语音接收端设备后,向选择的语音接收端设备发送连接请求。
语音接收端设备为未搭载语音收发硬件的老旧设备和低端设备,但是具备联网功能,本发明致力于在这类设备上扩展出语音交互功能,而又无需增加相关硬件;
如图3所示,其包括:
第二连接建立模块,用于与语音发送端设备建立连接;
接收模块,用于从语音发送端设备接收编码后的语音数据;
解析模块,用于对收到的语音数据进行解码和相关解析处理,获得对应交互控制指令;
执行模块,用于执行交互控制指令;
所述第二连接建立模块具体包括:
联网模块,用于在语音接收端设备开机后自动联网;
上线通知模块,用于在内部局域网络按一定频率发送设备上线报文,宣告设备上线;
侦听模块,用于侦听语音发送端设备的设备搜索请求报文;
反馈模块,用于在侦听到设备搜索请求报文后,向对应语音发送端设备反馈响应报文;
连接模块,用于在收到语音发送端设备的连接请求后,接受该请求与对应语音发送端设备建立连接。
基于上述系统,语音发送端设备和语音接收端设备的连接建立和交互流程如图4所示:
1、语音接收端设备上线通知:
本步骤中,接收端设备开机后,自动连接网络,并在内部局域网络按给定频率发送设备上线报文,宣告设备上线,同时,语音接收端设备开启设备搜索请求报文的侦听;
设备上线报文采用udp报文方式,通过网络广播方式发送,上线报文中包含有设备的名称、设备在局域网中的ip地址,设备侦听服务的端口port等信息;
而为了让接收端设备在上线后都能够获得语音交互控制功能,在设备上线后,即按照设定的频率一直发送上线报文,直到设备下线。
另外,语音接收端设备开启设备搜索请求报文的侦听,侦听接收到设备搜索请求报文后,会以设定的格式进行响应和回复。
2、语音发送端设备上线并搜索接收端设备:
本步骤中,语音发送端设备开机后,加入语音接收端设备所在的局域网络,启动侦听语音接收端设备的上线报文,并发送设备搜索请求报文;
设备搜索请求报文采用udp报文方式,通过网络广播的方式发送,此类报文在设备上线后,会间隔发送三次。
3、语音发送端设备获取接收端设备列表:
本步骤中,语音发送端设备将发现的设备进行汇总成列表进行呈现;“发现”语音接收端设备的方式有两种:即通过反馈的响应报文或者侦听到的语音接收端设备的上线报文来发现,两种发现方式可以提高设备发现的效率和准确性。
4、语音发送端设备选择接收端并发送连接请求:
本步骤中,用户可以通过语音发送端设备中的列表来选择某个语音接收端设备,语音发送端设备向该语音接收端设备发出连接请求;
5、语音接收端设备接受连接请求并建立连接:
本步骤中,语音接收端设备在接收到语音发送端设备的连接请求后,接受该请求,从而实现双向通信通路的建立;
6、语音发送和接收处理:
本步骤中,在建立语音发送端设备和语音接收端设备之间的双向通信后,即可实现语音交互控制功能,具体为:语音发送端设备拾取语音输入,并编码成语音控制指令后,将语音控制指令数据通过双向通信通路发送给语音接收端设备,语音接收端设备在接收到语音控制指令后,通过后续相关处理,转化为最终的交互控制指令,并执行相应的交互控制指令,从而实现语音交互控制功能。
实施例:
以语音发送端设备为智能手机,而语音接收端设备为不具备语音收发硬件的网络电视为例:设备之间的通信连接的建立以及语音交互控制流程如下:
(1)网络电视设备开机后,自动连接局域网络,连接完成后,网络电视在内部局域网络按30秒一次的频率发送设备上线报文,上线报文中包括网络电视的名称客厅电视1、网络电视的局域网络ip地址“192.168.1.66”,以及智能电视所监听的网络端口号port“34567”,同时,网络电视设备开启侦听设备搜索请求广播报文;
(2)智能手机开机后,连接网络电视所在的局域网络,并获取到局域网络的ip地址“192.168.1.88”,智能手机启动侦听语音接收端设备的上线报文,并通过广播方式发送设备搜索请求报文;
(3)智能手机获取到网络电视的响应回复,将网络电视设备的相关信息记录在设备列表中,并展示列表;
(4)在列表中选择“客厅电视1”,智能手机向该网络电视的网络端口port“34567”发送连接请求,等待网络电视的接收处理;
(5)网络电视从端口“34567”处接收到智能手机的连接请求,接受并建立tcp连接,从而实现双向通信通路的建立;
(6)智能手机端拾取并录制“快进到第30分钟”的语音指令,采用pcm编码方式,将此语音数据发送到网络电视端,网络电视在接收到语音控制指令后,通过后续相关处理,转化为最终的播放快进控制指令,并执行快进到第30分钟的指令,从而实现语音交互控制功能。
可以看出,本发明不需要对语音接收端设备进行硬件改动,而只需要采用第三方的语音发送端设备通过网络建立与语音接收端设备之间的连接,即可在不增加任何硬件配置及成本的前提下,通过纯软件的方式,为未搭载语音收发硬件的老旧设备和低端设备增加语音交互控制功能,提升这类设备交互控制的体验,给用户带来交互体验的升级。通过本发明的实施,可以极大提升用户对产品的粘性,形成品牌及产品的口碑效应。