一种家电设备的语音交互方法与流程

文档序号:15674506发布日期:2018-10-16 19:54阅读:449来源:国知局

本发明属于家电设备领域,,尤其涉及一种家电设备的语音交互方法。

随着科学技术的不断发展,家电智能化越来越成熟并被广泛应用,而其中作为直接与用户接触的人机交互模块,更是被各种智能化所替代,如人体感应、触控等等,而作为对人手操作的解放,语音交互控制则是更重要的一大模块。

现有技术中,家电设备可以识别用户发出的声音,并根据该声音执行相应的指令。

但是,如果用户距离家电设备较远,则家电设备可能无法有效的识别到用户发出的声音,所以影响了用户体验。



技术实现要素:

本发明提供了一种家电设备的语音交互方法,能够减少计算量、提升语音检测的效率以及准确性。

为解决上述技术问题,本发明采用如下技术方案:

家电设备接收用户终端通过无线网络发送的绑定指令;

所述家电设备根据所述绑定指令与所述用户终端建立无线连接;

所述家电设备通过所述无线连接接收所述用户终端发送的音频信号;

所述家电设备判断所述音频信号是否为语音信号;

若是语音信号,则所述家电设备对所述语音信号进行语义分析得到分析结果;

所述家电设备根据所述分析结果获取对应的操作指令;

所述家电设备按照所述操作指令进行相应的操作。

本发明中,家电设备可以与用户终端建立无线连接,并且通过该无线连接接收音频信号,所以即使用户距离家电设备较远,也可以通过用户终端向家电设备发送语音指令,因此提高了用户体验。

附图说明

下面结合附图对本发明做进一步的说明:

图1为本发明一种家电设备语音交互方法的实施例的流程框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

实施例:

如图1所示,一种家电设备的语音交互方法,所述家电设备上设有音频检测装置以及对语音信号处理的处理装置,所述处理装置对交互的语音信号进行判断确定,并根据语音信号指令控制家电设备工作,其中,所述判断确定包括:获取音频信号;对所述音频信号进行快速傅里叶变换得到频域信号;根据所述频域信号计算谱幅度值;根据所述谱幅度值计算概率密度;根据所述概率密度计算所述音频信号的谱熵;根据所述谱熵确定所述音频信号是否为语音信号。

具体的家电设备的语音交互方法,包括:

家电设备接收用户终端通过无线网络发送的绑定指令;

所述家电设备根据所述绑定指令与所述用户终端建立无线连接;

所述家电设备通过所述无线连接接收所述用户终端发送的音频信号;

所述家电设备判断所述音频信号是否为语音信号;

若是语音信号,则所述家电设备对所述语音信号进行语义分析得到分析结果;

所述家电设备根据所述分析结果获取对应的操作指令;

所述家电设备按照所述操作指令进行相应的操作。

其中,家电设备根据所述绑定指令与所述用户终端建立无线连接之前,还可以包括:

所述家电设备从所述绑定指令中提取校验信息;

所述家电设备判断所述校验信息是否对应合法用户;

若是,则家电设备触发建立无线连接的步骤。

家电设备可以通过多种无线连接接收所述用户终端发送的音频信号,若所述无线连接是wifi连接,则所述家电设备以第一接收功率接收所述音频信号;若所述无线连接是蓝牙连接,则所述家电设备以第二接收功率接收所述音频信号;

由于蓝牙连接一般是短距离连接,wifi连接一般是长距离连接,为了能够提升传输质量,所以第二接收功率需要大于第一接收功率。

家电设备判断所述音频信号是否为语音信号的过程具体可以包括:

所述家电设备对所述音频信号进行快速傅里叶变换得到频域信号;

所述家电设备根据所述频域信号计算谱幅度值;

所述家电设备根据所述谱幅度值计算概率密度;

所述家电设备根据所述概率密度计算所述音频信号的谱熵;

所述家电设备根据所述谱熵确定所述音频信号是否为语音信号。

在本实施例中,根据所述谱幅度值计算概率密度的具体过程:根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;根据所述总能量以及所述谱幅度值计算概率密度。

具体的,在本实施例中,根据所述频域信号计算谱幅度值的具体过程:

其中,x(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,n表示快速傅里叶变换的变化长度,k小于或等于n,exp(-j2πkn/n)表示幅角为2π的kn/n倍的复数。

具体的,在本实施例中,计算总能量的具体过程:

其中,esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,x(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,n表示快速傅里叶变换的变化长度。

具体的,在本实施例中,概率密度的计算过程:

d(k,y)=|x(k,y)|2/esum(y),d(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。

具体的,在本实施例中,根据所述概率密度计算所述音频信号的谱熵的具体过程:

其中,h(y)表示第y个音频信号的谱熵。

在本实施例中,根据所述谱熵确定所述音频信号是否为语音信号的具体过程:计算所述音频信号的能量;根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号。

具体的,在本实施例中,计算所述音频信号的能量的具体过程:

其中,e(y)表示第y个音频信号的能量,m表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度。根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的具体过程:判断p(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,

本发明中,可以根据音频信号的谱熵来进行语音检测,谱熵的计算过程主要涉及时频变换、幅度计算和能量计算等,这些计算过程所针对的都是语音信号本身的属性,而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式,从而减少了计算量,提高了语音检测的效率,以及准确性,提升了家电设备的语音交互的用户体验感。

虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1