1.一种基于深度学习的智慧视听设备多业务控制方法,其特征在于,所述方法包括:
麦克风阵列以特定频率监听采集用户发出的语音控制信号;
语音预处理模块对语音控制信号进行提取,获得MFCC原始语音特征信息;检测MFCC原始语音特征的对数能量是否大于阈值;若是,则由互联网连接模块发送MFCC原始语音特征信息到远程GPU服务器;
远程GPU服务器接收到MFCC原始语音特征信息,根据MFCC原始语音特征信息获得深度语音特征信息,并将深度特征信息对应的控制信号标识信息发送给互联网连接模块;
互联网连接模块将控制信号标识信息传递给控制信号解析模块,由控制信号解析模块根据控制信号标识信息生成控制信号编码,选择对应的控制信号输出模块,将控制信号编码传递给该控制信号输出模块;
控制信号输出模块根据控制信号编码发送控制信号给智慧视听设备。
2.如权利要求1所述的基于深度学习的智慧视听设备多业务控制方法,其特征在于,所述语音预处理模块对语音控制信号进行提取,获得MFCC原始语音特征信息的步骤,包括:
对语音控制信号进行端点检测及分割处理;
对分割处理后的语音控制信号进行降噪处理;
对降噪处理后的语音控制信号进行MFCC原始语音特征提取,获得MFCC原始语音特征信息。
3.如权利要求1所述的基于深度学习的智慧视听设备多业务控制方法,其特征在于,所述远程GPU服务器接收到MFCC原始语音特征信息,对MFCC原始语音特征信息进行深度语音特征提取,获得深度语音特征信息的步骤,包括:
远程GPU服务器接收到MFCC原始语音特征信息,启动深度学习语音识别程序,采用biLSTM算法对MFCC原始语音特征信息进行深度语音特征提取,获得深度语音特征信息。
4.如权利要求1所述的基于深度学习的智慧视听设备多业务控制方法,其特征在于,所述远程GPU服务器接收到MFCC原始语音特征信息,根据MFCC原始语音特征信息获得深度语音特征信息,并将深度特征信息对应的控制信号标识信息发送给互联网连接模块的步骤,包括:
远程GPU服务器接收到MFCC原始语音特征信息,对MFCC原始语音特征信息进行深度语音特征提取,获得深度语音特征信息,并将深度特征信息对应的控制信号标识信息发送给互联网连接模块;
远程GPU服务器对深度语音特征信息进行分类,得到该深度语音特征信息对应的类别,并检测该类别是否对应一种控制信号标识;若是,返回控制信号标识信息给互联网连接模块。
5.一种基于深度学习的智慧视听设备多业务控制系统,其特征在于,所述系统包括:麦克风阵列、语音预处理模块、远程GPU服务器、互联网连接模块、控制信号解析模块、控制信号输出模块;其中,
麦克风阵列以特定频率监听采集用户发出的语音控制信号;
语音预处理模块对语音控制信号进行提取,获得MFCC原始语音特征信息;检测MFCC原始语音特征的对数能量是否大于阈值;若是,则由互联网连接模块发送MFCC原始语音特征信息到远程GPU服务器;
远程GPU服务器接收到MFCC原始语音特征信息,根据MFCC原始语音特征信息获得深度语音特征信息,并将深度特征信息对应的控制信号标识信息发送给互联网连接模块;
互联网连接模块将控制信号标识信息传递给控制信号解析模块,由控制信号解析模块根据控制信号标识信息生成控制信号编码,选择对应的控制信号输出模块,将控制信号编码传递给该控制信号输出模块;
控制信号输出模块根据控制信号编码发送控制信号给智慧视听设备。
6.如权利要求5所述的基于深度学习的智慧视听设备多业务控制系统,其特征在于,所述语音预处理模块包括:
分割单元,用于对语音控制信号进行端点检测及分割处理;
降噪单元,用于对分割处理后的语音控制信号进行降噪处理;
提取单元,用于对降噪处理后的语音控制信号进行MFCC原始语音特征提取,获得MFCC原始语音特征信息。
7.如权利要求5所述的基于深度学习的智慧视听设备多业务控制系统,其特征在于,所述远程GPU服务器接收到MFCC原始语音特征信息,启动深度学习语音识别程序,采用biLSTM算法对MFCC原始语音特征信息进行深度语音特征提取,获得深度语音特征信息。
8.如权利要求5所述的基于深度学习的智慧视听设备多业务控制系统,其特征在于,远程GPU服务器接收到MFCC原始语音特征信息,对MFCC原始语音特征信息进行深度语音特征提取,获得深度语音特征信息,并将深度特征信息对应的控制信号标识信息发送给互联网连接模块;
远程GPU服务器对深度语音特征信息进行分类,得到该深度语音特征信息对应的类别,并检测该类别是否对应一种控制信号标识;若是,返回控制信号标识信息给互联网连接模块。