一种基于食品安全语料数据的语音匹配方法与流程

文档序号：13681871阅读：来源：国知局

技术特征：
1.音频数据在食品安全方面的语音匹配方法，其特征在于：音频信号的预处理、语音信号的特征提取、食品安全语料库的构建、基于DTW的语音识别算法。音频信号的预处理包含去噪、预加重、加窗分帧。去噪采用谱减法进行去噪，减少语音中噪声的干扰。预加重的目的是提高语音信号的高频部分，使信号的频谱变得平坦，便于后续的分析。预加重使用6dB/倍频程的提高高频特性的预加重数字滤波器实现。加窗分帧是通过加窗来截取一段语音信号进行分析。同时相邻两帧要设置交叠，称为帧移，本发明采用汉明窗进行加窗分帧，采用256个采样点的窗口长度，帧移位窗口长度的50％，即128个采样点。语音信号的特征提取采用梅尔频率倒谱系数作为音频识别特征，同时计算器一阶差分系数。特征距离的计算采用改进的动态时间规整算法，针对食品安全相关词汇，能极大的提高匹配成功率。食品安全语料库的构建，参照GB2760-2014标准，构建食品分类信息语料库。进行音频数据匹配识别，得到本音频与食品事件相关程度的得分。2.根据权利要求1所述音频信号预处理，其特征针对所选音频进行去噪等处理，使识别工作根据精准。3.根据权利要求1所述的语音识别算法，其特征在于针对食品安全相关语音，改进基于动态时间规整的算法，设两个特征序列需进行计算，待匹配特征序列为X＝{x1，x2…xn

完整全部详细技术资料下载

当前第2页1 2 3