一种基于食品安全语料数据的语音匹配方法与流程

文档序号:13681871阅读:来源:国知局
技术特征:
1.音频数据在食品安全方面的语音匹配方法,其特征在于:音频信号的预处理、语音信号的特征提取、食品安全语料库的构建、基于DTW的语音识别算法。音频信号的预处理包含去噪、预加重、加窗分帧。去噪采用谱减法进行去噪,减少语音中噪声的干扰。预加重的目的是提高语音信号的高频部分,使信号的频谱变得平坦,便于后续的分析。预加重使用6dB/倍频程的提高高频特性的预加重数字滤波器实现。加窗分帧是通过加窗来截取一段语音信号进行分析。同时相邻两帧要设置交叠,称为帧移,本发明采用汉明窗进行加窗分帧,采用256个采样点的窗口长度,帧移位窗口长度的50%,即128个采样点。语音信号的特征提取采用梅尔频率倒谱系数作为音频识别特征,同时计算器一阶差分系数。特征距离的计算采用改进的动态时间规整算法,针对食品安全相关词汇,能极大的提高匹配成功率。食品安全语料库的构建,参照GB2760-2014标准,构建食品分类信息语料库。进行音频数据匹配识别,得到本音频与食品事件相关程度的得分。2.根据权利要求1所述音频信号预处理,其特征针对所选音频进行去噪等处理,使识别工作根据精准。3.根据权利要求1所述的语音识别算法,其特征在于针对食品安全相关语音,改进基于动态时间规整的算法,设两个特征序列需进行计算,待匹配特征序列为X={x1,x2…xn
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1