一种快速语音孤立词识别算法及其用途、语音识别系统的制作方法

文档序号：2827446阅读：603来源：国知局

一种快速语音孤立词识别算法及其用途、语音识别系统的制作方法
【专利摘要】本发明的快速语音孤立词识别算法主要包括步骤：S1、对语音信号x(n)进行连续频谱分析以获得二维图像语谱图，其中纵坐标为频率，横坐标为时间，像素灰度值大小反应相应时刻和相应频率的信号能量密度；S2、将语谱图等效为时频函数；S3、将时频函数与语谱图相结合为特征参数并提取。上述算法应用于STM32低速嵌入式处理器实现语音开关功能。有益效果：本发明的快速语音孤立词识别算法、用途及语音识别系统可以实现在低速嵌入式系统上的语音开关识别系统，从而降低语音开关芯片的价格，且方便携带，因此可以应用到不同的场合。
【专利说明】一种快速语音孤立词识别算法及其用途、语音识别系统
【技术领域】
[0001]本发明属于语音识别【技术领域】，涉及用于例如STM32等低速嵌入式系统的快速语音识别算法以及应用这种算法的采用低速嵌入式系统芯片的语音识别系统，特别涉及一种适用于上述系统的快速语音孤立词识别算法及其语音识别系统。
【背景技术】
[0002]经过近五十年的发展，语音识别技术在许多应用领域显示出巨大的应用前景。在手机、呼叫中心、车载、互联网电视、智能家电、语言翻译等各领域得到创新应用。语音可以帮助客户做本地化的应用，包括打电话、发短信、查询目的歌曲，也可以聊天。短短两年时间内，科大讯飞、Apple、百度、盛大、云之声、腾讯、中科院自动化所等公司或单位相继推出了在线语音识别引擎和应用软件。近年来，科大讯飞、云之声、中科院自动化所又相继推出了适合手机平台使用的离线语音识别引擎。短短数年，互联网搜索巨头、网游巨头、通讯巨头和学术带头单位纷纷进军语音识别的产业化应用，掀起语音识别的应用热潮。但是，目前大多数语音识别系统的关键技术都是基于HMM模型而开发的，HMM是一种统计模型，模型参数的估计需要大量的训练数据，而且训练过程计算量大，耗时长，运算起来极为复杂，在一般的硬件下根本不可能运行。上述HMM模型除了 PC机、DSP和FPGA等一些专门用于处理数字信号的芯片及各种语音芯片外几乎不能在一般的硬件上实现，导致基于上述模型开发的语音系统昂贵。目前也有部分语音系统使用非数字信号芯片作为语音识别芯片，虽在成本上比起语音专用芯片便宜很多，但在硬件上大部分是在PC系统完成码本训练和语音模板的训练，嵌入式系统只完成语音识别部分；或者直接使用语音芯片，嵌入式系统仅仅做控制使用。

【发明内容】

[0003]本发明的目的是为了解决现有的语音识别系统或者采用的专用语音芯片价格昂贵或者需要在PC系统中完成码本训练集语音模板训练等不足，提出了一种快速语音孤立词识别算法及语音识别系统。
[0004]本发明的技术方案为:一种快速语音孤立词识别算法，其特征在于，包括以下步骤:
[0005]S1、对语音信号x(n)进行连续频谱分析以获得二维图像语谱图，其中纵坐标为频率，横坐标为时间，像素灰度值大小反应相应时刻和相应频率的信号能量密度；
[0006]S2、将语谱图等效为时频函数；
[0007]S3、将时频函数与语谱图相结合为特征参数并提取。
[0008]进一步的,上述步骤SI包括步骤:
[0009]SlU STFT:

eo
[0010]x?(u*) = ^![0011]S12、X (η)做 DTFT 变换:
【权利要求】
1.一种快速语音孤立词识别算法，其特征在于，包括以下步骤: 51、对语音信号X(n)进行连续频谱分析以获得二维图像语谱图，其中纵坐标为频率，横坐标为时间，像素灰度值大小反应相应时刻和相应频率的信号能量密度； 52、将语谱图等效为时频函数； 53、将时频函数与语谱图相结合为特征参数并提取。
2.根据权利要求1所述的快速语音孤立词识别算法，其特征在于，步骤SI包括步骤:
511、STFT:
3.根据权利要求1或2所述的快速语音孤立词识别算法，其特征在于，步骤S2包括步骤: 521、通过过零率寻找过零点的位置，并记录: 定义信号Ix (η)}的短时平均过零率Zn:1 4mZn = ; Σ I sgn[-v(?0]-sgn[.r(w — I)] | w(n-m) 式中，sgn为符号函数:

4.快速语音孤立词识别算法应用于STM32低速嵌入式处理器实现语音开关功能。
5.一种语音识别系统，其特征在于，包括低速嵌入式处理单元，与处理单元连接的语音输入单元和信号输出单元，所述低速嵌入式处理单元内包含实现快速语音孤立词识别算法的软件程序。
6.根据权利要求5所述的语音识别系统，其特征在于，低速嵌入式处理单元芯片型号为 STM32F103ZET6。
7.根据权利要求5或6所述的语音识别系统，其特征在于，语音识别系统还包括SD卡槽，用于连接外部SD卡用于存储数据。
8.根据权利要求7所述的语音识别系统，其特征在于，语音识别系统还包括设置用得功能按键，用于更改软件系统设置。
9.根据权利要求8所述的语音识别系统，其特征在于，语音识别系统还包括显示单元，用于显示设置结果。
10.根据权利要求5至9之任一项权利要求所述的语音识别系统，其特征在于，语音识别系统的软件程序包含“开”和“关”读音的模型，并存储于软件模型库，用于制作语音开关。
【文档编号】G10L15/02GK103971676SQ201410164154
【公开日】2014年8月6日申请日期:2014年4月23日优先权日:2014年4月23日
【发明者】殷业, 李丽, 刘传勇, 刘芳萍申请人:上海师范大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：殷业;李丽;刘传勇;刘芳萍
技术所有人：上海师范大学
我是此专利的发明人