一种腭裂语音声韵母自动切分方法及系统的制作方法

文档序号：9912693阅读：308来源：国知局

一种腭裂语音声韵母自动切分方法及系统的制作方法
【技术领域】
[0001] 本发明涉及语音信号处理技术领域，尤其是一种腭裂语音声韵母自动切分技术。
【背景技术】
[0002] 唇腭裂是最常见的先天性颅颂面畸形。其中，语音语言功能障碍是腭裂最大的影响。语音评估是腭裂序列治疗中的重要环节。对腭裂语音计算机自动评估算法的实现具有重要临床意义。
[0003] 构音障碍为腭裂语音特有的表现形式构音障碍是由于患者发音方法不正确而产生，其表现形式包括辅音省略(音节中辅音被省去，只剩下元音的现象）、辅音替代(某一音节的辅音部分被另外一个辅音所替换，从而变成不同的音节)和代偿性发音（即在口腔后部位置-咽部、喉部声门等位置进行的构音行为）。腭裂构音障碍发生于普通话音节中的声母部分。对腭裂语音的声韵母切分，是腭裂语音构音障碍研究的重要环节。
[0004] 当前的研究中，有实现对普通话声韵母的自动切分，但是这些研究是针对正常人群的普通话声韵母切分算法。目前，针对病理性语音的声韵母切分算法研究较少。腭裂语音具有独特的表现形式，其共鸣障碍与构音障碍的存在改变了其部分声学特性。

【发明内容】

[0005] 本发明所要解决的技术问题是:针对上述存在的问题，提供一种针对腭裂语音的声韵母自动切分算法。
[0006] 本发明采用的技术方案如下：一种腭裂语音声韵母自动切分算法，对包含声母的音节进行以下处理步骤：
[0007] 准清音声母及准浊音声母判别步骤，用于判别所述音节为包含准清音声母的音节还是包含准浊音声母的音节；
[0008] 对包含准清音声母的音节进行声韵母切分步骤；
[0009] 以及对包含准浊音声母的音节进行声韵母切分步骤。
[0010] 进一步，所述准清音声母及准浊音声母判别步骤进一步包括：
[0011 ]对音节语音信号进行分帧，帧长为20ms，帧移为三分之一帧长；
[0012]计算前5帧语音信号的短时过零率；
[0013]若所述5帧语音信号中有任一帧的短时过零率超过50,则将该音节判别为包含准清音声母的音节;否则判断为包含准浊音声母的音节。
[0014] 对包含准清音声母的音节进行声韵母切分步骤进一步包括：
[0015] 步骤Z1:对于所述音节语音信号进行小波变换与短时能量幅值计算得到声韵母切分粗定位点；
[0016] 步骤Z2:在所述音节语音信号中截取包含声韵母切分粗定位点的一段语音信号，对截取的语音信号进行短时过零率计算，得到声韵母切分精确定位点。
[0017] 对包含准浊音声母的音节进行声韵母切分步骤进一步包括：
[0018] 步骤Q1:对所述音节语音信号进行带通滤波；
[0019] 步骤Q2:对滤波后的音节语音信号进行短时自相关函数计算，得到声韵母切分粗定位点；
[0020] 步骤Q3:在所述滤波后的音节语音信号中截取包含声韵母切分粗定位点的一段语音信号，进行语音信号时域波形的差异分析，得到声韵母切分精确定位点。
[0021]所述步骤Z1进步一包括：
[0022] 步骤Z11:对所述音节语音信号进行一维小波分解得到低频系数向量与高频系数向量，分解深度为一层;然后将低频系数向量与高频系数向量按位对应相乘并进行归一化，得到小波变换系数向量C;
[0023] 步骤Z12:将小波变换系数向量C进行分帧，帧间无重叠也无间隔;对于每帧信号Xl (k)，k=l，2,…，N，计算其短时幅值绝对值和Mi，其计算公式为：2^=ijxi001;i表示为第i帧信号，N为每帧信号的长度；
[0024]取短时幅值绝对值和大于阈值T的第一帧信号的起点作为该音节的声韵母切分粗定位点。
[0025] 所述步骤Z2进一步包括：
[0026] 步骤Z21:设置一窗口 W1，使用该窗口 W1在所述音节语音信号中截取语音信号S1，其窗口中心为所述声韵母切分粗定位点，窗口宽度为wthl，如果声韵母切分粗定位点距离音节语音信号的起始点的长度小于wth 1 X 1 /2，则取音节语音信号的起始点为窗口 W1的起始点；
[0027] 步骤Z22:将语音信号S1进行分帧，帧间有重叠;对每帧信号计算短时过零率，得到语音信号S1的短时过零率向量Z;
[0028] 步骤Z23:对向量Z进行中值滤波，滤波长度为向量Z长度的一半；中值滤波后得到向量L1;
[0029]步骤Z24:对向量L1计算一阶微分，得到微分向量D1，微分向量D1中的最小值即对应声韵母切分精确定位帧，该帧的起始点即为声韵母切分精确定位点。
[0030] 所述步骤Q2进一步包括：
[0031] 步骤Q21:对带通滤波后的音节语音信号分帧，帧间有重叠;求出每一帧信号的短时自相关函数；
[0032] 步骤Q22:对于每一帧的短时自相关函数计算出波峰个数，所有帧的波峰个数组成短时自相关函数波形峰数向量R2;
[0033] 步骤Q23:对向量R2进行中值滤波，滤波长度为向量R2长度的一半；中值滤波后得到向量L2;
[0034]步骤Q24:对向量L2计算一阶微分，得到微分向量D2，微分向量D2中的最大值即对应声韵母切分粗定位帧，该帧的起点为声韵母切分粗定位点；
[0035] 步骤Q3进一步包括：
[0036]步骤Q31:设置一窗口 W2,使用窗口 W2在所述滤波后的音节语音信号中截取语音信号S2,其窗口中心为所述声韵母切分粗定位点，窗口宽度为wth2;如果声韵母切分粗定位点距离所述滤波后的音节语音信号的起始点的长度小于wth2X 1/2,则取音节语音信号的起始点为窗口 W2的起始点；
[0037] 步骤Q32:将语音信号S2进行分帧，帧间无重叠也无间隔；对每帧信号求取波峰个数，得到语音信号S2的峰数向量R3,对向量R3计算一阶微分得到微分向量D3,微分向量D3中的最大值对应的帧即为声韵母切分精确定位帧，该帧的起始点即为声韵母切分精确定位点。
[0038] 本发明还提供了一种腭裂语音声韵母自动切分系统，包括：
[0039] 准清音声母及准浊音声母判别模块，用于判别所述音节为包含准清音声母的音节还是包含准浊音声母的音节；
[0040]准清音声母切分模块，用于对包含准清音声母的音节进行声韵母切分；
[0041]以及准浊音声母切分模块，用于对包含准浊音声母的音节进行声韵母切分。
[0042]所述准清音声母及准浊音声母判别模块进一步包括：
[0043]分帧单元，用于对音节语音信号进行分帧，帧长为20ms，帧移为三分之一帧长；
[0044] 短时过零率计算单元，用于计算前5帧语音信号的短时过零率；
[0045] 短时过零率判断单元，用于若所述5帧语音信号中有任一帧的短时过零率超过50，则将该音节判别为包含准清音声母的音节;否则判断为包含准浊音声母的音节。
[0046] 准清音声母切分模块进一步包括：
[0047] 声韵母切分粗定位点计算单元，用于对于所述音节语音信号进行小波变换与短时能量幅值计算得到声韵母切分粗定位点；
[0048] 声韵母切分精确定位点计算单元，用于在所述音节语音信号中截取包含声韵母切分粗定位点的一段语音信号，对截取的语音信号进行短时过零率计算，得到声韵母切分精确定位点。
[0049] 准浊音声母切分模块进一步包括：
[0050] 带通滤波单元，用于对所述音节语音信号进行带通滤波；
[0051 ]声韵母切分粗定位点计算单元，用于对滤波后的音节语音信号进行短时自相关函数计算，得到声韵母切分粗定位点；
[0052]声韵母切分精确定位点计算单元，用于在所述滤波后的音节语音信号中截取包含声韵母切分粗定位点的一段语音信号，进行语音信号时域波形的差异分析，得到声韵母切分精确定位点。
[0053] 综上所述，由于采用了上述技术方案，本发明的有益效果是：
[0054] 1.本发明针对腭裂语音的病变特点提出了准清音声母及准浊音声母的识别方法，填补了现有技术空白。
[0055] 2.本发明在切分声韵母时先进行粗定位，然后再截取粗定位点附近一端语音信号进行进一步处理、分析得到精确定位点。使声韵母切分点更加精准。
【附图说明】
[0056

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何凌;柳银;尹恒;郭春丽;
技术所有人：四川大学;
我是此专利的发明人

上一篇：声带-喉室-声道联动的物理模型及精神压力检测方法
上一篇：一种声气信号分离与合成的方法及系统的制作方法