一种腭裂语音声韵母自动切分方法及系统的制作方法

文档序号:9912693阅读:308来源:国知局
一种腭裂语音声韵母自动切分方法及系统的制作方法
【技术领域】
[0001] 本发明涉及语音信号处理技术领域,尤其是一种腭裂语音声韵母自动切分技术。
【背景技术】
[0002] 唇腭裂是最常见的先天性颅颂面畸形。其中,语音语言功能障碍是腭裂最大的影 响。语音评估是腭裂序列治疗中的重要环节。对腭裂语音计算机自动评估算法的实现具有 重要临床意义。
[0003] 构音障碍为腭裂语音特有的表现形式构音障碍是由于患者发音方法不正确而产 生,其表现形式包括辅音省略(音节中辅音被省去,只剩下元音的现象)、辅音替代(某一音 节的辅音部分被另外一个辅音所替换,从而变成不同的音节)和代偿性发音(即在口腔后部 位置-咽部、喉部声门等位置进行的构音行为)。腭裂构音障碍发生于普通话音节中的声母 部分。对腭裂语音的声韵母切分,是腭裂语音构音障碍研究的重要环节。
[0004] 当前的研究中,有实现对普通话声韵母的自动切分,但是这些研究是针对正常人 群的普通话声韵母切分算法。目前,针对病理性语音的声韵母切分算法研究较少。腭裂语音 具有独特的表现形式,其共鸣障碍与构音障碍的存在改变了其部分声学特性。

【发明内容】

[0005] 本发明所要解决的技术问题是:针对上述存在的问题,提供一种针对腭裂语音的 声韵母自动切分算法。
[0006] 本发明采用的技术方案如下:一种腭裂语音声韵母自动切分算法,对包含声母的 音节进行以下处理步骤:
[0007] 准清音声母及准浊音声母判别步骤,用于判别所述音节为包含准清音声母的音节 还是包含准浊音声母的音节;
[0008] 对包含准清音声母的音节进行声韵母切分步骤;
[0009] 以及对包含准浊音声母的音节进行声韵母切分步骤。
[0010] 进一步,所述准清音声母及准浊音声母判别步骤进一步包括:
[0011 ]对音节语音信号进行分帧,帧长为20ms,帧移为三分之一帧长;
[0012]计算前5帧语音信号的短时过零率;
[0013]若所述5帧语音信号中有任一帧的短时过零率超过50,则将该音节判别为包含准 清音声母的音节;否则判断为包含准浊音声母的音节。
[0014] 对包含准清音声母的音节进行声韵母切分步骤进一步包括:
[0015] 步骤Z1:对于所述音节语音信号进行小波变换与短时能量幅值计算得到声韵母切 分粗定位点;
[0016] 步骤Z2:在所述音节语音信号中截取包含声韵母切分粗定位点的一段语音信号, 对截取的语音信号进行短时过零率计算,得到声韵母切分精确定位点。
[0017] 对包含准浊音声母的音节进行声韵母切分步骤进一步包括:
[0018] 步骤Q1:对所述音节语音信号进行带通滤波;
[0019] 步骤Q2:对滤波后的音节语音信号进行短时自相关函数计算,得到声韵母切分粗 定位点;
[0020] 步骤Q3:在所述滤波后的音节语音信号中截取包含声韵母切分粗定位点的一段语 音信号,进行语音信号时域波形的差异分析,得到声韵母切分精确定位点。
[0021]所述步骤Z1进步一包括:
[0022] 步骤Z11:对所述音节语音信号进行一维小波分解得到低频系数向量与高频系数 向量,分解深度为一层;然后将低频系数向量与高频系数向量按位对应相乘并进行归一化, 得到小波变换系数向量C;
[0023] 步骤Z12:将小波变换系数向量C进行分帧,帧间无重叠也无间隔;对于每帧信号Xl (k),k=l,2,…,N,计算其短时幅值绝对值和Mi,其计算公式为:2^=ijxi001;i表示 为第i帧信号,N为每帧信号的长度;
[0024]取短时幅值绝对值和大于阈值T的第一帧信号的起点作为该音节的声韵母切分粗 定位点。
[0025] 所述步骤Z2进一步包括:
[0026] 步骤Z21:设置一窗口 W1,使用该窗口 W1在所述音节语音信号中截取语音信号S1, 其窗口中心为所述声韵母切分粗定位点,窗口宽度为wthl,如果声韵母切分粗定位点距离 音节语音信号的起始点的长度小于wth 1 X 1 /2,则取音节语音信号的起始点为窗口 W1的起 始点;
[0027] 步骤Z22:将语音信号S1进行分帧,帧间有重叠;对每帧信号计算短时过零率,得到 语音信号S1的短时过零率向量Z;
[0028] 步骤Z23:对向量Z进行中值滤波,滤波长度为向量Z长度的一半;中值滤波后得到 向量L1;
[0029]步骤Z24:对向量L1计算一阶微分,得到微分向量D1,微分向量D1中的最小值即对 应声韵母切分精确定位帧,该帧的起始点即为声韵母切分精确定位点。
[0030] 所述步骤Q2进一步包括:
[0031] 步骤Q21:对带通滤波后的音节语音信号分帧,帧间有重叠;求出每一帧信号的短 时自相关函数;
[0032] 步骤Q22:对于每一帧的短时自相关函数计算出波峰个数,所有帧的波峰个数组成 短时自相关函数波形峰数向量R2;
[0033] 步骤Q23:对向量R2进行中值滤波,滤波长度为向量R2长度的一半;中值滤波后得 到向量L2;
[0034]步骤Q24:对向量L2计算一阶微分,得到微分向量D2,微分向量D2中的最大值即对 应声韵母切分粗定位帧,该帧的起点为声韵母切分粗定位点;
[0035] 步骤Q3进一步包括:
[0036]步骤Q31:设置一窗口 W2,使用窗口 W2在所述滤波后的音节语音信号中截取语音信 号S2,其窗口中心为所述声韵母切分粗定位点,窗口宽度为wth2;如果声韵母切分粗定位点 距离所述滤波后的音节语音信号的起始点的长度小于wth2X 1/2,则取音节语音信号的起 始点为窗口 W2的起始点;
[0037] 步骤Q32:将语音信号S2进行分帧,帧间无重叠也无间隔;对每帧信号求取波峰个 数,得到语音信号S2的峰数向量R3,对向量R3计算一阶微分得到微分向量D3,微分向量D3中 的最大值对应的帧即为声韵母切分精确定位帧,该帧的起始点即为声韵母切分精确定位 点。
[0038] 本发明还提供了一种腭裂语音声韵母自动切分系统,包括:
[0039] 准清音声母及准浊音声母判别模块,用于判别所述音节为包含准清音声母的音节 还是包含准浊音声母的音节;
[0040]准清音声母切分模块,用于对包含准清音声母的音节进行声韵母切分;
[0041]以及准浊音声母切分模块,用于对包含准浊音声母的音节进行声韵母切分。
[0042]所述准清音声母及准浊音声母判别模块进一步包括:
[0043]分帧单元,用于对音节语音信号进行分帧,帧长为20ms,帧移为三分之一帧长;
[0044] 短时过零率计算单元,用于计算前5帧语音信号的短时过零率;
[0045] 短时过零率判断单元,用于若所述5帧语音信号中有任一帧的短时过零率超过50, 则将该音节判别为包含准清音声母的音节;否则判断为包含准浊音声母的音节。
[0046] 准清音声母切分模块进一步包括:
[0047] 声韵母切分粗定位点计算单元,用于对于所述音节语音信号进行小波变换与短时 能量幅值计算得到声韵母切分粗定位点;
[0048] 声韵母切分精确定位点计算单元,用于在所述音节语音信号中截取包含声韵母切 分粗定位点的一段语音信号,对截取的语音信号进行短时过零率计算,得到声韵母切分精 确定位点。
[0049] 准浊音声母切分模块进一步包括:
[0050] 带通滤波单元,用于对所述音节语音信号进行带通滤波;
[0051 ]声韵母切分粗定位点计算单元,用于对滤波后的音节语音信号进行短时自相关函 数计算,得到声韵母切分粗定位点;
[0052]声韵母切分精确定位点计算单元,用于在所述滤波后的音节语音信号中截取包含 声韵母切分粗定位点的一段语音信号,进行语音信号时域波形的差异分析,得到声韵母切 分精确定位点。
[0053] 综上所述,由于采用了上述技术方案,本发明的有益效果是:
[0054] 1.本发明针对腭裂语音的病变特点提出了准清音声母及准浊音声母的识别方法, 填补了现有技术空白。
[0055] 2.本发明在切分声韵母时先进行粗定位,然后再截取粗定位点附近一端语音信号 进行进一步处理、分析得到精确定位点。使声韵母切分点更加精准。
【附图说明】
[0056
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1