一种用数字技术实现听觉改变反馈的方法

文档序号:1112821阅读:557来源:国知局
专利名称:一种用数字技术实现听觉改变反馈的方法
技术领域
本发明涉及一种语音信号处理方法,确切的说是一种用数字技术实现听觉改变反馈的方法,适用于口吃矫正或辅助治疗。
背景技术
听觉改变反馈(Altered auditory feedback,以下称AAF)是指说话者听到自身经过改变后的语音的方式,它是一种利用听觉感官的言语反馈方法。AAF可以有听觉延迟反馈(Delayed Auditory Feedback,以下称DAF)、频率改4变反馈(Frequency Altered Feedback,以下称FAF)和掩蔽听觉反馈(masking auditory feedback,以下称MAF)三种方式。口吃患者使用听觉改变反馈方式说话,可以提高说话者的流畅程度,减轻口吃症状。DAF和FAF,是口吃矫正仪器的理想选择方法,MAF也对部分口吃患者有用,尤其是针对那些易于产生不发声的口吃行为的人。听觉改变反馈本质上是利用人体镜像元神经系统(直观地看,是利用原本用来模仿和帮助新生儿生存的临时适应的、神经的机制)在语言获得和发展中的作用,除了用来改善口吃等沟通疾病,近年的研究更涉及如孤独症病人等镜像系统功能紊乱的研究。
目前已有一些采用DAF矫正口吃的仪器,它们采用存储器(如磁介质),通过读写时序的控制,来实现语音信号的延迟。该方法的缺点是延迟时间受存储器读写周期的限制,不能满足近年来对DAF研究所提出的延迟时间短促、精确的要求。尤其对于那些易于产生不发声的口吃行为和首字发声困难的患者毫无效果。

发明内容
本发明的目的在于针对现有口吃矫正方法及其设备的不足,提供一种用数字技术实现听觉改变反馈的方法,适用于口吃矫正或辅助治疗。本发明采用数字技术,对语音信号进行听觉延迟反馈、频率改变反馈和掩蔽听觉反馈三种反馈处理。极大地提高说话者的发音流畅程度,减轻口吃症状,尤其对于易于产生不发声的口吃行为和首字发声困难的患者效果显著。
为实现上述目的,本发明采用的技术方案如下一种用数字技术实现听觉改变反馈的方法,其特征在于该方法的步骤为A、信号输入传感器将模拟信号转换成电平信号,模/数转换器A/D将电平信号转换成数字信号,然后再采用傅立叶变换,时/频域转换器将数字信号从时域信号变换成频域信号;B、信号识别与优化对经转换后的频域信号施行算法降噪,计算频域信号各波段的信/噪比因子,决定应给予各频段混噪信号的衰减量和语音信号的增益量,衰减各频段的噪声信号,增益各频段的语音信号。
C、信号重构频域信号同时经延迟滤波器将频域信号进行听觉延迟反馈处理,经频率改变器将频域信号进行频率改变反馈处理;D、掩蔽优化经听觉延迟反馈和频率改变反馈处理后的频域信号进行反傅立叶变换,频/时域转换器将频域信号转换成时域信号,时域信号经言语识别器识别,控制混音器将掩蔽生成器生成的掩蔽信号与该时域信号混合输出,完成掩蔽听觉反馈处理;E、信号输出经听觉延迟反馈处理、频率改变反馈处理和掩蔽听觉反馈处理后的数字信号经数/模转换器D/A转换成电平信号,由传感器输出。
所述听觉延迟反馈处理是通过延迟滤波器对频域信号进行延迟处理。
所述频率改变反馈处理是通过频率改变器对频域信号进行频率改变处理所述频域信号的各个波段的频域分量按照频率高低顺序排列,所述频率改变器按指定的排列顺序将所述频域分量重新排列。
所述掩蔽信号为白噪声或窄带噪声,所述白噪声由随机函数算法生成,所述窄带噪声为白噪声经过带通滤波器后产生的通带噪声。
所述传感器为麦克风或扬声器。
本发明的优点在于1、本发明采用听觉延迟反馈、频率改变反馈和掩蔽听觉反馈三种反馈对声音信号进行处理,可有效提高口吃患者言语流畅程度、治疗口吃效果更显著、稳定,适用范围广,较现有的仅通过延迟信号治疗口吃的口吃治疗仪效果更明显、尤其对于易于产生不发声的口吃行为的人和首字发声困难的人效果显著。
2、本发明采用数字技术处理的方式,所需元件数量少、体积小、功耗低,便于采用本发明开发微型便携式设备,以满足使用者对外观和隐蔽性的需求。
3、本发明通过将模拟信号转换为数字信号,再转换为频域信号,再对频域信号进行延迟和频率改变,在这个过程中可以方便地应用数字信号处理的高级算法,实现高质量、实时的信号重构。
4、研究表明最低4ms的延迟听觉反馈就开始对使用者提高语言流畅度起作用,而延迟时间越短,对使用者说话的速率影响越小,因此,通过本发明实现的对信号的快速重构、精确控制对治疗口吃和用于口吃辅助治疗具有重大意义。
附图及图面说明

图1为本发明的整体结构流程示意2为本发明信号的识别优化的流程示意3为本发明信号重构的流程示意4为本发明信号进行听觉延迟反馈处理原理示意5为本发明信号进行频率改变反馈处理原理示意6为本发明掩蔽信号生成器生成掩蔽信号原理示意7为本发明信号进行掩蔽听觉反馈处理原理示意图具体实施方式
如图1所示本发明的信号流程分为下述阶段输入信号传感器如麦克风将模拟信号转换成电平信号,模/数转换器A/D将电平信号转换成数字信号也即混噪语音信号,然后再采用傅立叶变换,时/频域转换器将数字信号从时域信号变换成频域信号;信号识别与优化对经转换后的频域信号施行算法降噪,计算频域信号各波段的信/噪比因子,决定应给予各频段混噪信号的衰减量和语音信号的增益量,衰减各频段的噪声信号,增益各频段的语音信号。
信号重构频域信号同时经延迟滤波器将频域信号进行听觉延迟反馈处理,经频率改变器将频域信号进行频率改变反馈处理;掩蔽优化经听觉延迟反馈和频率改变反馈处理后的频域信号进行反傅立叶变换,频/时域转换器将频域信号转换成时域信号,时域信号经言语识别器识别,控制混音器将掩蔽生成器生成的掩蔽信号与该时域信号混合输出,完成掩蔽听觉反馈处理;信号输出经听觉延迟反馈处理、频率改变反馈处理和掩蔽听觉反馈处理后的数字信号经数/模转换器D/A转换成电平信号,由传感器如扬声器输出。
如图2所示本发明信号的识别和优化步骤为-1、时/频域转换采用快速傅立叶变换(FFT),将混噪语音从时域信号变换成频域信号,得到混噪语音N个波段的频率分量(N由FFT点数决定)。
2、计算信/噪比因子按一定时间间隔,计算各波段瞬时能量值;按一定时间间隔(时间为前述间隔的若干倍),在若干个瞬时能量值中计算其最大值和最小值,并纪录;根据最大值和最小值计算特征值作为信/噪比因子,即特征值=f(最大值,最小值)(特征值的计算算法有多种,如求其平均值就是其中一种,采用哪种算法可由针对的噪声类型,由一学习算法或根据经验确定。)3、根据事先通过学习算法或经验确定的信/噪比因子即衰减量关系、增益量关系,计算出对这一时间间隔内对该波段信号的衰减量和增益量,混噪信号的信/噪比越高,信/噪比因子的数值越大,衰减量越小。(考虑的信号的变化通常是连续的、渐变的,实际应用中,可以是计算出下一个时间间隔内的衰减量。)4、对这一时间间隔内的各波段信号分别进行衰减和应用增益(增益的大小由放大策略决定,如可以采用EDRC宽动态范围压缩策略等)。从而使信号中的噪声被抑制,语音的信号包络被从噪声中还原出来,提高了信/噪比。
5、进行其他处理如对信号进行听觉延迟反馈、频率改变反馈处理和掩蔽听觉反馈处理。
6、频/时域转换采用快速傅立叶变换(IFFT),将优化后的信号从频域信号变换成时域信号如图4所示,本发明信号进行听觉延迟反馈处理中延迟滤波器的工作原理为延迟滤波器以一个环形输入输出缓冲器为基础,输入的频域信号总是被放置在输入指针指向的位置,而输出信号总是从输出指针指向的位置获取。假设输出指针从起始位置开始,而输入指针在输出指针前,间隔N个位置(N=指定的延迟时间/一次输入输出的数据所代表时间间隔),输入和输出指针同步向前运动,这样,每次输入的信号,就会在指定的间隔时间后被输出,达到信号延迟的目的,调整整个缓冲器的长度、输入指针和输出指针的间隔,即可任意设定延迟时间。
如图5所示各频率分量被整体下移了一个波段,波段1的频率分量1被移动到波段2,原波段1填0;波段2的频率分量2被移动到波段3;……以此类推,直至波段n-1的频率分量n-1被移动到波段n,而原波段n的频率分量丢弃。这样得到的新的排列与原信号频率相比,其频率升高了了(假设从波段1到波段n是按频率升序排列),升高的频率为一个波段的带宽。假设一个波段带宽为500Hz,原信号频率为1000Hz信号,则得到信号为频率1500Hz的信号。
如图6所示掩蔽信号的生成掩蔽信号是白噪声或窄带噪声,白噪声可用随机函数生成,即均值为0,方差为1的高斯随机噪声。考虑到实际应用中,数字信号处理器的运算能力的限制,本发明中采用事先录制好的白噪声信号作为白噪声声源。窄带噪声是白噪声经过带通滤波器产生的通带噪声。本发明中将白噪声经过频率分析后,只取某一个或几个相邻的波段的频率分量,而将其余波段的频率分量置0,就可以得到窄带噪声。
如图7所示掩蔽听觉反馈处理步骤为言语识别器检查重构后的信号是否为言语信号,以控制混音器只在有言语信号输入时,将掩蔽信号与言语信号混合输出,否则直接输出重构后的信号(即在说话人静默时,不加掩蔽信号)。言语识别器的识别方法除采用与前述信号优化中提到的言语识别算法相近视的方法一采用计算信/噪比因子并判断其是否超过设定的阈值。
除了由言语识别器来控制混音器输出混合信号外,还可以由控制信号直接控制混音器输出混合信号或掩蔽信号。这主要是为了让使用者可以通过一个外部接口(如一个按钮或遥控器),控制本方法中系统发一个掩蔽信号,该掩蔽信号可以作为帮助使用者解决难发音的刺激信号。该刺激信号除了用掩蔽信号外,还可以采用录制的语音信号,如元音“a”,以达到更佳效果。
本发明不限于上述实施例,在本发明权利要求所限定的构思范围内,本领域内的普通技术人员还可对上述实施例作一些显而易见的改变,但这些改变均应落入本发明权利要求的保护范围之内。
权利要求
1.一种用数字技术实现听觉改变反馈的方法,其特征在于该方法的步骤为A、输入信号传感器将模拟信号转换成电平信号,模/数转换器A/D将电平信号转换成数字信号,然后再采用傅立叶变换,时/频域转换器将数字信号从时域信号变换成频域信号;B、信号识别与优化对经转换后的频域信号施行算法降噪,计算频域信号各波段的信/噪比因子,决定应给予各频段混噪信号的衰减量和语音信号的增益量,衰减各频段的噪声信号,增益各频段的语音信号;C、信号重构频域信号同时经延迟滤波器将频域信号进行听觉延迟反馈处理,经频率改变器将频域信号进行频率改变反馈处理;D、掩蔽优化经听觉延迟反馈和频率改变反馈处理后的频域信号进行反傅立叶变换,频/时域转换器将频域信号转换成时域信号,时域信号经言语识别器识别,控制混音器将掩蔽生成器生成的掩蔽信号与该时域信号混合输出,完成掩蔽听觉反馈处理;E、信号输出经听觉延迟反馈处理、频率改变反馈处理和掩蔽听觉反馈处理后的数字信号经数/模转换器D/A转换成电平信号,由传感器输出。
2.根据权利要求1所述的一种用数字技术实现听觉改变反馈的方法,其特征在于所述听觉延迟反馈处理是通过延迟滤波器对频域信号进行延迟处理。
3.根据权利要求1所述的一种用数字技术实现听觉改变反馈的方法,其特征在于所述频率改变反馈处理是通过频率改变器对频域信号进行频率改变处理所述频域信号的各个波段的频域分量按照频率高低顺序排列,所述频率改变器按指定的排列顺序将所述频域分量重新排列。
4.根据权利要求1所述的一种用数字技术实现听觉改变反馈的方法,其特征在于所述掩蔽信号为白噪声或窄带噪声,所述白噪声由随机函数算法生成,所述窄带噪声为白噪声经过带通滤波器后产生的通带噪声。
5.根据权利要求1所述的一种用数字技术实现听觉改变反馈的方法,其特征在于所述传感器为麦克风或扬声器。
全文摘要
本发明公开了一种用数字技术实现听觉改变反馈的方法,该方法的步骤为;使用者自己说话的言语信号被传感器采集转换成电平信号,再经过A/D转换成数字信号,该数字信号经傅立叶变换被分解为频域信号,频域数据经延迟和频率改变后,经反傅立叶变换重新合成为时域数据,再按一定条件与掩蔽信号混合输出,输出的数字信号经数/模转换器D/A转换为电平信号,经传感器转换为声音信号,输出给使用者。本发明具有效果显著、稳定,适用范围广的优点。
文档编号A61F5/58GK1803111SQ200610020219
公开日2006年7月19日 申请日期2006年1月24日 优先权日2006年1月24日
发明者蒋一宁, 夏世雄, 蒋涛, 付晓毅, 蔺君刚 申请人:四川微迪数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1