一种基于智能终端选择输出的双耳麦克风助听器降噪算法的制作方法

文档序号:17898790发布日期:2019-06-13 16:11阅读:156来源:国知局
一种基于智能终端选择输出的双耳麦克风助听器降噪算法的制作方法

本发明涉及语音信号处理技术领域,特别是涉及一种基于智能终端选择输出的双耳麦克风助听器降噪算法。



背景技术:

目前,我国听力障碍高发,听力障碍患者以老年人为主,伴随我国老龄化趋势加剧,我国听力障碍总现患率还有进一步升高的趋势。

助听器的本质是一个声音放大器,它将声音放大,使听力障碍人士能有效地利用其残余听力。但是,对于经常出入不同吵杂环境的不同的人群,他们很难在所处的吵杂环境中获取目标语音,也正因如此,他们很难实现和别人正常的交流。即使他们佩戴了传统的助听器,也只是把周围的声源信号进行全面的放大,不能比较理想的得到目标语音信号。

为了提高听力障碍人士的交流质量,使用户可以得到较为清晰的目标语音信号,助听器开发人员一直致力于降噪,提高语音清晰度的方面的相关工作,由于不同的助听器用户所处的环境噪声不同,交流的对象也各不相同,这就导致了助听器接收的语音信号的信息特点差异性很大。目前,现有助听器采用的一些传统的降噪算法,很难达到理想的降噪效果。

因陈,目前迫切需要开发出一种技术,其可以对助听器接收的语音信号进行降噪处理,有效提高降噪效果,获得让用户收听的、高质量的目标语音信号。



技术实现要素:

有鉴于此,本发明的目的是提供一种基于智能终端选择输出的双耳麦克风助听器降噪算法,其能够对助听器接收的语音信号进行降噪处理,有效提高降噪效果,获得让用户收听的、高质量的目标语音信号,具有重大的实践意义。

为此,本发明提供了一种基于智能终端选择输出的双耳麦克风助听器降噪算法,其特征在于,包括以下步骤:

第一步、由助听器具有的双耳麦克风阵列模块,采集助听器用户所在外部环境的、混合在一起的多个源语音信号,然后发送给麦克风定位模块以及盲源信号分离和语音识别模块;

第二步、麦克风定位模块在接收到助听器用户所在外部环境的多个源语音信号后,分别进行定位分析操作,获得助听器用户所在外部环境的每个源语音信号的声源距离信息,然后发送给智能终端,同时,盲源信号分离和语音识别模块在接收到助听器用户所在外部环境的、混合在一起的多个源语音信号后,先进行分离操作,获得单独的、多个源语音信号,然后通过语音识别将各个源语音信号分别定义上对应的声源类别信息,然后发送给智能终端;

第三步、智能终端在收到麦克风定位模块发来的助听器用户所在外部环境的每个源语音信号的声源距离信息,以及盲源信号分离和语音识别模块发来的具有声源类别信息的多个源语音信号后,实时进行显示,并且根据助听器用户通过智能终端输入的语音信号输出约束条件,将对应的源语音信号作为目标语音信号向外输出。

其中,在第二步中,所述声源类别信息,包括人声、动物声和机器声。

其中,在第二步中,每个源语音信号的声源距离信息,为每个源语音信号的声源与助听器用户所在位置之间的距离。

其中,在第二步中,通过盲源分离算法,来将用户所在外部环境的、混合在一起的多个源语音信号进行分离操作。

其中,在第三步中,所述语音信号输出约束条件包括:源语音信号的声源距离值的预设范围区间以及源语音信号的声源类别的预设种类。

由以上本发明提供的技术方案可见,与现有技术相比较,本发明提供了一种基于智能终端选择输出的双耳麦克风助听器降噪算法,其能够对助听器接收的语音信号进行降噪处理,有效提高降噪效果,获得让用户收听的、高质量的目标语音信号,具有重大的实践意义。

附图说明

图1为本发明提供的一种基于智能终端选择输出的双耳麦克风助听器降噪算法的流程图。

图2为本发明的整体工作结构示意图。

图3为本发明所用的盲源分离信号混合分离的示意图。

图4为本发明所用的双耳麦克风阵列定位的拓扑结构图。

图5为本发明所用的双耳麦克风阵列定位原理讲解拓扑结构图;

图6为本发明的具体操作工作流程图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面结合附图和实施方式对本发明作进一步的详细说明。

参见图1至图6,本发明提供一种基于智能终端选择输出的双耳麦克风助听器降噪算法,具体包括以下步骤:

第一步、由助听器具有的双耳麦克风阵列模块,采集助听器用户所在外部环境的、混合在一起的多个源语音信号(多个语音源信号在一起组成混合语音信号),然后发送给麦克风定位模块以及盲源信号分离和语音识别模块;

需要说明的是,一个源语音信号是指由单独的一个声源所发出的语音信号,例如一个人作为声源发出的语音信号,一头动物作为声源发出的语音信号。

第二步、麦克风定位模块在接收到助听器用户所在外部环境的多个源语音信号后,分别进行定位分析操作,获得助听器用户所在外部环境的每个源语音信号的声源距离信息(即每个单独的源语音信号对应的声源距离信号),然后发送给智能终端,同时,盲源信号分离和语音识别模块在接收到助听器用户所在外部环境的、混合在一起的多个源语音信号(即混合语音信号)后,先进行分离操作,获得单独的、多个源语音信号,然后通过语音识别将各个源语音信号分别定义上对应的声源类别信息,然后发送给智能终端;

在第二步中,具体实现上,所述声源类别信息,包括人声、动物声和机器声等类别信息,可以根据实际需要,增加其他的类别信息,例如,下雨的声音。

在第二步中,具体实现上,每个源语音信号的声源距离信息,即为每个源语音信号的声源,与助听器用户所在位置之间的距离。

在第二步中,具体实现上,通过盲源分离(bss:blindsourceseparation)算法,来将用户所在外部环境的、混合在一起的多个源语音信号进行分离操作。

第三步、智能终端在收到麦克风定位模块发来的助听器用户所在外部环境的每个源语音信号的声源距离信息,以及盲源信号分离和语音识别模块发来的具有声源类别信息的多个源语音信号后,实时进行显示,并且根据助听器用户通过智能终端(例如触摸显示屏)输入的语音信号输出约束条件,将对应的源语音信号作为目标语音信号向外输出(例如输出给助听器中具有的扬声器,如耳机)。

在第三步中,具体实现上,所述语音信号输出约束条件包括:源语音信号的声源距离值的预设范围区间(例如1米~4米)以及源语音信号的声源类别的预设种类(例如人声和动物声,从而过滤其他声源类别的源语音信号)。

需要说明的是,对于本发明,能够对助听器接收到的语音信号进行相应的处理,分离大量的混合语音信号进行分支处理,既可以更好的提高降噪效果,又方便获得用户选择想要的目标语音信号,从而大大提高听力损失者的助听器使用体验感受。

对于本发明,其属于基于双耳麦克风阵列处理的语音信号分离,分类以及智能选择输出的助听装置设计。主要应用的技术有盲信号分离,麦克风阵列声源定位,语音识别,智能终端选择输出等。本发明通过分析助听器使用者接收到的来自四周的语音信号,通过盲源分离算法将声源信号简单的分离,然后传给下一级,进行语音识别实现语音分类,最后将处理过的语音信号传输给终端设备选择输出,以便于接下来的一系列操作,同时助听器设备利用麦克风阵列进行声源定位,也将相应的信息传输给终端设备选择输出,同语音种类的相关语音信号进行下一步的相关操作。

此外,终端设备可以通过界面接收到用户的相关需求操作信息,从而使用户可以得到自己迫切需求的目标语音信号,减少不必要的噪声干扰,提高用户助听器的使用体验感受。

由以上技术方案可知,本发明的目的是为了弥补现有技术的缺陷,进一步改善目前恢复听力设备的功能,提供了一种基于智能终端选择输出的双耳麦克风助听器降噪算法。该降噪算法将麦克风阵列采集到的语音信号进行多支路处理,分别得到语音信号的位置信息(声源的距离)、声源类别信息(例如:人声、动物声、机器声等),然后使用者可以根据个人需求选择接收各种目标语音信号,屏蔽周围的干扰信号,从而提高了语音质量,保证了用户的交流质量。

具体实现上,该算法通过双耳麦克风定位得到所需的位置信息,通过盲源分离算法将混合的迭代信号分离出若干源语音信号,然后通过语音识别将各个源语音信号进行系统的归类(即分别定义声源类别信息),作为用户选择输出的约束条件。其中,盲源分离(bss:blindsourceseparation)算法的应用,进一步提高了语音识别的精度,减少了部分干扰,也是后续备选的输出目标语音,很大程度上增强了语音质量。

具体实现上,本发明结构清晰需要四大主要模块进行协同工作,利用各种方法实现目标需求,具体分为双耳麦克风阵列模块,盲源信号分离和语音识别模块,麦克风定位模块,智能终端的软件app的开发模块。

其中,语音信号经双耳助听器的双耳麦克风阵列接收并传输到麦克风定位模块和盲源信号分离模块。麦克风定位模块经过一系列的算法对声源进行二维或者三位定位,然后将处理信号经无线设备传输到智能终端进行存储和选择操作。盲源信号分离和语音识别模块对复杂的语音信号进行简单的分离,然后通过语音识别的相关算法对接收信号进行系统的分类,然后将处理信号经无线设备传输到智能终端进行存储和选择操作。本发明应用的智能终端(包括手机、平板电脑及智能穿戴设备等)提供一个使用户和设备进行信息交互的界面。

需要说明的是,关于麦克风定位模块,其具有的麦克风声源定位方法按照定位原理大体上可以分为三大类:到达时延技术(timedelayofarrival,tdoa);高分辨率谱估计技术;可控波束形成技术。通过这些算法(技术)可以实现目标声源的定位,例如可以得到声源的方位角φ或者相对麦克风距离r。

关于语音识别的相关算法,即为语音识别方法,主要是模式匹配方法,提取目标语音的特征与模式库进行匹配,从而实现分类。本发明可以采用人工神经网络中的基于反向传播算法(bp算法)训练模式库,从而提高识别能力,从而可以保证对目标语音信号的准确分类。

此外,如果要进一步提高获取的语音信号质量,也可以充分利用智能终端设备的麦克风,增加参考信号等。

相比于其他传统的助听器降噪算法,本发明提供的一种基于智能终端选择输出的双耳麦克风助听器降噪算法更加的成熟,更加的人性化。针对不同的用户在不同的时段,不同的场合对各方语音信号的需求不同,本发明可以实现传统助听器简单的降噪功能,同时,又可以根据用户个人需求单独输出目标语音信号,不仅很大程度上降低了语音噪声,还更好的优化了用户的使用体验,使用户能够接收到更舒适、清晰的目标语音。

为了更加清楚地理解本发明的技术方案,下面结合附图对本发明做进一步的说明。

如图2所示,为本发明的整体工作结构示意图,本发明主要是助听器麦克风接收语音信号进行模数转换,进行简单的滤波处理,然后无线传输给智能终端进行相应的处理,最后根据用户的需求将处理过的相应语音信号无线传输给助听器,然后数模转换进行输出。

对于本发明,具体的操作工作流程如图6所示,双耳助听器的麦克风阵列接收到周围的带噪语音信号,然后分别传输到声源定位模块、盲源信号分离和语音识别模块。其中,声源定位模块通过计算得出相应的位置信息(方位或距离)传输给选择输出模块,根据用户设置的输出约束条件进行相应的输出。同时,盲源信号分离和语音识别模块对混合语音进行分离然后分类识别,可以根据用户需求输入相应的模型库,进行不同的分类(如人声、动物声、机械声等),同时也可以增加训练模型,提高用户的个人体验,该模块的输出结果,也传输给选择输出模块(具体为智能终端),根据用户设置的输出约束条件进行相应的输出(如:前方两米的动物声),从而使用户可以准确的接收到需要的目标语音,同时屏蔽掉其他语音的干扰,充分的发挥助听的功能。当然,如果用户不添加输出约束条件,则该助听器就相当于普通的助听器,全面接收周围的语音信号。

图3是本发明所用的盲源分离信号混合分离的示意图。对于不同的输入信号混合模型应该采取不同的盲源分离模型,假设是简单的线性混合模型,则麦克风中的传感器的输出信号xi(t)为:

xi(t)=ai1s1(t)+ai2s2(t)+|+ainsn(t);

其中,aij是未知的混合参数,si(t)是接收到的语音信号。然后通过一定的盲源分离方法(如时域或频域卷积盲源分离法)可以近似得到语音信号的近似估计s′1(t),s′2(t),s′n(t)。

图4是本发明所用的双耳麦克风阵列定位的拓扑结构图。该麦克风阵列结构为立体阵列拓扑结构,且形状为四个麦克风组成的正四面体结构。通过该结构采集分析信号可得到信号的水平方位角、垂直方位角和声源与麦克风阵列参考点距离这三维信息。

具体实现上,参见图5所示,本发明可以采用的是麦克风正四面体阵列拓扑结构,简单讲述一下平面麦克风阵列对其声源进行定位的原理。正四面体中每三个麦克风可以组成一个等边三角形(边长为l),以三角形的重心为原点o建立坐标系,声源s到每个麦克风的距离分别为d1、d2、d3,则三个麦克风的极坐标分别为:m1(r,π/2),m2(r,π/2),m3(r,π/2),其中r=l*3^(-1/2),声源到各个麦克风的距离差分别为:d12=d1-d2、d13=d1-d3、d23=d2-d3,设声源的极坐标为(r,φ),其中r为声源到坐标的距离,φ为声源的方位角。参考图5可知,由图5中的三角形边角关系可得:

d1=[r^2+r^2-2*r*r*cos(|π/2-φ|)]^(1/2);

d2=[r^2+r^2-2*r*r*cos(|7*π/6-φ|)]^(1/2);

d3=[r^2+r^2-2*r*r*cos(|-π/6-φ|)]^(1/2);

将上述各式带入以下各式:

d12=d1-d2,公式(1);

d13=d1-d3,公式(2);

d23=d2-d3,公式(3);

根据任意联立式(1)~(3)中的任意两个,均可解出r和φ的值。

因此,基于以上表述可知,对于本发明,其通过将语音信号分开处理,既能改善降噪效果,又创新性的利用声源定位和语音识别相结合,产生两个制约条件,从而可以实现用户通过智能终端,可以根据个人需求选择输出目标语音信号,很大程度上提高了助听器的使用体验感受。

综上所述,与现有技术相比较,本发明提供的一种基于智能终端选择输出的双耳麦克风助听器降噪算法,其能够对助听器接收的语音信号进行降噪处理,有效提高降噪效果,获得让用户收听的、高质量的目标语音信号,具有重大的实践意义。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1