一种应用于手机的语音增强装置的制作方法

文档序号：2834313阅读：340来源：国知局

专利名称：一种应用于手机的语音增强装置的制作方法
技术领域：
本实用新型涉及语音信号处理技术领域，特别涉及一种应用于手机的语音增强装置。
背景技术：
手机在人们的日常生活和工作中已经得到了广泛应用，解除了人们通讯的时空约束，为人们的生活和工作提供了极大的便利。但是人们进行通讯的环境是复杂多变的，其中包括吵杂的环境，噪声会使得通话的语音质量严重下降，因此应用于手机的抑制噪声的语音增强技术有着重要的意义。目前手机中常用的语音增强技术中有单麦克风谱减语音增强技术，也叫单通道谱减语音增强技术，也可以成为单麦克风降噪技术，这种技术只能抑制稳态的噪声，对非稳态的噪声，如商场超市或餐厅里的周围人的说话声等，没有明显的抑制效果。另一种更优的降噪技术是多麦克风阵列语音增强技术，也称为多麦克风降噪技术，这种技术又分为两类:第一类是通过多麦克风信号处理形成固定的指向性，即保留来自一个指定方向的声音，抑制来自其它方向的声音，当处理形成的指向性指向使用者的嘴则能达到保护语音抑制周围噪声的效果。第二类是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理。图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理方案的多麦克风的安装位置示意图。如图1所示，这里有两个麦克风，分别为主麦克风I和辅麦克风2，把主麦克风I安装到手机的底端靠近人嘴的位置，主麦克风I接收到的使用者的语音信号能量很大，辅麦克风2安装在手机的顶端远离人嘴的位置，辅麦克风2接收到的使用者的语音信号能量小。如图1所示，对于外界环境噪声两个麦克风接收到的能量接近，因此通过比较两个麦克风接收到的信号能量差异可以判断是语音信号还是噪声信号，从而保留语音成分抑制噪声成分，达到提高信噪比的效果。多麦克风降噪技术优于单麦克风降噪技术的是可以有效抑制非稳态的噪声。但是多麦克风降噪技术对用户使用手机的方式会有严格约束，即用户握持手机的方式要受到限制。对于所述第一类利用指向性的技术来说，用户必须保持指向性对准人嘴的握持方式，否则若用户的握持方式有偏差就会导致人嘴偏离被保护的方向，语音就会被作为来自其他方向的噪声抑制；同样对于第二类利用能量差异的技术也要求用户保证主麦克靠近人嘴而辅麦克远离嘴握持方式，如图2所示，图2是用户正常握持手机状态示意图；当用户异常握持时，如手机被水平握持时，如图3所示，图3是用户异常握持手机状态示意图，两个麦克风到人嘴的距离接近，语音到两个麦克风的能量接近，语音同样会被当作噪声抑制。

实用新型内容有鉴于此，本实用新型提供了一种应用于手机的语音增强和装置，以解决只采用单麦克风降噪只能一致稳态噪声，而采用多麦克风降噪虽然能抑制非稳态噪声但在用户异常握持手机时损伤语音信号的问题。为达到上述目的，本实用新型的技术方案是这样实现的:本实用新型公开了一种应用于手机的语音增强装置，在手机的底部设置有主麦克风，在手机的远离主麦克风的位置设置有一个或多个辅麦克风，则该装置包括:检测单元和降噪单元，其中:检测单元，用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态；当判断用户处于说话状态时，进一步检测用户的手机握持状态是正常握持手机还是异常握持手机，并通知给降噪单元；降噪单元，用于在接收到用户正常握持手机的通知时，采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理；用于在接收到用户异常握持手机的通知时，只采用单麦克风降噪方式进行语音增强处理。在上述装置中，所述检测单元包括:近场语音检测模块和握持状态检测模块；所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块；其中，近场语音检测模块，用于接收主麦克风信号和各辅助麦克风信号，并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态，当判断用户处于说话状态时向握持状态检测模块发送通知，当判断用户处于接听状态时不向握持状态检测模块发送通知；握持状态检测模块，用于接收主麦克风信号和各辅助麦克风信号，在收到近场语音检测模块的通知时，检测用户的手机握持状态是正常握持手机还是异常握持手机，当检测到用户正常握持手机时，将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块，当检测到用户异常握持手机时，将主麦克风信号发送给单麦克风降噪处理模块；多麦克风降噪处理模块，用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块；单麦克风降噪处理模块，用于对所接收的信号进行单麦克风降噪处理后输出。在上述装置中，所述近场语音检测模块，用于计算主麦克风信号与辅麦克风信号之间的相关值，如果该相关值大于第一阈值则判断用户处于说话状态，如果该相关值小于或等于第一阈值则判断用户处于接听状态；其中，所述近场语音检测模块，计算主麦克风信号与每个辅麦克风信号之间的相关值，然后进行平均得到平均相关值，或者，计算主麦克风信号与其中一个辅麦克风信号之间的相关值。在上述装置中，所述握持状态检测模块，用于通过多麦克风检测语音的方向，若语音来自手机底部方向，则确定用户正常握持手机，若语音来自手机的侧向或顶部方向，则确定用户异常握持手机；或者，所述握持状态检测模块，用于计算主麦克风信号能量与辅麦克风信号能量的比值，如果该比值大于第二阈值，则确定用户正常握持手机，如果该比值小于或等于第二阈值，则确定用户异常握持手机。[0024]该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块，其中:快速傅里叶变换模块，用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给近场语音检测模块和握持状态检测模块；所述多麦克风降噪处理模块，用于在每个频率子带上，计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值，根据该能量比值确定抑噪函数在该频率子带上的取值；用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模块；所述单麦克风降噪处理模块，用于在每个频率子带上，通过滑动平均算法计算出所接收信号在该频率子带上的平稳噪声能量，进而计算出语音成分比例函数在该频率子带上的取值；将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块；逆快速傅里叶变换模块，用于对所接收的信号进行逆快速傅里叶变换处理后输出。由上述可见，本实用新型这种在用户说话时对用户的手机握持状态进行检测，根据用户的手机握持状态采用不同的降噪处理方案，在用户正常握持手机时采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制，而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪声进行抑制，避免了多麦克风降噪对语音的损伤，保证了语音质量。

图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理方案的多麦克风的安装位置示意图；图2是用户正常握持手机状态示意图；图3是用户异常握持手机状态示意图；图4是本实用新型实施例中的一种应用于手机的语音增强装置的结构示意图。
具体实施方式
本实用新型是应用于手机的语音增强技术，本实用新型中采用了手机握持状态检测技术，对用户正常握持手机状态采用多麦克降噪与单麦克降噪结合处理的方案，从而能够保证在用户正确握持手机时能达到最优的降噪效果，对用户异常握持状态采用单通道降噪处理只对稳态噪声进行抑制以避免此时采用多麦克降噪处理对语音造成伤害。也就是说，本实用新型在多麦克风降噪的基础上加入用户手机握持状态的检测，从而能在不同的手机握持状态采用不同的降噪技术，保证最优降噪的同时也避免语音失真。下面对本实用新型的技术方案进行详细分析介绍。在嘈杂的环境中使用手机通话时往往会遇到这样的情况，自己的说话声被周围的噪声所掩盖导致对方难以听清，本实用新型所公开的就是一种消除这些噪声，保留清晰的语音，使得通话即使在吵闹的环境中仍然能够通畅清晰进行的多麦克风降噪技术，这里的多个麦克风包括两个或两个以上的麦克风。因此本技术适用于安装有两个或两个以上麦克风的手机。如图1是一种双麦克风手机示意图，其中安装在手机底部的是主麦克1，安装在手机背部上端位置的是辅麦克2。在其他情况下也可以使用3个或3个以上的麦克风，其中只有一个主麦克风安装在手机底部，其余多个辅麦克风安装在手机的远离主麦克风的位置，如手机的顶部或背部上端位置。用户在使用手机通话时通常会有两种握持方式:1、正常握持，手机底部的主麦克风I挨近用户的嘴，如图2所示。此时在本实用新型中采用多麦克风降噪和单麦克风降噪结合的降噪技术能够很好的消除噪声，同时语音质量不会受到损害；2、异常握持，手机底部的主麦克风I远远偏离用户的嘴，如图3所示。此时若采用多麦克降噪技术在消除噪声的同时会把语音当作噪声消除，因此在本实用新型中只采用单麦克风降噪处理。本实用新型的技术方案主要包括两大单元:检测单元和降噪单元。检测单元的作用是检测目前的通话状态，这些状态包括:用户在说话还是在接听，用户正常握持手机还是异常握持手机。其中用户的说话或接听状态由近场语音检测模块检测得到；用户的握持手机状态则进一步由握持状态检测模块检测得到。近场语音检测模块的原理是:当用户使用手机时，不管是正常握持还是异常握持用户的嘴到手机上的麦克风距离都会小于20cm，可认为是近场声源，而周围的噪声源一般都会距离手机50cm以上，可认为是远场声源，因此可以通过检测声源的距离来判断是用户的说话还是用户没有说话只有周围噪声。若是近场声源，两个麦克风接收到的信号间的相关性强，若是远场声源，两个麦克风接收到的信号间的相关性弱。因此可以通过计算主辅麦克风信号间的相关性来判断信号是用户语音还是周围噪声。具体的检测步骤可以如下:1、计算主麦克风信号与辅麦克风信号之间的相关值；可以计算主麦克风信号与每个辅麦克风信号之间的相关值，然后进行平均得到平均相关值，或者，也可以计算主麦克风信号与其中一个辅麦克风信号之间的相关值；2、如该相关值小于或等于设定阈值则信号是远场噪声信号，用户处于接听状态；若该相关值大于设定阈值则信号是近场语音信号，用户处于说话状态。若是用户处于说话状态，则进一步进行用户握持状态检测。在本实用新型中提供检测用户握持状态的两种方法:第一种方法:通过多麦克风检测语音的方向，通过语音的方向来判断用户握持状态，若语音来自手机的底部则是正常握持，若语音来自手机的侧向或顶部方向则是异常握持。第二种方法:通过多麦克风信号能量的差异来判断用户握持状态:若主麦克风信号能量与辅麦克风信号能量的比值大于设定的阈值，则是正确握持，若能量比值小于或等于设定的阈值，则是异常握持。经过检测单元的判定后，降噪单元根据不同的状态采用对应的降噪处理:1、若是正常握持，采用多麦克风降噪模式:即首先经过多麦克风降噪处理抑制大部分的噪声，然后再经过单麦克风降噪处理抑制残留的稳态噪声，从而达到最优降噪；2、若是异常握持，采用单麦克风降噪模式:不经过多麦克风降噪处理，只经过单麦克风降噪处理抑制稳态噪声，从而保证最优的语音质量。3、用户接听状态，保持降噪模式不变，即保持之前的语音增强处理方式不变。由于用户不说话，此时不确定用户的握持状态，因此认为上一次检测到的握持状态没有改变，所以降噪模式也不改变。通过本实用新型可以根据用户使用手机时的握持状态采用不同的降噪模式，从而有效消除噪声，同时能够保证语音信号不会受到损伤。为使本实用新型的目的、技术方案和优点更加清楚，
以下结合附图对本实用新型中的应用于手机的语音增强装置进行详细描述。以图1所示的具有两个麦克风的手机为例，其中主麦克风I在手机的底部，辅麦克风2在手机的背部上端位置，远离主麦克风I。当用户如图2所示正常握持手机时，主麦克风I到嘴的距离小于5cm，辅麦克风2到嘴的距离15cnT20Cm。当用户如图3所示异常握持手机时，主麦克风I到嘴的距离大于10cm，辅麦克风2到嘴的距离15cnT20Cm。因此用户正常握持时，主麦克风I接收到的语音能量与辅麦克风2接收到的语音能量的差异大于9dB以上；用户异常握持时，主麦克风I接收到的语音能量与辅麦克风2接收到的语音能量的差异在3dB以内。无论何种握持，主麦克风I接收到的噪声能量与辅麦克风2接收到的噪声能量的接近，也在3dB以内。因此正常握持时，能通过两个麦克风的能量差异来区分语音和噪声，采用多麦克风降噪能有效抑制噪声不损伤语音。但异常握持时，不能通过两个麦克风的能量差异来区分语音和噪声，采用多麦克风降噪会损伤语音，此时要保护语音只能采用单麦克风降噪抑制稳态噪声。在本实用新型的实施例中，也可以在手机的底部设置I个主麦克风，在手机的远离主麦克风的位置，如在手机的顶部或背部上端设置2以上的多个辅麦克风，多个辅助麦克风可以相距较近地分布在手机的顶部或背部上端。在本实施例中设有P (P为大于I的自然数)个麦克风:首先把主麦克风接收到的时域信号S1和多个辅麦克风接收到的时域信号S2,…，Sp通过快速傅里叶变换(FFT)变换为频域信号S1,…，SP。频域信号输入近场语音检测模块，场语音检测模块通过主麦克风信号和辅麦克风信号的相关性判断输入的信号是近场语音还是远场噪声。若近场语音检测模块检测到的是近场语音信号，把频域信号输入到握持状态检测模块通过主麦克风信号和辅麦克风信号的总能量差异判断用户是正常握持还是异常握持。若用户是正常握持，M个麦克风的M路频域信号输入到多麦克风降噪处理模块进行降噪处理，然后再经过单麦克风降噪处理，最后输出一路经过降噪后的频域信号。若用户是异常握持，只把一路主麦克风的频域信号S1输入单麦克风降噪处理模块进行降噪处理，输出一路经过降噪后的频域信号。若近场语音检测模块检测到的是远场噪声信号，此时不能确定握持状态，因此保持此时的降噪模式。最后把经过降噪处理后的频域信号进行逆快速傅里叶变换(IFFT)变换成时域信号输出。详细的处理结构见图4。图4是本实用新型实施例中的一种应用于手机的语音增强装置的结构示意图。参见图4，该装置包括:快速傅里叶变换模块41、检测单元42、降噪单元43和逆快速傅里叶变换模块44，其中:快速傅里叶变换模块41、用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给检测单元42 ；检测单元42，用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态；当判断用户处于说话状态时，进一步检测用户的手机握持状态是正常握持手机还是异常握持手机，并通知给降噪单元43 ；降噪单元43，用于在接收到用户正常握持手机的通知时，采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理；用于在接收到用户异常握持手机的通知时，只采用单麦克风降噪方式进行语音增强处理；逆快速傅里叶变换模块44，用于将降噪单元43输出的信号进行逆快速傅里叶变换处理后输出。如图4所示，检测单元42包括:近场语音检测模块421和握持状态检测模块422 ；降噪单元43包括:多麦克风降噪处理模块431和单麦克风降噪处理模块432 ;其中，近场语音检测模块421,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态，当判断用户处于说话状态时向握持状态检测模块422发送通知；当判断用户处于接听状态时近场语音检测模块421不向握持状态检测模块422发送通知，这样握持状态检测模块422就会仍按照之前的握持状态判断结果向降噪单元43输入对应的信号，则降噪单元43仍保持之前的降噪模式；握持状态检测模块422，用于接收主麦克风信号和各辅助麦克风信号，在收到近场语音检测模块421的通知时，检测用户的手机握持状态是正常握持手机还是异常握持手机，当检测到用户正常握持手机时，将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块431，当检测到用户异常握持手机时，只将主麦克风信号发送给单麦克风降噪处理模块432 ；多麦克风降噪处理模块431，用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块432 ；
`[0065]单麦克风降噪处理模块432`，用于对所接收的信号进行单麦克风降噪处理后输出。下面对各个模块的具体处理过程进行详细介绍:快速傅里叶变换模块41:首先对Si进行分帧处理(i = 1，…，P)，每帧N个采样点，第111帧信号是屯(111，11)，其中0<n〈N，m>0。相邻两帧有M个采样点的混叠，即当前帧的前M个采样点是前一帧的最后M个采样点，每帧只有L=N-M个采样点的新数据。因此第m巾贞数据为(Ii (m, n) = Si (m*L+n)。例如在本实施方案中取巾贞长N=256,混叠M=128,即50%的混叠。分巾贞处理后对每巾贞信号用窗函数win (η)进行加窗处理,加窗后的数据为Wi (m, n) =win (n) ^di (m, η)。窗函数可选择汉明窗,汉宁窗等窗函数,本实施方案选取汉宁窗:
权利要求1.一种应用于手机的语音增强装置，其特征在于，在手机的底部设置有主麦克风，在手机的远离主麦克风的位置设置有一个或多个辅麦克风，则该装置包括:检测单元和降噪单元，其中: 检测单元，用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态；当判断用户处于说话状态时，进一步检测用户的手机握持状态是正常握持手机还是异常握持手机，并通知给降噪单元；降噪单元，用于在接收到用户正常握持手机的通知时，采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理；用于在接收到用户异常握持手机的通知时，只采用单麦克风降噪方式进行语音增强处理。
2.根据权利要求1所述的装置，其特征在于，所述检测单元包括:近场语音检测模块和握持状态检测模块；所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块;其中，近场语音检测模块，用于接收主麦克风信号和各辅助麦克风信号，并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态，当判断用户处于说话状态时向握持状态检测模块发送通知，当判断用户处于接听状态时不向握持状态检测模块发送通知；握持状态检测模块，用于接收主麦克风信号和各辅助麦克风信号，在收到近场语音检测模块的通知时，检测用户的手机握持状态是正常握持手机还是异常握持手机，当检测到用户正常握持手机时，将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块，当检测到用户异常握持手机时，将主麦克风信号发送给单麦克风降噪处理模块；多麦克风降噪处理模块，用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块；单麦克风降噪处理模块，用于对所接收的信号进行单麦克风降噪处理后输出。
3.根据权利要求2所述的装置，其特征在于，所述近场语音检测模块，用于计算主麦克风信号与辅麦克风信号之间的相关值，如果该相关值大于第一阈值则判断用户处于说话状态，如果该相关值小于或等于第一阈值则判断用户处于接听状态；其中，所述近场语音检测模块，计算主麦克风信号与每个辅麦克风信号之间的相关值，然后进行平均得到平均相关值，或者，计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
4.根据权利要求2所述的装置，其特征在于，所述握持状态检测模块，用于通过多麦克风检测语音的方向，若语音来自手机底部方向，则确定用户正常握持手机，若语音来自手机的侧向或顶部方向，则确定用户异常握持手机；或者，所述握持状态检测模块，用于计算主麦克风信号能量与辅麦克风信号能量的比值，如果该比值大于第二阈值，则确定用户正常握持手机，如果该比值小于或等于第二阈值，则确定用户异常握持手机。
5.根据权利要求2所述的装置，其特征在于，该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块，其中: 快速傅里叶变换模块，用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给近场语音检测模块和握持状态检测模块；所述多麦克风降噪处理模块，用于在每个频率子带上，计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值，根据该能量比值确定抑噪函数在该频率子带上的取值；用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模块；所述单麦克风降噪处理模块，用于在每个频率子带上，通过滑动平均算法计算出所接收信号在该频率子带上的平稳噪声能量，进而计算出语音成分比例函数在该频率子带上的取值；将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块；逆快速傅里叶变换模块，用于对所接收的信号进行逆快速傅里叶变换处理后输出。
专利摘要本实用新型公开了一种应用于手机的语音增强装置，包括检测单元，根据设置于手机底部的主麦克风信号和设置于手机远离主麦克风的位置的各辅助麦克风信号进行判断；当判断用户处于说话状态时，检测用户的手机握持状态是正常还是异常，并通知给降噪单元；降噪单元，在接收到正常握持的通知时，采用多麦克风和单麦克风降噪结合的方式进行语音增强处理，在接收到异常握持的通知时，只采用单麦克风降噪方式进行语音增强处理。本实用新型的技术方案在用户正常握持时采用多麦克风和单麦克风降噪结合的方案对稳态和非稳态噪声都进行抑制，在用户异常握持时采用单麦克风降噪方案对稳态噪声进行抑制，避免了多麦克风降噪对语音的损伤，保证了语音质量。
文档编号G10L21/02GK202957890SQ20122038907
公开日2013年5月29日申请日期2012年8月7日优先权日2012年8月7日
发明者刘崧, 李波, 楼厦厦申请人:歌尔声学股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘崧;李波;楼厦厦
技术所有人：歌尔声学股份有限公司
我是此专利的发明人