基于传声器阵列的语音信号处理方法及装置的制作方法

文档序号:2823633阅读:241来源:国知局
专利名称:基于传声器阵列的语音信号处理方法及装置的制作方法
技术领域
本发明涉及语音信号处理技术,尤其涉及一种基于传声器阵列的语音信号处理方 法及装置。
背景技术
在会议场所,各种干扰源的存在以及混响等噪音干扰着语音信号,会使语音处理 系统的性能急剧下降,因此语音增强技术颇为重要。基于传声器阵列的多通道语音增强算 法融合了信号的时空域信息,利用噪声同语音的相关性差异进行消噪,近几年已经成为多 媒体会议、通信、声控等系统所依赖的重要技术。音质和性能的好坏会严重影响音频会议系 统的整体效果与市场竞争力,因此,针对噪声,目前常通过传声器阵列技术实现消噪,这使 得音频会议系统的参与人员彻底摆脱手持传声器并定向到传声器的束缚,大大提高了音频 会议系统的实用性。对语音信号处理而言,要争取使进入编码器的语音音质就比较好如低 混响、低噪声等,传声器阵列就是保证语音信号的低混响、低噪声。公开号为CN101496417A
公开日为2009年7月29日的中国专利申请公开了一种 “语音会议系统”,在不同方向上的多个单向传声器拾取的语音采集信号形成多个语音采集 束信号,其后,与语音到达方向相对应的语音采集束信号的信号电平变高,语音采集部分选 择信号电平超过设定阈值的语音采集束信号,并将该信号送到通信部分。该技术方案中,超 过阈值的语音采集束信号可能有多个,这样在小房间就会增加混响,使声音清晰度降低。公开号为US20050195988A
公开日为2005年9月8日的美国专利申请公开了一 ft "System and method for beamforming using a microphone array,,,i亥技术方案是使 用传声器阵列聚束的系统和方法,其技术方案的实质是设计了一个聚束器,该聚束器首先 利用描述传声器阵列的特性和结构的参数信息来计算频域相关的权值矩阵,与一个或多个 为传声器阵列周围环境自动生成或计算得到的噪声模型相结合,来对传声器阵列的最优固 定波束进行设计,然后,在对传声器阵列接收的音频信号进行频域聚束处理时,利用此权值 矩阵对传声器阵列中的每个传声器的输出进行频域加权。该方法需要根据阵列的特性和结 构在频域计算加权矩阵,以达到形成波束的目的,增加了系统的复杂度,加大了系统的开发 难度并且降低了系统的可靠性。

发明内容
有鉴于此,本发明的主要目的在于提供一种基于传声器阵列的语音信号处理方法 及装置,利用强指向性传声器阵列能将距发言人最近的语音信号进行放大,从而能动态跟 踪发目人。为达到上述目的,本发明的技术方案是这样实现的—种基于传声器阵列的语音信号处理方法,所述传声器阵列由两个以上的指向性 传声器构成;所述方法包括确定各指向性传声器接收的相同帧的语音信号的能量值;
4
根据所述能量值确定所述相同帧的各语音信号的调整参数;根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将各语音信号 中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积值进行累 加,将累加后的取样点信号依次输出。优选地,所述根据所述能量值确定所述相同帧的各语音信号的调整参数,为将所述相同帧的各语音信号的能量值分别与最大的能量值作商;对各商值进行指数调整处理,并作为各语音信号的调整参数。优选地,所述对各商值进行指数调整处理,并作为各语音信号的调整参数,为将各商值的E次方作为各语音信号的调整参数;其中,E为大于等于2小于等于10 的正数。优选地,所述根据各语音信号的调整参数确定语音信号中各取样点信号的权值, 具体按下式计算Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的权值,Wi(n-l)为传声器i中的当前语音信号帧中第n-1个取样点信号的权 值八为预先设定的遗忘因子,0< A < 1 ;C为当前语音信号帧的调整参数。优选地,所述根据各语音信号的调整参数确定语音信号中各取样点信号的权值, 为Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的初始权值,Wi(n-1)为传声器i中的当前语音信号帧中第个取样点信号 的初始权值;、为预先设定的遗忘因子,0 < A < 1 ;C为当前语音信号帧的调整参数;按下式对&(11)进行处理,将成(功作为传声器i中的当前语音信号帧中第n个取
样点信号的最终权值


其中,max()为取最大值计算。 优选地,所述传声器阵列为圆形阵列或球形阵列;所述传声器阵列中的传声器数 量为4至16个。一种基于传声器阵列的语音信号处理装置,所述传声器阵列由两个以上的指向性 传声器构成;所述装置包括第一确定单元、第二确定单元、计算单元和输出单元;其中,第一确定单元,用于确定各指向性传声器接收的相同帧的语音信号的能量值;第二确定单元,用于根据所述能量值确定所述相同帧的各语音信号的调整参数;计算单元,用于根据各语音信号的调整参数确定语音信号中各取样点信号的权 值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号 的乘积值进行累加;输出单元,用于将累加后的取样点信号依次输出。优选地,所述第二确定单元进一步将所述相同帧的各语音信号的能量值分别与最 大的能量值作商;并对各商值进行指数调整处理,作为各语音信号的调整参数。优选地,所述第二确定单元进一步将各商值的E次方作为各语音信号的调整参 数;其中,E为大于等于2小于等于10的正数。优选地,所述计算单元进一步按下式计算语音信号中各取样点信号的权值
Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的权值,Wi(n-l)为传声器i中的当前语音信号帧中第n-1个取样点信号的权 值八为预先设定的遗忘因子,0< A < 1 ;C为当前语音信号帧的调整参数。优选地,所述计算单元进一步按下述方式计算语音信号中各取样点信号的权值Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的初始权值,Wi(n-1)为传声器i中的当前语音信号帧中第个取样点信号 的初始权值;、为预先设定的遗忘因子,0 < A < 1 ;C为当前语音信号帧的调整参数;按下式对&(11)进行处理,将戌…)作为传声器i中的当前语音信号帧中第n个取 样点信号的最终权值
其中,maxO为取最大值计算。 优选地,所述传声器阵列为圆形阵列或球形阵列;所述传声器阵列中的传声器数 量为3至16个。本发明中,采用N个强指向性传声器构成圆形阵列,阵列的拾音覆盖360度方位; 首先对强指向性传声器阵列中各传声器接收到的语音信号的能量值,通过语音信号的能量 值信息,确定出各传声器接收到的当前语音帧的语音信号的调整参数,并利用该调整参数 计算当前语音帧的各采样点信号的权值,将所计算出的权值与对应的采样点信号相乘,对 相同位置的采样点信号的乘积进行累加,并按采样点的顺序依次输出。本发明利用传声器 阵列中各传声器所接收语音信号的能量值来确定各路语音信号的调整参数,并利用遗忘因 子对各采样点信号进行平滑处理,使得所输出的语音信号更连贯。本发明计算方式简单,不 需要复杂的计算和电路,具有良好的抗混响和定向拾音功能。


图1为本发明基于传声器阵列的语音信号处理方法的流程图;图2为在混响室两个声源相互切换发声时,传声器阵列中各传声器拾取的语音信 号语音帧的归一化能量变化关系的示意图;图3为在混响室两个声源相互切换发声时,传声器阵列的输出信号中各通道语音 帧所占的平均权重变化关系的示意图;图4为在混响室两个声源同时发声时,传声器阵列中各传声器拾取的语音信号语 音帧的归一化能量变化关系的示意图;图5为在混响室两个声源同时发声时,传声器阵列的输出信号中各通道语音帧所 占的平均权重变化关系的示意图;图6为在普通房间两个声源相互切换发声时,传声器阵列中各传声器拾取的语音 信号语音帧的归一化能量变化关系的示意图;图7为在普通房间两个声源相互切换发声时,传声器阵列的输出信号中各通道语 音帧所占的平均权重变化关系的示意图;图8为在普通房间两个声源同时发声时,传声器阵列中各传声器拾取的语音信号 语音帧的归一化能量变化关系的示意图;图9为在普通房间两个声源同时发声时,传声器阵列的输出信号中各通道语音帧所占的平均权重变化关系的示意图;图10为本发明基于传声器阵列的语音信号处理装置的组成结构示意图。
具体实施例方式本发明的基本思想为,采用N个强指向性传声器构成圆形阵列,阵列的拾音覆盖 360度方位;对各传声器拾取的信号分帧计算能量,通过能量的比较,保持能量最大通道的 语音信号幅度不变,而弱化其它通道的语音信号;语音信号的弱化程度受调整参数的控制; 并且,为保证基于能量比较在各通道间进行切换时语音信号平稳自然无切换噪声,引入平 滑机制-遗忘因子,将当前采样点和以前采样点的信号相结合来进行切换。为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照附图,对 本发明进一步详细说明。本发明的方法中,传声器阵列中的传声器均为强指向性传声器,而非全向性传声 器。所谓强指向性传声器,即该传声器能按指向进行语音信号的采集。强指向性传声器能 有效降低进入各个传声器的混响强度;本发明正是利用强指向性传声器的指向性拾音特 点,利用各传声器所拾取的相同语音帧的能量来确定各该相同语音帧中各语音信号中各采 样点信号的权值,从而输出较佳的语音信号。本发明的传声器阵列采用圆周或球面布局,以 对各方位的语音信号进行采集。本发明中,传声器阵列中的强指向性传声器的数量一般为3 至16个,以在设定的圆周或球面上均勻分布,达到各个指向均有相应的传声器进行语音采 集。圆周或球面的半径一般为3至20cm,各传声器振膜沿圆周或圆球的径向朝外。基于传声器阵列,上述传声器阵列中第i(i = 1,2,...,N)个传声器接收的第k帧 (帧长为L毫秒)采样信号如(1)式所示Xi(n) = Xi((k_l)L+j),j = 1,2, ,L (1)图1为本发明基于传声器阵列的语音信号处理方法的流程图,如图1所示,本发明 基于传声器阵列的语音信号处理方法具体包括如下步骤步骤101,计算第i(i = 1,2,. . .,N)个传声器接收的第k帧信号的能量。因正对 声源的传声器所采集到的语音信号相对来说能量要强,通过语音信号的能量能进行声源方 位的初步判断;所计算出的语音信号的能量值,同时也作为确定该传声器的语音信号处理 的权重值的依据,将在以下步骤中对如何确定相应的权重值。第i(i = 1,2,...,N)个传声 器接收的第k帧信号的能量值£310如式(2)所示本发明中,用于计算能量的各通道语音帧长度可取为400ms ;通道间自适应切换 的系统响应时间取为400ms。上述帧长由处理器的处理速度决定,也可以取其他的长度,如 450ms 或 500ms 等。步骤102,以N个通道的第k帧信号的能量的最大值为基准,对式(2)所确定的能 量值进行归一化处理。本步骤中,归一化处理即是将各个通道的第k帧信号的能量值转换 到0至1之间的数值,以便于后续处理。归一化处理方式如式(3)所示,其中£ i(k)为对 Ejk)的归一化处理结果。 其中,maxO为取最大值计算。步骤103,根据第i(i = 1,2, ...,N)个传声器接收的第k帧信号的归一化能量 计算调整参数。确定调整参数的目的是使能量数值大的通道上的语音信号变得更大,而使 能量数值小的通道上的语音信号变得更小,并依此拉大能量值较大语音信号与能量值较小 语音信号之间的差异,这样可以更突出声源方向的信号,抑制其它方向的信号,使声音更清 晰,混响更小。具体的,对于归一化后的能量值,对其分别进行幂运算。本步骤中,所选用的 调整指数值为大于等于2小于等于10的正数。为方便运算及考虑到语音信号的差异量,调 整指数一般选用4、5、6。调整参数、(10的确定方式如式(4)所示
(4)其中a称为调整指数,根据各通道语音帧的能量大小关系调整各通道信号在输 出信号中所占的比重。步骤104,计算阵列输出信号中第i(i = 1,2,. . .,N)个传声器采集的第n个采样 点信号的权值;该权值的变化是根据每个采样点信号逐步计算得到的,具体的,第n个采样 点信号的权值Wi(n)的确定方式如式(5)所示Wi (n) = A Wi (n-1) + (1-A ) hj (k) (5)其中\为遗忘因子,以平滑切换前后语音帧音量,避免语音信号的忽大忽小,并 抑制切换时通道的语音帧能量变化太大所导致的切换噪声。X为事先设定的参数,X为 大于0小于1的数,为保证语音信号的平滑性,\为近于1的数,本发明中可设定\ = 0.9998;入也可设定为其他值,如0. 9996、0. 9992、0. 9990等值。具体取值由用户希望的平 滑性来确定。步骤105,对第i(i = 1,2,.. .,N)个传声器采集的信号的每个采样点的权值按其 中的最大值进行归一化处理。这主要是为了使传声器阵列输出的能量最大通道的信号音量 与能量最大的通道传声器采集的信号音量相等。对第i (i = 1,2,. . .,N)个传声器采集的 信号的每个采样点信号的权值的归一化处理如式(6)所示 其中,maxO为取最大值计算。步骤106,计算传声器阵列的输出采样点信号,并依次输出。所输出的各采样点信 号如式(7)所示
Ns(n) = [ Wj {n)xi {n)
i=l式(7)是将传声器阵列中各传声器相同帧的语音信号中的各采样点依次与所确 定的对应权值进行相乘,并对各传声器的对应采样点信号进行累加,作为输出的采样点信号。本发明中,实际工作中在进入本算法处理前的典型前端处理为,通过传声器将语 音信号转化为电信号,经过放大以及模数转换进入数字信号处理器(DSP,Digital Signal Processor)处理。
8
以下以传声器阵列由4个传声器沿圆周均勻分布为例,说明各应用环境下语音信 号处理结果。其中,圆周的半径为5cm,遗忘因子\ = 0.9998,调整指数a =5.0。图2为在混响室两个声源相互切换发声时,传声器阵列中各传声器拾取的语音信 号语音帧的归一化能量变化关系的示意图,如图2所示,示出了在混响室两个声源相互切 换发声时,采用本发明方法计算各传声器拾取的语音帧的能量后,传声器阵列中各传声器 拾取的语音信号语音帧的归一化能量变化关系。图3为在混响室两个声源相互切换发声时,传声器阵列的输出信号中各通道语音 帧所占的平均权重变化关系的示意图,如图3所示,在混响室两个声源相互切换发声时,采 用本发明方法计算各传声器拾取的语音帧能量后,传声器阵列的输出信号中各通道语音帧 所占的平均权值变化关系,可以看出,本发明能根据各传声器拾音的语音帧能量大小而自 动切换,并且切换过程自然稳定,各传声器拾取的语音信号经过本发明方法处理后,传声器 阵列的输出语音信号音质流畅自然,混响大大降低。图4为在混响室两个声源同时发声时,传声器阵列中各传声器拾取的语音信号语 音帧的归一化能量变化关系的示意图,如图4所示,示出了在混响室两个声源同时发声时, 采用本发明方法计算各传声器拾取的语音帧能量,传声器阵列中各传声器拾取的语音信号 语音帧的归一化能量变化关系。图5为在混响室两个声源同时发声时,传声器阵列的输出信号中各通道语音帧所 占的平均权重变化关系的示意图,如图5所示,在混响室两个声源同时发声时,采用本发明 方法计算各传声器拾取的语音帧能量,传声器阵列的输出信号中各通道语音帧所占的平均 权重变化关系。可以看出,本发明能根据各传声器拾音的语音帧能量大小自动切换,并且切 换过程自然稳定,各传声器拾取的语音信号经过本发明方法处理后,传声器阵列的输出语 音信号音质流畅自然。图6为在普通房间两个声源相互切换发声时,传声器阵列中各传声器拾取的语音 信号语音帧的归一化能量变化关系的示意图,如图6所示,示出了在普通房间两个声源相 互切换发声时,采用本发明方法计算各传声器拾取的语音帧能量,传声器阵列中各传声器 拾取的语音信号语音帧的归一化能量变化关系。图7为在普通房间两个声源相互切换发声时,传声器阵列的输出信号中各通道语 音帧所占的平均权重变化关系的示意图,如图7所示,在普通房间两个声源相互切换发声 时,采用本发明方法计算各传声器拾取的语音帧能量,传声器阵列的输出信号中各通道语 音帧所占的平均权重变化关系。可以看出,本发明能根据各传声器拾音的语音帧能量大小 而自动切换,并且切换过程自然稳定,各传声器拾取的语音信号经过本发明方法处理后,传 声器阵列的输出语音信号音质流畅自然,混响降低。图8为在普通房间两个声源同时发声时,传声器阵列中各传声器拾取的语音信号 语音帧的归一化能量变化关系的示意图,如图8所示,在普通房间两个声源同时发声时,采 用本发明计算各传声器拾取的语音帧能量,传声器阵列中各传声器拾取的语音信号语音帧 的归一化能量变化关系;图9为在普通房间两个声源同时发声时,传声器阵列的输出信号中各通道语音帧 所占的平均权重变化关系的示意图,如图9所示,在普通房间两个声源同时发声时,采用本 发明计算各传声器拾取的语音帧能量,传声器阵列的输出信号中各通道语音帧所占的平均
9权重变化关系。可以看出,本发明能根据各传声器拾音的语音帧能量大小自动切换,并且切 换过程自然稳定,各传声器拾取的语音信号经过本发明的方法处理后,传声器阵列的输出 语音信号音质流畅自然。通过以上步骤处理的语音信号可以以数字信号的方式输出,也可以数模转换后模 拟信号输出。图10为本发明基于传声器阵列的语音信号处理装置的组成结构示意图,如图10 所示,所述装置包括第一确定单元100、第二确定单元101、计算单元102和输出单元103 ; 其中,第一确定单元100,用于确定各指向性传声器接收的相同帧的语音信号的能量 值;第二确定单元101,用于根据所述能量值确定所述相同帧的各语音信号的调整参 数;计算单元102,用于根据各语音信号的调整参数确定语音信号中各取样点信号的 权值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信 号的乘积值进行累加;输出单元103,用于将累加后的取样点信号依次输出。本发明中,传声器阵列由两个以上的指向性传声器构成。上述第二确定单元101进一步将所述相同帧的各语音信号的能量值分别与最大 的能量值作商;并对各商值进行指数调整处理,作为各语音信号的调整参数。上述第二确定单元101进一步将各商值的E次方作为各语音信号的调整参数;其 中,E为大于等于2小于等于10的正数。上述计算单元102进一步按下式计算语音信号中各取样点信号的权值Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的权值,Wi(n-l)为传声器i中的当前语音信号帧中第n-1个取样点信号的权 值八为预先设定的遗忘因子,0< A < 1 ;C为当前语音信号帧的调整参数。上述计算单元102进一步按下述方式计算语音信号中各取样点信号的权值Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的初始权值,Wi(n-1)为传声器i中的当前语音信号帧中第个取样点信号 的初始权值;、为预先设定的遗忘因子,0 < A < 1 ;C为当前语音信号帧的调整参数;按下式对&(11)进行处理,将成0)作为传声器i中的当前语音信号帧中第n个取 样点信号的最终权值 上述传声器阵列为圆形阵列或球形阵列;所述传声器阵列中的传声器数量为3至 16个。本领域技术人员应当理解,图10所示的基于传声器阵列的语音信号处理装置是 为实现前述的基于传声器阵列的语音信号处理方法而设计的,图10所示装置中各处理单 元的功能可参照前述方法的描述而理解,各处理单元的功能可通过运行于处理器上的程序 而实现,也可通过具体的逻辑电路而实现。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
权利要求
一种基于传声器阵列的语音信号处理方法,其特征在于,所述传声器阵列由两个以上的指向性传声器构成;所述方法包括确定各指向性传声器接收的相同帧的语音信号的能量值;根据所述能量值确定所述相同帧的各语音信号的调整参数;根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积值进行累加,将累加后的取样点信号依次输出。
2.根据权利要求1所述的方法,其特征在于,所述根据所述能量值确定所述相同帧的 各语音信号的调整参数,为将所述相同帧的各语音信号的能量值分别与最大的能量值作商;对各商值进行指数调整处理,并作为各语音信号的调整参数。
3.根据权利要求2所述的方法,其特征在于,所述对各商值进行指数调整处理,并作为 各语音信号的调整参数,为将各商值的E次方作为各语音信号的调整参数;其中,E为大于等于2小于等于10的 正数。
4.根据权利要求1所述的方法,其特征在于,所述根据各语音信号的调整参数确定语 音信号中各取样点信号的权值,具体按下式计算Wi (n) = XWi(n-l) + (l-X)C;其中,Wi(n)为传声器i中的当前语音信号帧中第η个取 样点信号的权值,Wi(H-I)为传声器i中的当前语音信号帧中第n-1个取样点信号的权值; λ为预先设定的遗忘因子,0 < λ < 1 ;C为当前语音信号帧的调整参数。
5.根据权利要求1所述的方法,其特征在于,所述根据各语音信号的调整参数确定语 音信号中各取样点信号的权值,为Wi (n) = XWi(n-l) + (l-X)C;其中,Wi(n)为传声器i中的当前语音信号帧中第η个取 样点信号的初始权值,Wi (n-1)为传声器i中的当前语音信号帧中第n-1个取样点信号的初 始权值;λ为预先设定的遗忘因子,0 < λ < 1 ;C为当前语音信号帧的调整参数;按下式对Wi (η)进行处理,并将戌(《)作为传声器i中的当前语音信号帧中第η个取样 点信号的最终权值 Wi (η)=wi(n)/max(w1(n),w2(n),……wn(n)),其中,maxO为取最大值计算。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述传声器阵列为圆形阵列或 球形阵列;所述传声器阵列中的传声器数量为3至16个。
7.一种基于传声器阵列的语音信号处理装置,其特征在于,所述传声器阵列由两个以 上的指向性传声器构成;所述装置包括第一确定单元、第二确定单元、计算单元和输出单 元;其中,第一确定单元,用于确定各指向性传声器接收的相同帧的语音信号的能量值;第二确定单元,用于根据所述能量值确定所述相同帧的各语音信号的调整参数;计算单元,用于根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将 各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积 值进行累加;输出单元,用于将累加后的取样点信号依次输出。
8.根据权利要求7所述的装置,其特征在于,所述第二确定单元进一步将所述相同帧 的各语音信号的能量值分别与最大的能量值作商;并对各商值进行指数调整处理,作为各 语音信号的调整参数。
9.根据权利要求8所述的装置,其特征在于,所述第二确定单元进一步将各商值的E次 方作为各语音信号的调整参数;其中,E为大于等于2小于等于10的正数。
10.根据权利要求7所述的装置,其特征在于,所述计算单元进一步按下式计算语音信 号中各取样点信号的权值Wi (n) = XWi(n-l) + (l-X)C;其中,Wi(n)为传声器i中的当前语音信号帧中第η个取 样点信号的权值,Wi(H-I)为传声器i中的当前语音信号帧中第n-1个取样点信号的权值; λ为预先设定的遗忘因子,0 < λ < 1 ;C为当前语音信号帧的调整参数。
11.根据权利要求7所述的装置,其特征在于,所述计算单元进一步按下述方式计算语 音信号中各取样点信号的权值Wi (n) = XWi(n-l) + (l-X)C;其中,Wi(n)为传声器i中的当前语音信号帧中第η个取 样点信号的初始权值,Wi (n-1)为传声器i中的当前语音信号帧中第n-1个取样点信号的初 始权值;λ为预先设定的遗忘因子,0 < λ < 1 ;C为当前语音信的调整参数;按下式对&(11)进行处理,将成…)作为传声器i中的当前语音信号帧中第η个取样点 信号的最终权值
12.根据权利要求7至11任一项所述的装置,其特征在于,所述传声器阵列为圆形阵列 或球形阵列;所述传声器阵列中的传声器数量为3至16个。
全文摘要
本发明公开了一种基于传声器阵列的语音信号处理方法,所述传声器阵列由两个以上的指向性传声器构成;所述方法包括确定各指向性传声器接收的相同帧的语音信号的能量值;根据所述能量值确定所述相同帧的各语音信号的调整参数;根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积值进行累加,将累加后的取样点信号依次输出。本发明同时公开了一种基于传声器阵列的语音信号处理装置。本发明计算方式简单,不需要复杂的计算和电路,具有良好的抗混响和定向拾音功能。
文档编号G10L21/0216GK101867853SQ201010197159
公开日2010年10月20日 申请日期2010年6月8日 优先权日2010年6月8日
发明者何宏森, 袁浩, 邱小军, 黄志宏 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1