一种基于声强差效应的实时声源定向方法

文档序号:10592873阅读:413来源:国知局
一种基于声强差效应的实时声源定向方法
【专利摘要】本发明公开了一种基于声强差效应的实时声源定向方法,采用四元十字拾音器阵列进行声源方向检测,在对检测到的声源信号进行处理定向过程中采用了平滑算法。本发明能够实时地根据突发声音信号判断出声音的方向,而且能避免回响对系统判断声源方向的影响,系统开销小。
【专利说明】
-种基于声强差效应的实时声源定向方法
技术领域
[0001] 本发明属于声源定向技术领域,尤其设及一种基于声强差效应的实时音源定向方 法。
【背景技术】
[0002] 目前的多数研究和应用大都是基于时延估计的定位方法。此方法分两步来完成, 第一步对各个麦克接受的信号进行处理,估计出时延;第二步根据麦克的空间结构,结合第 一步估计的时延,计算出声源的空间方位。但基于时延估计的方法存在一些固有的缺点:估 算时延的方法大都是采用互相关法及其各种的改进方法,而互相关法的精度受信号的采样 率的影响,采样率越高,时延估计精度越高,运就对信号采样率有了特殊要求,增大了系统 的开销。而且算法实现复杂,在信号处理和噪声处理过程中需要使用到傅立叶变换、互相关 法、最小二乘法、协方差等需要的大量数学模型也增加了系统开销;另外,采用传统的定位 方法还易受回响影响。

【发明内容】

[0003] 为了解决现有技术存在的技术问题,本发明提供了一种基于声强差效应的实时音 源定向方法,它能够实时地根据突发声音信号判断出声音的方向,而且能避免回响对系统 判断声源方向的影响,系统开销小。
[0004] 本发明采用的技术方案如下:
[0005] -种基于声强差效应的实时声源定向方法,采用四元十字拾音器阵列进行声源检 测,在对检测到的声源信号进行处理定向过程中采用了平滑算法。
[0006] 本发明采用了平滑算法对检测到的声源信号也即采集到的数据进行平滑,对回响 增强原声的部分完全进行了限制,对回响削弱原声的部分降低其削弱效果。
[0007] 本发明中,所述处理定向过程步骤包括如下:
[000引S21.对四元十字拾音器阵列检测到的声源信号通过RC低通滤波;
[0009] S22.将经过RC低通滤波后的声源信号进行AD采样获得数据;
[0010] S23.对AD采样获得的数据进行平滑过滤处理;
[0011] S24.对平滑过滤处理后的数据进行抽样采集;
[0012] S25.对抽样采集的数据基于背景噪音进行触发判断,若数据大于触发值T则表示 检测到了突发声音,并继续S26;其中触发值T为声源定位的灵敏度;
[0013] S26.对抽样采集的数据进行分析点均值处理;
[0014] S27.将均值处理获得数据进行方向角计算,进而获取声源方向。
[0015] 进一步地,在S21中,所述声源信号通过RC低通滤波前先被拾音器放大形成声波, 然后采用了半波整流电路去掉负半周的波形。
[0016] 进一步地,在S22中,经过RC低通滤波后的声源信号在进行AD采样前先通过单片机 引脚可兼容电压值对输出波形进行等比例缩小到AD采集合适范围内。
[0017] 本发明中,声音通过拾音器如拾音器LM358放大后,显示为一系列杂乱无序的声 波。在后端先采用半波整流电路去掉负半周的波形,再经过RC低通滤波,同时结合单片机引 脚可兼容电压值对后端输出波形进行等比例缩小到AD采集合适范围内。
[0018] 进一步地,所述AD采样过程具体步骤包括:按采集周期进行采样,并将4个拾音器 每次采集的数据Sl~s4保存为数组Sl~S4。
[0019] 进一步地,所述采集周期为每0.02ms采样一次。
[0020] 本发明中,为了保证声音间隔有Ims左右的差异,所述四元十字拾音器阵列中横向 设置的两拾音器之间的距离与竖向设置的两拾音器之间的距离均为30cm。
[0021] 本发明中,根据两个拾音器之间最小距离为21.21cm,声音在15°C时的速度为 34cm/ms则两个拾音器检测到声音的时间间隔最小约为0.623ms。为保证采集到足够的数据 用于分析,每0.02ms采样一次,并将4个拾音器采集的数据Sl~s4保存为数组Sl~S4。当然, 采集周期也可W设定为其它合适值,运里并不作唯一限定,但取0.02ms为比较优选的值。
[0022] 本发明中,经过RC滤波的采集数据Sl~s4的波动还是比较大,需要进行平滑和过 滤才能很好地体现出声音先后到达引起的声强差。故进一步地,在S23中,所述平滑过滤处 理步骤包括:定义单个拾音器声音敏感度常量D,对AD采样获得的数据Sl~s4进行平滑采样 后的声音为SSl~ss4,保存数组为SSl~SS4;将采样数据Sl~s4和平滑采样到的数据SSl~ 834分别进行比较,若31〉331+0,贝1|331 = 331 + 1,若31<331-0,贝1|331 = 331-1;若32〉332+0,贝1| ss2 = ss21+l,若s2<ss2-D,则ss2 = ss2-1;若s3〉ss3+D,则ss3 = ss3+1,若s3<ss3-D,贝ljss3 = ss3-l;若s4〉ss4+D,则ss4 = ss4+1,若s4<ss4-D,则ss4 = ss4-1。
[0023] 进一步地,对于S25中,利用AD采样获得的数据Si~s4作为背景噪音,定义单个拾 音器噪音敏感度常量DN,平滑采样后的背景噪音为nl~n4,保存数组为Nl~N4,其中nl~n4 采样周期大于Si~s4的采样周期;具体将AD采样数据Si~s4和平滑采样到的数据nl~n4分 别进行比较,若 sl〉nl+DN,则 nl = nl+l,若 sKsl-DN,则 nl=nl-l;若 s2〉n 化DN,则 n2 = n2+l, 若 s2<s2-DN,则 n2 = n2-l;若 s3〉n3+DN,则 n3 = n3+l,若 s3<s3-DN,则 n3 = n3-l;若 s4〉n4+DN, 则n4 = n4+l,若s4<s4-DN,则n4 = n4-l。
[0024] 进一步地,所述背景噪音采集周期为每Ims采集一次。
[0025] 本发明中,关于背景噪音,由于判断检测到了突发声音最简单的方法就是设置一 个触发判断值,当拾音器采样数据超过了运个值就判断为检测到了突发声音。但是单一的 触发判断值无法适应现实中复杂的环境。如安静环境下设置的触发判断值,到了增杂的环 境中拾音器的采样数据可能会一直超过运个值,所W需要引入背景噪音采集来动态调整运 个触发判断值。
[0026] 背景噪音也是声音,可W直接利用拾音器采样到的Sl~s4作为噪音,保存为nl~ n4。但nl~n4要求受突发声音影响小,同时在环境噪音变化时需要上升或下降到相应稳定 的水平。依据该要求,nl~n4采集周期需要大于Sl~s4的采样周期,同时为避免突发信号的 影响需要对其进行过滤和平滑。
[0027] 背景噪音的采样周期越小,采样的噪音值对声音的敏感度就越高,nl~n4的曲线 也就越接近Sl~s4,反之背景采样周期越大,采样的噪声对声音的敏感度越低,nl~n4的曲 线也就越平直。拾音器采样Sl~s4周期为0.02ms,背景噪音需要大于运个采样周期,本发明 采用Ims采样周期采集,运个周期可W根据需求修改,再采用过滤和平滑算法。
[0028] 进一步地,对于S25中,所述触发值T通过背景噪音值和一个常量触发值相加得到, 良PT = nl+n化n3+n4+SEN,其中SEN为常量;将4个拾音器抽样采集获得的数据SSl~ss4的和 跟T进行比较,若大于T即满足条件ssl+ss化ss3+ss4〉T,就表示检测到突发声音。
[0029] 本发明中,一个突发声响的时间大约是几百毫秒,每0.02毫秒采样一次就可能会 有几万的采样数据,而大量的数据处理会降低声源定位的实时性。根据原理设计只需要用 到最初的几个毫秒的数据便可W完成声源定向。经过平滑采样W后数据有比较强的连续 性,只要抽取其中的某些点进行保存计算就能快速的计算出声音的方向。故进一步对于S24 中,所述抽样采集W每25个采样点保存一次,即每0.5ms保存一次数据。
[0030] 本发明中,回响可能会对采集到的数据产生影响,如果对声音反射的物体越远,拾 音器检测到原始声音跟反射声音的时间差就越大,反之反射物体越近,则检测到的时间差 就越短。本系统避免回响的方法是在回响到达前就确定用于声音方向判断的分析点。运个 分析点需要在4个拾音器都检测到声音时便确定。故进一步地,所述分析点均值处理步骤包 括:定义一个比较值B,把抽样采集获得的数组SSl~SS4中的每一组SSl~ss4跟噪音值nl~ n4比较,当ssl〉nl+B且ss2〉n2+B且ss3〉n3+B且ss4〉n4+B时,则选取该组数据作为分析点,然 后求在分析点之前若干组数据的算术平均值得到Vl~v4"B值跟进不同拾音器而不一样,一 般设置比拾音器采样较强的噪音的波动值大一些。
[0031] 进一步地,通过公^^
十算获得声源方向角0。
[0032] 进一步地,本发明中,所述平滑处理采用的是限幅滤波法。
[0033] 本发明与现有技术相比,具有的有益效果为:
[0034] 1.采用平滑算法,能够避免回响对系统判断声源方向的影响。
[0035] 2.不需要专口的拾音器,跟进需要监听范围大小选择相应灵敏度的拾音器即可。
[0036] 3.方法运算简单,只有在角度计算的时候使用到乘法和角度计算函数,其余的计 算都是简单的加减法,系统开销小。
【附图说明】
[0037] 图1:本发明四元十字拾音器阵列原理结构示意图;
[0038] 图2:本发明对声源处理定向流程框架图一;
[0039] 图3:本发明对声源处理定向流程框架图二;
[0040] 图4:本发明拾音器采集数据滤波前图示;
[0041] 图5:本发明拾音器采集数据滤波后图示;
[0042] 图6:本发明AD采样数据图示;
[0043] 图7:本发明AD采样数据平滑后图示;
[0044] 图8:本发明背景噪音数据平滑后图示;
[0045] 图9:本发明回响原理图示。
【具体实施方式】
[0046] 下面结合附图和实施例对本发明作进一步详细描述。
[0047]实施例:
[004引本发明采用的原理如图1所示,W十字阵构建平面直角坐标系,ac方向为坐标系X 轴,ac距离为30cm,化方向为坐标系Y轴,化距离也为30cm。当突发声音信号从某一个方向传 到十字阵时,四个拾音器会先后检测到声音信号。取四个拾音器刚检测到声音时的瞬态声 强,将a的声强减去C的声强得到X轴方向上的矢量声强Vl,d的声强减去b的声强得到Y轴方 向上的矢量声强V2。拾音器两两相减能够消除环境噪音的影响。用V1、V2便可W求出突发声 音位于坐标系的方向,公式如下:
[0049] a 化 n2(V2,Vl)*18〇A。
[0050] 其中atan2为C语言中的反正切值函数。结果Wa为0度,在第一、第二象限0~180 度,第四、第S象限0~-180度。
[0051] 如图2和图3所示为本发明设及的方法流程框图,具体步骤包括:
[0052] S21.对四元十字拾音器阵列检测到的声源信号通过RC低通滤波;
[0053] S22.将经过RC低通滤波后的声源信号进行AD采样获得数据;
[0054] S23.对AD采样获得的数据进行平滑过滤处理;
[0055] S24.对平滑过滤处理后的数据进行抽样采集;
[0056] S25.对抽样采集的数据基于背景噪音进行触发判断,若数据大于触发值T则表示 检测到了突发声音,并继续S26;其中触发值T为声源定位的灵敏度;
[0057] S26.对抽样采集的数据进行分析点均值处理;
[0058] S27.将均值处理获得数据进行方向角计算,进而获取声源方向。
[0化9] 对于S21中设及的RC低通滤波:
[0060]声音通过拾音器LM358放大后,显示为一系列杂乱无序的声波。在后端先采用半波 整流电路去掉负半周的波形,再经过RC低通滤波,同时结合单片机引脚可兼容电压值对后 端输出波形进行等比例缩小到AD采集合适范围内。处理结果如图4和图5所示。
[0061 ] 对于S22中设及的AD采样:
[0062] 本发明中,根据两个拾音器之间最小距离为21.21cm,声音在15°C时的速度为 34cm/ms则两个拾音器检测到声音的时间间隔最小约为0.623ms。为保证采集到足够的数据 用于分析,每0.02ms采样一次,并将4个拾音器采集的数据Sl~s4保存为数组Sl~S4。处理 结果如图6所示。其中,采集数据Sl~s4相当于上述提及的a、b、c、d位置测得的声强。
[0063] 对AD采样数据Sl~s4进行平滑过滤处理:
[0064] 对于S23中,定义单个拾音器声音敏感度常量D,对AD采样获得的数据Sl~s4进行 平滑采样后的声音为SSl~ss4,保存数组为SSl~SS4;将采样数据Sl~s4和平滑采样到的 数据SS1 ~ss4分别进行比较,若SDss 1+D,则ssl = SS 1+1,若SKssI-D,则ssl = SSl-I;若s2 〉332+0,贝1|3 32 = 3321 + 1,若32<332-0,贝1|3 32 = 332-1;若33〉3 33+0,贝1|333 = 3 33+1,若33< ss3-D,贝 Ijss3 = ss3-1;若 s4〉ss4+D,贝 Ijss4 = ss4+1,若 s4<ss4-D,贝 Ijss4 = ss4-1。处理结构如 图7所示。
[0065] 对于S24中设及的抽样采集:
[0066] -个突发声响的时间大约是几百毫秒,每0.02毫秒采样一次就可能会有几万的采 样数据,而大量的数据处理会降低声源定位的实时性。根据原理设计只需要用到最初的几 个毫秒的数据便可W完成声源定向。经过平滑采样W后数据有比较强的连续性,只要抽取 其中的某些点进行保存计算就能快速的计算出声音的方向。设每25个采样点保存一次,贝U 每0.5ms保存一次数据。
[0067] 对于触发判断:
[0068] 对于S25中,利用AD采样获得的数据Sl~s4作为背景噪音,定义单个拾音器噪音敏 感度常量DN,平滑采样后的背景噪音为nl~n4,保存数组为Nl~M,其中nl~n4采样周期大 于Sl~s4的采样周期;具体将AD采样数据Sl~s4和平滑采样到的数据nl~n4分别进行比 较,若 sl〉nl+DN,则 nl = nl+l,若 sKsl-DN,则 nl=nl-l;若 s2〉n 化DN,则 n2 = n2+l,若 s2<s2- DN,则 n2 = n2-l;若 s3〉n3+DN,则 n3 = n3+l,若 s3<s3-DN,则 n3 = n3-l;若 s4〉n4+DN,则 n4 = n4 +1,若 s4<s4-DN,则n4 = n4-l。如图8所示。
[0069] 所述背景噪音采集周期为每Ims采集一次。
[0070] 对于S25中,所述触发值T通过背景噪音值和一个常量触发值相加得到,即T = nl + n2+n3+n4+SEN,其中SEN为常量;将4个拾音器抽样采集获得的数据SSl~ss4的和跟T进行比 较,若大于T即满足条件ssl+ss化ss3+ss4〉T,就表示检测到突发声音。
[0071] 如果检测到突发声音后则对抽样采集数据SSl~ss4进行分析点均值处理。
[0072] 对于S26中设及的分析点均值:
[0073] 回响可能会对采集到的数据产生影响,如果对声音反射的物体越远,拾音器检测 到原始声音跟反射声音的时间差就越大,反之反射物体越近,则检测到的时间差就越短。本 系统避免回响的方法是在回响到达前就确定用于声音方向判断的分析点。运个分析点需要 在4个拾音器都检测到声音时便确定。
[0074] 设一个比较值B,把抽样采集获得的数组SSl~战4中的每一组SSl~ss4跟噪音值 nl~n4比较,当ssl〉nl+B且ss2〉n2+B且ss3〉n3+B且ss4〉n4+B时,则选取该组数据作为分析 点,然后求在分析点之前若干组数据的算术平均值得到Vl~v4"B值跟进不同拾音器而不一 样,一般设置比拾音器采样较强的噪音的波动值大一些。
[0075] 最后通过获得的Vl~v4运用到S27中设及的方向角计算:
[0076] 通过公;
十算获得声源方向角0。
[0077] 本实施例采用的定向方法基本不受回响的影响,一方面经过RC滤波后还对采集数 据进行平滑,对回响增强原声的部分完全进行了限制,对回响削弱原声的部分降低了其削 弱的效果,所W即使未能将B设置在回响到来之前也能将回响对角度计算的影响减小。另一 由于声音传播直线距离最短,所W拾音器采集到声音的起始点并不会因为回响而改变。如 图9所示,设Z+0.34m = X+Y,则回响对拾音器a产生影响的时间应该是在a检测到声音的Ims (0.34m^ 340m/s = Ims)。那么只需要确保分析点在a检测到声音的Ims便可W避免回响的影 响。分析点的B设置得越小,则可能受到回响的影响就越小,但越小也就越容易受环境噪音 影响,所W运个B值需要根据不同拾音器的信噪比测试得出。
【主权项】
1. 一种基于声强差效应的实时声源定向方法,采用四元十字拾音器阵列进行声源方向 检测,其特征在于,在对检测到的声源信号进行处理定向过程中采用了平滑算法。2. 根据权利要求1所述的基于声强差效应的实时声源定向方法,其特征在于,所述处理 定向过程步骤包括如下:521. 对四元十字拾音器阵列检测到的声源信号通过RC低通滤波;522. 将经过RC低通滤波后的声源信号进行AD采样获得数据;523. 对AD采样获得的数据进行平滑过滤处理;524. 对平滑过滤处理后的数据进行抽样采集; S25 .对抽样采集的数据基于背景噪音进行触发判断,若数据大于触发值T则表示检测 到了突发声音,并继续S26;其中触发值T为声源定位的灵敏度;526. 对抽样采集的数据进行分析点均值处理;527. 将均值处理获得数据进行方向角计算,进而获取声源方向。3. 根据权利要求1所述的基于声强差效应的实时声源定向方法,其特征在于,在S21中, 所述声源信号通过RC低通滤波前先被拾音器放大形成声波,然后采用了半波整流电路去掉 负半周的波形。4. 根据权利要求3所述的基于声强差效应的实时声源定向方法,其特征在于,在S22中, 经过RC低通滤波后的声源信号在进行AD采样前先通过单片机引脚可兼容电压值对输出波 形进行等比例缩小到AD采集合适范围内。5. 根据权利要求4所述的基于声强差效应的实时声源定向方法,其特征在于,所述AD采 样过程具体步骤包括:按采集周期进行采样,并将4个拾音器每次采集的数据s 1~s4保存为 数组S1~S4。6. 根据权利要求5所述的基于声强差效应的实时声源定向方法,其特征在于,所述采集 周期为每〇. 〇2ms米样一次。7. 根据权利要求5所述的基于声强差效应的实时声源定向方法,其特征在于,在S23中, 所述平滑过滤处理步骤包括:定义单个拾音器声音敏感度常量D,对AD采样获得的数据si~ s4进行平滑采样后的声音为ssl~ss4,保存数组为SS1~SS4;将采样数据si~s4和平滑采 样到的数据8 81~8 84分别进行比较,若81>881+0,贝1|881 = 881 + 1,若81〈881-0,贝1|881 = 881-1;若s2>ss2+D,则ss2 = ss21+l,若s2〈ss2_D,则ss2 = ss2_l;若s3>ss3+D,则ss3 = ss3+l,若 s3〈ss3_D,则ss3 = ss3_l;若s4>ss4+D,则ss4 = ss4+l,若s4〈ss4_D,则ss4 = ss4_l。8. 根据权利要求6所述的基于声强差效应的实时声源定向方法,其特征在于,对于S25 中,利用AD采样获得的数据si~s4作为背景噪音,定义单个拾音器噪音敏感度常量DN,平滑 采样后的背景噪音为nl~n4,保存数组为N1~N4,其中nl~n4采样周期大于si~s4的采样 周期;具体将AD采样数据si~s4和平滑采样到的数据nl~n4分别进行比较,若sl>nl+DN,则 nl=nl+l,若sl〈sl_DN,则nl=nl_l;若s2>n2+DN,则n2 = n2+l,若s2〈s2_DN,则n2 = n2_l;若 s3>n3+DN,则 n3 = n3+l,若 s3〈s3-DN,则 n3 = n3-l;若 s4>n4+DN,则 n4 = n4+l,若 s4〈s4-DN,则 n4 = n4-l 〇9. 根据权利要求8所述的基于声强差效应的实时声源定向方法,其特征在于,所述背景 噪音采集周期为每lms采集一次。10. 根据权利要求8所述的基于声强差效应的实时声源定向方法,其特征在于,对于S25 中,所述触发值T通过背景噪音值和一个常量触发值相加得到,即T = nl+n2+n3+n4+SEN,其 中SEN为常量;将4个拾音器抽样采集获得的数据ssl~SS4的和跟T进行比较,若大于T即满 足条件ssl+ss2+ss3+ss4>T,就表示检测到突发声音。11. 根据权利要求10所述的基于声强差效应的实时声源定向方法,其特征在于,对于 S24中,所述抽样采集以每25个采样点保存一次,即每0.5ms保存一次数据。12. 根据权利要求10所述的基于声强差效应的实时声源定向方法,其特征在于,所述分 析点均值处理步骤包括:定义一个比较值B,把抽样采集获得的数组SS1~SS4中的每一组 ssl~ss4跟噪音值nl~n4比较,当ssl>nl+B且ss2>n2+B且ss3>n3+B且ss4>n4+B时,则选取 该组数据作为分析点,然后求在分析点之前若干组数据的算术平均值得到vl~v4。13. 根据权利要求12所述的基于声强差效应的实时声源定向方法,其特征在于,通过公 ^算获得声源方向角Θ。14. 根据权利要求1至13任意一项所述的基于声强差效应的实时声源定向方法,其特征 在于,所述平滑处理采用的是限幅滤波法。15. 根据权利要求1至13任意一项所述的基于声强差效应的实时声源定向方法,其特征 在于,所述四元十字拾音器阵列中横向设置的两拾音器之间的距离与竖向设置的两拾音器 之间的距离均为30cm 〇
【文档编号】G01S3/802GK105954711SQ201610422011
【公开日】2016年9月21日
【申请日】2016年6月15日
【发明人】覃学松, 黄洪加, 俞翔, 刘玉姣, 黄仝宇, 宋兵, 宋一兵, 汪刚, 柏林, 刘双广
【申请人】广州尚云在线科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1