传播延迟校正设备以及传播延迟校正方法_2

文档序号:9568880阅读:来源:国知局
根据频率的相位偏移给到每个频带的相位旋转。
[0034][图2中的S14(相位平滑)]
[0035]相位平滑单元15通过利用整合处理来平滑从相位控制量计算单元14输入的对于每个频带的相位控制量信号Lc和Rc,来对每个频带产生相位控制信号Lp和Rp。相位平滑单元15将对于每个频带产生的相位控制信号Lp和Rp输出到相位控制单元16。
[0036][图2中的S15(相位控制)]
[0037]相位控制单元16基于从相位平滑单元15输入的对于每个频带的相位控制信号Lp和Rp,来控制对于每个频带的从STFT单元12输入的频谱信号Lf和Rf的相位(执行相位旋转和相位偏移)。相位控制单元16将对于每个频带相位受控的频谱信号Lfp和Rfp输出至ISTFT单元17。
[0038][图2中的S16(短时傅里叶逆变换)]
[0039]ISTFT单元17通过ISTFT将从相位控制单元16输入的频谱信号Lfp和Rfp从频域信号变换为时域信号,并且通过对变换的信号使用窗口函数和重叠相加来执行加权。在重叠相加之后获得的音频信号Lo和Ro是根据传播延迟时间设定单元13的设定执行了传播延迟校正的信号,并且从ISTFT单元17输出至随后阶段的电路(比如功率放大器或扬声器)。
[0040]如上所述,利用根据本发明的声音处理设备1,可以通过对于每个频带执行相位控制(相位旋转和相位偏移)来调节(校正)多个频带之间的传播延迟时间,而不需要使用大量的FIR滤波器。因此,在接听者的接听位置处的传输特性的线性度得到提高,同时抑制了处理负荷的增加。此外,由于频带之间的相位干扰所产生的频率特性扰乱(峰值和/或跌落的发生)通过利用平滑处理来平滑传播延迟时间彼此不同的频带之间的相位变化而得到抑制。
[0041][用于时间对准处理的示例性特定值]
[0042]接下来,将描述用于通过声音处理设备1执行的时间对准处理的示例性特定值。以下为示例性特定值的参数及其值。
[0043]音频信号取样频率:44.1kHz
[0044]傅里叶变换长度:16,384个取样
[0045]重叠长度:12,288个取样
[0046]窗口函数:汉明
[0047]频带划分数量:20
[0048](在该示例中,可听范围被划分为20个频带。)
[0049]从传播延迟时间设定单元13输出的对于每个频带的传播延迟时间信号Lt和Rt的示例在图3(a)和图3(b)中分别示出。在图3(a)和图3(b)的每一个中,纵轴为延迟时间(单位:毫秒),而横轴为频率(单位:Hz)。如图3中所示,对于所有频带,L通道侧信号Lt的传播延迟时间是0毫秒(见图3 (a)),而R通道侧信号Rt的传播延迟时间在0毫秒-2.2毫秒的范围中对于20个频带中的每一个独立地设定(见图3(b))。
[0050]从相位控制量计算单元14输出的对于每个频带的相位控制量信号Lc和Rc的示例在图4(a)和图4(b)中分别示出。在图4(a)和图4(b)的每一个中,纵轴为相位(单位:度),而横轴为频率(单位:Hz)。如上所示,对于所有频带,L通道侧的传播延迟时间为0毫秒。因此,如图4(a)中所示,信号Lc是不包括相位旋转和相位偏移的平坦信号。另一方面,如图4(b)中所示,信号Rc是包括根据传播延迟时间的相位旋转和相位偏移的信号(见图3(b)) ο
[0051]从相位平滑单元15输出的对于每个频带的相位控制信号Lp和Rp的示例分别在图5(a)和图5(b)中示出。在图5(a)和图5(b)的每一个中,纵轴为相位(单位:度),而横轴为频率(单位:Hz)。在利用现有的示例性特定值的用于相位平滑的整合处理中,使用阶数为128的FIR低通滤波器。FIR低通滤波器的归一化截止频率为0.05。应当注意,FIR低通滤波器仅用于为了相位平滑的整合处理。因此,由于FIR低通滤波器而引起的处理负荷的增加是很小的。此外,FIR低通滤波器可以用IIR(无限冲激响应)低通滤波器来代替。
[0052]图6为示出以连续相位显示的、根据传播延迟时间设定单元13设定的R通道的相位控制量的示图。在图6中,纵轴为角度(单位:弧度),而横轴为频率(单位:Hz)。此外,在图6中,虚线表示在通过相位平滑单元15进行相位平滑之前的相位控制量(图4(b)中所示的相位控制量信号Rc),而实线表示在通过相位平滑单元15进行相位平滑之后的相位控制量(图5(b)中所示的相位控制信号Rp)。
[0053]从图4(b)和图5(b)的比较或在图6中的虚线和实线的比较中清楚的是,频带之间的陡峭相位变化通过相位平滑单元15的相位平滑进行平滑。由于传播延迟时间彼此不同的频带之间的相位干扰而引起的频率特性扰乱(峰值和/或跌落的发生)因此得到抑制。
[0054]图7和图8为示出在图3中示出的传播延迟时间被设定的情况下,当输入具有平坦频率特性的冲激信号(音频信号L和R)时输出(音频信号Lo和Ro)的频率特性的示图。在图7和图8中,纵轴为水平(单位:dB),而横轴为频率(单位:Hz)。图7 (a)和图7 (b)分别示出在相位平滑单元15的相位平滑没有执行的情况下音频信号Lo和Ro的频率特性。图8 (a)和图8 (b)分别示出在执行了相位平滑单元15的相位平滑的情况下音频信号Lo和Ro的频率特性。从图7和图8(b)的比较中清楚的是,频率特性通过相位平滑单元15的相位平滑而平坦了,并且由于在传播延迟时间彼此不同的频带之间的相位干扰而产生的频率特性扰乱(峰值和/或跌落的发生)得到抑制。
[0055]图9 (a)和图9 (b)分别示出对应于图8 (a)和图8 (b)中所示的频率特性的冲激响应。在图9(a)和图9(b)的每一个中,纵轴是幅度(归一化的值),而横轴是时间(单位:秒)。从图9(a)和图9(b)的比较中清楚的是,R通道冲激响应(音频信号Ro)相对于L通道冲激响应(音频信号Lo)是延迟的。更具体而言,由于在0毫秒-2.2毫秒的范围中的传播延迟时间给到R通道冲激响应(音频信号Ro)的每个频带,因此清楚的是,包括各个延迟。
[0056]图10(a)和图10(b)分别示出在图3中示出的传播延迟时间被设定的情况下,当频带被限制为2.8kHz-3.5kHz并且输入了具有平坦频率特性的冲激信号(音频信号L和R)时的冲激响应(音频信号Lo和Ro)。在图10(a)和图10(b)的每一个中,纵轴是幅度(归一化的值),而横轴是时间(单位:秒)。如图3 (b)所示,在2.8kHz-3.5kHz的频带中由传播延迟时间设定单元13设定的传播延迟时间为2.2毫秒。从图10(a)和图10(b)的比较中清楚的是,在将相位保持在频带内时仅传播延迟时间(2.2毫秒)受控。
[0057]以上为本发明的说明性实施方案的描述。本发明的实施方案不限于以上所解释的实施方案,并且在本发明的技术概念范围内的各种变化都是可以的。例如,在说明书中详细说明的示例性实施方案的适当组合和/或从说明书中显而易见的示例性实施方案也包括在本发明的实施方案中。
【主权项】
1.一种传播延迟时间校正设备,包括: 频谱信号产生装置,其配置为通过对音频信号执行短时傅里叶变换来产生频谱信号;传播延迟时间设定装置,其配置为对于多个预定频带中的每一个设定传播延迟时间;相位控制量计算装置,其配置为基于对于多个预定频带中的每一个设定的传播延迟时间,来计算对于多个预定频带中的每一个的相位控制量; 相位控制信号产生装置,其配置为通过平滑对于多个预定频带中的每一个所计算的相位控制量来产生相位控制信号; 相位控制装置,其配置为基于所产生的相位控制信号来控制多个预定频带中的每一个的频谱信号的相位;以及 音频信号产生装置,其配置为通过对频谱信号执行短时傅里叶逆变换来产生执行了传播延迟校正的音频信号,所述频谱信号的相位对于多个预定频带中的每一个受控。2.根据权利要求1所述的传播延迟时间校正设备, 其中,相位控制装置配置为基于相位控制信号来旋转和偏移多个预定频带中的每一个的频谱信号的相位。3.根据权利要求1或2所述的传播延迟时间校正设备, 进一步包括频带指定装置,其能够指定要通过传播延迟时间设定装置设定传播延迟时间的频带的数量和宽度中的至少一个。4.一种传播延迟时间校正方法,包括: 频谱信号产生步骤,其通过对音频信号执行短时傅里叶变换来产生频谱信号; 传播延迟时间设定步骤,其对多个预定频带中的每一个设定传播延迟时间; 相位控制量计算步骤,其基于对于多个预定频带中的每一个设定的传播延迟时间来计算对于多个预定频带中的每一个的相位控制量; 相位控制信号产生步骤,其通过平滑对于多个预定频带中的每一个所计算的相位控制量来产生相位控制信号; 相位控制步骤,其基于所产生的相位控制信号来控制对于多个预定频带中的每一个的频谱信号的相位;以及 音频信号产生步骤,其通过对频谱信号执行短时傅里叶逆变换来产生执行了传播延迟校正的音频信号,所述频谱信号的相位对于多个预定频带中的每一个受控。5.根据权利要求4所述的传播延迟时间校正方法, 其中,在相位控制步骤中,基于相位控制信号来旋转和偏移多个预定频带中的每一个的频谱信号的相位。6.根据权利要求4或5所述的传播延迟时间校正方法, 进一步包括频带指定步骤,其能够指定要设定传播延迟时间的频带的数量和宽度中的至少一个。
【专利摘要】一种传播延迟校正设备包括:对音频信号执行短时傅里叶变换从而产生频谱信号的装置;对于多个预定频带中的每一个设定传播延迟时间的装置;基于对于预定频带中的每一个设定的传播延迟时间来计算对于这些频带中的每一个的相位控制量的装置;平滑对于预定频带中的每一个所计算的相位控制量,由此产生预定的相位控制信号的装置;基于所产生的相位控制信号来控制对于预定频带中的每一个的频谱信号的相位的装置;以及对频谱信号执行短时傅里叶逆变换,由此产生传播延迟校正的音频信号的装置,其中所述频谱信号的相位对于预定频带中的每一个受控。
【IPC分类】H04S5/02, G10L19/00, H04S1/00
【公开号】CN105325012
【申请号】CN201480036038
【发明人】桥本武志, 渡边哲生, 藤田康弘, 福江一智
【申请人】歌拉利旺株式会社
【公开日】2016年2月10日
【申请日】2014年6月19日
【公告号】EP3016412A1, US20160134985, WO2014208431A1
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1