声音增强装置的制造方法

文档序号:9264777阅读:446来源:国知局
声音增强装置的制造方法
【技术领域】
[0001] 本发明设及声音增强装置,用于被导入有声音通信、声音蓄积、声音合成、声音识 别系统的车载导航仪、移动电话、内线电话系统(interphone)、收音装置等声音通信系统、 免提通话系统、电视会议系统、监视系统、广播系统、声音合成系统等的音质改善和声音识 别系统的识别率的提高,并改善声音信号的质量及清晰度。
【背景技术】
[0002] 在模拟电话中,关于通过电话线路发送来的声音信号的频带,例如上限的频率被 限制成3400化的狭窄频带。因此,现有的电话线路的音质不能说太良好。另外,在移动 电话、业务无线等的数字声音通信中,由于比特率的严格限制,带宽与模拟线路同样受到限 审IJ,因而在该种情况下音质也不能说太良好。对于声音的子音成分、声音具有的"个人性 (像某个人的)"和"自然性",时常还处于3400化W上的频带,但该些频带由于上述的带宽 限制而丢失很多。
[0003] 另外,近年来随着声音压缩技术(声音编码技术)的发展,能够W低比特率无线传 输宽带(例如上限的频率为7000化)的声音信号。但是,需要发送侧终端和接收侧终端双 方支持对应的宽带声音编码/解码方法,而且在双方的基站中也需要完备宽带编码用的网 络,因而仅仅是在一部分业务通信系统中得到实际应用,当在公共电话通信网中实施时不 仅带来很大的经济负担,而且普及需要很长的时间。
[0004] 为此,进行了压缩声音信号的频率,将其频谱整体控制在通过频带内的尝试。但 是,在该种方法中,与原有的声音信号相比,包括含有声音的基本周期(音调(pitch))的低 频带的信号在内都被压缩在较低的频率范围内,在该被压缩的信号不再次经过解压缩就被 再现的情况下,所再现的声音成为不自然地低的音调,存在声音的个人性消失、质量明显下 降的问题。针对此种情况,虽然通过在接收侧终端将压缩信号解压缩能够解决该问题,但是 为此需要接收侧终端应对对在发送侧终端被压缩后的高频信号进行再次展开的作业。与应 对宽带化同样,对于不具备将压缩信息与声音信号一起发送并再次将其展开的功能的通信 终端,该种解决方案不实用。
[0005] 针对上述的问题,例如有专利文献1记载的技术。在该技术中,根据不改变声音的 音调而仅将规定的高频压缩的方法,能够得到清晰的声音信号。
[0006] 现有技术文献
[0007] 专利文献
[000引专利文献1 ;日本特开2011-141551号公报
【发明内容】

[0009] 发明要解决的问题
[0010] 但是,在上述专利文献1公开的现有技术中,虽然具有声音的个人性得到保留的 优点,但是,由于仅仅是将压缩后的高频信号成分映射至低频的预先设定的固定频带中,因 而根据输入信号的声音状态,上述带宽有时不是最佳的,在该种情况下存在音质的劣化不 能避免的问题。
[0011] 本发明正是为了解决上述问题而提出的,其目的在于,提供一种能够生成高质量 的声音的声音增强装置。
[0012] 用于解决问题的手段
[0013] 本发明的声音增强装置具有:时间-频率变换部,其将时域的输入信号变换成作 为频域信号的功率谱;输入信号分析部,其根据功率谱分析输入信号的状态;频带决定部, 其根据输入信号的状态,在不超过预先设定的第1频率的范围内决定边界频率;谱压缩部, 其沿频率方向压缩比第1频率靠上的频带的频率的功率谱;谱合成部,其将压缩后的功率 谱反映到由第1频率和边界频率决定的频带中;W及频率-时间变换部,其将从谱合成部输 出的合成功率谱和输入信号的相位谱变换到时域而得到增强信号。
[0014] 发明效果
[0015] 本发明的声音增强装置根据输入信号的状态确定用于决定反映高频成分的频带 的边界频率,因而能够防止谱合成造成的异常噪声,能够实现良好且清晰的声音增强处理。
【附图说明】
[0016] 图1是表示本发明的实施方式1的声音增强装置的结构图。
[0017] 图2是表示本发明的实施方式1的声音增强装置的输入信号分析部的详情的结构 图。
[0018] 图3是示意地表示本发明的实施方式1的声音增强装置的处理流程的说明图。
[0019] 图4是表示本发明的实施方式1的声音增强装置的输入信号频谱的一例的说明 图。
[0020] 图5是表示基于现有方法的声音增强处理的说明图。
[0021] 图6是表示本发明的实施方式1的声音增强装置的声音增强处理的说明图。
【具体实施方式】
[0022] 下面,为了更详细地说明本发明,参照【附图说明】用于实施本发明的方式。
[0023] 实施方式1
[0024] 图1是表示本发明的实施方式1的声音增强装置的结构图。
[0025] 本实施方式1的声音增强装置由输入端子1、时间-频率变换部2、输入信号分析 部3、频带决定部4、高频成分切取部5、谱压缩部6、增益校正部7、谱合成部8、频率-时间 变换部9、输出端子10构成。另外,图2是表示输入信号分析部3的内部结构的图,输入信 号分析部3由自相关分析部11、噪声频谱估计部12、SN比计算部13、功率比分析部14、判 定部15构成。
[0026] 输入端子1是被输入声音信号该样的信号作为输入信号的端子。时间-频率变换 部2是将时域的输入信号变换成作为频域信号的功率谱的处理部。输入信号分析部3是根 据从时间-频率变换部2输出的功率谱分析输入信号的状态,即分析输入信号是声音还是 噪声W及在是声音时是母音还是子音的处理部。频带决定部4是根据由输入信号分析部 3分析出的输入信号的状态,在不超过预先设定的第1频率的范围内决定边界频率的处理 部。高频成分切取部5是切取比第1频率靠上的频带的频率的功率谱的处理部。谱压缩部 6是沿频率方向压缩由高频成分切取部5切取出的频带的功率谱的处理部。增益校正部7 是进行由谱压缩部6压缩后的增益校正的处理部。谱合成部8是将由增益校正部7进行增 益校正后的压缩功率谱反映到由第1频率和边界频率决定的频带的处理部。频率-时间变 换部9是用于将从谱合成部8输出的合成功率谱和输入信号的相位谱变换到时域而得到增 强声音(增强信号)的处理部。输出端子10是用于将从频率-时间变换部9输出的增强 声音输出到外部的端子。
[0027] 下面,详细说明图2所示的输入信号分析部3。
[002引 自相关分析部11是根据输入信号的功率谱求出归一化自相关函数的处理部。噪 声频谱估计部12是根据输入信号的功率谱求出估计噪声频谱的处理部。SN比计算部13是 根据时间-频率变换部2输出的功率谱和噪声频谱估计部12输出的估计噪声频谱计算原 有帖的平均SN比的处理部。功率比分析部14是根据输入信号的功率谱求出高频/低频功 率比的处理部。判定部15是输入时间-频率变换部2输出的功率谱、由自相关分析部11 得到的归一化自相关函数的最大值、由功率比分析部14得到的高频/低频功率比W及噪声 频谱估计部12输出的估计噪声频谱,进行当前帖的输入信号是声音(母音/子音)还是噪 声的判定的处理部。
[0029] 下面,根据图1和图2说明本发明的声音增强装置的动作原理。
[0030] 首先,在对通过传声器等获取的声音、音乐等进行A/D(模拟/数字)变换后,按照 规定的采样频率(例如16曲Z)进行采样,并且分割成帖单位(例如10ms),通过输入端子 1输入到声音增强装置。另外,在本实施方式中,将最终得到的处理信号的频带设为0化~ 3400Hz(第1频率),将0化~3400化称作通过频带,将3400化~8000化称作高频频带进 行说明。另外,如果没有特殊指定,则假定对包含0化~8000化的通过频带和高频频带的 信号进行处理。并且,将高频频带的信号也称作高频成分进行说明。
[0031] 时间-频率变换部2在对分割成帖单位后的输入信号x(t)进行例如汉宁窗处理 后,例如下式(1)所示进行512点的高速傅里叶变换(FastFourierTransform;FFT),从 时域的信号变换成作为频域信号的频谱成分X(A,k)。
[003引X(A,k) =FT[x(t)] (1)
[0033] 其中,t表示采样时间,A表示对输入信号进行帖分割时的帖编号,k表示指定频 谱的频带的频率成分的编号(W下称作频谱编号),FT[ ?]表示高速傅里叶变换处理。然 后,使用下式(2)从输入信号的频谱成分得到功率谱Y(A,k),并且得到相位谱0 (A,k)。
[0034]
[003引其中,Re找(A,
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1