声音增强装置的制造方法

文档序号：9264777阅读：446来源：国知局

声音增强装置的制造方法
【技术领域】
[0001] 本发明设及声音增强装置，用于被导入有声音通信、声音蓄积、声音合成、声音识别系统的车载导航仪、移动电话、内线电话系统（interphone)、收音装置等声音通信系统、免提通话系统、电视会议系统、监视系统、广播系统、声音合成系统等的音质改善和声音识别系统的识别率的提高，并改善声音信号的质量及清晰度。
【背景技术】
[0002] 在模拟电话中，关于通过电话线路发送来的声音信号的频带，例如上限的频率被限制成3400化的狭窄频带。因此，现有的电话线路的音质不能说太良好。另外，在移动电话、业务无线等的数字声音通信中，由于比特率的严格限制，带宽与模拟线路同样受到限审IJ，因而在该种情况下音质也不能说太良好。对于声音的子音成分、声音具有的"个人性 (像某个人的）"和"自然性"，时常还处于3400化W上的频带，但该些频带由于上述的带宽限制而丢失很多。
[0003] 另外，近年来随着声音压缩技术（声音编码技术）的发展，能够W低比特率无线传输宽带（例如上限的频率为7000化）的声音信号。但是，需要发送侧终端和接收侧终端双方支持对应的宽带声音编码/解码方法，而且在双方的基站中也需要完备宽带编码用的网络，因而仅仅是在一部分业务通信系统中得到实际应用，当在公共电话通信网中实施时不仅带来很大的经济负担，而且普及需要很长的时间。
[0004] 为此，进行了压缩声音信号的频率，将其频谱整体控制在通过频带内的尝试。但是，在该种方法中，与原有的声音信号相比，包括含有声音的基本周期（音调（pitch))的低频带的信号在内都被压缩在较低的频率范围内，在该被压缩的信号不再次经过解压缩就被再现的情况下，所再现的声音成为不自然地低的音调，存在声音的个人性消失、质量明显下降的问题。针对此种情况，虽然通过在接收侧终端将压缩信号解压缩能够解决该问题，但是为此需要接收侧终端应对对在发送侧终端被压缩后的高频信号进行再次展开的作业。与应对宽带化同样，对于不具备将压缩信息与声音信号一起发送并再次将其展开的功能的通信终端，该种解决方案不实用。
[0005] 针对上述的问题，例如有专利文献1记载的技术。在该技术中，根据不改变声音的音调而仅将规定的高频压缩的方法，能够得到清晰的声音信号。
[0006] 现有技术文献
[0007] 专利文献
[000引专利文献1 ;日本特开2011-141551号公报
【发明内容】

[0009] 发明要解决的问题
[0010] 但是，在上述专利文献1公开的现有技术中，虽然具有声音的个人性得到保留的优点，但是，由于仅仅是将压缩后的高频信号成分映射至低频的预先设定的固定频带中，因而根据输入信号的声音状态，上述带宽有时不是最佳的，在该种情况下存在音质的劣化不能避免的问题。
[0011] 本发明正是为了解决上述问题而提出的，其目的在于，提供一种能够生成高质量的声音的声音增强装置。
[0012] 用于解决问题的手段
[0013] 本发明的声音增强装置具有：时间-频率变换部，其将时域的输入信号变换成作为频域信号的功率谱；输入信号分析部，其根据功率谱分析输入信号的状态；频带决定部，其根据输入信号的状态，在不超过预先设定的第1频率的范围内决定边界频率；谱压缩部，其沿频率方向压缩比第1频率靠上的频带的频率的功率谱；谱合成部，其将压缩后的功率谱反映到由第1频率和边界频率决定的频带中；W及频率-时间变换部，其将从谱合成部输出的合成功率谱和输入信号的相位谱变换到时域而得到增强信号。
[0014] 发明效果
[0015] 本发明的声音增强装置根据输入信号的状态确定用于决定反映高频成分的频带的边界频率，因而能够防止谱合成造成的异常噪声，能够实现良好且清晰的声音增强处理。
【附图说明】
[0016] 图1是表示本发明的实施方式1的声音增强装置的结构图。
[0017] 图2是表示本发明的实施方式1的声音增强装置的输入信号分析部的详情的结构图。
[0018] 图3是示意地表示本发明的实施方式1的声音增强装置的处理流程的说明图。
[0019] 图4是表示本发明的实施方式1的声音增强装置的输入信号频谱的一例的说明图。
[0020] 图5是表示基于现有方法的声音增强处理的说明图。
[0021] 图6是表示本发明的实施方式1的声音增强装置的声音增强处理的说明图。
【具体实施方式】
[0022] 下面，为了更详细地说明本发明，参照【附图说明】用于实施本发明的方式。
[0023] 实施方式1
[0024] 图1是表示本发明的实施方式1的声音增强装置的结构图。
[0025] 本实施方式1的声音增强装置由输入端子1、时间-频率变换部2、输入信号分析部3、频带决定部4、高频成分切取部5、谱压缩部6、增益校正部7、谱合成部8、频率-时间变换部9、输出端子10构成。另外，图2是表示输入信号分析部3的内部结构的图，输入信号分析部3由自相关分析部11、噪声频谱估计部12、SN比计算部13、功率比分析部14、判定部15构成。
[0026] 输入端子1是被输入声音信号该样的信号作为输入信号的端子。时间-频率变换部2是将时域的输入信号变换成作为频域信号的功率谱的处理部。输入信号分析部3是根据从时间-频率变换部2输出的功率谱分析输入信号的状态，即分析输入信号是声音还是噪声W及在是声音时是母音还是子音的处理部。频带决定部4是根据由输入信号分析部 3分析出的输入信号的状态，在不超过预先设定的第1频率的范围内决定边界频率的处理部。高频成分切取部5是切取比第1频率靠上的频带的频率的功率谱的处理部。谱压缩部 6是沿频率方向压缩由高频成分切取部5切取出的频带的功率谱的处理部。增益校正部7 是进行由谱压缩部6压缩后的增益校正的处理部。谱合成部8是将由增益校正部7进行增益校正后的压缩功率谱反映到由第1频率和边界频率决定的频带的处理部。频率-时间变换部9是用于将从谱合成部8输出的合成功率谱和输入信号的相位谱变换到时域而得到增强声音（增强信号）的处理部。输出端子10是用于将从频率-时间变换部9输出的增强声音输出到外部的端子。
[0027] 下面，详细说明图2所示的输入信号分析部3。
[002引自相关分析部11是根据输入信号的功率谱求出归一化自相关函数的处理部。噪声频谱估计部12是根据输入信号的功率谱求出估计噪声频谱的处理部。SN比计算部13是根据时间-频率变换部2输出的功率谱和噪声频谱估计部12输出的估计噪声频谱计算原有帖的平均SN比的处理部。功率比分析部14是根据输入信号的功率谱求出高频/低频功率比的处理部。判定部15是输入时间-频率变换部2输出的功率谱、由自相关分析部11 得到的归一化自相关函数的最大值、由功率比分析部14得到的高频/低频功率比W及噪声频谱估计部12输出的估计噪声频谱，进行当前帖的输入信号是声音（母音/子音）还是噪声的判定的处理部。
[0029] 下面，根据图1和图2说明本发明的声音增强装置的动作原理。
[0030] 首先，在对通过传声器等获取的声音、音乐等进行A/D(模拟/数字）变换后，按照规定的采样频率（例如16曲Z)进行采样，并且分割成帖单位（例如10ms)，通过输入端子 1输入到声音增强装置。另外，在本实施方式中，将最终得到的处理信号的频带设为0化~ 3400Hz(第1频率），将0化~3400化称作通过频带，将3400化~8000化称作高频频带进行说明。另外，如果没有特殊指定，则假定对包含0化~8000化的通过频带和高频频带的信号进行处理。并且，将高频频带的信号也称作高频成分进行说明。
[0031] 时间-频率变换部2在对分割成帖单位后的输入信号x(t)进行例如汉宁窗处理后，例如下式（1)所示进行512点的高速傅里叶变换（FastFourierTransform;FFT)，从时域的信号变换成作为频域信号的频谱成分X(A，k)。
[003引X(A，k) =FT[x(t)] (1)
[0033] 其中，t表示采样时间，A表示对输入信号进行帖分割时的帖编号，k表示指定频谱的频带的频率成分的编号（W下称作频谱编号），FT[ ?]表示高速傅里叶变换处理。然后，使用下式（2)从输入信号的频谱成分得到功率谱Y(A，k)，并且得到相位谱0 (A，k)。
[0034]
[003引其中，Re找（A，

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古田训;细谷耕佑;
技术所有人：三菱电机株式会社;
我是此专利的发明人

上一篇：个人化带宽扩展的制作方法
上一篇：在位流中用信号表示音频渲染信息的制作方法