信号处理装置、信号处理方法、信号处理程序的制作方法

文档序号:9383159阅读:551来源:国知局
信号处理装置、信号处理方法、信号处理程序的制作方法
【技术领域】
[0001] 本发明涉及一种检测输入信号中的人语音的技术。
【背景技术】
[0002] 在以上技术领域中,专利文献1公开了一种通过确定输入语音帧的背景噪声电平 并且比较输入语音帧的音量与对应于噪声电平的阈值来检测语音的技术。

【发明内容】

[0003] 引用列表
[0004] 专利文献1 :日本专利待审公开号2013-005418
[0005] 非专利文献
[0006] 非专利文献 I :Masakiyo Fujimoto, "The Fundamentals and Recent Progress of Voice Activity Detection",the Institute of Electronics, Information and Communication Engineers, IEICE Technical Report SP2010-23, 2010 年 6 月
[0007] 非专利文献 2 :Tsuneo Kato, Shingo Kuroiwa, Tohru Shimizu, and Norio Higuchi, "Tree-Based Clustering for Gaussian Mixture HMMs", IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences D-II, Vol. J83-D-II, No. 11,第 2128-2136 页,200011 月
[0008] 非专利文献 3 :Ken Hanazawa and Ryosuke Isotani, 〃Gender_Independent Speech Recognition by Look-Ahead Model Selection",Proceedings of the Acoustical Society of Japan,第 197-198 页,2004 年 9 月
[0009] 非专利文献 4 :"Speaker Verification Using Adapted Gaussian Mixture Models",Douglas A.Reynolds, Thomas F.Quatieri, Robert B.Dunn, Digital Signal Processing 10,19-41(2000)
[0010] 技术问题
[0011] 然而,在以上文献中描述的技术中,简单地通过比较音量来确定语音的存在/不 存在,并且因此如果噪声大,则根本不能检测语音。即使噪声小,通过按照音量检测语音而 获得的检测准确性也并未充分地高。
[0012] 本发明实现了提供一种解决以上描述的问题的技术。
[0013] 对问题的解决方案
[0014] 本发明的一个方面提供了一种信号处理装置,该信号处理装置包括:
[0015] 变换器,该变换器将输入信号变换成频域中的振幅分量信号;
[0016] 计算器,该计算器计算在频率方向上的振幅分量信号的改变的范数;
[0017] 累加器,该累加器累加由计算器计算出的改变的范数;以及
[0018] 分析器,该分析器根据由累加器计算出的累加值来分析输入信号中的声音。
[0019] 本发明的另一方面提供了一种信号处理方法,该信号处理方法包括:
[0020] 将输入信号变换成频域中的振幅分量信号;
[0021] 计算在频率方向上的振幅分量信号的改变的范数;以及
[0022] 累加在计算中计算出的改变的范数。
[0023] 本发明的又一方面提供了一种用于使得计算机执行方法的信号处理程序,该方法 包括:
[0024] 将输入信号变换成频域中的振幅分量信号;
[0025] 计算在频率方向上的振幅分量信号的改变的范数;以及
[0026] 累加在计算中计算出的改变的范数。
[0027] 本发明的有利效果
[0028] 根据本发明,有可能提尚声首确定准确性。
【附图说明】
[0029] 图1是示出了根据本发明的第一实施例的信号处理装置的布置的框图;
[0030] 图2是示出了根据本发明的第二实施例的信号处理装置的布置的框图;
[0031] 图3是示出了根据本发明的第三实施例的信号处理装置的布置的框图;
[0032] 图4是示出了根据本发明的第四实施例的信号处理装置的布置的框图;
[0033] 图5是示出了根据本发明的第五实施例的信号处理装置的布置的示例的框图;
[0034] 图6是示出了根据本发明的第五实施例的信号处理装置的布置的另一示例的框 图;
[0035] 图7是示出了根据本发明的第五实施例的变换器的布置的框图;
[0036] 图8是示出了根据本发明的第五实施例的逆变换器的布置的框图;
[0037] 图9是示出了根据本发明的第五实施例的逆变换器的语音检测器的布置的示例 的框图;
[0038] 图10是用于说明根据本发明的第五实施例的语音检测器的示例的图形;
[0039] 图11是用于说明根据本发明的第五实施例的语音检测器的示例的图形;
[0040] 图12是示出了根据本发明的第五实施例的语音检测器的布置的另一示例的框 图;
[0041] 图13是用于说明根据本发明的第五实施例的语音检测器的另一示例的视图;
[0042] 图14是示出了根据本发明的第五实施例的信号处理装置的信号处理结果的视 图;
[0043] 图15是示出了根据本发明的第六实施例的替换单元的布置的框图;
[0044] 图16是示出了根据本发明的第七实施例的替换单元的布置的框图;
[0045] 图17是示出了根据本发明的第八实施例的替换单元的布置的框图;
[0046] 图18是示出了根据本发明的第九实施例的替换单元的布置的框图;
[0047] 图19是示出了根据本发明的第十实施例的替换单元的布置的框图;以及
[0048] 图20是示出了在根据本发明的实施例的信号处理装置由软件实施时的布置的框 图。
【具体实施方式】
[0049] 现在将参照附图描述本发明的优选实施例。应当注意,在这些实施例中阐述的部 件的相对布置、数值表达式和数值除非具体地另有陈述则并未限制本发明的范围。注意,在 以下说明中的"语音信号"指示根据语音或者另一声音的影响而出现的直接电改变。语音 信号传输语音或者另一声音并且不限于语音。
[0050] [第一实施例]
[0051] 将参照图1描述根据本发明的第一实施例的信号处理装置100。信号处理装置10 是用于确定在输入信号中语音的存在的装置。
[0052] 如图1中所示,信号处理装置100包括变换器101、频率方向差值计算器102、累加 器103和分析器104。变换器101将输入信号110变换成频域中的振幅分量信号130。频 率方向差值计算器102计算在频率方向上的频率方向差值计算器102的改变的范数。累加 器103累加由计算器102计算出的改变的范数。分析器104根据由累加器103计算出的累 加值150分析在输入信号110中的语音。
[0053] 利用以上描述的布置,有可能更正确地确定语音在输入信号中的存在的可能性或 者语首的属性。
[0054] 这一布置关注语音在频率方向上大量地改变而噪声在频率方向上平滑这样的事 实。例如,通过使用在频率方向上的改变的范数的累加值,确定语音随着累加值更大而以更 高概率存在。可以通过比较累加值与阈值来执行硬判定(0/1),或者可以通过对累加值本身 取整(round)来执行软判定(0至256)。
[0055] [第二实施例]
[0056] 将参照图2描述根据本发明的第二实施例的信号处理装置。图2是用于说明根据 这一实施例的信号处理装置的功能布置的框图。
[0057] 如图2中所示,信号处理装置200包括变换器201、频率方向差值计算器202、累加 器203、分析器204和频率方向平滑器205。变换器201将输入信号210变换成频域中的振 幅分量信号230。频率方向平滑器205在频率方向上平滑振幅分量信号230。频率方向差 值计算器202计算在频率方向上的平滑的振幅分量信号230的改变的范数。累加器203累 加由频率方向差值计算器202计算出的改变的范数。分析器204基于由累加器203计算出 的累加值250确定女性语音或者儿童语音的存在。注意,分析器204可以确定尖叫的存在。
[0058] 利用以上描述的布置,女性语音或者儿童语音是否被混合在输入信号210中或者 女性语音或者儿童语音被混合在输入信号210中的可能性被确定。这在用户想要确定妇女 或者儿童是否存在于目标空间中时有用。例如,通过在用于检测儿童的害怕语音并且生成 报警的装置中并入这样的装置,有可能防止生成错误报警并且更正确地生成报警。
[0059] 这一实施例关注女性和儿童语音比男性语音更逐渐地改变这样的事实。由于男性 语音的振幅分量信号在频率方向上改变多次,所以通过在频率方向上执行平滑来获得平滑 曲线,从而产生与噪声的波形相似的波形。这使得有可能正确地提取女性语音和儿童语音。 尖叫的音调高于通常,因此尖叫具有与女性语音或者儿童语音相似的特征。
[0060] [第三实施例]
[0061] 将参照图3描述根据本发明的第三实施例的信号处理装置。图3是用于说明根据 这一实施例的信号处理装置的功能布置的框图。
[0062] 如图3中所示,信号处理装置300包括变换器301、频率方向差值计算器302、累加 器303、分析器304和时间方向平滑器305。变换器301将输入信号310变换成频域中的振 幅分量信号330。时间方向平滑器305在时间方向上平滑振幅分量信号330。频率方向差 值计算器302计算在频率方向上的平滑的振幅分量信号的改变的范数。累加器303累加由 频率方向差值计算器302计算出的改变的范数。分析器304基于由累加器203计算出的累 加值350确定男性语音的存在。
[0063] 利用以上描述的布置,男性语音是否被混合在输入信号310中或者男性语音被混 合在输入信号310中的可能性被确定。这在用户想要确定男人是否存在于目标空间中时有 用。例如,通过在用于检测男人入侵对男人关闭的位置(比如女人的宿舍)中的装置中并 入这样的装置并且生成报警,有可能防止生成错误报警并且更正确地生成报警。
[0064] 这一实施例关注男性语音比女性和儿童语音在频率方向上改变更多次数这样的 事实。由于女性和儿童声音更逐渐地改变,所以通过在时间方向上执行平滑来获得平滑曲 线,从而产生与噪声的波形相似的波形。这使得有可能正确地提取男性语音。
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1