一种语音信号处理方法、装置及系统的制作方法

文档序号:9912689阅读:454来源:国知局
一种语音信号处理方法、装置及系统的制作方法
【技术领域】
[0001]本发明涉及音视频技术领域,具体涉及一种语音信号处理方法、装置及系统。
【背景技术】
[0002]随着音视频技术的快速发展,摄像机与麦克风阵列设备已经在视频监控、视频会议等应用场合中不可或缺。不幸的是,在我们可以获取清晰录像的同时,音频通讯通常会遭受干扰声源、噪声和混响的影响,使得难以听清摄像现场的讲话内容。
[0003]为改善不利环境中音频讯号的接收,麦克风阵列通常被应用来对声源定位,并对声源方向进行波束形成等语音信号处理。然而在多人声嘈杂环境中时,目前的阵列麦克风技术在面对复杂的声学场景时,则无法进行声源定位,因此对声源发出的语音信息进行语音信号处理的效果难以保证,抑制噪声干扰能力差。

【发明内容】

[0004]因此,本发明实施例要解决的技术问题在于现有技术中的语音信号处理系统在复杂多人声环境中的抑制噪声干扰能力差。
[0005]为此,本发明实施例的一种语音信号处理方法,包括以下步骤:
[0006]获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;
[0007]根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;
[0008]根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。
[0009]优选地,所述获取目标声源相对于麦克风阵列中的每个麦克风的位置信息包括:
[0010]获取所述目标声源相对于摄像机的位置信息;
[0011 ]根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克风的位置信息。
[0012]优选地,所述获取所述目标声源相对于摄像机的位置信息包括:
[0013]接收摄像机发送的包含声源的现场视频信息和在所述现场视频信息包含的所有声源中选取的目标声源;
[0014]根据所述现场视频信息,获取所述目标声源相对于所述摄像机的位置信息。
[0015]优选地,所述获取目标声源相对于麦克风阵列中的每个麦克风的位置信息还包括:
[0016]利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验调整,获取校验调整后的位置信息。
[0017]优选地,还包括以下步骤:
[0018]将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行存储。
[0019]本发明实施例的一种语音信号处理装置,包括:
[0020]位置获取单元,用于获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;
[0021 ]时延获取单元,用于根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;
[0022]语音获取单元,用于根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。
[0023]优选地,所述位置获取单元包括:
[0024]第一位置获取子单元,用于获取所述目标声源相对于摄像机的位置信息;
[0025]第二位置获取子单元,用于根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克风的位置信息。
[0026]优选地,所述第一位置获取子单元包括:
[0027]接收单元,用于接收摄像机发送的包含声源的现场视频信息和在所述现场视频信息包含的所有声源中选取的目标声源;
[0028]位置获取子子单元,用于根据所述现场视频信息,获取所述目标声源相对于所述摄像机的位置信息。
[0029]优选地,所述位置获取单元还包括:
[0030]位置校验调整单元,用于利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验调整,获取校验调整后的位置信息。
[0031]优选地,还包括:
[0032]发送单元,用于将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行存储。
[0033]本发明实施例的一种语音信号处理系统,包括:
[0034]摄像机,用于获取包含声源的现场视频信息并发送给语音信号处理装置;
[0035]麦克风阵列,用于获取目标声源发出的语音信息并发送给语音信号处理装置;
[0036]语音信号处理装置,用于接收摄像机发送的包含声源的现场视频信息;根据所述现场视频信息获取所述目标声源相对于所述摄像机的位置信息;根据所述目标声源相对于所述摄像机的位置信息和预设的麦克风阵列与摄像机之间的位置关系,获取目标声源相对于麦克风阵列中的每个麦克风的位置信息;根据目标声源相对于麦克风阵列中的每个麦克风的位置信息,获取所述目标声源发出语音信息到每个麦克风获取到所述语音信息的延迟时间;根据所述延迟时间,对来自各个麦克风的语音信息进行语音信号处理,获取所述目标声源发出的语音信息。
[0037]优选地,所述语音信号处理装置,还用于利用麦克风阵列的空间几何构造和麦克风相互间的相关性统计对获取到的所述目标声源相对于麦克风阵列中的每个麦克风的位置信息进行校验调整,获取校验调整后的位置信息。
[0038]优选地,所述语音信号处理装置,还用于将获取到的所述目标声源发出的语音信息发送至本地扬声器进行播放、发送至通信装置进行与远端装置的语音信息交互或者发送至存储装置进行存储。
[0039]优选地,还包括:
[0040]显示装置,用于显示现场视频信息,获取所选取的目标声源并发送给所述语音信号处理装置;
[0041 ]扬声器装置,用于获取所述语音信号处理装置发送的所述目标声源发出的语音信息并进行播放;
[0042]通信装置,用于获取所述语音信号处理装置发送的所述目标声源发出的语音信息并进行与远端装置的语音信息交互;
[0043]存储装置,用于获取所述语音信号处理装置发送的所述目标声源发出的语音信息并进行存储。
[0044]本发明实施例的技术方案,具有如下优点:
[0045]1.本发明实施例提供的语音信号处理方法、装置及系统,通过获取目标声源相对于麦克风阵列中每个麦克风的位置信息,可以直接估算出每个麦克风获取到目标声源发出的语音信息的时延,再结合目标声源的位置,在对语音信息进行语音信号处理时,可以降低复杂多人声环境中其他声源对麦克风语音获取过程中的影响,从而语音信号处理后的效果好,也提高了抑制干扰的能力。
[0046]2.本发明实施例提供的语音信号处理方法、装置及系统,通过采集目标声源相对于摄像机的位置信息,再结合预设的麦克风阵列与摄像机之间的位置关系,能够精确的获取到目标声源相对于麦克风阵列中的每个麦克风的位置信息,提高了对目标声源的定位精度,从而能够进一步改善语音信号处理的效果。
[0047]3.本发明实施例提供的语音信号处理方法、装置及系统,利用麦克风阵列技术对声源位置利用相邻统计相关性进行精确校验,对声源的方位距离调优,进一步提高了对目标声源的定位精度,从而能够进一步改善语音信号处理的效果。
【附图说明】
[0048]为了更清楚地说明本发明【具体实施方式】中的技术方案,下面将对【具体实施方式】描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
[0049]图1为本发明实施例1中语音信号处理方法的一个具体示例的流程图;
[0050]图2为本发明实施例1中摄像机、麦克风阵列和声源的一个具体不例的分布图;
[0051]图3为本发明实施例2中语音信号处理装置的一个具体示例的原理框图;
[0052]图4为本发明实施例3中语音信号处理系统的一个具体示例的原理框图。
【具体实施方式】
[0053]下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
[0054]在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[005
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1