一种直录播互动系统中的音频处理方法及装置的制造方法

文档序号：9218172阅读：231来源：国知局

一种直录播互动系统中的音频处理方法及装置的制造方法
【技术领域】
[0001] 本发明属于音频处理领域，尤其涉及一种直录播互动系统中的音频处理方法及装置。
【背景技术】
[0002] 在音频信号的采集和录制过程中，需对接收到的音频信号进行处理，再通过音频混音算法对采集到的多路语音信号进行混合，使混合后的语音信号中包含每一路麦克风采集到的信息，以便能够让发声者的说话信息传送给每一个参与会议的成员。
[0003] 传统的音频混音算法大都是对采集到的语音信号进行分析，根据信号的强弱分配不同的混音权重值，最后进行加权求和以达到混音的目的。这种方法可以在一定程度上实现混音的效果，但是由于其使用的是后验知识，即必须首先得到语音信号才能对每路麦克风通道赋予相应的权重值，存在着处理上的滞后性和信号产生方位的不确定性，如果能够利用一些先验知识，即在得到语音信号前就分配好了每路麦克风所对应的权重值，则可以更为精准地实现混音的效果。

【发明内容】

[0004] 本发明提供一种直录播互动系统中的音频处理方法及装置，以解决上述问题。
[0005] 本发明提供一种直录播互动系统中的音频处理方法。上述方法包括以下步骤：采集当前图像；根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值；根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值；根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息，进行混音，获取混音后的音频输出值。
[0006] 本发明还提供一种直录播互动系统中的音频处理装置，上述装置包括：全景摄像机、音频采集设备和智能导播设备；所述全景摄像机和所述音频采集设备分别与所述智能导播设备相连；所述全景摄像机，用于采集当前图像；所述音频采集设备，用于采集音频信息；所述智能导播设备，用于根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值，并根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值；所述智能导播设备还用于根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息，进行混音，并获取混音后的音频输出值。
[0007] 相较于先前技术，根据本发明提供的直录播互动系统中的音频处理方法及装置，首先对获取到的视频图像进行分析，提取出发声者在房间内的具体位置，利用人员的位置信息提前对房间内的多个麦克风设备分配相应的混音权重值，并且可以随着人员的移动实时改变权重值的大小，精准地实现混音效果。本发明利用根据发声者实时的位置变化，能够更加准确有效地根据人员实时位置从而避免权重值变化的滞后，能够使最终的混音效果变化平缓、自然真实。
【附图说明】
[0008] 此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
[0009] 图1所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理方法的流程图；
[0010] 图2所示为根据本发明的较佳实施例提供的整个直录播教室的图像中教师与麦克风的位置不意图；
[0011] 图3所示为根据本发明的另一较佳实施例提供的整个直录播教室的图像中教师与麦克风的位置示意图；
[0012]图4所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理装置的结构图。
【具体实施方式】
[0013] 下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。
[0014] 如图1所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理方法的流程图。如图1所示，本发明的较佳实施例提供的直录播互动系统中的音频处理方法包括步骤101-104。
[0015] 步骤101:采集当前图像；
[0016] 步骤102 :根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值；
[0017] 所述第一策略包括：建立各个音频采集设备与划分区域的对应关系；根据声源所在的区域、声源区域及音频采集设备混音权重动态分配表，确定各个音频采集设备对应的一次混音权重值。
[0018] 所述声源区域及音频采集设备混音权重动态分配表包括：声源所在区域的音频采集设备对应的一次混音权重值、划分区域中非声源所在区域中的各个音频采集设备分别对应的一次混音权重值。
[0019] 举例而言：在另一优选的实施例中，在确定所述当前图像中各个音频采集设备对应的一次混音权重值的方法还包括：假设声源的发出者为教师，建立教师所在区域和麦克风的混音权重动态分配表，具体如表1所示，将全景摄像头采集到的图像进行区域划分，具体如图3所示，将采集到的图像按照6个麦克风的位置划分为6个区域，每个区域分别对应着一个麦克风，假设教师在区域2中，根据混音权重动态分配表得到区域1中麦克风1对应的一次混音权重值为0. 5,区域2中麦克风2对应的一次混音权重值为1，区域3中麦克风 3对应的一次混音权重值0. 5,区域4中麦克风4对应的一次混音权重值为0. 25,区域5中麦克风5对应的一次混音权重值0. 5,区域6中麦克风6对应的一次混音权重值为0. 25。
[0020] 表1混音权重动态分配表
[0021]
[0022] 所述第一策略包括：根据获取的声源与各个音频采集设备之间距离，确定各个音频采集设备对应的一次混音权重值。
[0023] 根据获取的声源与各个音频采集设备之间距离，确定各个音频采集设备对应的一次混音权重值的过程为：
[0026] 其中，P(xp，yp)为所述声源位置坐标，所述声源位置坐标通过运动目标检测方法实时获取；
[0027] 其中，^为第i路音频采集设备位置坐标Mic i (Xi，yi)和声源位置坐标P(xp，yp)之间距离平方的倒数，i = 1，2, 3……n;
[0028] 其中，&为第i路音频采集设备的一次混音权重值。
[0029] 步骤103 :根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值；
[0030] 根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值，获取各个音频采集设备进行一次混音权重分配后的语音信号包络值；对获取的各个音频采集设备进行一次混音权重分配后的语音信号包络值进行平滑处理；获取各个音频采集设备平滑处理后的语音信号包络值总和，并根据获取的各个音频采集设备平滑处理后的语音信号包络值总和，获取各个音频采集设备的语音信号权重值，并对所述语音信号权重值进行平滑处理，得到二次混音权重值。
[0031] 根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值，获取各个音频采集设备进行一次混音权重分配后的语音信号包络值的过程为：en Vi = ei|*ki;其中，e ,表示第i路音频采集设备直接采集到的语音信号幅值，h是第i路音频采集设备的一次混音权重值；enVi表示第i路音频采集设备进行一次混音权重分配后的语音信号包络值。
[0032] 对一次

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾驰;高华;
技术所有人：阔地教育科技有限公司;
我是此专利的发明人

上一篇：一种基于稀疏化表示的空间音频编解码方法
上一篇：音频编码装置、方法以及音频解码装置、方法