摄像声音提取方法及装置的制作方法

文档序号:2833607阅读:410来源:国知局
专利名称:摄像声音提取方法及装置的制作方法
技术领域
本发明涉及通信技术领域,特别涉及一种摄像声音提取方法及装置。
背景技术
随着音频技术的发展,人们对音乐品质的要求也越来越高。现有的音频技术主要包括单声道、双声道立体声和声道环绕声。其中,单声道音频在录制过程中使用一个麦克风,播放效果仅能够体现出声音的强弱;双声道立体声音频在录制过程中模拟人的双耳,在播放时使用两个喇叭分别播放左声道和右声道录制的信号,能够使听者既感知到声音的强 弱,又感知到声音的水平方位变化;声道环绕声利用多个麦克风进行录制,并且使用多个喇叭进行播放,能够让听者感知声音的空间方位,具有立体的现场感觉。现有技术中至少存在如下问题目前的单声道、双声道立体声以及声道环绕声只是将麦克风或麦克风阵列感知的信号还原为所录制的声音,但是对于所录制的声音并没有区分。例如,用户用智能手机为朋友所参加的某项表演比赛录像,并在录像的同时进行解说,当将其录制的声音还原时,既有解说音也有其朋友的声音,同时还有一定的干扰音源。由于用户距离手机要比其朋友近得多,所以解说声音要远大于其朋友的声音,再加上干扰音源的干扰,使得混合信号播放出来以后效果很差,无法对解说者的声音和被摄目标的声音进行清晰的分辨。

发明内容
提供一种摄像声音提取方法及装置,能够解决录像过程中由于解说者和被摄目标距离麦克风远近不同而带来的声音强度差别很大的问题,将解说声音和被摄目标声音分别清晰的播放出来,并降低干扰音源的影响。第一方面,提供一种摄像声音提取方法,包括根据公SvF(t) = sF(t) + @BsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t) = sB(t) + P FsF(t)+n(t)获取第二麦克风得到的初始声音信号vB (t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,解说声音到第一麦克风的衰减系数,1^为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;根据公式Sf (t) =vF⑴-β BvB (t)获取所述第一麦克风得到的最终声音信号Sf⑴,根据公式&(0=%(0-^^^(0获取所述第二麦克风得到的最终声音信号Sb(t);对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’F(t)和解说声音信号sB’ (t)。在第一种可能的实现方式中,在所述对所述Sf (t)和所述SB(t)进行自动增益调整之前,还包括将所述vF ⑴和 vB(t)代入所述 Sf (t),得到 Sf (t)=sF(t) (1-3b3f) +n(t);将所述 Vf (t)和 Vb (t)代入所述 Sb (t),得到 Sb (t) = Sb (t) (I- β Β β F) + (I-β F) n (t)。将所述 Vf (t)和 Vb (t)代入所述 Sf (t),得到 Sf (t) = Sf (t) (I- β Β β F) + (I- β B) n (t),将所述 Vf (t)和 Vb (t)代入所述 Sb (t),得到 Sb (t) = Sb (t) (I- β Β β F) + (I-β F) n (t)。可选的,所述对所述Sf(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’ F(t)和解说声音信号sB’ (t)包括调节所述&⑴和所述SB(t)的增益值,将调节后的SF(t)信号作为s’F(t),将调节后的Sb⑴信号作为sB’⑴。进一步的,在所述获得被摄目标的声音信号s’F(t)和解说声音信号sB’ (t)之后,还包括根据用户需要分别对所述S’ F(t)和所述sB’ (t)的声音强度进行调节;或者,根据用户需要对所述s’F(t)和所述sB’ (t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。 第二方面,提供一种摄像声音提取装置,包括第一信号获取单元,用于根据公式vF (t) = sF(t) + P BsB(t)+n(t)获取第一麦克风得到的初始声音信号vF (t),根据公Svb (t) = sB(t) + 3 FsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βΒ为解说声音到第一麦克风的衰减系数,PfS被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;第二信号获取单元,用于根据公式Sf (t) =vF (t) - β BvB (t)获取所述第一麦克风得到的最终声音信号Sf (t),根据公式Sb (t) =vB (t) - β FvF (t)获取所述第二麦克风得到的最终声音信号Sb (t);调整单元,用于对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’ F(t)和解说声音信号sB’ (t)。在第一种可能的实现方式中,所述第二信号获取单元还包括第一计算子单元,用于将所述vF(t)和vB(t)代入所述SF(t),得到SF(t) = Sf(t)(1-β Ββ f) + (1-3 B)n(t);第二计算子单元,用于将所述vF (t)和 ⑴代入所述Sb (t),得到Sb (t) = sB (t)(I- β B β F) + (I- β F) n (t)。可选的,所述调整单元还用于调节所述&⑴和所述SB(t)的增益值,将调节后的SF(t)信号作为s’F(t),将调节后的Sb⑴信号作为sB’⑴。进一步的,所述装置还包括第一音量调节单元,用于根据用户需要分别对所述s’F(t)和所述sB’ (t)的声音强度进行调节;或者,第二音量调节单元,用于根据用户需要对所述s’F(t)和所述sB’ (t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声首和被摄目标的声首,可以在视频中播放解说者的声首和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。


为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图I为本发明实施例一提供的方法流程图; 图2为本发明实施例二提供的方法流程图;图3为本发明实施例二提供的解说者和被拍摄者的空间位置示意图;图4为本发明实施例二提供的音量调节示意图;图5、图6为本发明实施例三提供的装置结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。实施例一本实施例提供一种摄像声音提取方法,如图I所示,所述方法包括101、获取第一麦克风得到的初始声音信号%(0和第二麦克风得到的初始声音信号 Vb (t)。例如,根据公式 Vf (t) = sF (t) + β bsb (t) +n (t)得到 Vf (t),根据公式 vB (t)=sB(t) + P FsF(t)+n(t)得到vB(t),其中,sF(t)为被摄目标的初始声音信号,sB (t)为解说初始声音信号,β B为解说声音到第一麦克风的衰减系数,β F为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号。102、根据vF(t)和vB (t)获取第一麦克风得到的最终声音信号SF(t)以及获取第二麦克风得到的最终声音信号Sb (t)。例如,根据公式SF(t)=vF(t)-@ BvB(t)获取 Sf (t),根据公式 SB(t)=vB(t)-@ FvF(t)获取 Sb(t)。将所述 vF(t)和 vB(t)代入所述 Sf(t),得到 Sf(t) = Sf(t) (1-βΒβΡ) + (1-βΒ)n (t),将所述 vF (t)和 vB (t)代入所述 Sb (t),得到 Sb (t) = sB (t) (I- β Β β F) + (I-β F) n (t)。103、对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’F(t)和解说声音信号sB’(t)。
例如,所述对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’ F(t)和解说声音信号sB’ (t)包括调节所述SF(t)和所述SB(t)的信号增益值,将调节后的SF(t)信号作为8%(0,将调节后的&(0信号作为Sb’(t)。可选的,在无解说音时,将SF(t) = Sf (t) (I- β B β F) + (I- β B) n (t)式中的βΒ调整为1,将βρ调整为0,获得被摄目标的声音信号SF(t)=sF(t)。进一步的,在所述获得被摄目标的声音信号s’F(t)和解说声音信号sB’ (t)之后,还包括根据用户需要分别对所述s’ F(t)和所述sB’ (t)的声音强度进行调节;或者,根据用户需要对所述s’F(t)和所述sB’ (t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。 其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。 与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声首和被摄目标的声首,可以在视频中播放解说者的声首和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。实施例二本实施例提供一种摄像声音提取方法,以通过智能终端进行摄像为例,如图2所示,所述方法包括201、通过后置麦克风接收被拍摄者的初始声音信号sF(t),同时通过前置麦克风接收解说者的初始声音信号SB (t)。例如,如图3所示,当用智能终端对目标进行摄像时,因为解说者(一般来说即为摄像者)位于终端的正面,距离前置的麦克风较近,而目标位于终端背面,距离后置的麦克风较近,所以为了提取更加清晰的声音,使用终端正面前置的麦克风接收解说者的声音信号,使用终端背面(与摄像头同侧)后置的麦克风接收目标的声音信号。当然,由于声音的传播特性,前置的麦克风在接收解说者声音信号的同时,也会接收到一定的被拍摄者的声音信号。同理,后置麦克风也接收到解说者的声音信号。再加上不可避免的噪声信号,所以需要综合考虑,利用步骤202得到一个总的声音信号202、获取第一麦克风得到的初始声音信号%(0和第二麦克风得到的初始声音信号 Vb (t)。例如,根据公式vF(t) = sF(t) + @BsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公SvB(t) = sB(t) + ^FsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t)0其中,βΒ为解说声音到第一麦克风的衰减系数,βΒ8Βα)即为后置麦克风接收到的经过衰减的解说者的声音信号,被摄目标声音到第二麦克风的衰减系数,i3FsF(t)即为前置麦克风接收到的经过衰减的被拍摄者的声音信号,n(t)为噪声信号。可选的,默认被拍摄者与后置麦克风之间的声音传播信道为1,默认解说者与前置麦克风之间的声音传播信道为I。其中,经过此步骤得出的vF(t)和vB(t)为混合的声音信号,如果按照此信号进行声音的还原,那么用户听到的声音将会十分嘈杂,不一定能分辨出解说者和被拍摄者的声音,所以需要利用步骤203对这两个声音信号作进一步的处理。需要说明的是,两个衰减系数^^和,是根据时域和频域的匹配算法估计出来的,该匹配算法为本领域人员所熟知的现有技术,此处不再对其进行详细的说明。203、构造信号SF(t)和Sb(t)。其中,SF(t)为后置麦克风获得的被拍摄者的最终声音信号,Sb(t)为前置麦克风获得的解说者的最终声音信号。例如,使用公式Sf (t) =vF⑴-β BvB⑴得到信号Sf⑴,利用此公式可以消除解说者给后置麦克风带来的声音干扰,将步骤202得到的vF(t)和vB(t)代入该公式,得到SF(t)=sF(t)-3 B β FsF(t) + (l-3 B)n(t),经过整理后得至丨J SF(t) = sF (t) (1-βΒβ Ρ) + (1-β Β)n(t),可以看出经过整理后的公式中并没有解说者的初始声音信号sB(t),只包括被拍摄者的初始声音信号和噪声信号。同理,使用公式Sb (t) =vB⑴-β FvF (t)得到信号Sb⑴,利用此公式可以消除被拍摄者给前置麦克风带来的声音干扰,将步骤202得到的vF(t)和vB(t)代入该公式,得到SB(t) = sB (t) - β Β β FsB (t) + (I- β F) n (t),经过整理后得到SB(t) = sB (t)(1-βΒβΡ) + (1-βΡ)ηα),可以看出经过整理后的公式中并没有被拍摄者的初始声音信号sF(t),只包括解说者的初始声音信号和噪声信号。进一步的,执行步骤204,对整理后的声音信号进行微调,消除噪声的干扰,最大化的提取解说者和被拍摄者的声音信号。204、对信号SF(t)和SB(t)进行自动增益调整。例如,调整SF(t) Sb(t)的增益值,将最清晰的Sf(t)信号作为s’F(t),将最清晰的SB(t)信号作为Sb’⑴。可选的,当仅有被拍摄者的声音,并没有解说时,可以令^为1,令^^为0,获得被拍摄者的声音信号SF(t)=s’ F(t),即仅存在清晰的被拍摄者的声音,噪声几乎为O。在此种情形下,能够显著降低周围噪声对摄像的影响,提高录制效果。205、对被拍摄者的声音信号和解说者的声音信号进行还原。206、根据用户需要对被拍摄者的声音强度和解说者的声音强度进行调节。可选的,在实际播放时,可以根据用户喜好只播放被拍摄者的声音,或者只播放解说者的声音,或者同时播放二者的声音。例如,在进行调节时,如图4所示,调节方案A中,可以分别对解说音和目标音(被拍摄者的声音)进行调节,二者的调节互不干扰;调解方案B中,对解说音和目标音进行联动调节,即当调高解说音时目标音降低相应的音量,反之亦然;调解方案C中,使用旋钮对解说音和目标音进行联动调节,能够达到和方案B相同的效果O与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声首和被摄目标的声首,可以在视频中播放解说者的声首和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。实施例三本实施例提供一种摄像声音提取装置30,如图5所示,所述装置30包括第一信号获取单元31,用于根据公式vF(t) = sF(t) + @ BsB(t)+n(t)获取第一麦克风得到的初始声音信号vF (t),根据公Svb (t) = sB(t) + ^ FsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βΒ为解说声音到第一麦克风的衰减系数,Pf为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;第二信号获取单元32,用于根据公式Sf (t) =vF(t) - β BvB (t)获取所述第一麦克风 得到的最终声音信号Sf (t),根据公式Sb (t) =vB (t) - β FvF (t)获取所述第二麦克风得到的最终声音信号Sb (t);调整单元33,用于对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’ F(t)和解说声音信号sB’ (t)。进一步的,如图6所示,所述第二信号获取单元32还可以包括第一计算子单元321,用于将所述vF(t)和 ⑴代入所述&⑴,得到SF(t)=Sf (t) (I- β B β F) + (I- β B) n (t);第二计算子单元322,用于将所述vF(t)和 ⑴代入所述Sb(t),得到Sb(t)=Sb(t) (1-βΒβ F) + (I-β F)n(t)。进一步的,如图6所示,所述调整单元33还用于调整所述&⑴和所述SB(t)的增益值,将调整后的SF(t)信号作为s’F(t),将调整后的Sb⑴信号作为sB’⑴。进一步的,如图6所示,所述装置30还可以包括第一音量调节单元34,用于根据用户需要分别对所述s’F(t)和所述sB’ (t)的声音强度进行调节;或者,第二音量调节单元35,用于根据用户需要对所述s’F(t)和所述sB’ (t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声首和被摄目标的声首,可以在视频中播放解说者的声首和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。本发明实施例提供的摄像声音提取装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的摄像声音提取方法及装置可以适用于在摄像过程中对不同目标的声音进行区分和调整,但不仅限于此。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁 碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random AccessMemory, RAM)等。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
权利要求
1.一种摄像声音提取方法,其特征在于,包括 根据公SvF(t) = sF(t) + ^ BsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公SvB(t) = sB(t) + P FsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF (t)为被摄目标的初始声音信号,sB (t)为解说初始声音信号,βΒ为解说声音到第一麦克风的衰减系数,PF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号; 根据公式Sf (t) =vF (t) - β BvB (t)获取所述第一麦克风得到的最终声音信号Sf (t),根据&SSB(t)=vB(t)-i3FvF(t)获取所述第二麦克风得到的最终声音信号Sb(t); 对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’F(t)和解说声音信号sB’ (t)。
2.根据权利要求I所述的方法,其特征在于,在所述对所述&(0和所述SB(t)进行自动增益调整之前,还包括>1 嘗所述 Vf(t)和 vB(t)代入所述 Sf(t),得到 SF(t)=sF(t) (1-βΒβρ) + (1-βΒ)η( ) ;>!嘗所述 vF (t)和 vB (t)代入所述 Sb (t),得到 Sb (t) = sB (t) (I- β Β β F) + (I-β F) n (t)。
3.根据权利要求2所述的方法,其特征在于,所述对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’F(t)和解说声音信号sB’ (t)包括 调节所述&(0和所述SB(t)的信号增益值,将调节后的SF(t)信号作为s’F(t),将调节后的Sb⑴信号作为sB’⑴。
4.根据权利要求I所述的方法,其特征在于,在所述获得被摄目标的声音信号s’F(t)和解说声音信号Sb’ (t)之后,还包括 根据用户需要分别对所述s’F(t)和所述sB’ (t)的声音强度进行调节;或者, 根据用户需要对所述s’F(t)和所述sB’ (t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
6.一种摄像声音提取装置,其特征在于,包括 第一信号获取单元,用于根据公式%(0 = sF(t) + ^BsB(t)+n(t)获取第一麦克风得到的初始声音信号vF (t),根据公式vB (t) = sB(t) + ^ FsF(t)+n(t)获取第二麦克风得到的初始声音信号Vb (t),其中,Sf (t)为被摄目标的初始声音信号,Sb (t)为解说初始声音信号,βΒ为解说声音到第一麦克风的衰减系数,β P为被摄目标声音到第二麦克风的衰减系数,n (t)为噪声信号; 第二信号获取单元,用于根据公式Sf (t) =Vf (t) - β BvB (t)获取所述第一麦克风得到的最终声音信号Sf (t),根据公式Sb (t) =vB (t) - β FvF (t)获取所述第二麦克风得到的最终声音信号Sb (t); 调整单元,用于对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s’F(t)和解说声音信号sB’(t)。
7.根据权利要求6所述的装置,其特征在于,所述第二信号获取单元还包括 第一计算子单元,用于将所述Vf⑴和Vb⑴代入所述Sf (t),得到Sf (t) = Sf (t)(1-β Ββ f) + (1-3 B)n(t);第二计算子单元,用于将所述Vf⑴和νΒ⑴代入所述Sb (t),得到Sb (t) = Sb (t)(I- β B β F) + (I- β F) n (t)。
8.根据权利要求7所述的装置,其特征在于,所述调整单元还用于 调节所述&(0和所述SB(t)的增益值,将调节后的SF(t)信号作为s’F(t),将调节后的SB(t)信号作为Sb’⑴。
9.根据权利要求6所述的装置,其特征在于,还包括 第一音量调节单元,用于根据用户需要分别对所述s’F(t)和所述sB’ (t)的声音强度进行调节;或者, 第二音量调节单元,用于根据用户需要对所述s’F(t)和所述SB’ (t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
全文摘要
本发明实施例公开了一种摄像声音提取方法及装置,所述方法包括根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;根据公式SF(t)=vF(t)-βBvB(t)获取第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取第二麦克风得到的最终声音信号SB(t);对SF(t)和SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。本发明适用于在摄像过程中对不同目标的声音进行区分和调整。
文档编号G10L21/0272GK102969003SQ201210461668
公开日2013年3月13日 申请日期2012年11月15日 优先权日2012年11月15日
发明者闫正航 申请人:东莞宇龙通信科技有限公司, 宇龙计算机通信科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1