音频文件的合成方法及装置与流程

文档序号：17593380发布日期：2019-05-03 22:07阅读：164来源：国知局

本公开涉及录音技术领域，尤其涉及一种音频文件的合成方法及装置。

背景技术：

通常，立体声的经典录音方式包括：a/b式，ortf式。a/b式的录音方式要求两个麦克风之间的距离为20inch(50.8cm)；ortf式录音方式要求两个麦克风之间的距离为17cm。由于移动设备的尺寸比较小，移动设备上安装的任一两个麦克风之间的距离有限，不能满足经典的立体声录音的要求。

相关技术中，虽然使用了两颗麦克风，但是录制的立体声效果欠佳，移动设备的麦克风录音位置受到限制。

技术实现要素：

有鉴于此，本公开提供一种音频文件的合成方法及装置，以解决移动设备的麦克风录音位置受到限制的问题。

为实现上述目的，本公开提供技术方案如下：

根据本公开的第一方面，提出了一种音频文件的合成方法，包括：

确定用于录制立体声的第一录音位置及第二录音位置；

确定所述第一录音位置对应的第一录音信号；

确定所述第二录音位置对应的第二录音信号；

基于所述第一录音信号和所述第二录音信号合成音频文件。

在一实施例中，所述确定用于录制立体声的第一录音位置及第二录音位置，包括：

基于录制立体声的预设录音方式确定目标距离；

基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置；

基于所述预设原点、第三麦克风所在的第五录音位置及第四麦克风所在的第六录音位置确定第二录音位置，所述第一录音位置与所述第二录音位置之间的距离与所述目标距离一致。

在一实施例中，所述确定所述第一录音位置对应的第一录音信号，包括：

基于所述第三录音位置及声速确定所述第一录音位置至所述第三录音位置的第一传播时间，以及基于所述第四录音位置及声速确定所述第一录音位置至所述第四录音位置的第二传播时间；

采集语音信号到达所述第一麦克风时的第三录音信号，采集所述语音信号到达所述第二麦克风时的第四录音信号；

基于所述第三录音信号及所述第四录音信号，确定所述语音信号的第一传播方向；

基于所述第一传播时间、所述第二传播时间、所述第三录音信号、所述第四录音信号及所述第一传播方向确定所述第一录音位置对应的第一录音信号。

在一实施例中，所述确定所述第二录音位置对应的第二录音信号，包括：

基于所述第五录音位置及声速确定所述第二录音位置至所述第五录音位置的第三传播时间，以及基于所述第六录音位置及声速确定所述第二录音位置至所述第六录音位置的第四传播时间；

采集语音信号到达所述第三麦克风时的第五录音信号，采集所述语音信号到达所述第四麦克风时的第六录音信号；

基于所述第五录音信号及所述第六录音信号，确定所述语音信号的第二传播方向；

基于所述第三传播时间、所述第四传播时间、所述第五录音信号、所述第六录音信号及所述第二传播方向确定所述第二录音位置对应的第二录音信号。

在一实施例中，所述确定所述第一录音位置对应的第一录音信号，包括：

基于所述第三录音位置，确定所述第一录音位置至所述第三录音位置的第一声压衰减值，基于所述第四录音位置，确定所述第一录音位置至所述第四录音位置的第二声压衰减值；

采集语音信号在到达所述第一麦克风时的第七录音信号，采集所述语音信号在到达所述第二麦克风时的第八录音信号；

基于所述第七录音信号及所述第八录音信号，确定所述语音信号的第三传播方向；

基于所述第一声压衰减值、所述第二声压衰减值、所述第七录音信号、所述第八录音信号及所述第三传播方向确定所述第一录音位置对应的第一录音信号。

在一实施例中，所述确定所述第二录音位置对应的第二录音信号，包括：

基于所述第五录音位置，确定所述第二录音位置至所述第五录音位置的第三声压衰减值，基于所述第六录音位置，确定所述第二录音位置至所述第六录音位置的第四声压衰减值；

采集语音信号在到达所述第三麦克风时的第九录音信号，采集所述语音信号在到达所述第四麦克风时的第十录音信号；

基于所述第九录音信号及所述第十录音信号，确定所述语音信号的第四传播方向；

基于所述第三声压衰减值、所述第四声压衰减值、所述第九录音信号、所述第十录音信号及所述第四传播方向确定所述第二录音位置对应的第二录音信号。

在一实施例中，所述基于所述第一录音信号和所述第二录音信号合成音频文件，包括：

基于所述第一录音信号生成第一音轨；

基于所述第二录音信号生成第二音轨；

基于所述第一音轨和所述第二音轨合成音频文件。

根据本公开的第二方面，提出了一种音频文件的合成装置，包括：

第一确定模块，被配置为确定用于录制立体声的第一录音位置及第二录音位置；

第二确定模块，被配置为确定所述第一录音位置对应的第一录音信号；

第三确定模块，被配置为确定所述第二录音位置对应的第二录音信号；

音频合成模块，被配置为基于所述第二确定模块中确定的所述第一录音信号和所述第三确定模块中确定的所述第二录音信号合成音频文件。

在一实施例中，所述第一确定模块，包括：

距离确定子模块，被配置为基于录制立体声的预设录音方式确定目标距离；

第一确定子模块，被配置为基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置；

第二确定子模块，被配置为基于所述预设原点、第三麦克风所在的第五录音位置及第四麦克风所在的第六录音位置确定第二录音位置，所述第一确定子模块中确定的所述第一录音位置与所述第二录音位置之间的距离与所述距离确定子模块中确定的所述目标距离一致。

在一实施例中，所述第二确定模块，包括：

第一时间确定子模块，被配置为基于所述第三录音位置及声速确定所述第一确定子模块中的所述第一录音位置至所述第三录音位置的第一传播时间，以及基于所述第四录音位置及声速确定所述第一确定子模块中的所述第一录音位置至所述第四录音位置的第二传播时间；

第一采集子模块，被配置为采集语音信号到达所述第一麦克风时的第三录音信号，采集所述语音信号到达所述第二麦克风时的第四录音信号；

第一方向确定子模块，被配置为基于所述第三录音信号及所述第四录音信号，确定所述语音信号的第一传播方向；

第三确定子模块，被配置为基于所述第一时间确定子模块中确定的所述第一传播时间和所述第二传播时间，所述第一采集子模块中采集的所述第三录音信号和所述第四录音信号，以及所述第一方向确定子模块中确定的所述第一传播方向确定所述第一录音位置对应的第一录音信号。

在一实施例中，所述第三确定模块，包括：

第二时间确定子模块，被配置为基于所述第五录音位置及声速确定所述第二确定子模块中的所述第二录音位置至所述第五录音位置的第三传播时间，以及基于所述第六录音位置及声速确定所述第二确定子模块中的所述第二录音位置至所述第六录音位置的第四传播时间；

第二采集子模块，被配置为采集语音信号到达所述第三麦克风时的第五录音信号，采集所述语音信号到达所述第四麦克风时的第六录音信号；

第二方向确定子模块，被配置为基于所述第五录音信号及所述第六录音信号，确定所述语音信号的第二传播方向；

第四确定子模块，被配置为基于所述第二时间确定子模块中确定的所述第三传播时间和所述第四传播时间，所述第二采集子模块中采集的所述第五录音信号和所述第六录音信号，以及所述第二方向确定子模块中确定的所述第二传播方向确定所述第二录音位置对应的第二录音信号。

在一实施例中，所述第二确定模块，包括：

第一衰减值确定子模块，被配置为基于所述第三录音位置，确定所述第一确定子模块中确定的所述第一录音位置至所述第三录音位置的第一声压衰减值，基于所述第四录音位置，确定所述第一确定子模块中确定的所述第一录音位置至所述第四录音位置的第二声压衰减值；

第三采集子模块，被配置为采集语音信号在到达所述第一麦克风时的第七录音信号，采集所述语音信号在到达所述第二麦克风时的第八录音信号；

第三方向确定子模块，被配置为基于所述第七录音信号及所述第八录音信号，确定所述语音信号的第三传播方向；

第五确定子模块，被配置为基于所述第一衰减值确定子模块中确定的所述第一声压衰减值和所述第二声压衰减值，所述第三采集子模块中采集的所述第七录音信号和所述第八录音信号，以及所述第三方向确定子模块中确定的所述第三传播方向确定所述第一录音位置对应的第一录音信号。

在一实施例中，所述第三确定模块，包括：

第二衰减值确定子模块，被配置为基于所述第五录音位置，确定所述第二确定子模块中确定的所述第二录音位置至所述第五录音位置的第三声压衰减值，基于所述第六录音位置，确定所述第二确定子模块中确定的所述第二录音位置至所述第六录音位置的第四声压衰减值；

第四采集子模块，被配置为采集语音信号在到达所述第三麦克风时的第九录音信号，采集所述语音信号在到达所述第四麦克风时的第十录音信号；

第四方向确定子模块，被配置为基于所述第九录音信号及所述第十录音信号，确定所述语音信号的第四传播方向；

第六确定子模块，被配置为基于所述第二衰减值确定子模块中确定的所述第三声压衰减值和所述第四声压衰减值，所述第四采集子模块中采集的所述第九录音信号和所述第十录音信号，以及所述第四方向确定子模块中确定的所述第四传播方向确定所述第二录音位置对应的第二录音信号。

在一实施例中，所述音频合成模块，包括：

第一生成子模块，被配置为基于所述第二确定模块中确定的所述第一录音信号生成第一音轨；

第二生成子模块，被配置为基于所述第三确定模块中确定的所述第二录音信号生成第二音轨；

文件合成子模块，被配置为基于所述第一生成子模块中生成的所述第一音轨和所述第二生成子模块中生成的所述第二音轨合成音频文件。

根据本公开的第三方面，提出了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述第一方面提出的内存检测方法。

根据本申请的第四方面，提出了一种电子设备，所述电子设备包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

确定用于录制立体声的第一录音位置及第二录音位置；

确定所述第一录音位置对应的第一录音信号；

确定所述第二录音位置对应的第二录音信号；

基于所述第一录音信号和所述第二录音信号合成音频文件。

本公开的实施例提供的技术方案可以包括以下有益效果：

终端设备确定录制立体声的第一录音位置及第二录音位置，通过确定第一录音位置对应的第一录音信号以及第二录音位置对应的第二录音信号，终端设备基于第一录音信号和第二录音信号合成音频文件，该音频文件符合产生立体声的要求，解决了移动设备的麦克风录音位置受到限制的问题。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1a是本公开提供的一个音频文件的合成方法的实施例流程图；

图1b是图1a所示实施例中第一录音位置及第二录音位置相对终端设备的位置示意图；

图2是本公开提供的另一个音频文件的合成方法的实施例流程图；

图3是本公开提供的再一个音频文件的合成方法的实施例流程图；

图4是本公开提供的再一个音频文件的合成方法的实施例流程图；

图5是本公开提供的再一个音频文件的合成方法的实施例流程图；

图6是本公开提供的再一个音频文件的合成方法的实施例流程图；

图7是本公开提供的再一个音频文件的合成方法的实施例流程图；

图8是本公开提供的一个音频文件的合成装置的实施例框图；

图9a是图8基础上本公开提供的一个音频文件的合成装置的实施例框图；

图9b是图8基础上本公开提供的另一个音频文件的合成装置的实施例框图；

图10是本公开提供的适用于音频文件的合成装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1a是本公开提供的一个音频文件的合成方法的实施例流程图；图1b是图1a所示实施例中第一录音位置及第二录音位置相对终端设备的位置示意图；如图1a所示，该音频文件的合成方法可以应用在终端设备上，终端设备例如为手机、电脑、智能手表等，如图1a所示，该音频文件的合成方法包括以下步骤：

在步骤101中，确定用于录制立体声的第一录音位置及第二录音位置。

在一实施例中，第一录音位置及第二录音位置为终端设备确定的相对于终端设备的空间位置，第一录音位置与第二录音位置的间距需要满足录制立体声的间距要求。如图1b所示，终端设备11上有4个麦克风：麦克风12、麦克风13、麦克风14和麦克风15。播放设备16向终端设备11发送语音信号。图1b中的a点为第一录音位置，b点为第二录音位置。具体的，终端设备11如何确定用于录制立体声的第一录音位置及第二录音位置的，可参考下述图2中的步骤201-步骤203的相关描述，此处先不做详述。

在步骤102中，确定第一录音位置对应的第一录音信号。

在一实施例中，播放设备开始向终端设备发送语音信号后，终端设备确定第一录音位置对应的第一录音信号，具体的，终端设备如何确定第一录音位置对应的第一录音信号的，可参考下述图3中的步骤301及步骤304的相关描述，或者可参考下述图5中的步骤501及步骤504的相关描述，此处先不做详述。

在步骤103中，确定第二录音位置对应的第二录音信号。

在一实施例中，播放设备开始向终端设备发送语音信号后，终端设备确定第二录音位置对应的第二录音信号，具体的，终端设备如何确定第二录音位置对应的第二录音信号的，可参考下述图4中的步骤401及步骤404的相关描述，或者可参考下述图6中的步骤601及步骤604的相关描述，此处先不做详述。

在步骤104中，基于第一录音信号和第二录音信号合成音频文件。

在一实施例中，终端设备基于第一录音信号和第二录音信号合成音频文件，该音频文件符合产生立体声的要求。

本实施例中，终端设备确定录制立体声的第一录音位置及第二录音位置，通过确定第一录音位置对应的第一录音信号以及第二录音位置对应的第二录音信号，终端设备基于第一录音信号和第二录音信号合成音频文件，该音频文件符合产生立体声的要求，解决了移动设备的麦克风录音位置受到限制的问题。

在一实施例中，确定用于录制立体声的第一录音位置及第二录音位置，具体包括：

基于录制立体声的预设录音方式确定目标距离；

基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置；

基于预设原点、第三麦克风所在的第五录音位置及第四麦克风所在的第六录音位置确定第二录音位置，第一录音位置与第二录音位置之间的距离与目标距离一致。

在一实施例中，确定第一录音位置对应的第一录音信号，具体包括：

基于第三录音位置及声速确定第一录音位置至第三录音位置的第一传播时间，以及基于第四录音位置及声速确定第一录音位置至第四录音位置的第二传播时间；

采集语音信号到达第一麦克风时的第三录音信号，采集语音信号到达第二麦克风时的第四录音信号；

基于第三录音信号及第四录音信号，确定语音信号的第一传播方向；

基于第一传播时间、第二传播时间、第三录音信号、第四录音信号及第一传播方向确定第一录音位置对应的第一录音信号。

在一实施例中，确定第二录音位置对应的第二录音信号，具体包括：

基于第五录音位置及声速确定第二录音位置至第五录音位置的第三传播时间，以及基于第六录音位置及声速确定第二录音位置至第六录音位置的第四传播时间；

采集语音信号到达第三麦克风时的第五录音信号，采集语音信号到达第四麦克风时的第六录音信号；

基于第五录音信号及第六录音信号，确定语音信号的第二传播方向；

基于第三传播时间、第四传播时间、第五录音信号、第六录音信号及第二传播方向确定第二录音位置对应的第二录音信号。

在一实施例中，确定第一录音位置对应的第一录音信号，具体包括：

基于第三录音位置，确定第一录音位置至第三录音位置的第一声压衰减值，基于第四录音位置，确定第一录音位置至第四录音位置的第二声压衰减值；

采集语音信号在到达第一麦克风时的第七录音信号，采集语音信号在到达第二麦克风时的第八录音信号；

基于第七录音信号及第八录音信号，确定语音信号的第三传播方向；

基于第一声压衰减值、第二声压衰减值、第七录音信号、第八录音信号及第三传播方向确定第一录音位置对应的第一录音信号。

在一实施例中，确定第二录音位置对应的第二录音信号，具体包括：

基于第五录音位置，确定第二录音位置至第五录音位置的第三声压衰减值，基于第六录音位置，确定第二录音位置至第六录音位置的第四声压衰减值；

采集语音信号在到达第三麦克风时的第九录音信号，采集语音信号在到达第四麦克风时的第十录音信号；

基于第九录音信号及第十录音信号，确定语音信号的第四传播方向；

基于第三声压衰减值、第四声压衰减值、第九录音信号、第十录音信号及第四传播方向确定第二录音位置对应的第二录音信号。

在一实施例中，基于第一录音信号和第二录音信号合成音频文件，具体包括：

基于第一录音信号生成第一音轨；

基于第二录音信号生成第二音轨；

基于第一音轨和第二音轨合成音频文件。

具体如何合成音频文件的，请参考后续实施例。

至此，本公开实施例提供的上述方法，终端设备通过自身的麦克风也可以录制到符合立体声要求的音频文件，解决了移动设备的麦克风录音位置受到限制的问题。

为对本公开进行进一步说明，提供下列实施例：

图2是本公开提供的另一个音频文件的合成方法的实施例流程图，本实施例利用本公开实施例提供的上述方法，结合图1b，以终端设备如何确定用于录制立体声的第一录音位置及第二录音位置进行示例性说明，如图2所示，包括如下步骤：

在步骤201中，基于录制立体声的预设录音方式确定目标距离。

在一实施例中，预设录音方式可以为终端设备出厂时预设的，或者可以终端设备接收到用户的设定指令，设置对应的预设录音方式。预设录音方式例如包括：a/b式，ortf式。a/b式的录音方式要求两个麦克风之间的距离为20inch(50.8cm)；ortf式录音方式要求两个麦克风之间的距离为17cm。目标距离为预设录音方式对应的两个录音位置之间的距离。以预设录音方式为ortf式为例，则终端设备基于录制立体声的ortf式录音方式确定目标距离为17cm。

在步骤202中，基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置。

在步骤203中，基于预设原点、第三麦克风所在的第五录音位置及第四麦克风所在的第六录音位置确定第二录音位置，第一录音位置与第二录音位置之间的距离与目标距离一致。

在一实施例中，步骤202-步骤203中，预设原点可以为相对终端设备的任一位置点。终端设备对预设的第一麦克风的第三录音位置与预设的第二麦克风的第四录音位置进行连线，得到第一连线，终端设备对预设的第三麦克风的第五录音位置与预设的第四麦克风的第六录音位置进行连线，得到第二连线；终端设备基于预设选取规则，在第一连线上选取第一录音位置，在第二连线上选取第二录音位置，第一录音位置与第六录音位置之间的距离与目标距离一致即可；结合图1b，以第一麦克风12所在的第三录音位置及第二麦克风13所在的第四录音位置确定第一录音位置a(x1，y1)；以第三麦克风14所在的第五录音位置及第四麦克风15所在的第六录音位置确定第二录音位置b(x2，y2)。基于预设原点，终端设备可以确定第一录音位置及第六录音位置的具体数值。以预设原点为第二麦克风13与第三麦克风14连线中点为例，结合步骤201中目标距离为17cm，第一录音位置与第二录音位置之间的距离与目标距离17cm一致，则第一录音位置可以为a(-8.5，0)，第二录音位置可以为b(8.5，0)。本领域技术人员可以理解的是，上述终端设备基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置，以及终端设备基于预设原点、第三麦克风所在的第五录音位置及第四麦克风所在的第六录音位置确定第二录音位置，4枚麦克风的数量仅为示例性说明，3枚麦克风也可以确定第一录音位置及第二录音位置，每两颗麦克风确定一个录音位置即可。

本公开实施例中，终端设备基于录制立体声的预设录音方式确定目标距离，第一录音位置与第二录音位置之间的距离需要与目标距离一致。因此通过设置不同的预设录音方式，可以变换不同目标距离，使得终端设备的第一录音位置及第二录音位置的选择具有灵活性。

图3是本公开提供的再一个音频文件的合成方法的实施例流程图，本实施例利用本公开实施例提供的上述方法，结合图1b，以终端设备如何确定第一录音位置对应的第一录音信号进行示例性说明，如图3所示，包括如下步骤：

在步骤301中，基于第三录音位置及声速确定第一录音位置至第三录音位置的第一传播时间，以及基于第四录音位置及声速确定第一录音位置至第四录音位置的第二传播时间。

在一实施例中，声速v为声音在空气中传播的速度，根据声速v以及第一录音位置至第三录音位置的距离s1，通过速度公式：t1＝s1/v，终端设备可以确定第一录音位置至第三录音位置的第一传播时间t1；同样的，根据声速v以及第一录音位置至第四录音位置的距离s2，通过速度公式：t2＝s2/v，终端设备可以确定第一录音位置至第四录音位置的第二传播时间t2。本领域技术人员可以理解的是，第一麦克风及第二麦克风是终端设备出厂时就安装好的，因此第一麦克风对应的第三录音位置及第二麦克风对应的第四录音位置是已知的。

在步骤302中，采集语音信号到达第一麦克风时的第三录音信号，采集语音信号到达第二麦克风时的第四录音信号。

在一实施例中，结合图1b，终端设备11采集播放设备16发出的语音信号到达第一麦克风12时的第三录音信号f(t3)，其中t3为播放设备16发出的语音信号到达第一麦克风12时的时间；终端设备11采集播放设备16发出的语音信号到达第二麦克风13时的第四录音信号f(t4)，其中t4为播放设备16发出的语音信号到达第二麦克风13时的时间。具体的，终端设备11如何采集第三录音信号及第四录音信号的，可参考相关技术的具体描述，在此不作赘述。

在步骤303中，基于第三录音信号及第四录音信号，确定语音信号的第一传播方向。

在一实施例中，终端设备基于第三录音信号及第四录音信号，确定语音信号的第一传播方向，具体的，终端设备可以根据第三录音信号的幅值与第四录音信号的幅值变化来确定语音信号的第一传播方向；或者，终端设备可以根据比较第三录音信号的时间t3与第四录音信号的时间t4的长短来确定语音信号的第一传播方向，时间长表示离播放设备近，时间短表示离播放设备远。本领域技术人员可以理解的是，终端设备需要判断出播放设备相对终端设备的方向信息，以便为后续计算中的运算做“加”还是“减”提供计算依据。

在步骤304中，基于第一传播时间、第二传播时间、第三录音信号、第四录音信号及第一传播方向确定第一录音位置对应的第一录音信号。

在一实施例中，结合上述步骤301-步骤303，终端设备基于第一传播时间t1、第二传播时间t2、第三录音信号f(t3)、第四录音信号f(t4)及第一传播方向确定第一录音位置对应的第一录音信号。具体的，终端设备可以通过自相关函数将第三录音信号f(t3)、第四录音信号f(t4)合成得到第一录音位置对应的第一录音信号f(t5)。

本公开实施例中，终端设备基于第一传播时间、第二传播时间、第三录音信号、第四录音信号及第一传播方向确定第一录音位置对应的第一录音信号，计算简单，易于实现。

图4是本公开提供的再一个音频文件的合成方法的实施例流程图，本实施例利用本公开实施例提供的上述方法，结合图1b、图3，以终端设备如何确定第二录音位置对应的第二录音信号进行示例性说明，如图4所示，包括如下步骤：

在步骤401中，基于第五录音位置及声速确定第二录音位置至第五录音位置的第三传播时间，以及基于第六录音位置及声速确定第二录音位置至第六录音位置的第四传播时间。

在步骤402中，采集语音信号到达第三麦克风时的第五录音信号，采集语音信号到达第四麦克风时的第六录音信号。

在步骤403中，基于第五录音信号及第六录音信号，确定语音信号的第二传播方向。

在步骤404中，基于第三传播时间、第四传播时间、第五录音信号、第六录音信号及第二传播方向确定第二录音位置对应的第二录音信号。

在上述步骤401-步骤404中，终端设备基于第三传播时间、第四传播时间、第五录音信号、第六录音信号及第二传播方向确定第二录音位置对应的第二录音信号的实现过程可以参考上述图3中的步骤301-步骤304，在此不作赘述。

本公开实施例中，终端设备基于第三传播时间、第四传播时间、第五录音信号、第六录音信号及第二传播方向确定第二录音位置对应的第二录音信号，计算简单，易于实现。

图5是本公开提供的再一个音频文件的合成方法的实施例流程图，本实施例利用本公开实施例提供的上述方法，结合图1b，以终端设备如何确定第一录音位置对应的第一录音信号进行示例性说明，如图5所示，包括如下步骤：

在步骤501中，基于第三录音位置，确定第一录音位置至第三录音位置的第一声压衰减值，基于第四录音位置，确定第一录音位置至第四录音位置的第二声压衰减值。

在一实施例中，本领域技术人员可以理解的是，第一麦克风及第二麦克风是终端设备出厂时就安装好的，因此第一麦克风对应的第三录音位置及第二麦克风对应的第四录音位置是已知的。基于公式：δl＝10lg[1/(4πr)]，其中：δl表示声音传播的距离增加产生的衰减值；r表示播放设备的发声位置至麦克风的距离，终端设备确定第一录音位置至第三录音位置的第一声压衰减值，以及第一录音位置至第四录音位置的第二声压衰减值。

在步骤502中，采集语音信号在到达第一麦克风时的第七录音信号，采集语音信号在到达第二麦克风时的第八录音信号。

在一实施例中，在一实施例中，结合图1b，终端设备11采集播放设备16发出的语音信号到达第一麦克风12时的第七录音信号f(δl1)，其中δl1为播放设备16发出的语音信号到达第一麦克风12时的声压衰减量；终端设备11采集播放设备16发出的语音信号到达第二麦克风13时的第八录音信号f(δl2)，其中δl2为播放设备16发出的语音信号到达第二麦克风13时的声压衰减量。具体的，终端设备11如何采集第七录音信号及第八录音信号的，可参考相关技术的具体描述，在此不作赘述。

在步骤503中，基于第七录音信号及第八录音信号，确定语音信号的第三传播方向。

在一实施例中，终端设备基于第七录音信号及第八录音信号，确定语音信号的第三传播方向，具体的，终端设备可以根据第七录音信号的幅值与第八录音信号的幅值变化来确定语音信号的第三传播方向；或者，终端设备可以根据比较第七录音信号的声压衰减量δl1与第八录音信号的声压衰减量δl2的大小来确定语音信号的第三传播方向，声压衰减量小表示离播放设备近，声压衰减量大表示离播放设备远。本领域技术人员可以理解的是，终端设备需要判断出播放设备相对终端设备的方向信息，以便为后续计算中的运算做“加”还是“减”提供计算依据。

在步骤504中，基于第一声压衰减值、第二声压衰减值、第七录音信号、第八录音信号及第三传播方向确定第一录音位置对应的第一录音信号。

在一实施例中，结合上述步骤501-步骤503，终端设备基于第一声压衰减值δl1、第二声压衰减值δl2、第七录音信号f(δl1)、第八录音信号f(δl2)及第三传播方向确定第一录音位置对应的第一录音信号。具体的，终端设备可以通过自相关函数将第七录音信号f(δl1)、第八录音信号f(δl2)合成得到第一录音位置对应的第一录音信号f(δl3)。

本公开实施例中，终端设备基于第一声压衰减值、第二声压衰减值、第七录音信号、第八录音信号及第三传播方向确定第一录音位置对应的第一录音信号，计算简单，易于实现。

图6是本公开提供的再一个音频文件的合成方法的实施例流程图，本实施例利用本公开实施例提供的上述方法，结合图1b、图5，以终端设备如何确定第二录音位置对应的第二录音信号进行示例性说明，如图6所示，包括如下步骤：

在步骤601中，基于第五录音位置，确定第二录音位置至第五录音位置的第三声压衰减值，基于第六录音位置，确定第二录音位置至第六录音位置的第四声压衰减值。

在步骤602中，采集语音信号在到达第三麦克风时的第九录音信号，采集语音信号在到达第四麦克风时的第十录音信号。

在步骤603中，基于第九录音信号及第十录音信号，确定语音信号的第四传播方向。

在步骤604中，基于第三声压衰减值、第四声压衰减值、第九录音信号、第十录音信号及第四传播方向确定第二录音位置对应的第二录音信号。

在上述步骤601-步骤604中，终端设备基于第三声压衰减值、第四声压衰减值、第九录音信号、第十录音信号及第四传播方向确定第二录音位置对应的第二录音信号的实现过程可以参考上述图5中的步骤501-步骤504，在此不作赘述。

本公开实施例中，终端设备基于第三声压衰减值、第四声压衰减值、第九录音信号、第十录音信号及第四传播方向确定第二录音位置对应的第二录音信号，计算简单，易于实现。

图7是本公开提供的再一个音频文件的合成方法的实施例流程图，本实施例利用本公开实施例提供的上述方法，以终端设备如何基于第一录音信号和第二录音信号合成音频文件进行示例性说明，如图7所示，包括如下步骤：

在步骤701中，基于第一录音信号生成第一音轨。

在步骤702中，基于第二录音信号生成第二音轨。

在步骤703中，基于第一音轨和第二音轨合成音频文件。

步骤701-步骤703中，终端设备基于第一录音信号生成第一音轨，基于第二录音信号生成第二音轨，终端设备基于第一音轨和第二音轨合成可以实现立体声效果的音频文件。具体的，终端设备如何基于第一录音信号生成第一音轨以及终端设备如何基于第二录音信号生成第二音轨的过程描述可参考相关技术，在此不作赘述。

本公开实施例中，终端设备基于第一录音信号和第二录音信号合成音频文件，该音频文件符合产生立体声的要求，解决了移动设备的麦克风录音位置受到限制的问题。

图8是本公开提供的一个音频文件的合成装置的实施例框图，如图8所示，音频文件的合成装置包括：

第一确定模块81，被配置为确定用于录制立体声的第一录音位置及第二录音位置；

第二确定模块82，被配置为确定第一录音位置对应的第一录音信号；

第三确定模块83，被配置为确定第二录音位置对应的第二录音信号；

音频合成模块84，被配置为基于第二确定模块82中确定的第一录音信号和第三确定模块83中确定的第二录音信号合成音频文件。

图9a是图8基础上本公开提供的一个音频文件的合成装置的实施例框图，如图9a所示，在上述图8所示实施例的基础上，第一确定模块81，包括：

距离确定子模块811，被配置为基于录制立体声的预设录音方式确定目标距离；

第一确定子模块812，被配置为基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置；

第二确定子模块813，被配置为基于预设原点、第三麦克风所在的第五录音位置及第四麦克风所在的第六录音位置确定第二录音位置，第一确定子模块812中确定的第一录音位置与第二录音位置之间的距离与距离确定子模块811中确定的目标距离一致。

在一实施例中，第二确定模块82，包括：

第一时间确定子模块821，被配置为基于第三录音位置及声速确定第一确定子模块812中的第一录音位置至第三录音位置的第一传播时间，以及基于第四录音位置及声速确定第一确定子模块812中的第一录音位置至第四录音位置的第二传播时间；

第一采集子模块822，被配置为采集语音信号到达第一麦克风时的第三录音信号，采集语音信号到达第二麦克风时的第四录音信号；

第一方向确定子模块823，被配置为基于第三录音信号及第四录音信号，确定语音信号的第一传播方向；

第三确定子模块824，被配置为基于第一时间确定子模块821中确定的第一传播时间和第二传播时间，第一采集子模块822中采集的第三录音信号和第四录音信号，以及第一方向确定子模块823中确定的第一传播方向确定第一录音位置对应的第一录音信号。

在一实施例中，第三确定模块83，包括：

第二时间确定子模块831，被配置为基于第五录音位置及声速确定第二确定子模块813中的第二录音位置至第五录音位置的第三传播时间，以及基于第六录音位置及声速确定第二确定子模块813中的第二录音位置至第六录音位置的第四传播时间；

第二采集子模块832，被配置为采集语音信号到达第三麦克风时的第五录音信号，采集语音信号到达第四麦克风时的第六录音信号；

第二方向确定子模块833，被配置为基于第五录音信号及第六录音信号，确定语音信号的第二传播方向；

第四确定子模块834，被配置为基于第二时间确定子模块831中确定的第三传播时间和第四传播时间，第二采集子模块832中采集的第五录音信号和第六录音信号，以及第二方向确定子模块833中确定的第二传播方向确定第二录音位置对应的第二录音信号。

在一实施例中，音频合成模块84，包括：

第一生成子模块841，被配置为基于第二确定模块82中确定的第一录音信号生成第一音轨；

第二生成子模块842，被配置为基于第三确定模块83中确定的第二录音信号生成第二音轨；

文件合成子模块，被配置为基于第一生成子模块841中生成的第一音轨和第二生成子模块842中生成的第二音轨合成音频文件。

图9b是图8基础上本公开提供的另一个音频文件的合成装置的实施例框图，如图9b所示，在上述图8所示实施例的基础上，第一确定模块81，包括：

距离确定子模块811，被配置为基于录制立体声的预设录音方式确定目标距离；

第一确定子模块812，被配置为基于预设原点、第一麦克风所在的第三录音位置及第二麦克风所在的第四录音位置确定第一录音位置；

在一实施例中，第二确定模块82，包括：

第一衰减值确定子模块825，被配置为基于第三录音位置，确定第一确定子模块812中确定的第一录音位置至第三录音位置的第一声压衰减值，基于第四录音位置，确定第一确定子模块812中确定的第一录音位置至第四录音位置的第二声压衰减值；

第三采集子模块826，被配置为采集语音信号在到达第一麦克风时的第七录音信号，采集语音信号在到达第二麦克风时的第八录音信号；

第三方向确定子模块827，被配置为基于第七录音信号及第八录音信号，确定语音信号的第三传播方向；

第五确定子模块828，被配置为基于第一衰减值确定子模块825中确定的第一声压衰减值和第二声压衰减值，第三采集子模块826中采集的第七录音信号和第八录音信号，以及第三方向确定子模块827中确定的第三传播方向确定第一录音位置对应的第一录音信号。

在一实施例中，第三确定模块83，包括：

第二衰减值确定子模块835，被配置为基于第五录音位置，确定第二确定子模块813中确定的第二录音位置至第五录音位置的第三声压衰减值，基于第六录音位置，确定第二确定子模块813中确定的第二录音位置至第六录音位置的第四声压衰减值；

第四采集子模块836，被配置为采集语音信号在到达第三麦克风时的第九录音信号，采集语音信号在到达第四麦克风时的第十录音信号；

第四方向确定子模块837，被配置为基于第九录音信号及第十录音信号，确定语音信号的第四传播方向；

第六确定子模块838，被配置为基于第二衰减值确定子模块835中确定的第三声压衰减值和第四声压衰减值，第四采集子模块836中采集的第九录音信号和第十录音信号，以及第四方向确定子模块837中确定的第四传播方向确定第二录音位置对应的第二录音信号。

在一实施例中，音频合成模块84，包括：

第一生成子模块841，被配置为基于第二确定模块82中确定的第一录音信号生成第一音轨；

第二生成子模块842，被配置为基于第三确定模块83中确定的第二录音信号生成第二音轨；

文件合成子模块，被配置为基于第一生成子模块841中生成的第一音轨和第二生成子模块842中生成的第二音轨合成音频文件。

图10是本公开提供的适用于音频文件的合成装置的框图。例如，装置1000可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等终端设备。

参照图10，装置1000可以包括以下一个或多个组件：处理组件1002，存储器1004，电源组件1006，多媒体组件1008，音频组件1010，输入/输出(i/o)的接口1012，传感器组件1014，以及通信组件1016。

处理组件1002通常控制装置1000的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件1002可以包括一个或多个处理器1020来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1002可以包括一个或多个模块，便于处理组件1002和其他组件之间的交互。例如，处理部件1002可以包括多媒体模块，以方便多媒体组件1008和处理组件1002之间的交互。

存储器1004被配置为存储各种类型的数据以支持在设备1000的操作。这些数据的示例包括用于在装置1000上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1004可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1006为装置1000的各种组件提供电力。电源组件1006可以包括电源管理系统，一个或多个电源，及其他与为装置1000生成、管理和分配电力相关联的组件。

多媒体组件1008包括在所述装置1000和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1008包括一个前置摄像头和/或后置摄像头。当设备1000处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1010被配置为输出和/或输入音频信号。例如，音频组件1010包括一个麦克风(mic)，当装置1000处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1004或经由通信组件1016发送。在一些实施例中，音频组件1010还包括一个扬声器，用于输出音频信号。

i/o接口1012为处理组件1002和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1014包括一个或多个传感器，用于为装置1000提供各个方面的状态评估。例如，传感器组件1014可以检测到设备1000的打开/关闭状态，组件的相对定位，例如所述组件为装置1000的显示器和小键盘，传感器组件1014还可以检测装置1000或装置1000一个组件的位置改变，用户与装置1000接触的存在或不存在，装置1000方位或加速/减速和装置1000的温度变化。传感器组件1014可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1014还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1014还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1016被配置为便于装置1000和其他设备之间有线或无线方式的通信。装置1000可以接入基于通信标准的无线网络，如wifi，2g或3g，或它们的组合。在一个示例性实施例中，通信部件1016经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件1016还包括近场通信(nfc)模块，以促进短程通信。例如，在nfc模块可基于射频识别(rfid)技术，红外数据协会(irda)技术，超宽带(uwb)技术，蓝牙(bt)技术和其他技术来实现。

在示例性实施例中，装置1000可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1004，上述指令可由装置1000的处理器1020执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

处理器1020被配置为：

当在屏幕中的预设提示区域检测到音量调节指令时，基于音量调节指令确定需要调节的音量变化值；

基于当前的第一音量值与音量变化值确定需要调节到的第二音量值；

将当前音量调节至第二音量值对应的音量。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张鹏飞
技术所有人：北京小米移动软件有限公司
我是此专利的发明人

上一篇：管道安全监测与预警方法与流程
上一篇：一种带状物的软质头部的制作方法及其制作的鞋带与流程