实现对象音频录音的方法及装置、电子设备的制造方法_5

文档序号：9351149阅读：来源：国知局

合。在一个示例性实施例中，通信组件1916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件1916还包括近场通信（NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别（RFID)技术，红外数据协会（IrDA)技术，超宽带（UWB)技术，蓝牙（BT)技术和其他技术来实现。
[0218] 在示例性实施例中，装置1900可以被一个或多个应用专用集成电路（ASIC)、数字信号处理器（DSP)、数字信号处理设备（DSPD)、可编程逻辑器件（PLD)、现场可编程门阵列 (FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。
[0219] 在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1904,上述指令可由装置1900的处理器1920执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器（RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
[0220] 本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0221] 应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1. 一种实现对象音频录音的方法，其特征在于，包括：通过多个麦克风同时执行声音采集操作，得到混合声音信号；根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号；组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据。2. 根据权利要求1所述的方法，其特征在于，所述根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号，包括：根据每个声源发出的声音信号在各个麦克风之间形成的幅度差与相位差，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号。3. 根据权利要求1所述的方法，其特征在于，所述根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号，包括：根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量和每个声源的位置信息；根据所述混合声音信号，每个麦克风的设置位置信息，以及所述声源数量和所述声源的位置信息，从所述混合声音信号中分离出对应于每个声源的对象声音信号。4. 根据权利要求3所述的方法，其特征在于，所述根据所述混合声音信号，每个麦克风的设置位置信息，以及所述声源数量和所述声源的位置信息，从所述混合声音信号中分离出对应于每个声源的对象声音信号，包括：根据每个声源发出的声音信号在预设维度形成的特征量，建立对应的统计模型；通过所述统计模型识别并分离出所述混合声音信号中符合任一声源的位置信息的声音信号，作为对应于所述任一声源的对象声音信号。5. 根据权利要求1所述的方法，其特征在于，所述组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据，包括：按照各个声源之间的排列顺序，对相应的对象声音信号进行组合，得到多对象音频数据；按照所述排列顺序对各个声源的位置信息进行组合，得到对象音频辅助数据；将包含预设参数的头文件信息、所述多对象音频数据和所述对象音频辅助数据进行依次拼接，得到所述对象音频格式的音频数据。6. 根据权利要求1所述的方法，其特征在于，所述组合每个声源的位置信息和对象声音信号，得到对象音频格式的音频数据，包括：生成包含预设参数的头文件信息，并发送至预设音频处理设备；其中，所述头文件信息中包含每帧音频数据的时间长度；通过下述步骤生成符合所述每帧音频数据的时间长度的每帧对象音频格式的音频数据，并依次将每帧对象音频格式的音频数据发送至所述预设音频处理设备：按照各个声源之间的排列顺序，对相应的对象声音信号进行组合，得到多对象音频数据；按照所述排列顺序对各个声源的位置信息进行组合，得到对象音频辅助数据；将所述多对象音频数据和所述对象音频辅助数据进行依次拼接，得到每帧对象音频格式的音频数据。7. 根据权利要求5或6所述的方法，其特征在于，所述按照各个声源之间的排列顺序，对相应的对象声音信号进行组合，得到多对象音频数据，包括：按照预设采样频率，在每个采样时间点分别对各个声源对应的对象声音信号进行采样，并按照所述排列顺序对所有采样信号进行排列，得到组合采样信号；按照采样顺序，将每个采样时间点得到的组合采样信号进行依次排列，得到所述多对象音频数据。8. 根据权利要求5或6所述的方法，其特征在于，所述按照所述排列顺序对各个声源的位置信息进行组合，得到对象音频辅助数据，包括：按照预设采样频率，在每个采样时间点分别对各个声源对应的位置信息进行采样，并将得到的每个采样位置信息与对应的声源信息、采样时间点信息进行关联记录，得到组合采样位置信息；按照采样顺序，将每个采样时间点得到的组合采样位置信息进行依次排列，得到所述对象音频辅助数据。9. 根据权利要求5或6所述的方法，其特征在于，所述按照所述排列顺序对各个声源的位置信息进行组合，得到对象音频辅助数据，包括：按照预设采样频率，分别对各个声源对应的位置信息进行采样；其中，若当前采样点为首个采样时间点，则将得到的每个采样位置信息与对应的声源信息、采样时间点信息进行关联记录；若当前采样点为非首个采样时间点，则将得到的每个声源的采样位置信息与已记录的同一声源的上一采样位置信息进行比较，并将比较结果为不同的采样位置信息与对应的声源信息、采样时间点信息进行关联记录。10. -种实现对象音频录音的装置，其特征在于，包括：采集单元，通过多个麦克风同时执行声音采集操作，得到混合声音信号；处理单元，根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号；组合单元，组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据。11. 根据权利要求10所述的装置，其特征在于，所述处理单元包括：处理子单元，根据每个声源发出的声音信号在各个麦克风之间形成的幅度差与相位差，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号。12. 根据权利要求10所述的装置，其特征在于，所述处理单元包括：识别子单元，根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量和每个声源的位置信息；分离子单元，根据所述混合声音信号，每个麦克风的设置位置信息，以及所述声源数量和所述声源的位置信息，从所述混合声音信号中分离出对应于每个声源的对象声音信号。13. 根据权利要求12所述的装置，其特征在于，所述分离子单元包括：模型建立模块，根据每个声源发出的声音信号在预设维度形成的特征量，建立对应的统计模型；分离模块，通过所述统计模型识别并分离出所述混合声音信号中符合任一声源的位置信息的声音信号，作为对应于所述任一声源的对象声音信号。14. 根据权利要求10所述的装置，其特征在于，所述组合单元包括：信号组合子单元，按照各个声源之间的排列顺序，对相应的对象声音信号进行组合，得到多对象音频数据；位置组合子单元，按照所述排列顺序对各个声源的位置信息进行组合，得到对象音频辅助数据；第一拼接子单元，将包含预设参数的头文件信息、所述多对象音频数据和所述对象音频辅助数据进行依次拼接，得到所述对象音频格式的音频数据。15. 根据权利要求10所述的装置，其特征在于，所述组合单元包括：头文件发送子单元，生成包含预设参数的头文件信息，并发送至预设音频处理设备；其中，所述头文件信息中包含每帧音频数据的时间长度，以使信号组合子单元、位置组合子单元和拼接子单元生成符合所述每帧音频数据的时间长度的每帧对象音频格式的音频数据；信号组合子单元，按照各个声源之间的排列顺序，对相应的对象声音信号进行组合，得到多对象音频数据；位置组合子单元，按照所述排列顺序对各个声源的位置信息进行组合，得到对象音频辅助数据；第二拼接子单元，将所述多对象音频数据和所述对象音频辅助数据进行依次拼接，得到每帧对象音频格式的音频数据；音频数据发送子单元，依次将每帧对象音频格式的音频数据发送至所述预设音频处理设备。16. 根据权利要求14或15所述的装置，其特征在于，所述信号组合子单元包括：信号采样模块，按照预设采样频率，在每个采样时间点分别对各个声源对应的对象声音信号进行采样，并按照所述排列顺序对所有采样信号进行排列，得到组合采样信号；信号排列模块，按照采样顺序，将每个采样时间点得到的组合采样信号进行依次排列，得到所述多对象音频数据。17. 根据权利要求14或15所述的装置，其特征在于，所述位置组合子单元包括：第一位置记录模块，按照预设采样频率，在每个采样时间点分别对各个声源对应的位置信息进行采样，并将得到的每个采样位置信息与对应的声源信息、采样时间点信息进行关联记录，得到组合采样位置信息；位置排列模块，按照采样顺序，将每个采样时间点得到的组合采样位置信息进行依次排列，得到所述对象音频辅助数据。18. 根据权利要求14或15所述的装置，其特征在于，所述位置组合子单元包括：位置采样模块，按照预设采样频率，分别对各个声源对应的位置信息进行采样；第二位置记录模块，若当前采样点为首个采样时间点，则将得到的每个采样位置信息与对应的声源信息、采样时间点信息进行关联记录；若当前采样点为非首个采样时间点，则将得到的每个声源的采样位置信息与已记录的同一声源的上一采样位置信息进行比较，并将比较结果为不同的采样位置信息与对应的声源信息、采样时间点信息进行关联记录。19. 一种电子设备，其特征在于，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：通过多个麦克风同时执行声音采集操作，得到混合声音信号；根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号；组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据。
【专利摘要】本公开是关于实现对象音频录音的方法及装置、电子设备，该方法可以包括：通过多个麦克风同时执行声音采集操作，得到混合声音信号；根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号；组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据。通过本公开的技术方案，可以实现对象音频的直接录音。
【IPC分类】G11B27/031, G10L21/028
【公开号】CN105070304
【申请号】CN201510490373
【发明人】史润宇, 颜嘉甫, 杜慧
【申请人】小米科技有限责任公司
【公开日】2015年11月18日
【申请日】2015年8月11日

完整全部详细技术资料下载

当前第5页1 2 3 4 5