实现对象音频录音的方法及装置、电子设备的制造方法_4

文档序号:9351149阅读:来源:国知局
,该实施例在前述图12所示实施例的基础上,分离子单元1002C包括:模型建立模 块1002C1和分离模块1002C2。
[0181] 其中,模型建立模块1002C1,被配置为根据每个声源发出的声音信号在预设维度 形成的特征量,建立对应的统计模型;
[0182] 分离模块1002C2,被配置为通过所述统计模型识别并分离出所述混合声音信号中 符合任一声源的位置信息的声音信号,作为对应于所述任一声源的对象声音信号。
[0183] 如图14所示,图14是根据一示例性实施例示出的另一种实现对象音频录音的装 置的框图,该实施例在前述图10所示实施例的基础上,组合单元1003包括:信号组合子单 元1003A、位置组合子单元1003B和第一拼接子单元1003C。
[0184] 其中,信号组合子单元1003A,被配置为按照各个声源之间的排列顺序,对相应的 对象声音信号进行组合,得到多对象音频数据;
[0185] 位置组合子单元1003B,被配置为按照所述排列顺序对各个声源的位置信息进行 组合,得到对象音频辅助数据;
[0186] 第一拼接子单元1003C,被配置为将包含预设参数的头文件信息、所述多对象音频 数据和所述对象音频辅助数据进行依次拼接,得到所述对象音频格式的音频数据。
[0187] 需要说明的是,上述图14所示的装置实施例中的信号组合子单元1003A、位置组 合子单元1003B和第一拼接子单元1003C的结构也可以包含在前述图11-13的装置实施例 中,对此本公开不进行限制。
[0188] 如图15所示,图15是根据一示例性实施例示出的另一种实现对象音频录音的装 置的框图,该实施例在前述图10所示实施例的基础上,组合单元1003包括:头文件发送子 单元1003D、信号组合子单元1003A、位置组合子单元1003B、第二拼接子单元1003E和音频 数据发送子单元1003F。
[0189] 头文件发送子单元1003D,被配置为生成包含预设参数的头文件信息,并发送至预 设音频处理设备;其中,所述头文件信息中包含每帧音频数据的时间长度,以使信号组合子 单元、位置组合子单元和拼接子单元生成符合所述每帧音频数据的时间长度的每帧对象音 频格式的音频数据;
[0190] 信号组合子单元1003A,被配置为按照各个声源之间的排列顺序,对相应的对象声 音信号进行组合,得到多对象音频数据;
[0191] 位置组合子单元1003B,被配置为按照所述排列顺序对各个声源的位置信息进行 组合,得到对象音频辅助数据;
[0192] 第二拼接子单元1003E,被配置为将所述多对象音频数据和所述对象音频辅助数 据进行依次拼接,得到每帧对象音频格式的音频数据;
[0193] 音频数据发送子单元1003F,被配置为依次将每帧对象音频格式的音频数据发送 至所述预设音频处理设备。
[0194] 需要说明的是,上述图14所示的装置实施例中的头文件发送子单元1003D、信号 组合子单元1003A、位置组合子单元1003B、第二拼接子单元1003E和音频数据发送子单元 1003F的结构也可以包含在前述图11-13的装置实施例中,对此本公开不进行限制。
[0195] 如图16所示,图16是根据一示例性实施例示出的另一种实现对象音频录音的装 置的框图,该实施例在前述图14或15所示实施例的基础上,信号组合子单元1003A包括: 信号采样模块1003A1和信号排列模块1003A2。
[0196] 其中,信号采样模块1003A1,被配置为按照预设采样频率,在每个采样时间点分 别对各个声源对应的对象声音信号进行采样,并按照所述排列顺序对所有采样信号进行排 列,得到组合采样信号;
[0197] 信号排列模块1003A2,被配置为按照采样顺序,将每个采样时间点得到的组合采 样信号进行依次排列,得到所述多对象音频数据。
[0198] 如图17所示,图17是根据一示例性实施例示出的另一种实现对象音频录音的装 置的框图,该实施例在前述图14或15所示实施例的基础上,位置组合子单元1003B包括: 第一位置记录模块1003B1和位置排列模块1003B2。
[0199] 其中,第一位置记录模块1003B1,被配置为按照预设采样频率,在每个采样时间点 分别对各个声源对应的位置信息进行采样,并将得到的每个采样位置信息与对应的声源信 息、采样时间点信息进行关联记录,得到组合采样位置信息;
[0200] 位置排列模块1003B2,被配置为按照采样顺序,将每个采样时间点得到的组合采 样位置信息进行依次排列,得到所述对象音频辅助数据。
[0201] 如图18所示,图18是根据一示例性实施例示出的另一种实现对象音频录音的装 置的框图,该实施例在前述图14或15所示实施例的基础上,位置组合子单元1003B包括: 位置采样模块1003B3和第二位置记录模块1003B4。
[0202] 其中,位置采样模块1003B3,被配置为按照预设采样频率,分别对各个声源对应的 位置信息进行采样;
[0203] 第二位置记录模块1003B4,被配置为若当前采样点为首个采样时间点,则将得到 的每个采样位置信息与对应的声源信息、采样时间点信息进行关联记录;若当前采样点为 非首个采样时间点,则将得到的每个声源的采样位置信息与已记录的同一声源的上一采样 位置信息进行比较,并将比较结果为不同的采样位置信息与对应的声源信息、采样时间点 信息进行关联记录。
[0204] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法 的实施例中进行了详细描述,此处将不做详细阐述说明。
[0205] 对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实 施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件 说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以 不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的 需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付 出创造性劳动的情况下,即可以理解并实施。
[0206] 相应的,本公开还提供一种实现对象音频录音的装置,包括:处理器;用于存储处 理器可执行指令的存储器;其中,所述处理器被配置为:通过多个麦克风同时执行声音采 集操作,得到混合声音信号;根据所述混合声音信号,以及每个麦克风的设置位置信息,从 所述混合声音信号中识别出声源数量、每个声源的位置信息,并分离出对应于每个声源的 对象声音信号;组合各个声源的位置信息和对象声音信号,得到对象音频格式的音频数据。
[0207] 相应的,本公开还提供一种终端,所述终端包括有存储器,以及一个或者一个以上 的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处 理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:通过多个麦克风同时 执行声音采集操作,得到混合声音信号;根据所述混合声音信号,以及每个麦克风的设置位 置信息,从所述混合声音信号中识别出声源数量、每个声源的位置信息,并分离出对应于每 个声源的对象声音信号;组合各个声源的位置信息和对象声音信号,得到对象音频格式的 音频数据。
[0208] 图19是根据一示例性实施例示出的一种用于实现对象音频录音的装置1900的框 图。例如,装置1900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台, 平板设备,医疗设备,健身设备,个人数字助理等。
[0209] 参照图19,装置1900可以包括以下一个或多个组件:处理组件1902,存储器 1904,电源组件1906,多媒体组件1908,音频组件1910,输入/输出(I/O)的接口 1912,传 感器组件1914,以及通信组件1916。
[0210]处理组件1902通常控制装置1900的整体操作,诸如与显示,电话呼叫,数据通信, 相机操作和记录操作相关联的操作。处理组件1902可以包括一个或多个处理器1920来执 行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1902可以包括一个或多个 模块,便于处理组件1902和其他组件之间的交互。例如,处理组件1902可以包括多媒体模 块,以方便多媒体组件19019和处理组件1902之间的交互。
[0211] 存储器1904被配置为存储各种类型的数据以支持在装置1900的操作。这些数据 的示例包括用于在装置1900上操作的任何应用程序或方法的指令,联系人数据,电话簿数 据,消息,图片,视频等。存储器1904可以由任何类型的易失性或非易失性存储设备或者它 们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可 擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(R0M),磁存储器, 快闪存储器,磁盘或光盘。
[0212] 电源组件1906为装置1900的各种组件提供电力。电源组件1906可以包括电源 管理系统,一个或多个电源,及其他与为装置1900生成、管理和分配电力相关联的组件。
[0213] 多媒体组件1908包括在所述装置1900和用户之间的提供一个输出接口的屏幕。 在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面 板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸 传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动 动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中, 多媒体组件1908包括一个前置摄像头和/或后置摄像头。当装置1900处于操作模式,如 拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个 前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0214] 音频组件1910被配置为输出和/或输入音频信号。例如,音频组件1910包括一 个麦克风(MIC),当装置1900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦 克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1904或 经由通信组件1916发送。在一些实施例中,音频组件1910还包括一个扬声器,用于输出音 频信号。
[0215] I/O接口 1912为处理组件1902和外围接口模块之间提供接口,上述外围接口模块 可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和 锁定按钮。
[0216] 传感器组件1914包括一个或多个传感器,用于为装置1900提供各个方面的状态 评估。例如,传感器组件1914可以检测到装置1900的打开/关闭状态,组件的相对定位, 例如所述组件为装置1900的显示器和小键盘,传感器组件1914还可以检测装置1900或装 置1900 -个组件的位置改变,用户与装置1900接触的存在或不存在,装置1900方位或加 速/减速和装置1900的温度变化。传感器组件1914可以包括接近传感器,被配置用来在 没有任何的物理接触时检测附近物体的存在。传感器组件1914还可以包括光传感器,如 CMOS或C⑶图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1914还 可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0217] 通信组件1916被配置为便于装置1900和其他设备之间有线或无线方式的通信。 装置1900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1