定向拾音方法、录音设备和存储介质与流程

文档序号：18603041发布日期：2019-09-03 22:56阅读：871来源：国知局

本发明涉及音频处理技术领域，尤其涉及一种定向拾音方法、录音设备和存储介质。

背景技术：

市场上大部分录音设备，例如录音笔、录音机以及桌面会议记录仪等录音设备已经走进了大众视野。随着生活水平的提高，人们对录音设备的要求越来越高，越来越多的录音设备也具备定向录音这一功能。

然而，大多数录音设备都是通过用户对录音设备的调整来确定录音方向，再选取与录音方向对应的麦克风所录制的声音数据，并对选取的声音数据进行增强，从而实现指定方向的定向拾音。但是，在实际应用中，录音设备中麦克风的指定方向并不明确，进而或多或少的收录非指定方向的声音，使得录音设备的定向拾音难以达到最佳效果。

技术实现要素：

本发明的主要目的在于提供了一种定向拾音方法、录音设备和存储介质，旨在解决录音设备的定向拾音功能难以达到预期效果的技术问题。

为实现上述目的，本发明提供了一种定向拾音方法，包括以下步骤：

获取采集到的多个目标声音以及用户输入的定向拾音指令，并对所述多个目标声音时延补偿，以使得所述多个目标声音的时序一致；

将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音，并对所述指向声音进行降噪。

可选地，所述对所述多个目标声音时延补偿，以使得所述多个目标声音的时序一致的步骤包括：

从采集到的多个目标声音中确定预设基准麦克风采集的声音，并将预设基准麦克风采集的声音作为标准声音，采集到的多个目标声音中除所述标准声音之外的目标声音作为非标准声音；

确定所述标准声音的时序，并根据所述标准声音的时序调整所述非标准声音的时序，以使得所述非标准声音的时序与所述标准声音的时序一致。

可选地，所述获取采集到的多个目标声音以及用户输入的定向拾音指令的步骤包括：

根据用户在显示界面上的操作生成对应的定向拾音指令，并根据所述定向拾音指令通过麦克风阵列中的各个麦克风采集声音；

将所述各个麦克风采集到的声音作为目标声音。

可选地，所述获取采集到的多个目标声音以及用户输入的定向拾音指令的步骤之后，还包括：

根据用户输入的定向拾音指令确定对应的水平角值以及仰角值，并将所述水平角值以及所述仰角值显示在所述显示界面上；

所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤包括：

根据所述水平角值以及所述仰角值确定对应的指向方位，并将所述多个目标声音中与所述指向方位对应的目标声音作为所述指向声音。

可选地，所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤之后，还包括：

对所述指向声音进行信号采样以及归一化处理；

将归一化处理后的指向声音输入至预设滤波器中，以增强所述指向声音。

可选地，所述对所述指向声音进行降噪的步骤包括：

将所述指向声音输入至预设噪声估计算法中，以识别所述指向声音中的噪声；

确定所述噪声的频率、振幅以及相位，并输出与所述噪声对应的反噪声，以对所述指向声音进行降噪，其中所述反噪声为与所述噪声频率相同、振幅相同以及相位相反的声波。

可选地，所述对所述指向声音进行降噪的步骤之后，还包括：

将降噪后的指向声音上传至云端服务器，并在获取到用户输入的读取指令后，从云端服务器下载对应的指向声音。

可选地，所述麦克风阵列的型号为es7210，所述麦克风阵列的指向性为全向、心形指向、超级心形指向以及8字型指向中的至少一种；

预设滤波器为空间滤波器、时域滤波器、听觉滤波器以及维纳滤波器中的至少一种；

预设噪声估计算法为对数谱幅度最优估计法和/或mcra(minima-controlled-recursive-averagingalgorithms，递归平均)算法。

此外，为实现上述目的，本发明还提供一种录音设备，所述录音设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的定向拾音程序，所述定向拾音程序被所述处理器执行时实现如上所述定向拾音方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有定向拾音程序，所述定向拾音程序被处理器执行时实现如上所述定向拾音方法的步骤。

本发明提供了一种定向拾音方法、录音设备和存储介质，所述定向拾音方法通过获取采集到的多个目标声音以及用户输入的定向拾音指令，并对所述多个目标声音时延补偿，以使得所述多个目标声音的时序一致；将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音，并对所述指向声音进行降噪。从而在录音设备拾取声音的过程中，对录制的各个方向的声音进行时延补偿，再精准的拾取用户指定方向的声音，并对拾取到的声音中的噪声进行降噪处理，进而减少非指向方向的声音对录音结果的干扰，使录音设备的定向拾音达到最佳效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的结构示意图；

图2为本发明定向拾音方法一实施例的流程示意图；

图3为本发明所述对所述多个目标声音时延补偿，以使得所述多个目标声音的时序一致的步骤流程细化示意图；

图4为本发明定向拾音方法另一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明终端是一种装置，该装置可以是录音设备，还可以是服务器、电脑、智能手机、平板电脑、便携计算机等具有存储功能的终端设备。

如图1所示，该终端可以包括：处理器1001，例如cpu，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、wi-fi模块等等，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要包括输入单元比如键盘，键盘包括无线键盘和有线键盘，用于连接客户端，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的定向拾音程序，并执行以下操作：

获取采集到的多个目标声音以及用户输入的定向拾音指令，并对所述多个目标声音时延补偿，以使得所述多个目标声音的时序一致；

将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音，并对所述指向声音进行降噪。