定向拾音方法、录音设备和存储介质与流程

文档序号:18603041发布日期:2019-09-03 22:56阅读:871来源:国知局
定向拾音方法、录音设备和存储介质与流程

本发明涉及音频处理技术领域,尤其涉及一种定向拾音方法、录音设备和存储介质。



背景技术:

市场上大部分录音设备,例如录音笔、录音机以及桌面会议记录仪等录音设备已经走进了大众视野。随着生活水平的提高,人们对录音设备的要求越来越高,越来越多的录音设备也具备定向录音这一功能。

然而,大多数录音设备都是通过用户对录音设备的调整来确定录音方向,再选取与录音方向对应的麦克风所录制的声音数据,并对选取的声音数据进行增强,从而实现指定方向的定向拾音。但是,在实际应用中,录音设备中麦克风的指定方向并不明确,进而或多或少的收录非指定方向的声音,使得录音设备的定向拾音难以达到最佳效果。



技术实现要素:

本发明的主要目的在于提供了一种定向拾音方法、录音设备和存储介质,旨在解决录音设备的定向拾音功能难以达到预期效果的技术问题。

为实现上述目的,本发明提供了一种定向拾音方法,包括以下步骤:

获取采集到的多个目标声音以及用户输入的定向拾音指令,并对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致;

将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音,并对所述指向声音进行降噪。

可选地,所述对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致的步骤包括:

从采集到的多个目标声音中确定预设基准麦克风采集的声音,并将预设基准麦克风采集的声音作为标准声音,采集到的多个目标声音中除所述标准声音之外的目标声音作为非标准声音;

确定所述标准声音的时序,并根据所述标准声音的时序调整所述非标准声音的时序,以使得所述非标准声音的时序与所述标准声音的时序一致。

可选地,所述获取采集到的多个目标声音以及用户输入的定向拾音指令的步骤包括:

根据用户在显示界面上的操作生成对应的定向拾音指令,并根据所述定向拾音指令通过麦克风阵列中的各个麦克风采集声音;

将所述各个麦克风采集到的声音作为目标声音。

可选地,所述获取采集到的多个目标声音以及用户输入的定向拾音指令的步骤之后,还包括:

根据用户输入的定向拾音指令确定对应的水平角值以及仰角值,并将所述水平角值以及所述仰角值显示在所述显示界面上;

所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤包括:

根据所述水平角值以及所述仰角值确定对应的指向方位,并将所述多个目标声音中与所述指向方位对应的目标声音作为所述指向声音。

可选地,所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤之后,还包括:

对所述指向声音进行信号采样以及归一化处理;

将归一化处理后的指向声音输入至预设滤波器中,以增强所述指向声音。

可选地,所述对所述指向声音进行降噪的步骤包括:

将所述指向声音输入至预设噪声估计算法中,以识别所述指向声音中的噪声;

确定所述噪声的频率、振幅以及相位,并输出与所述噪声对应的反噪声,以对所述指向声音进行降噪,其中所述反噪声为与所述噪声频率相同、振幅相同以及相位相反的声波。

可选地,所述对所述指向声音进行降噪的步骤之后,还包括:

将降噪后的指向声音上传至云端服务器,并在获取到用户输入的读取指令后,从云端服务器下载对应的指向声音。

可选地,所述麦克风阵列的型号为es7210,所述麦克风阵列的指向性为全向、心形指向、超级心形指向以及8字型指向中的至少一种;

预设滤波器为空间滤波器、时域滤波器、听觉滤波器以及维纳滤波器中的至少一种;

预设噪声估计算法为对数谱幅度最优估计法和/或mcra(minima-controlled-recursive-averagingalgorithms,递归平均)算法。

此外,为实现上述目的,本发明还提供一种录音设备,所述录音设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的定向拾音程序,所述定向拾音程序被所述处理器执行时实现如上所述定向拾音方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有定向拾音程序,所述定向拾音程序被处理器执行时实现如上所述定向拾音方法的步骤。

本发明提供了一种定向拾音方法、录音设备和存储介质,所述定向拾音方法通过获取采集到的多个目标声音以及用户输入的定向拾音指令,并对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致;将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音,并对所述指向声音进行降噪。从而在录音设备拾取声音的过程中,对录制的各个方向的声音进行时延补偿,再精准的拾取用户指定方向的声音,并对拾取到的声音中的噪声进行降噪处理,进而减少非指向方向的声音对录音结果的干扰,使录音设备的定向拾音达到最佳效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的结构示意图;

图2为本发明定向拾音方法一实施例的流程示意图;

图3为本发明所述对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致的步骤流程细化示意图;

图4为本发明定向拾音方法另一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明终端是一种装置,该装置可以是录音设备,还可以是服务器、电脑、智能手机、平板电脑、便携计算机等具有存储功能的终端设备。

如图1所示,该终端可以包括:处理器1001,例如cpu,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,终端还可以包括摄像头、wi-fi模块等等,在此不再赘述。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要包括输入单元比如键盘,键盘包括无线键盘和有线键盘,用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的定向拾音程序,并执行以下操作:

获取采集到的多个目标声音以及用户输入的定向拾音指令,并对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致;

将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音,并对所述指向声音进行降噪。

进一步地,处理器1001可以调用存储器1005中存储的定向拾音程序,还执行以下操作:

从采集到的多个目标声音中确定预设基准麦克风采集的声音,并将预设基准麦克风采集的声音作为标准声音,采集到的多个目标声音中除所述标准声音之外的目标声音作为非标准声音;

确定所述标准声音的时序,并根据所述标准声音的时序调整所述非标准声音的时序,以使得所述非标准声音的时序与所述标准声音的时序一致。

进一步地,处理器1001可以调用存储器1005中存储的定向拾音程序,还执行以下操作:

根据用户在显示界面上的操作生成对应的定向拾音指令,并根据所述定向拾音指令通过麦克风阵列中的各个麦克风采集声音;

将所述各个麦克风采集到的声音作为目标声音。

进一步地,处理器1001可以调用存储器1005中存储的定向拾音程序,还执行以下操作:

根据用户输入的定向拾音指令确定对应的水平角值以及仰角值,并将所述水平角值以及所述仰角值显示在所述显示界面上;

所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤包括:

根据所述水平角值以及所述仰角值确定对应的指向方位,并将所述多个目标声音中与所述指向方位对应的目标声音作为所述指向声音。

进一步地,处理器1001可以调用存储器1005中存储的定向拾音程序,还执行以下操作:

对所述指向声音进行信号采样以及归一化处理;

将归一化处理后的指向声音输入至预设滤波器中,以增强所述指向声音。

进一步地,处理器1001可以调用存储器1005中存储的定向拾音程序,还执行以下操作:

将所述指向声音输入至预设噪声估计算法中,以识别所述指向声音中的噪声;

确定所述噪声的频率、振幅以及相位,并输出与所述噪声对应的反噪声,以对所述指向声音进行降噪,其中所述反噪声为与所述噪声频率相同、振幅相同以及相位相反的声波。

进一步地,处理器1001可以调用存储器1005中存储的定向拾音程序,还执行以下操作:

将降噪后的指向声音上传至云端服务器,并在获取到用户输入的读取指令后,从云端服务器下载对应的指向声音。

本终端的具体实施例与下述定向拾音方法各实施例基本相同,在此不作赘述。

请参阅图2,图2为本发明定向拾音方法一实施例的流程示意图,本实施例提供的定向拾音方法包括如下步骤:

步骤s10,获取采集到的多个目标声音以及用户输入的定向拾音指令,并对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致;

本实施例中的录音设备内置有多个麦克风,获取采集到的多个目标声音以及用户输入的定向拾音指令,所述定向拾音指令为用户输入的确定拾音方位的指令。容易理解的,录音设备中内置的多个麦克风与发声源的位置是不同的,因此采集到的多个目标声音的时序也各不相同。一般来说,距离发声源最近的麦克风,最先接收到声音,距离发声源最远的麦克风,最晚接收到声音,声音延长较长。本实施例中,对多个目标声音进行时延补偿,以使得多个目标声音的时序一致。

步骤s20,将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音,并对所述指向声音进行降噪。

得到时序一致的多个目标声音后,由于所述定向拾音指令包含有方位信息,则从多个目标声音中提取与所述方位信息对应的目标声音,并将所述目标声音作为指向声音,所述指向声音即录音设备收录的与用户指定方向对应的声音。对指向声音进行降噪,以增强录音设备的定向拾音效果。

本实施例提供了一种定向拾音方法,通过获取采集到的多个目标声音以及用户输入的定向拾音指令,并对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致;将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音,并对所述指向声音进行降噪。从而在录音设备拾取声音的过程中,对录制的各个方向的声音进行时延补偿,再精准的拾取用户指定方向的声音,并对拾取到的声音中的噪声进行降噪处理,进而减少非指向方向的声音对录音结果的干扰,使录音设备的定向拾音达到最佳效果。

进一步地,请参阅图3,图3为本发明所述对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致的步骤流程细化示意图,所述对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致的步骤包括:

步骤s11,从采集到的多个目标声音中确定预设基准麦克风采集的声音,并将预设基准麦克风采集的声音作为标准声音,采集到的多个目标声音中除所述标准声音之外的目标声音作为非标准声音;

步骤s12,确定所述标准声音的时序,并根据所述标准声音的时序调整所述非标准声音的时序,以使得所述非标准声音的时序与所述标准声音的时序一致。

如上所述,录音设备中包括有多个麦克风,各个麦克风录制的声音在时序上存在不同。在本实施例中,预先设置一个麦克风为基准麦克风,并将预设基准麦克风采集的声音作为标准声音,那么在对目标声音进行时延补偿这一过程中,以录音设备收录的标准声音的时序作为标准;将采集到的多个目标声音中除所述标准声音之外的目标声音作为非标准声音,也就是说,在对目标声音进行时延补偿这一过程中,只需要对非标准声音进行时序上的调整。

将多个目标声音划分为标准声音以及非标准声音后,确定所述标准声音的时序,并以所述标准声音的时序作为基准,调整非标准声音的时序,以使得非标准声音的时序与标准声音的时序一致,从而使得获取的多个目标声音的时序一致,实现对录制声音的时延补偿。本实施例通过上述方式,对目标声音进行时延补偿,从而减少非指向方向的声音对录音结果的干扰。

进一步地,所述获取采集到的多个目标声音以及用户输入的定向拾音指令的步骤包括:

步骤s13,根据用户在显示界面上的操作生成对应的定向拾音指令,并根据所述定向拾音指令通过麦克风阵列中的各个麦克风采集声音;

步骤s14,将所述各个麦克风采集到的声音作为目标声音。

特别的,根据用户在显示界面上的操作生成对应的定向拾音指令,容易理解的是,用户也可以通过其他方式生成对应的定向拾音指令,例如,用户可以通过调整终端的方位,来产生对应的定向拾音指令;用户也可以通过直接输入方位信息,来产生对应的定向拾音指令,本实施例在此不做具体限制。在获取到用户输入的定向拾音指令后,根据所述定向拾音指令通过麦克风阵列中的各个麦克风采集声音。优选地,为了达到全方位的拾音效果,麦克风阵列中麦克风的组成形式为6+1模式,即6个麦克风围绕中间一个麦克风形成闭环;上述麦克风阵列的型号为es7210,上述麦克风阵列的指向性为全向、心形指向、超级心形指向以及8字型指向中的至少一种。这样一来,全方位的收集录音设备所处环境的声音,并将各个麦克风采集到的声音作为目标声音。

本实施例通过上述方式,全方位的收集录音设备周围的声音,并将其作为目标声音,进而保障用户可以做到360度指定方向进行拾音。

进一步地,上述步骤s10获取采集到的多个目标声音以及用户输入的定向拾音指令之后,还包括:

步骤s30,根据用户输入的定向拾音指令确定对应的水平角值以及仰角值,并将所述水平角值以及所述仰角值显示在所述显示界面上;

所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤包括:

步骤s21,根据所述水平角值以及所述仰角值确定对应的指向方位,并将所述多个目标声音中与所述指向方位对应的目标声音作为所述指向声音。

用户输入的定向拾音指令中包括有用户确定拾音方向的方位信息,具体的,所述定向拾音指令中包含有水平角值以及仰角值,为了让用户确定方位信息的正确性,方便用户判断录音设备定向拾音的方向是否符合预期,将水平角值以及仰角值显示在显示界面上。通过这种方式,如若用户发现此时录音设备拾取声音的方向不符合预期,或用户想更改拾音方向,都可通过重新输入定向拾音指令实现。

容易理解的是,可以根据水平角值以及仰角值确定用户意欲进行拾音的方向,并将上述方向作为指向方向。由于一个目标声音是由一个麦克风所采集到的,而各个麦克风在录音设备上的位置为固定的,因此可以根据水平角值以及仰角值确定录音设备上对应的麦克风,并将所述麦克风录制的目标声音作为指向声音。本实施例通过上述方式,根据定向拾音指令确定录音设备上对应的麦克风,并将所述麦克风录制的声音作为指向声音,精准的实现定向拾音。

进一步地,上述步骤s20将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音之后,还包括:

步骤s40,对所述指向声音进行信号采样以及归一化处理;

步骤s50,将归一化处理后的指向声音输入至预设滤波器中,以增强所述指向声音。

确定指向声音后,对指向声音进行信号采样,上述信号采样,即按照一定的时间间隔在声音数据上逐点采集其瞬时值,从而实现声音的离散化。特别的,对指向声音进行信号采样后,还可以对离散后的声音进行傅里叶变换,并根据使用频段的不同,对不同的声音数据进行加权计算,并将离散的多个声音数据进行归一化处理。对指向声音进行归一化处理后,进一步地,将归一化处理后的指向声音输入至预设滤波器中,以增强所述指向声音,提高指向声音在混响环境下的表现,特别的,预设滤波器为空间滤波器、时域滤波器、听觉滤波器以及维纳滤波器中的至少一种。

本实施例通过上述方式,增强指向方向的声音,进而提高定向拾音的效果。

进一步地,所述对所述指向声音进行降噪的步骤包括:

步骤s22,将所述指向声音输入至预设噪声估计算法中,以识别所述指向声音中的噪声;

步骤s23,确定所述噪声的频率、振幅以及相位,并输出与所述噪声对应的反噪声,以对所述指向声音进行降噪,其中所述反噪声为与所述噪声频率相同、振幅相同以及相位相反的声波。

本实施例中,还预设有噪声估计算法,预设噪声估计算法为对数谱幅度最优估计法和/或mcra算法,使用预设噪声估计算法对所述指向声音进行噪声估计,以识别出指向声音中的噪声,并确定所述噪声的频率、振幅以及相位。再向所述指向声音输入与噪声声波频率相同、振幅相同以及相位相反的反噪声声波实现与噪声的相位抵消,从而对指向声音进行降噪,减少指向声音中的噪声源对录音结果的干扰,使录音设备的定向拾音达到最佳效果。

进一步地,请参阅图4,图4为本发明定向拾音方法另一实施例的流程示意图,上述步骤s20对所述指向声音进行降噪之后,还包括:

步骤s60,将降噪后的指向声音上传至云端服务器,并在获取到用户输入的读取指令后,从云端服务器下载对应的指向声音。

实现对指向声音的增强和降噪后,容易理解的是,此时的指向声音最为理想。本实施例中,还具备指向声音的自动备份功能,将降噪后的指向声音上传至云端服务器,以便用户能随时提取指向声音,相应的,在获取到用户输入的读取指令后,从云端服务器下载并播放对应的指向声音。通过上述方式,实现对指向声音的备份,从而满足用户更多的需求。

进一步地,上述麦克风阵列的型号为es7210,上述麦克风阵列的指向性为全向、心形指向、超级心形指向以及8字型指向中的至少一种;

预设滤波器为空间滤波器、时域滤波器、听觉滤波器以及维纳滤波器中的至少一种;

预设噪声估计算法为对数谱幅度最优估计法和/或mcra(minima-controlled-recursive-averagingalgorithms,递归平均)算法。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有定向拾音程序,所述定向拾音程序被处理器执行时实现如下操作:

获取采集到的多个目标声音以及用户输入的定向拾音指令,并对所述多个目标声音时延补偿,以使得所述多个目标声音的时序一致;

将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音,并对所述指向声音进行降噪。

进一步地,所述定向拾音程序被处理器执行时还实现如下操作:

从采集到的多个目标声音中确定预设基准麦克风采集的声音,并将预设基准麦克风采集的声音作为标准声音,采集到的多个目标声音中除所述标准声音之外的目标声音作为非标准声音;

确定所述标准声音的时序,并根据所述标准声音的时序调整所述非标准声音的时序,以使得所述非标准声音的时序与所述标准声音的时序一致。

进一步地,所述定向拾音程序被处理器执行时还实现如下操作:

根据用户在显示界面上的操作生成对应的定向拾音指令,并根据所述定向拾音指令通过麦克风阵列中的各个麦克风采集声音;

将所述各个麦克风采集到的声音作为目标声音。

进一步地,所述定向拾音程序被处理器执行时还实现如下操作:

根据用户输入的定向拾音指令确定对应的水平角值以及仰角值,并将所述水平角值以及所述仰角值显示在所述显示界面上;

所述将所述多个目标声音中与所述定向拾音指令对应的目标声音作为指向声音的步骤包括:

根据所述水平角值以及所述仰角值确定对应的指向方位,并将所述多个目标声音中与所述指向方位对应的目标声音作为所述指向声音。

进一步地,所述定向拾音程序被处理器执行时还实现如下操作:

对所述指向声音进行信号采样以及归一化处理;

将归一化处理后的指向声音输入至预设滤波器中,以增强所述指向声音。

进一步地,所述定向拾音程序被处理器执行时还实现如下操作:

将所述指向声音输入至预设噪声估计算法中,以识别所述指向声音中的噪声;

确定所述噪声的频率、振幅以及相位,并输出与所述噪声对应的反噪声,以对所述指向声音进行降噪,其中所述反噪声为与所述噪声频率相同、振幅相同以及相位相反的声波。

进一步地,所述定向拾音程序被处理器执行时还实现如下操作:

将降噪后的指向声音上传至云端服务器,并在获取到用户输入的读取指令后,从云端服务器下载对应的指向声音。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1