基于声音识别的动态测向方法、测向系统及可读存储介质与流程

文档序号:18460285发布日期:2019-08-17 01:58阅读:433来源:国知局
基于声音识别的动态测向方法、测向系统及可读存储介质与流程

本发明涉及无人控制设备测向领域,尤其涉及一种基于声音识别的动态测向方法、测向系统及可读存储介质。



背景技术:

随着民用无人机、无人船、无人车等应用技术的不断发展,无人控制设备逐渐普及,其中无人机具有飞行高度低、飞行速度慢、目标体积小等功能特性,同时具有放飞速度快、飞行距离短等使用特性,但无人机的黑飞、乱飞现象也越来越多,严重影响区域安全。

目前常用测向方法有雷达探测法、射频通信法、图片识别法等,但是这几种方法都有一定的局限性,例如,雷达成本较高,同时对于低空、慢速的飞行物体检测难度较大;图形识别法难度较大,不易排除非目标小物体的干扰;射频装置主要用于检测无人机发出的射频通信信息,但是由于环境中无线信号较为复杂,无人机的射频信号能量较小,难以对无人机进行甄别,因此,目前常用的测向方法并不适用于无人机等无人控制设备。



技术实现要素:

本发明提出的一种基于声音识别的动态测向方法、测向系统及可读存储介质,旨在解决目前常用的测向方法并不适用于检测无人控制设备的问题。

为实现上述目的,本发明提供一种基于声音识别的动态测向方法,所述方法包括步骤:

获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组;

根据所述预设时间周期内采集的音频数据组确定无人控制设备的移动方向。

可选地,所述根据所述预设时间周期内采集的音频数据组确定无人控制设备的移动方向的步骤包括:

获取预设时间周期内的音频数据组中的每个单位音频数据的声纹特征;

从所述每个单位音频数据的声纹特征中获取固定音频采集设备和旋转音频采集设备分别对应的声强值x和声强值y;

获取每个单位音频数据对应的声强值y和声强值x间的声强差值z,以获取最大的声强差值z对应的单位音频数据;

根据所述最大的声强差值z对应的单位音频数据获取该单位音频数据中动态旋转音频采集设备采集该音频数据时的采集方向,并将所述采集方向确定为无人控制设备的移动方向。

可选地,所述获取预设时间周期内的音频数据组中的每个单位音频数据的声纹特征的步骤之后,还包括:

判断所述预设时间周期内采集的音频数据组是否与无人控制设备对应的预设声音数据匹配;

若是,则从所述每个单位音频数据的声纹特征中获取固定音频采集设备和旋转音频采集设备分别对应的声强值x和声强值y。

可选地,所述判断所述预设时间周期内采集的音频数据组是否与无人控制设备对应的预设声音数据匹配的步骤包括:

将所述单位音频数据的声纹特征与预设数据库中的无人控制设备对应的声纹特征进行匹配;

当所述单位音频数据的声纹特征与预设数据库中的无人控制设备对应的声纹特征匹配时,则所述预设时间周期内采集的音频数据组与无人控制设备对应的预设声音数据匹配。

可选地,所述获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组的步骤之前,还包括:

获取预设或用户设定的测速精度、无人控制设备最大行驶速度以及动态旋转音频采集设备对应的水平采集角度;

根据所述测速精度、所述无人控制设备最大行驶速度以及所述动态旋转音频采集设备对应的水平采集角度计算时间t;

所述获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组的步骤包括:

在根据时间t控制所述动态旋转音频数据采集设备旋转的情况下,获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组。

可选地,所述根据所述测速精度、所述无人控制设备最大行驶速度以及所述动态旋转音频采集设备对应的水平采集角度计算时间t的步骤包括:

将所述测速精度、所述无人控制设备最大行驶速度以及所述动态旋转音频采集设备对应的水平采集角度代入公式计算所述时间t,所述公式为:

其中,a为测速精度,b为无人控制设备最大行驶速度,c为动态旋转音频采集设备对应的水平采集角度。

可选地,所述在根据时间t控制所述动态旋转音频数据采集设备旋转的情况下,获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组的步骤包括:

获取固定音频采集设备和动态旋转音频采集设备每间隔时间t所同时采集的单位音频数据,其中在相邻两次单位音频数据采集的间隔时间t内,控制动态旋转音频采集设备从当前采集位转移至下一采集位;

将预设周期内的所有单位音频数据作为预设周期内的音频数据组。

可选地,所述根据所述预设时间周期内采集的音频数据组确定无人控制设备的移动方向的步骤之后,还包括:

发送所述无人控制设备的移动方向至用户,以供用户根据所述无人控制设备的移动方向采取相应措施。

此外,为实现上述目的,本发明还提供一种测向系统,所述测向系统包括:通信模块、存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的基于声音识别的动态测向方法的步骤。

此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于声音识别的动态测向方法的步骤。

本发明通过获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组;根据所述预设时间周期内采集的音频数据组确定无人控制设备的移动方向。本发明基于声音识别的测向方法相比目前常用的测向方法更适用于检测无人控制设备,而且本方法相对目前常用的测向方法成本更低。此外,基于声音识别的测向方法更易检测出无人控制设备,同时更易排除非目标物的干扰。

附图说明

图1是本发明实施例方案涉及的测向系统的结构示意图;

图2为本发明基于声音识别的动态测向方法第一实施例的流程示意图;

图3为本发明基于声音识别的动态测向方法第一实施例中涉及的音频采集设备小组示意图;

图4为本发明基于声音识别的动态测向方法第二实施例的流程示意图。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

请参看图1,图1为本发明所提供的测向系统的硬件结构示意图。所述测向系统可以是服务器和/或计算机,其中服务器可以由单台或多台服务器组成。

所述测向系统在硬件结构上可以包括通信模块10、存储器20以及处理器30等部件。在所述测向系统中,所述处理器30分别与所述存储器20以及所述通信模块10连接,所述存储器20上存储有计算机程序,所述计算机程序同时被处理器30执行,所述计算机程序执行时实现下述方法实施例的步骤。

通信模块10,可通过网络与外部通讯设备连接。通信模块10可以接收外部通讯设备发出的请求,还可以发送请求、指令及信息至所述外部通讯设备。所述外部通讯设备可以是用户终端或其他系统服务器等等。

存储器20,可用于存储软件程序以及各种数据。存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组)等;存储数据区可包括数据库,存储数据区可存储根据测向系统的使用所创建的数据或信息等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件。

处理器30,是测向系统的控制中心,利用各种接口和线路连接整个测向系统的各个部分,通过运行或执行存储在存储器20内的软件程序和/或模块,以及调用存储在存储器20内的数据,执行测向系统的各种功能和处理数据,近而对测向系统进行整体监控。处理器30可包括一个或多个处理单元;可选地,处理器30可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器30中。

尽管图1未示出,但上述测向系统还可以包括电路控制模块,用于与电源连接,保证其他部件的正常工作。本领域技术人员可以理解,图1中示出的测向系统结构并不构成对测向系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

基于上述硬件结构,提出本发明方法各个实施例。

请参照图2,图2为本发明基于声音识别的动态测向方法第一实施例的流程示意图,在该实施例中,所述方法包括:

步骤s10,获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组;

本实施例中可设置同轴多个音频采集设备,包括固定音频采集设备和动态旋转音频采集设备,其中,固定音频采集设备是朝某个方向固定不动,动态旋转音频采集设备可以围绕中心点旋转,最大可旋转360°。其中采集设备可为麦克风,每个麦克风的采集角度为水平方向采集角或垂直方向采集角。音频采集设备组可以由一个固定麦克风和多个动态旋转麦克风组成,当音频采集设备组由一个固定麦克风和多个动态旋转麦克风组成时,每个动态旋转麦克风负责一个角度范围,不需要每个动态旋转麦克风转满360°;或者音频采集设备小组由一个固定麦克风和一个动态旋转麦克风组成,可由多个音频采集设备小组组成音频采集设备组,音频采集设备小组中的动态旋转麦克风需要转满360°。对各麦克风之间的轴向距离不做限定,可以是等距或非等距。

请参照图3,图3为本发明基于声音识别的动态测向方法第一实施例涉及的音频采集设备小组示意图,当音频采集设备小组由同轴的一个固定麦克风和一个动态旋转麦克风组成时,其中固定麦克朝某个方向固定在固定轴上,固定麦克风可以采集周围的声音数据并且在角度θ范围内收音效果最好,动态旋转麦克风安装在固定轴上,可围绕中心点旋转360°,预设时间周期为动态旋转麦克风围中心点旋转由起始位置旋转360°再回到该起始位置所需要的时间。预设时间周期设定越短,说明动态旋转麦克风旋转360°所需的时间就越短。在预设时间周期内,固定麦克风和动态旋转麦克风采集到多个音频数据,多个音频数据组成该预设时间周期内的音频数据组。固定音频采集设备和动态旋转音频采集设备与测向系统相连,可采用无线或有线方式连接至测向系统,并实时将采集的音频数据发送至测向系统,以供测向系统分析。

步骤s20,根据所述预设时间周期内采集的音频数据组确定无人控制设备的移动方向。

本实施例固定音频采集设备和动态旋转采集设备在预设时间周期内采集到多个音频数据组成音频数据组,例如,当预设时间周期设定为0.1s,固定音频采集设备和动态旋转采集设备采集当前时间至当前时间加0.1s内的音频数据组成预设时间周期内的音频数据组。根据每一组预设时间周期内采集的音频数据组确定无人机或无人车或无人船等无人控制设备的移动方向,通过固定麦克风和动态旋转麦克风采集预设时间周期内的音频数据确定无人控制设备的移动方向的方法较目前常用的测向方法成本更低。

进一步地,请参照图4,图4为本发明基于声音识别的动态测向方法第二实施例的流程示意图,基于本发明基于声音识别的动态测向方法的第一实施例提出本发明基于声音识别的动态测向方法的第二实施例,在本实施例中,步骤s20包括:

步骤s21,获取预设时间周期内的音频数据组中的每个单位音频数据的声纹特征;

步骤s22,从所述每个单位音频数据的声纹特征中获取固定音频采集设备和旋转音频采集设备分别对应的声强值x和声强值y;

步骤s23,获取每个单位音频数据对应的声强值y和声强值x间的声强差值z,以获取最大的声强差值z对应的单位音频数据;

步骤s24,根据所述最大的声强差值z对应的单位音频数据获取该单位音频数据中动态旋转音频采集设备采集该音频数据时的采集方向,并将所述采集方向确定为无人控制设备的移动方向。

本实施例预设时间周期内的音频数据组由多个单位音频数据组成,提取每个单位音频数据的声纹特征数据,确定特征有时域特征(声强、声压等)、频域特征(频率)、倒谱域特征、lpc系数特征、mfcc特征等。获取每个单位音频数据的声纹特征数据并根据公式计算每个单位音频数据对应的声强值x和声强值y,其中声强x对应的音频数据为固定音频采集设备采集的音频数据,声强y对应的音频数据为动态旋转音频采集设备采集的音频数据。声强计算可以采用多种声强的计算方法,可采用相对值或采用绝对值,计算声音数字信号最简单的方法通过计算周期内采集点的值求和或者求对数,可根据以下公式计算声强值:

本实施例将每个单位音频数据对应的声强y减去声强x得到声强差值z,每个单位音频数据对应一个声强差值z,将多个单位音频数据对应的声强差值z进行对比,选取声强差值z最大的,并获取最大的声强差值z对应的音频数据,根据该单位音频数据获取单位音频数据中动态旋转音频采集该音频数据时的采集方向,该采集方向为无人控制设备的移动方向。

本实施例通过计算预设时间周期内每个音频数据的声强值x和声强值y,从而求得声强差值z,获取最大声强差值z对应的单位音频数据中动态旋转音频采集设备采集该音频数据时的采集方向,从而通过该采集方向就可确定无人控制设备的移动方向。本方法通过声音数据即可确定无人控制设备的移动方向,使无人控制设备的测向方法更简单。

进一步地,步骤s21之后,还包括:

步骤s210,判断所述预设时间周期内采集的音频数据组是否与无人控制设备对应的预设声音数据匹配;若是,则执行步骤s22;

本实施例在获取预设时间周期内的音频数据组中的每个单位音频数据的声纹特征之后,判断这些声纹特征对应音频数据是否与无人控制设备对应预设声音数据匹配,若匹配成功,说明音频数据是无人控制设备产生的声音数据。首先判断采集的音频数据是否为无人控制设备所产生的声音数据,若是,继而计算声强差值,从而判断无人控制设备的方向;若采集的音频数据不是无人控制设备所产生的声音数据,无需继续分析该音频数据,可通过分析音频数据排除非目标物的干扰。

进一步地,步骤s210包括:

步骤s211,将所述单位音频数据的声纹特征与预设数据库中的无人控制设备对应的声纹特征进行匹配;

步骤s212,当所述单位音频数据的声纹特征与预设数据库中的无人控制设备对应的声纹特征匹配时,则所述预设时间周期内采集的音频数据组与无人控制设备对应的预设声音数据匹配。

本实施例中可以预先设置数据库将不同型号的无人机、无人船、无人车等无人控制设备的型号及不同型号无人控制设备对应的声纹特征数据添加至数据库中。实际上,判断预设时间周期内的采集的音频数据是否为无人控制设备对应产生的声音数据主要就是通过声纹特征进行判定的,首先获取单位音频数据的声纹特征,再将声纹特征与数据库中的无人控制设备对应的声纹特征进行匹配,若单位音频数据的声纹特征与数据库中无人控制设备对应的声纹特征匹配成功时,说明声纹特征对应的单位音频数据是无人控制设备产生的声音,即预设时间周期内采集是音频数据与无人控制设备对应的预设声音数据匹配。通过将单位音频数据的声纹特征数据与无人控制设备对应的声纹特征匹配,从而判断预设时间内采集的音频数据是否是无人控制设备所产生的,更易检测出音频采集设备采集范围内是否存在无人控制设备,而且易排除非目标物体的干扰。

进一步地,基于本发明基于声音识别的动态测向方法的第一实施例提出本发明基于声音识别的动态测向方法的第三实施例,在本实施例中,步骤s10之前,还包括:

步骤s30,获取预设或用户设定的测速精度、无人控制设备最大行驶速度以及动态旋转音频采集设备对应的水平采集角度;

步骤s40,根据所述测速精度、所述无人控制设备最大行驶速度以及所述动态旋转音频采集设备对应的水平采集角度计算时间t;

此时,所述步骤s10包括以下步骤:

步骤s50,在根据时间t控制所述动态旋转音频数据采集设备旋转的情况下,获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组。

本实施例在获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组之前需要计算时间t,首先获取预设或者用户设定的测速精度、无人控制设备最大行驶速度以及动态旋转音频采集设备对应的水平采集角度,从而根据公式计算时间t。其中测速精度可以设置为2m,对于无人控制设备的行驶速度而言移动2m的距离是可以忽略不计的,无人控制设备最大行驶速度以无人机为例,目前来说无人机的最大飞行速度为70km/h,可以默认为无人机飞行速度为20m/s,动态旋转音频采集设备水平采集角度可由用户进行设定,若将360°分为3份,将360°除以3份等于120°,即旋转音频采集设备每转动一次的水平角度为120°。获取固定音频采集设备和动态旋转音频采集设备在预设时间周期内采集的音频数据组实际就是根据时间t控制动态旋转采集设备旋转,获取预设时间周期内的固定音频采集设备和动态旋转音频采集设备所采集的的音频数据,预设时间周期中包括多个时间t。通过获取预设时间周期内的音频数据组从而可分析无人控制设备的移动方向,使无人控制设备的测向更加简单。

进一步地,步骤s40包括:

步骤s41,将所述测速精度、所述无人控制设备最大行驶速度以及所述动态旋转音频采集设备对应的水平采集角度代入公式计算所述时间t,所述公式为:

其中,a为测速精度,b为无人控制设备最大行驶速度,c为动态旋转音频采集设备对应的水平采集角度。

本实施例可将测速精度设置a为2m,无人控制设备最大行驶速度b设置为20m/s,动态旋转音频采集设备对应的水平采集角度c设置为120°,将a、b、c代入公式计算,通过公式计算得到时间t等于0.03s。通过计算可得到时间t,从而以时间t控制动态旋转采集设备转动。

进一步地,步骤s50包括:

步骤s51,获取固定音频采集设备和动态旋转音频采集设备每间隔时间t所同时采集的单位音频数据,其中在相邻两次单位音频数据采集的间隔时间t内,控制动态旋转音频采集设备从当前采集位转移至下一采集位;

步骤s52,将预设周期内的所有单位音频数据作为预设周期内的音频数据组。

本实施例时间t实际上是动态旋转采集设备从当前采集位转动至下一采集位所需要的时间,为了让固定音频采集设备采集的音频数据和动态旋转采集设备采集的音频数据一一对应,在动态旋转采集设备从当前采集位移至下一采集位时无需采集音频数据,同时这个期间固定采集设备同样不需要采集音频数据,所以固定音频采集设备和动态旋转音频采集设备均是按照每间隔时间t同时采集单位音频数据,多个单位音频数据组成了在预设时间周期内的音频数据组,例如,时间t为0.03s,将预设时间周期设定为0.1s,固定音频采集设备和动态旋转音频采集设备每间隔0.03s同时采集音频数据,而每间隔0.03s采集的音频数据为单位音频数据,动态旋转音频采集设备从采集起始点旋转360°回归至该采集起始点的时间为0.1s,0.1s内的多个单位音频数据构成该预设时间周期的音频数据组。通过获取预设时间周期内的音频数据组从而可分析无人控制设备的移动方向,使无人控制设备的测向更加简单。

进一步地,基于本发明基于声音识别的动态测向方法的第一实施例提出本发明基于声音识别的动态测向方法的第四实施例,在本实施例中,步骤s20之后,还包括:

步骤s200,发送所述无人控制设备的移动方向至用户,以供用户根据所述无人控制设备的移动方向采取相应措施。

本实施例将获取的无人控制设备的移动方向发送至用户,用户在接收到该信息后可以采取相应的措施,例如,采取防御措施或采取攻击措施等等。在发送消息的同时可将在数据库中匹配到的声纹特征对应的无人控制设备的型号同时发送至用户,可供用户参考,用户可根据无人控制设备的型号了解无人控制设备的性能,更有利于采取相应的措施。

本发明还提出一种计算机可读存储介质,其上存储有计算机程序。所述计算机可读存储介质可以是图1的终端中的存储器,也可以是如rom(read-onlymemory,只读存储器)/ram(randomaccessmemory,随机存取存储器)、磁碟、光盘中的至少一种,所述计算机可读存储介质包括若干指令用以使得一台具有处理器的终端设备(可以是手机,计算机,服务器,终端,或者网络设备等)执行本发明各个实施例所述的方法。

在本发明中,术语“第一”“第二”“第三”“第四”“第五”仅用于描述的目的,而不能理解为指示或暗示相对重要性,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,本发明保护的范围并不局限于此,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改和替换,这些变化、修改和替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权力要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1