用于实时定位鸣笛的机动车的方法及系统与流程

文档序号:12749187阅读:1171来源:国知局
用于实时定位鸣笛的机动车的方法及系统与流程

本发明涉及交通道路信息处理领域,具体而言,涉及一种用于实时定位鸣笛的机动车的方法及系统。



背景技术:

交通噪音是城市交通向高等级、高速度、高架立体等现代化方向发展的过程,机动车数量急剧增加带来的使城市道路交通噪音污染日益严重的噪音污染。《中华人民共和国道路交通安全法实施条例》第62条规定,驾驶机动车不得有下列行为:在禁止鸣喇叭的区域或者路段鸣喇叭。道路交通中,很多区域(如学校、机关等周边道路)禁止机动车乱鸣喇叭。但是由于鸣喇叭产生只是产生了声音信号,而目前道路交通中使用的各种监视设备均只能对道路中的图像进行保存或者识别,有些设备虽然具有录音功能,但是当道路上车流量很大的时候,仅仅通过声音是不能对道路上鸣喇叭的汽车进行定位并识别的,因此当前还无法对乱鸣喇叭的违章汽车,进行识别和记录。

目前已有些许现有技术,公开了通过声音信号对道路上鸣笛的机动车进行识别的方法,公开(公告)号CN102522082A的中国专利公开了一种用于公共场所异常声音识别及定位方法,用听觉感知的稀疏编码声音识别技术解决异常声音的特征提取及分类识别问题。公开(公告)号CN105809968A中国专利公开了一种机动车违章鸣笛自动取证系统,采用心理声学模型对植入水印信号的机动车笛音信号进行滤波处理,获得滤波处理后的含水印笛音信号,进而进行声音定位的理论分析。以上发明均需要通过声音分析方法,判断是否存在鸣笛音,鸣笛取证的效率会受算法影响,取证精度会受数学模型的准确性影响。

因此,需要一种新的用于实时定位鸣笛的机动车的方法及系统。

在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。



技术实现要素:

有鉴于此,本发明提供一种用于实时定位鸣笛的机动车的方法及系统,能够对乱鸣喇叭的违章汽车进行定位并识别。

本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。

根据本发明的一方面,提供一种用于实时定位鸣笛的机动车的方法,包括:

获取实时声音数据;

获取实时图像数据;

根据实时声音数据判断是否有鸣笛声音;

当有鸣笛声音时,识别鸣笛声音的来源方向;以及

通过鸣笛声音的来源方向与实时图像数据,定位鸣笛的机动车。

在本公开的一种示例性实施例中,根据实时声音数据判断是否有鸣笛声音,包括:

将声音数据转换为音频数据;

判断音频数据中的声压是否高于声压阈值;以及

在声压高于声压阈值时,判断音频数据中,是否在200~5000Hz范围内存在多个间隔100~200Hz的频率信号。

在本公开的一种示例性实施例中,当有鸣笛声音时,识别鸣笛声音的来源方向,包括:

进行噪声源定位计算。

在本公开的一种示例性实施例中,噪声源定位计算,包括:延迟累加算法和/或MUSIC算法。

在本公开的一种示例性实施例中,获取实时图像数据包括:通过图像采集设备对道路图像进行连续采集,获取实时图像数据。

在本公开的一种示例性实施例中,还包括:

根据实时图像数据识别鸣笛的机动车的车牌。

在本公开的一种示例性实施例中,获取实时声音数据包括:通过由多个传声器组成的传声器阵列,获取实时声音数据。

在本公开的一种示例性实施例中,传声器阵列的结构,包括:平面矩形、平面圆形、多平面立体以及球形。

根据本发明的一方面,提供一种用于实时定位鸣笛的机动车的系统,包括:

传声器阵列,用于获取实时声音数据;

图像采集设备,用于获取实时图像数据;

声音判断设备,用于根据实时声音数据判断是否有鸣笛声音;;

方向识别设备,用于当有鸣笛声音时,识别鸣笛声音的来源方向;以及

声音定位设备,用于通过鸣笛声音的来源方向与实时图像数据,定位鸣笛的机动车。

在本公开的一种示例性实施例中,还包括:

车牌识别设备,用于根据实时图像数据识别鸣笛的机动车的车牌。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法及系统,能够对乱鸣喇叭的违章汽车进行定位并识别。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。

附图说明

通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性来动的前提下,还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种用于实时定位鸣笛的机动车的方法的流程图。

图2是根据另一示例性实施例示出的一种用于实时定位鸣笛的机动车的方法的流程图。

图3是根据一示例性实施例示出的一种用于实时定位鸣笛的机动车的系统的框图。

图4是根据另一示例性实施例示出的一种用于实时定位鸣笛的机动车的系统的框图。

图5是根据另一示例性实施例示出的一种用于实时定位鸣笛的机动车的系统的框图。

具体实施例

现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。

图1是根据一示例性实施例示出的一种用于实时定位鸣笛的机动车的方法的流程图。

如图1所示,在S102中,获取实时声音数据。

通过声音采集装置进行实时声音采集。声音采集装置可例如,由若干传声器组成的传声器阵列。

在S104中,获取实时图像数据。

通过图像采集装置进行实时图像采集。图像采集装置可例如:适用于交通摄像的摄像机。

在S106中,根据实时声音数据判断是否有鸣笛声音。

通过实时采集的道路交通中的声音数据,判断是否存在鸣笛声音。可例如,为了避免造成浪费,可仅在禁止鸣笛的区域,采集实时声音数据,以便判断是否在禁止鸣笛的区域,存在鸣笛声音。可例如,通过实时声音采集装置采集声音,通过声音处理算法,获得声音特征数据,通过特征数据进一步判断是是否在禁止鸣笛的区域,存在鸣笛声音。还可例如,通过实时声音采集装置采集交通道路中的声音,通过声音处理算法,获得声音音质幅度数据,通过声音音质幅度数据进一步判断是是否在禁止鸣笛的区域,存在鸣笛声音。本发明不限于此。

在S108中,当有鸣笛声音时,识别鸣笛声音的来源方向。

如上文所述,可例如,在禁止鸣笛的区域,判断存在鸣笛声音时,识别声音来源的方向。判断声音来源的方向可通过音源定位算法实现。可例如,根据机动车的鸣笛音到达声阵列中多个传声器的时间的不同,通过时间差值,使用声阵列的声源定位算法,确定机动车鸣笛音的来源方向。

在S110中,通过鸣笛声音的来源方向与实时图像数据,定位鸣笛的机动车。

结合声源定位算法中识别出的鸣笛音声来源方向,以及实时摄像采集装置采集到的道路交通图像,从图像中声阵列所在位置开始搜索,沿着鸣笛音声音的来源方向,指向图像中的机动车,这个机动车,即为鸣笛的机动车。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法,能够对乱鸣喇叭的违章汽车进行定位并识别。

应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。

图2是根据一示例性实施例示出的一种用于实时定位鸣笛的机动车的方法的流程图。根据所述实时声音数据判断是否有鸣笛声音

如图2所示,在S202中,将声音数据转换为音频数据;

可例如,通过采样把模拟声音信号转换为数字化的音频数据。采样频率越高,采样得到的量化数值就越大。记录这一段音频信号所用的数据量就越大,同时音频质量也就越高。根据奈奎斯特理论,采样频率只要不低于音频信号最高频率的两倍,就可以无损失地还原原始的声音。通常人耳能听到频率范围大约在20Hz~20kHz之间的声音,为了保证声音不失真,采样频率应在40kHz以上。常用的音频采样频率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz、96kHz、192kHz等。

在S204中,判断音频数据中的声压是否高于声压阈值;

声压(sound pressure)是大气压受到声波扰动后产生的变化,即为大气压强的余压,它相当于在大气压强上的叠加一个声波扰动引起的压强变化。由于声压的测量比较容易实现,通过声压的测量也可以间接求得质点速度等其它物理量,所以声学中常用这个物理量来描述声波。声波通过媒质时,由于振动所产生的压强改变量。它是随时间变化的,实测声压测量的是声压的有效值,单位是Pa或MPa。表示声压大小的指标称为声压级(sound pressure level),用某声音的声压(p)与基本声压值(p0)之比的常用对数的20倍来表示,即20lgP/P0,单位为dB。

日常道路中的机动车行驶产生的噪声可视为白噪声,道路中噪音主要来源于以下几个方面,汽车轮胎与地面摩擦的声音,这种声音基本上属于低音而且伴随着振动,这种情况尤其邻近的是混凝土的公路比柏油路的要严重;汽车发动机、排气管、汽车传动系统的声音,马力越大、使用车限越长的车辆,这方面的噪音就越强;汽车风阻和刹车、减速带及承载物撞击引起的车辆振动的声音。在判断到声压升高时,可例如,设定声压阈值,根据目标判断的道路交通中噪音的特点,设定不同的声压阈值,当检测到的实时音频数据中的声压超过声压阈值时,则可认为可能产生了机动车鸣笛音。

在S206中,在声压高于声压阈值,判断所述音频数据中,是否在200~5000Hz范围内存在多个间隔100~200Hz的频率信号。

在获取的实时声音数据中,当检测到声压值高于预定的声压阈值时,继续监测,当检测到在200~5000Hz范围内存在多个间隔100~200Hz的频率信号,可认定,此时存在机动车鸣笛现象。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法及系统,通过对实时声音数据中频谱的判断,仅利用很小的数据就可以快速地识别出道路中是否存在机动车鸣笛现象,可以现场实时记录违法的机动车鸣笛现象。在本公开的一种示例性实施例中,当有所述鸣笛声音时,识别所述鸣笛声音的来源方向,包括:进行噪声源定位计算。

在本公开的一种示例性实施例中,所述噪声源定位计算,包括:延迟累加算法和/或MUSIC算法。

延迟累加算法主要是通过延时控制补偿从声源到每个声音接收装置中的麦克风的延时,对每个麦克风接收到的信号进行校正。然后,使麦克风阵列波束指向有最大输出功率的方向,即波束对准相应空间位置的声源信号同时削弱噪声和混响的影响。延时累加算法可以分为三部分:时间延迟估计、时间延迟补偿以及累加部分。时间延迟估计与声音接收装置中麦克风数目、麦克风间距、声源入射角及采样频率成正比,与声音的传播速度成反比。在进行声源的累加的时候,加权的方法有很多种,最简单的就是平均加权。该系统具有较好的鲁棒性其计算复杂度也较小,但在实际应用中,理论上信噪比的提高与采用麦克风数目的关系为10lgM(M为所采用的麦克风数目),因此,想达到较好指向性和较高信噪比时需要的麦克风数目较多。本发明不限于此。

MUSIC算法,也称为多重信号分类算法,该算法是通过对阵列接收数据的数学分解(如特征分解,奇异值分解及QR分解等),将接收数据划分为两个相互正交的子空间:一个时域信号源的阵列流型空间一致的信号子空间,另一个则是与信号子空间正交的噪声子空间。空间分解类算法从处理方式上可分为两类:一类是以MUSIC为代表的噪声子空间类算法,另一类是以旋转不变子空间(ESPRIT)为代表的信号子空间类算法。子空间分解类算法就是利用两个子空间的正交特性构造出“针状”空间谱峰。不发明不限于此。

声阵列和道路监控范围的几何关系,如图3所示,声阵列可接受来自实际道路区域测量面的所有声音。声阵列形成的阵列面与道路面可成一个0~90°的夹角θ,以消除其他方位传递来的声音。

以使用延迟累加方法为例,在该测量面上划分计算网格,假设喇叭发声点位于每个网格点上,可根据几何关系估计出喇叭声到达各传声器的时间差,然后将各传声器采集的声音波形进行相应的时间延迟补偿,最后进行累加计算,可得到各个网格点上累计之后的声压。当实际喇叭声处于某个网格点位置时,按照该点位置延迟累加的结果将达到最大。因此使用所有网格点上的结果可绘制出整个测量面上的声压分布图,在识别到鸣笛声时,该声压分布图上的最大点位置即为喇叭发生位置。该方法还可识别出多个位置同时存在喇叭声的情形。可例如,道路上的每辆汽车所占据的区域,按照小型汽车计算,大约为2米×5米的范围。通过调整阵列传声器数目、阵列传声器间距、声压分布图计算网格密度等,可使声压分布图的定位精度在2米×5米以内,保证识别的准确性。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法及系统,通过声音定位算法,可同时捕获多个机动车鸣笛现象。

在本公开的一种示例性实施例中,所述获取实时图像数据包括:通过图像采集设备对道路图像进行连续采集,获取所述实时图像数据。

在本公开的一种示例性实施例中,还包括:根据所述实时图像数据识别所述鸣笛的机动车的车牌。当识别到鸣笛汽车时,可能存在车牌号码被遮挡的情况,此时可例如,通过图像处理手段识别该汽车轮廓,并跟踪汽车运动,待其车牌可见时,进行车牌识别。

在本公开的一种示例性实施例中,所述获取实时声音数据包括:通过由多个传声器组成的传声器阵列,获取所述实时声音数据。

在本公开的一种示例性实施例中,所述传声器阵列的结构,包括:平面矩形、平面圆形、多平面立体以及球形。

在本公开的一种示例性实施例中,通过频谱特征方式(在200~5000Hz范围内存在多个间隔100~200Hz的频率信号),判断是否存在机动车鸣笛音。连续实时采集声音信号,并结合声音定位算法,实时进行鸣笛特征识别,发现符合鸣笛特征的声音后,使用大约0.2秒的特征最显著的声音信号,进行延迟累加计算。并且,通过声音定位算法,计算整个道路测量面的分布图,根据峰点确定声源,当存在多个明显的峰点时,可一次性确定多个同时存在的喇叭。

本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。

此外,需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

下述为本发明系统实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。

图4示意性示出根据本发明示例实施例的用于实时定位鸣笛的机动车的系统。该系统可例如,执行如图1或图2所示的用于实时定位鸣笛的机动车的方法,但本发明不限于此。如图4所示,用于实时定位鸣笛的机动车的系统40,包括:传声器阵列402,图像采集设备404,声音判断设备406,方向识别设备408,声音定位设备410,车牌识别设备412。

传声器阵列402用于获取实时声音数据。

图像采集设备404用于获取实时图像数据。

声音判断设备406用于根据所述实时声音数据判断是否有鸣笛声音。

方向识别设备408用于当有所述鸣笛声音时,识别所述鸣笛声音的来源方向。

声音定位设备410用于通过所述鸣笛声音的来源方向与所述实时图像数据,定位鸣笛的机动车。

车牌识别设备412用于根据所述实时图像数据识别所述鸣笛的机动车的车牌。

在本公开的一种示例性实施例中,提供如图5所示的用于实时定位鸣笛的机动车的系统示意图。

结合图4与图5的示例,用于实时定位鸣笛的机动车的系统流程,可例如:传声器阵列402接收到声音信号,根据传声器阵列中,声音接收设备数量的不同,可接收到N路声音信号。声音判断设备406对传声器阵列402传来的多路声音信号进行采样等处理,由处理后的数据判断是否存在机动车喇叭声。图像采集设备404对道路中的交通图像进行视频采集,在声音判断设备406判断到有机动车喇叭声音的时候,对实时的道路中运行的机动车图像进行抓拍。方向识别设备408对传声器阵列402传来的多路声音信号进行声源定位计算,得到声源方向。声音定位设备410通过方向识别设备408得到的声源定位计算的数据,以及图像采集设备404抓拍得到的图像对图像中的机动车进行定位。然后车牌识别设备412对图像中的车牌进行识别,并对识别到的结果进行保存。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的系统,能够对乱鸣喇叭的违章汽车进行定位并识别。

本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施例的方法。

通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的用于实时定位鸣笛的机动车的方法及系统有以下优点中的一个或多个。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法及系统,能够对乱鸣喇叭的违章汽车进行定位并识别。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法及系统,通过对实时声音数据中频谱的判断,仅利用很小的数据既可以可以快速的识别出道路中是否存在机动车鸣笛现象,实现了现场实时记录违法的机动车鸣笛现象。

根据本发明的一些实施例,用于实时定位鸣笛的机动车的方法及系统,通过声音定位算法,可同时捕获多个机动车鸣笛现象。

以上具体地示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如「上」、「第一」、「第二」及「一」等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本发明可实施的范畴。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1