一种基于yolo目标检测的异常检测方法及系统与流程

文档序号:32312805发布日期:2022-11-23 12:58阅读:471来源:国知局
一种基于yolo目标检测的异常检测方法及系统与流程

1.本发明属于目标检测技术领域,尤其涉及一种基于yolo目标检测的异常检测方法及系统。


背景技术:

2.计算机视觉技术是计算机模拟人类的视觉过程,具有感受环境的能力和人类视觉功能的技术。图像处理、人工智能和模式识别等技术的综合。其中,图像分类是计算机视觉最基本的任务之一,但是在图像分类的基础上,还有更复杂和有意思的任务,如目标检测,物体定位,图像分割等,目标检测是一件比较实际的且具有挑战性的计算机视觉任务,其可以看成图像分类与定位的结合,给定一张图片,目标检测系统要能够识别出图片的目标并给出其位置,由于图片中目标数是不定的,且要给出目标的精确位置,目标检测相比分类任务更复杂。目标检测的一个实际应用场景就是无人驾驶,如果能够在无人车上装载一个有效的目标检测系统,那么无人车将和人一样有了眼睛,可以快速地检测出前面的行人与车辆,从而作出实时决策。
3.近几年来,目标检测算法取得了很大的突破。比较流行的算法可以分为两类,一类是基于region proposal的r-cnn系算法(如r-cnn,fast r-cnn,faster r-cnn),它们是two-stage的,需要先使用启发式方法(selective search)或者cnn网络(rpn)产生region proposal,然后再在region proposal上做分类与回归。而另一类是yolo,ssd这类one-stage算法,仅仅使用一个cnn网络直接预测不同目标的类别与位置。yolo算法采用一个单独的cnn模型实现end-to-end的目标检测,相比r-cnn算法,其是一个统一的框架,其速度更快,但是目标检测的结果准确性要低一些。


技术实现要素:

4.有鉴于此,本发明实施例提供一种基于yolo目标检测的异常检测方法及系统,用于解决现有yolo目标检测方法,目标检测结果准确性较低的问题。本发明能够在保证待检测图像尽量保持原有像素效果的基础上,对所述待检测图片进行尺寸规格的调整,从而有效地提高了yolo目标检测的准确度。
5.第一方面,本发明实施例提供一种基于yolo目标检测的异常检测方法,包括:
6.将第一待检测图片调整为预设尺寸规格的第二待检测图片;
7.通过yolo目标检测模型检测所述第二待检测图片中的指定类型目标及其位置;
8.当在所述第二待检测图片中检测到指定类型目标时,确定所述第一待检测图片中存在异常。
9.在一可选实施例中,所述预设尺寸为448
×
448。
10.在一可选实施例中,所述将第一待检测图片调整为预设尺寸规格的第二待检测图片,包括:
11.根据第一公式,计算第一待检测图片的行列增减值;
12.根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于第二公式对所述第一待检测图片每一行的像素点进行自动智能保真增减,得到中间图片;
13.根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于第三公式对所述中间图片每一列的像素点进行自动智能保真增减,得到第二待检测图片;
14.其中,所述第一公式为:
15.g=f(m-448)《《1+f(n-448)
16.所述第一公式中,g表示第一待检测图片的行列增减值,其数值形式为二进制形式;m表示第一待检测图片的每一行像素点的个数;n表示第一待检测图片的每一列像素点的个数;《《1表示进行左移1位;f()表示非正检验函数,若括号内数值为非正数则函数值为二进制形式的数值1,若括号内数值为正数则函数值为二进制形式的数值0;
17.所述第二公式为:
[0018][0019]
所述第二公式中,h(i,j)表示对第一待检测图片每一行的像素点进行自动智能保真增减后得到的中间图片的第i行第j列像素点的像素值;g(1)表示第一待检测图片的行列增减值g的第1位二进制数值;表示向下取整;表示向下取整;表示第一待检测图片的第i行第列像素点的像素值;%表示取余;表示第一待检测图片的第i行第检测图片的第i行第列像素点的像素值;表示向下取整;
[0020]
所述第三公式为:
[0021][0022]
所述第三公式中,h

(i,j)表示对中间图片每一列的像素点进行自动智能保真增减后得到的第二待检测图片的第i行第j列像素点的像素值;g(2)表示第一待检测图片的行列增减值g的第2位二进制数值;表示所述中间图片的第行第j列像素点的像素值;表示所述中间图片的第行第j列像素点的像素值。
[0023]
在一可选实施例中,在所述将第一待检测图片调整为预设尺寸规格的第二待检测图片之前,还包括:
[0024]
判断所述第一待检测图片的尺寸是否为所述预设尺寸;
[0025]
若所述第一待检测图片的尺寸为所述预设尺寸,则将所述第一待检测图片作为第二待检测图片;
[0026]
若所述第一待检测图片的尺寸不为所述预设尺寸,则继续执行所述将第一待检测图片调整为预设尺寸规格的第二待检测图片的步骤。
[0027]
在一可选实施例中,所述指定类型目标包括行人;
[0028]
在所述将第一待检测图片调整为预设尺寸规格的第二待检测图片之前,还包括:
[0029]
采集车辆前方及侧方视野盲区内的场景图片,作为第一待检测图片。
[0030]
在一可选实施例中,在所述确定所述第一待检测图片中存在异常之后,还包括:
[0031]
将检测到行人的视野盲区内的场景图片作为异常图片发送到车辆中控显示屏上显示;
[0032]
根据采集所述异常图片的图像采集装置的摄像角度以及所述异常图片内检测到的行人位置,控制采集所述异常图片的图像采集装置对应的测距装置检测所述异常图片中检测到的行人所处方向上的第一个障碍物与当前车辆前/侧面的距离;
[0033]
判断所述第一个障碍物与当前车辆前/侧面的距离是否小于预设距离阈值;
[0034]
若所述第一个障碍物与当前车辆前/侧面的距离小于预设距离阈值,则获取当前车辆的刹车状态;
[0035]
判断当前车辆的刹车状态是否处于完全踩死状态;
[0036]
若当前车辆的刹车状态未处于完全踩死状态,则通过车载音响发出警报。
[0037]
第二方面,本发明实施例提供一种基于yolo目标检测的异常检测系统,包括:
[0038]
图片尺寸调整模块,用于将第一待检测图片调整为预设尺寸规格的第二待检测图片;
[0039]
目标检测模块,用于通过yolo目标检测模型检测所述第二待检测图片中的指定类型目标及其位置;
[0040]
指定目标确定模块,用于当在所述第二待检测图片中检测到指定类型目标时,确定所述第一待检测图片中存在异常。
[0041]
在一可选实施例中,所述预设尺寸为448
×
448。所述图片尺寸调整模块,包括:
[0042]
行列增减值计算单元,用于根据第一公式,计算第一待检测图片的行列增减值;
[0043]
每一行像素点调整单元,用于根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于第二公式对所述第一待检测图片每一行的像素点进行自动智能保真增减,得到中间图片;
[0044]
每一列像素点调整单元,用于根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于第三公式对所述中间图片每一列的像素点进行自动智能保真增减,得到第二待检测图片;
[0045]
其中,所述第一公式为:
[0046]
g=f(m-448)《《1+f(n-448)
[0047]
所述第一公式中,g表示第一待检测图片的行列增减值,其数值形式为二进制形式;m表示第一待检测图片的每一行像素点的个数;n表示第一待检测图片的每一列像素点的个数;《《1表示进行左移1位;f()表示非正检验函数,若括号内数值为非正数则函数值为二进制形式的数值1,若括号内数值为正数则函数值为二进制形式的数值0;
[0048]
所述第二公式为:
[0049][0050]
所述第二公式中,h(i,j)表示对第一待检测图片每一行的像素点进行自动智能保真增减后得到的中间图片的第i行第j列像素点的像素值;g(1)表示第一待检测图片的行列增减值g的第1位二进制数值;表示向下取整;表示向下取整;表示第一待检测图片的第i行第列像素点的像素值;%表示取余;表示第一待检测图片的第i行第检测图片的第i行第列像素点的像素值;表示向下取整;
[0051]
所述第三公式为:
[0052][0053]
所述第三公式中,h

(i,j)表示对中间图片每一列的像素点进行自动智能保真增减后得到的第二待检测图片的第i行第j列像素点的像素值;g(2)表示第一待检测图片的行列增减值g的第2位二进制数值;表示所述中间图片的第行第j列像素点的像素值;表示所述中间图片的第行第j列像素点的像素值。
[0054]
本发明提供的一种基于yolo目标检测的异常检测方法及系统,首先将待检测图片进行尺寸规格的调整,然后将调整后的图片提供给yolo目标检测模型进行目标检测,确定待检测图片中的异常目标。本发明能够在保证待检测图像尽量保持原有像素效果的基础上,对所述待检测图片进行尺寸规格的调整,从而有效地提高了yolo目标检测的准确度。
附图说明
[0055]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0056]
图1为本发明实施例提供的一种基于yolo目标检测的异常检测方法流程示意图;
[0057]
图2为本发明实施例提供的一种基于yolo目标检测的异常检测系统结构示意图。
具体实施方式
[0058]
下面结合附图对本发明实施例进行详细描述。
[0059]
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基
于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0060]
图1为本发明实施例提供的一种基于yolo目标检测的异常检测方法流程示意图。参见图1,该方法包括如下步骤s101-s103:
[0061]
s101:将第一待检测图片调整为预设尺寸规格的第二待检测图片。
[0062]
本实施例中,整体来看,yolo算法采用一个单独的cnn模型实现end-to-end的目标检测,首先将待检测图片在尽量保持原有像素效果的基础上,调整图像的尺寸为预设尺寸规格,优选为448x448,便于后续送入yolo算法的cnn网络,最后由此cnn处理网络进行结果预测得到检测的目标。
[0063]
s102:通过yolo目标检测模型检测所述第二待检测图片中的指定类型目标及其位置。
[0064]
s103:当在所述第二待检测图片中检测到指定类型目标时,确定所述第一待检测图片中存在异常。
[0065]
上述技术方案的有益效果为:本发明实施例提供的一种基于yolo目标检测的异常检测方法,首先将待检测图片进行尺寸规格的调整,然后将调整后的图片提供给yolo目标检测模型进行目标检测,确定待检测图片中的异常目标。本发明能够在保证待检测图像尽量保持原有像素效果的基础上,对所述待检测图片进行尺寸规格的调整,从而有效地提高了yolo目标检测的准确度。
[0066]
作为一可选实施例,所述步骤s101,可以包括以下步骤s201-s203:
[0067]
s201:根据第一公式,计算第一待检测图片的行列增减值;
[0068]
s202:根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于第二公式对所述第一待检测图片每一行的像素点进行自动智能保真增减,得到中间图片;
[0069]
s203:根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于第三公式对所述中间图片每一列的像素点进行自动智能保真增减,得到第二待检测图片;
[0070]
其中,所述第一公式为:
[0071]
g=f(m-448)《《1+f(n-448)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0072]
所述第一公式中,g表示第一待检测图片的行列增减值,其数值形式为二进制形式;m表示第一待检测图片的每一行像素点的个数;n表示第一待检测图片的每一列像素点的个数;《《1表示进行左移1位;f()表示非正检验函数,若括号内数值为非正数则函数值为二进制形式的数值1,若括号内数值为正数则函数值为二进制形式的数值0;
[0073]
所述第二公式为:
[0074][0075]
所述第二公式中,h(i,j)表示对第一待检测图片每一行的像素点进行自动智能保真增减后得到的中间图片的第i行第j列像素点的像素值;g(1)表示第一待检测图片的行列
增减值g的第1位二进制数值;表示向下取整;表示向下取整;表示第一待检测图片的第i行第列像素点的像素值;%表示取余;表示第一待检测图片的第i行第检测图片的第i行第列像素点的像素值;表示向下取整;将i的值从1取值到n,在每个i值下将j的值从1取值到448依次代入到上述第二公式(2)中,进而即可完成对所述待检测图片每一行的像素点进行自动智能保真的增减。
[0076]
所述第三公式为:
[0077][0078]
所述第三公式中,h

(i,j)表示对中间图片每一列的像素点进行自动智能保真增减后得到的第二待检测图片的第i行第j列像素点的像素值;g(2)表示第一待检测图片的行列增减值g的第2位二进制数值;表示所述中间图片的第行第j列像素点的像素值;表示所述中间图片的第行第j列像素点的像素值;将i的值从1取值到448,在每个i值下将j的值从1取值到448依次代入到上述第三公式(3)中,从而自动智能完成对待检测图像resize到448x448的操作。
[0079]
上述技术方案的有益效果为:利用第一公式(1)根据待检测图片的像素点个数,得到所述待检测图片行列像素点进行resize的行列增减值,从而为后待检测图片进行增减像素点提供控制依据;然后利用第二公式(2)根据待检测图片的像素点的像素值对所述图片每一行的像素点进行自动智能保真增减,从而利用公式来进行自动智能保真增减,体现了系统的智能化和自动化的特点,并且还会对像素增减数量进行自动判断,尽可能最大的保证原始待检测图片的像素点在新生成的图片中位置不偏移,图像的显示尽量保持完整;最后利用第三公式(3)根据待检测图片的像素点的像素值再对自动智能保真增减后的图片每一列的像素点进行自动智能保真增减,体现了系统的智能化和自动化的特点,便于利用公式进行自动resize的目的,从而利用公式减少编程代码,减轻编程人员的压力,同时可以使大量人员可以较快较轻松的利用公式上手编写所述自动resize图片的程序,提高了系统使用的普适性。
[0080]
作为一可选实施例,所述步骤s101之前,还包括以下步骤s301-s302:
[0081]
s301:判断所述第一待检测图片的尺寸是否为所述预设尺寸;是则执行步骤s302,否则执行s101。
[0082]
s302:将所述第一待检测图片作为第二待检测图片,随后执行步骤s102。
[0083]
上述技术方案的有益效果为:如果待检测图片的尺寸为预设尺寸,即448
×
448,则就不用对待检测图片的尺寸进行调整;如果待检测图片的尺寸不为预设尺寸时,才对待检测图片的尺寸进行调整,有效地提高了系统的执行效率。
[0084]
作为一可选实施例,所述指定类型目标包括行人;所述步骤s101之前,还包括:采集车辆前方及侧方视野盲区内的场景图片,作为第一待检测图片。
[0085]
上述技术方案的有益效果为:采集车辆前方及侧方视野盲区内的场景图片作为待检测图片,然后通过目标检测确定车辆前方及侧方视野盲区内是否存在行人,如果存在则及时进行报警及/或及时控制车辆停止运动,从而通过基于yolo目标检测的异常检测方法自动检测车辆前方的行人或者还可以进一步检测其他障碍物信息,进一步提高行车的安全性。
[0086]
作为一可选实施例,所述步骤s103之后,还可以包括以下步骤s401-s406:
[0087]
s401:将检测到行人的视野盲区内的场景图片作为异常图片发送到车辆中控显示屏上显示。
[0088]
s402:根据采集所述异常图片的图像采集装置的摄像角度以及所述异常图片内检测到的行人位置,控制采集所述异常图片的图像采集装置对应的测距装置检测所述异常图片中检测到的行人所处方向上的第一个障碍物与当前车辆前/侧面的距离。
[0089]
本实施例中,测距装置可以安装在图像采集装置(如摄像头)的图像采集窗口的正上方或正下方,例如:当车头右前方车身面板上安装了一个摄像头a,摄像头a采集车辆右前方视野盲区内的场景图片,当基于本发明提供的方法在该场景图片中检测到行人时,s402中通过安装于摄像头a上的激光测距装置往检测到的行人所处方向上发射检测激光,则该检测激光在遇到第一个障碍物时会被反射回来,则该激光测距装置可根据该反射激光计算测量出自身到第一个障碍物的距离,便于评估车头右前方车身面板到障碍物的距离情况,以自动控制车辆的车身不要碰到障碍物,从而保证了车辆、障碍物和行人的安全。
[0090]
s403:判断所述第一个障碍物与当前车辆前/侧面的距离是否小于预设距离阈值;是则执行s404。
[0091]
s404:获取当前车辆的刹车状态。
[0092]
s405:判断当前车辆的刹车状态是否处于完全踩死状态;否则执行s406。
[0093]
s406:通过车载音响发出警报。
[0094]
上述技术方案的有益效果为:在无人驾驶等实际应用场景中,可以在无人车上装载一个有效的目标检测系统(预先内置了本发明提供的基于yolo目标检测的异常检测方法),那么无人车将和人一样有了眼睛,可以快速地检测出前面的行人与车辆,从而作出实时决策,如行人与车辆非常靠近无人车时,可以提醒/触发车辆停止,达到有效地避开行人和车辆,从而保证了车辆和行人的安全。
[0095]
从上述实施例的内容可知,本发明采用一个单独的cnn模型实现end-to-end的目标检测,整个方法首先在保证原有像素效果的基础上,将待检测图片resize到448x448,然后送入cnn网络,最后处理网络预测结果得到检测的目标。相比r-cnn算法,其是一个统一的框架,其速度更快,并且具有目标检测准确度高的优点。
[0096]
图2为本发明实施例提供的一种基于yolo目标检测的异常检测系统结构示意图。如图2所示,所述系统包括:
[0097]
图片尺寸调整模块1,用于将第一待检测图片调整为预设尺寸规格的第二待检测图片;
[0098]
目标检测模块2,用于通过yolo目标检测模型检测所述第二待检测图片中的指定类型目标及其位置;
[0099]
指定目标确定模块3,用于当在所述第二待检测图片中检测到指定类型目标时,确
定所述第一待检测图片中存在异常。
[0100]
作为一可选实施例,所述预设尺寸为448
×
448,所述图片尺寸调整模块1,包括:
[0101]
行列增减值计算单元,用于根据上述第一公式,计算第一待检测图片的行列增减值;
[0102]
每一行像素点调整单元,用于根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于上述第二公式对所述第一待检测图片每一行的像素点进行自动智能保真增减,得到中间图片;
[0103]
每一列像素点调整单元,用于根据第一待检测图片的行列增减值以及第一待检测图片的像素点的像素值,基于上述第三公式对所述中间图片每一列的像素点进行自动智能保真增减,得到第二待检测图片。
[0104]
本发明实施例提供的基于yolo目标检测的异常检测系统的有益效果和前述方法的有益效果类似,此处不再赘述。
[0105]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的方法的装置。
[0106]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的方法。
[0107]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的方法的步骤。
[0108]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1