基于图像识别的异常检测方法与流程

文档序号:11729807阅读:423来源:国知局

本发明涉及图像识别技术领域,尤其涉及基于图像识别的异常检测方法。



背景技术:

以下对本发明的相关技术背景进行说明,但这些说明并不一定构成本发明的现有技术。

随着照相和视频监控系统在工业中的广泛应用,对于所采集的图片和影像进行高效和准且的分类处理,并在图片和影像中发现异常因素的需求越来越大。长期以来普遍利用人工对所采集的图片和影像进行异常识别,这样做成本高,识别效果受人为因素(例如经验、疲劳程度等)的影响大。因此,需要一种有效的自动处理手段对图片和影像中的异常因素进行识别。



技术实现要素:

本发明的目的在于提出一种基于图像识别的异常检测方法,能够自动实现对任意被检测目标的异常检测。

本发明基于图像识别的异常检测方法,包括:

s1、对包含被检测目标的图片进行正规化处理,获取灰度化图像;

s2、利用训练好的目标识别模型进行抠图,从所述灰度化图像中抠取被检测目标图像;

s3、利用训练好的二元分类模型对所述被检测目标图像进行二元分类,确定所述被检测目标图像的可信度分值;若所述被检测目标图像的可信度分值不高于预设的异常阈值,判定所述被检测目标图像为异常目标。

优选地,按照如下步骤训练目标识别模型:

获取用于模型训练的灰度化识别样本图片;

从均一化处理后的所述灰度化识别样本图片中抠取识别正样本,并对抠取的识别正样本和预设的识别负样本的尺寸进行均一化处理;

基于预设的识别负样本和抠取的识别正样本,采用级联分类训练算法进行训练,得到目标识别模型;

其中,识别正样本是指以被检测目标的标识部位为主体的局部图片,识别正样本不包含存在异常的样本图片;识别负样本是指不包含被检测目标的图片;抠图时,被检测目标充满90%以上被抠取图像区域。

优选地,按照如下步骤从所述灰度化识别样本图片中抠取识别正样本:

检测识别正样本在所述灰度化识别样本图片中的位置;

如果被检测目标在所述灰度化识别样本图片中所处部位随机,采用手工抠图;如果被检测目标在所述灰度化识别样本图片中所处部位固定,利用遮罩技术划定特定的图片或影像区域进行自动抠图。

优选地,得到目标识别模型之后进一步包括:

利用所述目标识别模型从所述灰度化识别样本图片中抠取识别正样本,并对抠取的识别正样本和预设的识别负样本的尺寸进行均一化处理;

利用预设的识别负样本和抠取的识别正样本训练所述目标识别模型。

优选地,按照如下步骤训练二元分类模型:

获取用于模型训练的灰度化分类样本图片,包括:分类正样本和分类负样本;

提取每个分类样本图片的样本特征,采用主成分分析法对样本特征进行分析,获取特征向量和特征值;

对特征向量进行聚类,聚类完成后通过二元分类算法对分类样本图片进行分类,得到二元分类模型;

其中,分类正样本是指以被检测目标的标识部位为主体的局部图片,分类正样本不包含存在异常的样本图片;分类负样本是指不包含被检测目标的图片;聚类的数量小于特征向量的数量。

优选地,获取用于模型训练的灰度化分类样本图片之后进一步包括:对分类样本图片的尺寸进行均一化处理。

优选地,提取每个分类样本图片的样本特征之后进一步包括:

对每个分类样本图片的样本特征数量进行均一化处理,具体地:针对任意一个分类样本图片,

如果提取的样本特征数量少于预定义的特征数量,则用零值或单位值填充,使该分类样本图片的样本特征数量达到预定义的特征数量;

如果提取的样本特征数量多于预定义的特征数量n,则选择预定义的特征数量个样本特征。

优选地,按照如下方法选择预定义的特征数量个样本特征:

对于分类负样本,随机选择预定义的特征数量个样本特征;

对于分类负样本,或特征数量接近预定义的特征数量的分类正样本,选择最前或最后的预定义数量个样本特征;

对于分类正样本,通过主成分分析法将样本特征按重要性降序排列,选择最重要的预定义的特征数量个样本特征。

优选地,采用主成分分析法对每个分类正样本的样本特征进行分析,选择代表性超过80%的样本特征数量的均值或最小值作为预定义的特征数量。

优选地,所述被检测目标图像的长宽像素尺寸与训练二元分类模型所使用的分类正样本的长宽像素尺寸相等。

优选地,步骤s1包括:

对包含被检测目标的图片或影像格式进行转换,得到具有统一格式的彩色图片;对于影像,将其转换为图片帧后再进行格式转换;

对彩色图片进行灰度化处理,得到灰度化图像。

优选地,得到灰度化图像之后进一步包括:采用直方图均衡化方法对灰度化图像进行处理。

从本发明的技术方案可以看出,本发明的应用场景主要是基于形状而不是基于色彩的差异进行异常检测;通过将包含被检测目标的图片转化成灰度化图像,可以在不减少图片特征信息的基础上有效降低图片包含的特征维度;通过将被检测目标图像从灰度化图像中抠取出来,能够有效减少非检测目标图像信息所带来的干扰,提高本发明异常检测算法的速度和准确性;通过利用训练好的二元分类模型对被检测目标图像进行二元分类,能够自动识别异常目标,提高本发明异常检测的效率和准确性。

附图说明

通过以下参照附图而提供的具体实施方式部分,本发明的特征和优点将变得更加容易理解,在附图中:

图1是示出本发明基于图像识别的异常检测方法的流程示意图。

具体实施方式

下面参照附图对本发明的示例性实施方式进行详细描述。对示例性实施方式的描述仅仅是出于示范目的,而绝不是对本发明及其应用或用法的限制。

由于用于拍摄的相机和摄像机通常固定在特定的位置,以一定的角度面对被检测物体(例如车辆,设备,行人,等等),所以图片或影像的内容相对固定。但是由于受到每个被检测的实例都存在个体上的差异,拍照的时间不同所带来的曝光差异,一幅图片或影像中可能存在多个被检查点,以及异常部位通常所占图片或影像画面比例较小等因素的影响,大大提高了自动识别技术复杂度。为了解决上述问题,本发明提供了一种基于形状差异进行异常检测的方法。

由于本发明的应用场景主要是基于形状而不是基于色彩的差异进行异常检测,因此本发明在步骤s1中首先对包含被检测目标的图片进行正规化处理,获取灰度化图像,参见图1,图中每个包含rgb或greyscale的方格表示一个像素。将包含被检测目标的图片转化成灰度化图像,可以在不减少图片特征信息的基础上有效降低图片包含的特征维度,保留有助于异常检测的信息和特征,从而降低异常检测的算法复杂程度和计算量。

实际使用过程中多采用相机或摄像机获取包含被检测目标的图像信息,相机获取的大多是图片格式,摄像机获取的多是视频影像。为了便于分析处理不同格式的被检测目标图像信息,步骤s1可以进一步包括:

对包含被检测目标的图片或影像格式进行转换,得到具有统一格式的彩色图片;对于影像,将其转换为图片帧后再进行格式转换;

对彩色图片进行灰度化处理,得到灰度化图像。

为了使灰度化图像中的特征信息更加明显,得到灰度化图像之后可以进一步包括:采用直方图均衡化(histogramequalization)方法对灰度化图像进行处理,对灰度化图像对比度进行调整,从而使灰度化图像的特征更加明显,改善灰度化图像的质量。

灰度化图像中往往既包含被检测目标,也包含非检测目标,被检测目标通常只占整个灰度化图像的一部分。为了尽量减少非检测目标图像信息所带来的干扰,提高异常检测算法的速度和准确性,本发明步骤s2中利用训练好的目标识别模型进行抠图,从灰度化图像中抠取被检测目标图像。例如,利用人工智能技术从灰度化图像中自动检测需要检测的关键部位,如车辆标识、部件、人脸等,并利用抠图技术提取关键部位的图片或影像信息。

级联分类训练(cascadeclassifiertraining)算法适合于在图片或影响中找到与被被检测目标相匹配的区域,但并不能有效的衡量被检测目标是否存在异常,因此本发明步骤s3中利用训练好的二元分类模型对被检测目标图像进行二元分类,确定被检测目标图像的可信度分值;若被检测目标图像的可信度分值不高于预设的异常阈值,判定被检测目标图像为异常目标。

本领域技术人员可以根据实际需要选择合适的目标分类模型进行抠取,在一些实施例中,按照如下步骤训练目标识别模型:

获取用于模型训练的灰度化识别样本图片;

从正规化处理后的所述灰度化识别样本图片中抠取识别正样本,并对抠取的识别正样本和预设的识别负样本的尺寸进行均一化处理;

基于预设的识别负样本和抠取的识别正样本,采用级联分类训练(cascadeclassifiertraining)算法进行训练,得到目标识别模型;

识别正样本是指以被检测目标的标识部位为主体的局部图片,识别正样本不包含存在异常的样本图片;识别负样本是指不包含被检测目标的图片。由于被检测目标通常只占整个灰度化图像的一部分,因此通过从灰度化识别样本图片中抠取被检测目标的图像获取目标识别的识别正样本可以有效减少非检测目标图像信息所带来的干扰,提升识别正样本的质量。为了进一步提升识别正样本的质量,抠图时,被检测目标充满90%以上被抠取图像区域。抠取图像时,应尽量保证被抠取部分的长宽比一致,以提高特征提取的相似度。

抠取识别正样本的方法可以根据实际情况进行选择,在一些实施例中,可以根据识别正样本在灰度化识别样本图片中的位置选择合适的抠图方法,具体地:

检测识别正样本在灰度化识别样本图片中的位置;

如果被检测目标在灰度化识别样本图片中所处部位随机,采用手工抠图;如果被检测目标在灰度化识别样本图片中所处部位固定,利用遮罩技术划定特定的图片或影像区域进行自动抠图。

上述实施例中,被检测目标在灰度化识别样本图片中所处部位固定并不限于被检测目标在灰度化识别样本图片中所处部位完全一致。当异常检测的精确性要求不高时,可以适当降低对被检测目标位置的要求,例如当被检测目标在灰度化识别样本图片中所处部位不超过预设的位置范围时,认定被检测目标在灰度化识别样本图片中所处部位固定。

为了提高目标识别模型的准确性,得到目标识别模型之后可以进一步包括:

利用目标识别模型从灰度化识别样本图片中抠取识别正样本,并对抠取的识别正样本和预设的识别负样本的尺寸进行均一化处理;

利用预设的识别负样本和抠取的识别正样本训练该目标识别模型。

优选地,可以按照如下步骤训练二元分类模型:

获取用于模型训练的灰度化分类样本图片,并对分类样本图片的尺寸进行均一化处理,以保证特征提取的相似度;

提取每个分类样本图片的样本特征,采用主成分分析法对样本特征进行分析,获取特征向量和特征值;

对特征向量进行聚类,聚类完成后通过二元分类算法对分类样本图片进行分类,得到二元分类模型;

其中,分类样本图片包括:分类正样本和分类负样本;分类正样本是指以被检测目标的标识部位为主体的局部图片,分类正样本不包含存在异常的样本图片;分类负样本是指不包含被检测目标的图片;聚类的数量小于特征向量的数量。对于分类样本图片,可以采用前面用于级联分类的识别正样本,也可以采用上述优选实施例中抠取识别正样本的方法检测和抠取用于模型训练的分类正样本。

在样本特征提取完成后,由于样本特征顺序的随机性,因此需要对特征进行聚类,以便于后续的分类模型训练。聚类的算法包括但不限于:k-means聚类算法。在采用聚类算法时,聚类的数量k值应小于等于样本特征的数量。聚类完成后,通过传统的二元分类算法对样本图片进行分类。二元分类算法包括但不限于:逻辑回归算法(logisticregression),支持向量机算法(svm)等。

分类正负样本都应采用灰度图片,或在训练分类模型之前转换为灰度图片。本发明采用常见的特征提取算法来提取样本特征。常用的特征提取算法包括但不限于:sift(scale-invariantfeaturetransform,恒比特征变换),surf(speeduprobustfeature,加速鲁棒特征),fast(featuresfromacceleratedsegmenttest,特征分割检测特征),brief(binaryrobustindependentelementaryfeatures,二分鲁棒独立特征),或orb(orientedfastandrotatedbrief,定向fast和旋转brief)等。

为了保证从每个分类样本图片所提取的样本特征数量完全一致,提取每个分类样本图片的样本特征之后可以进一步包括:

对每个分类样本图片的样本特征数量进行均一化处理,具体地:针对任意一个分类样本图片,

如果提取的样本特征数量少于预定义的特征数量,则用零值或单位值填充,使该分类样本图片的样本特征数量达到预定义的特征数量,例如,当分类负样本的样本特征数量少于预定义的特征数量,用零值或单位值填充;如果提取的样本特征数量多于预定义的特征数量n,则选择预定义的特征数量个样本特征。进一步优选地,可以按照如下方法选择预定义的特征数量个样本特征:

对于分类负样本,随机选择预定义的特征数量个样本特征;

对于分类负样本,或特征数量等于或接近预定义的特征数量的分类正样本,选择最前或最后的预定义数量个样本特征;

对于分类正样本,通过主成分分析法将样本特征按重要性降序排列,选择最重要的预定义的特征数量个样本特征。

对于预定义的样本特征数量,可以采用主成分分析法对每个分类正样本的样本特征进行分析,选择代表性超过80%的样本特征数量的均值或最小值作为预定义的特征数量。

为了便于将被检测目标图像与分类正样本进行比较分析,可以使被检测目标图像的长宽像素尺寸与训练二元分类模型所使用的分类正样本的长宽像素尺寸相等。

在二元分类模型训练完成后,利用训练好的二元分类模型对被检测目标图像进行二元分类,确定被检测目标图像的可信度分值;若被检测目标图像的可信度分值不高于预设的异常阈值,判定被检测目标图像为异常目标。异常阈值的取值可以根据实际使用情况进行设定,为了确定二元分类模型的分类效果和异常阈值的取值,还可以对训练好的二元分类模型进行异常检测测试。

异常检测测试的正样本是训练二元分类算法的分类正样本,异常检测测试的负样本是不包含在二元分类算法的分类正样本集中的、包含带有异常的被检测目标的样本。二元分类模型对每一个二元分类的分类都计算出一个可信度分值:如果分类为a和b。p(a)是分类结果为a的可信度分值,p(b)是分类结果为b的可信度分值,p为分类的最终可信度,那么:

p(a)+p(b)=1p=max(p(a),p(b))

假设a为正样本,则在测试结果中,正测试用例的分类结果应当为a,负测试用例的分类结果可以为a或者为b。若找到一个可信度分值p(a’),使得召回率(recallrate)(即低于p(a’)的负测试样本的数量对所有负测试样本总数比率)大于等于预定义的百分比(例如99.99%),则p(a’)即使异常检测所需要设定的异常阈值的取值。

虽然参照示例性实施方式对本发明进行了描述,但是应当理解,本发明并不局限于文中详细描述和示出的具体实施方式,在不偏离权利要求书所限定的范围的情况下,本领域技术人员可以对所述示例性实施方式做出各种改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1