基于人工智能的视觉信息处理方法、装置、设备及介质

文档序号:26267240发布日期:2021-08-13 19:19阅读:72来源:国知局
基于人工智能的视觉信息处理方法、装置、设备及介质

本发明属于机器视觉检测技术领域,尤其涉及一种基于人工智能的视觉信息处理方法、装置、计算机设备及存储介质。



背景技术:

近年来,人工智能取得了飞速的发展,机器视觉便是其中之一。行人检测是机器视觉中的重要问题,在安防监控、智能驾驶、智能机器人等领域得到广泛的应用。目前,基于机器学习的方法是行人检测算法的主流,该方法主要通过结合人工特征和分类器的方式来实现。

机器视觉能够提高生产的灵活性和自动化程度。在一些不适于人工作业的危险工作环境或者人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉。机器视觉主要的功能有四个,分别是引导和定位,外观检测,高精度监测和识别。其中引导和定位可应用于三维和二维条件下,做到定位流水线的静态和动态目标,可适应不同情况下的视觉定位需求。

随着自动化行业的发展,对产品的质量要求越来越高,所以使得产品的外观质量检测也越来越重要;目前自动化行业产品外观质量检测主要是人工检测和接触式检测为主,这两种检测方式都各有缺点;其中,人工检测对于人眼长时间工作在高光源下工作,极易疲劳,容易误判和漏判;并且由于每个人对标准的认识程度和理解程度不同,主观判断的标准不一;其检测的工作量大、重复性高,对人眼的伤害严重;而接触式检测主要是测量仪关节臂和三坐标等仪器测量,首先这类仪器对一些异性不规则的产品无法精确测量,其次接触式测量方式是逐点测量,其测量速度慢。



技术实现要素:

本发明实施例的目的在于提供一种基于人工智能的视觉信息处理方法、装置、计算机设备及存储介质,旨在解决目前自动化行业产品外观质量检测主要是人工检测和接触式检测为主,存在检测效率低、效果差的问题。本发明实施例是这样实现的:

在本发明的一个实施例中,提供了一种基于人工智能的视觉信息处理方法,所述方法包括以下步骤:

获取原始视频;

对所述原始视频进行预处理,得到多帧灰度图像;

确定至少一帧满足预设条件的参考帧图像;

将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;

根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

作为本发明优选实施例技术方案的进一步限定,所述对所述原始视频进行预处理的步骤具体包括:

提取所述原始视频的帧图像集,确定每一帧图像的产品图像;

将所述帧图像集中含有预设图像的的多帧图像进行灰度处理。

作为本发明优选实施例技术方案的进一步限定,所述确定每一帧图像的产品图像的步骤具体包括:

根据所述帧图像中各像素点的灰度值确定所述帧图像中的目标产品的边缘像素点;

根据所述帧图像的目标产品的边缘像素点确定所述帧图像中目标产品的边缘;

根据所述目标产品的边缘确定当前帧图像的产品图像。

作为本发明优选实施例技术方案的进一步限定,在所述根据预先训练的分类识别模型对所述描述向量进行分类识别的步骤之后,所述方法还包括:根据分类识别结果,对所述分类识别模型进行修正优化。

在本发明的另一个实施例中,提供了一种基于人工智能的视觉信息处理装置,所述装置包括:

视频摄像单元,用于获取原始视频;

视频处理单元,用于对所述原始视频进行预处理,得到多帧灰度图像;

帧图像确定单元,用于确定至少一帧满足预设条件的参考帧图像;

图像比对单元,用于将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;

类型识别单元,用于根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

作为本发明优选实施例技术方案的进一步限定,所述视频处理单元包括:

产品图像获取模块,用于提取所述原始视频的帧图像集,确定每一帧图像的产品图像;

图像处理模块,用于将所述帧图像集中含有预设图像的的多帧图像进行灰度处理。

作为本发明优选实施例技术方案的进一步限定,所述产品图像获取模块具体包括:

边缘像素点确定子模块,用于根据所述帧图像中各像素点的灰度值确定所述帧图像中的目标产品的边缘像素点;

产品边缘确定子模块,用于根据所述帧图像的目标产品的边缘像素点确定所述帧图像中目标产品的边缘;

产品图像确定子模块,用于根据所述目标产品的边缘确定当前帧图像的产品图像。

作为本发明优选实施例技术方案的进一步限定,所述装置还包括:

模型修正模块,用于根据分类识别结果,对所述分类识别模型进行修正优化。

在本发明的另一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现所述的基于人工智能的视觉信息处理方法的步骤:

获取原始视频;

对所述原始视频进行预处理,得到多帧灰度图像;

确定至少一帧满足预设条件的参考帧图像;

将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;

根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述的基于人工智能的视觉信息处理方法的步骤:

获取原始视频;

对所述原始视频进行预处理,得到多帧灰度图像;

确定至少一帧满足预设条件的参考帧图像;

将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;

根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

与现有技术相比,本发明实施例主要有以下有益效果:本发明实施例提供的基于人工智能的视觉信息处理方法通过获取原始视频;对所述原始视频进行预处理,得到多帧灰度图像;确定至少一帧满足预设条件的参考帧图像;将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。本发明实施例能够对原始视频中的目标产品的外观进行检测,并通过检测结果对目标产品存在的外观缺陷进行分类,能够有效解决目前自动化行业产品外观质量检测主要是人工检测和接触式检测为主,存在检测效率低、效果差的问题。

附图说明

图1为本发明实施例提供的一种基于人工智能的视觉信息处理方法的系统架构图;

图2为本发明实施例提供的一种基于人工智能的视觉信息处理方法的实施流程图;

图3为本发明实施例提供的一种基于人工智能的视觉信息处理方法的一个子流程图;

图4为本发明实施例提供的一种基于人工智能的视觉信息处理方法的另一个子流程图;

图5为本发明实施例提供的一种基于人工智能的视觉信息处理装置的结构框图;

图6为本发明实施例提供的一种基于人工智能的视觉信息处理装置中视频处理单元的结构框图;

图7为本发明实施例提供的一种基于人工智能的视觉信息处理装置中产品图像获取模块的结构框图;

图8为本发明实施例提供的一种基于人工智能的视觉信息处理方法的计算机设备的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。

目前,随着自动化行业的发展,对产品的质量要求越来越高,所以使得产品的外观质量检测也越来越重要;目前自动化行业产品外观质量检测主要是人工检测和接触式检测为主,这两种检测方式都各有缺点;其中,人工检测对于人眼长时间工作在高光源下工作,极易疲劳,容易误判和漏判;并且由于每个人对标准的认识程度和理解程度不同,主观判断的标准不一;其检测的工作量大、重复性高,对人眼的伤害严重;而接触式检测主要是测量仪关节臂和三坐标等仪器测量,首先这类仪器对一些异性不规则的产品无法精确测量,其次接触式测量方式是逐点测量,其测量速度慢。

为解决上述问题,本发明实施例提供的基于人工智能的视觉信息处理方法通过获取原始视频;对所述原始视频进行预处理,得到多帧灰度图像;确定至少一帧满足预设条件的参考帧图像;将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。本发明实施例能够对原始视频中的目标产品的外观进行检测,并通过检测结果对目标产品存在的外观缺陷进行分类,能够有效解决目前自动化行业产品外观质量检测主要是人工检测和接触式检测为主,存在检测效率低、效果差的问题。

以下结合具体实施例对本发明实施例提供的基于人工智能的视觉信息处理方法的具体实现进行详细描述。

在本申请一个典型的配置中,终端、服务网络的设备和计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。

计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

图1为本发明实施例提供的一种基于人工智能的视觉信息处理方法的系统架构图;

在本发明实施例中,一种基于人工智能的视觉信息处理方法,所述方法在系统中进行,其中,如图1所示,所述系统100包括摄像模块101、控制模块102及与所述控制模块10通过高速数据总线连接的计算模块103,所述摄像模块101包括用于采集包含目标产品的原始视频的一个或多个摄像头。

具体的,如图2所示,如2示出了本发明实施例提供的一种基于人工智能的视觉信息处理方法的实施流程图;

其中,在本发明的一个实例中,所述方法200包括以下步骤:

步骤s201:获取原始视频;

可以理解的是,在本发明优选实施例提供的获取原始视频的步骤中,其采用摄像模块101对目标区域进行摄像,其中,目标区域内包含有目标产品;其中,可以通过多个摄像头对目标产品的不同角度进行摄像,以获取内容信息更为丰富的原始视频;

步骤s202:对所述原始视频进行预处理,得到多帧灰度图像;

具体的,在本发明提供的步骤s202的具体实现中,首先,提取所述原始视频的帧图像集,确定每一帧图像的产品图像;将所述帧图像集中含有预设图像的的多帧图像进行灰度处理。

其中,在确定每一帧图像的产品图像中,可以采用图像色差的方式或者边缘检测的方式的进行,优选的,采用边缘检测的方式的确定每一帧图像的产品图像;具体的,所述边缘检测的方式包括:根据所述帧图像中各像素点的灰度值确定所述帧图像中的目标产品的边缘像素点;根据所述帧图像的目标产品的边缘像素点确定所述帧图像中目标产品的边缘;根据所述目标产品的边缘确定当前帧图像的产品图像。

步骤s203:确定至少一帧满足预设条件的参考帧图像;

在本发明实施例提供的步骤s203中,预设条件即具有合格产品图像的图像作为参考帧图像。

步骤s204:将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;

步骤s205:根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

具体的,在本发明实施例中,所述的类别属性可以是合格产品或者不合格产品,在判定为不合格产品时,对所述不合格产品的外观缺陷进行具体的细分,如产品图像的不完整,如产品边缘缺失等。

进一步的,在本发明提供的另一个优选实施方式中,在所述根据预先训练的分类识别模型对所述描述向量进行分类识别的步骤之后,所述方法还包括:根据分类识别结果,对所述分类识别模型进行修正优化,以获得更为精确的分类识别模型。

图3示出了本发明实施例提供的一种基于人工智能的视觉信息处理方法的一个子流程图;进一步的,在本发明提供的一个优选实施方式中,所述对所述原始视频进行预处理的步骤s202具体包括:

步骤s2021:提取所述原始视频的帧图像集,确定每一帧图像的产品图像;

步骤s2022:将所述帧图像集中含有预设图像的的多帧图像进行灰度处理。

图4为本发明实施例提供的一种基于人工智能的视觉信息处理方法的另一个子流程图;

进一步的,在本发明提供的一个优选实施方式中,所述确定每一帧图像的产品图像的步骤s2021具体包括:

步骤s20211:根据所述帧图像中各像素点的灰度值确定所述帧图像中的目标产品的边缘像素点;

步骤s20212:根据所述帧图像的目标产品的边缘像素点确定所述帧图像中目标产品的边缘;

步骤s20213:根据所述目标产品的边缘确定当前帧图像的产品图像。

在本发明提供的优选实施例中,为确定当前帧图像的产品图像,还可以是采用图像色差的方式直接获取所述待检产品的图像,例如,在采用图像色差的方式中,可以将目标产品放置在与产品颜色存在明显不同的背景下,这样一来,能够根据与目标产品与图像中背景的颜色的巨大反差,去直接又快速的获取所述目标产品的图像,当然,可以理解的是,上述采用图像色差的方式中,需要使得目标产品以及背景的颜色的反差效果能够达到一定的要求,若颜色反差效果不明显,则该采用图像色彩的方式可能无法精确的确定当前帧的产品图像;

另外,也可以是采用边缘检测的方式,根据所述帧图像中各像素点的灰度值确定所述帧图像中的目标产品的边缘像素点;根据所述帧图像的目标产品的边缘像素点确定所述帧图像中目标产品的边缘;根据所述目标产品的边缘确定当前帧图像的产品图像;在此种方式中,其本质是根据图像中物体的边缘的灰度不连续的特征,利用梯度进行处理,通过获取目标产品的图像的边缘,从而进一步确定所述目标产品的图像,例如,使用roberts边缘算子或者sobel边缘检测算子等方式实现所述的边缘检测的方式,相比于前述采用图像色差的方式,本发明优选实施例中采用边缘检测的方式对目标图像不存在色彩反差的要求,即要求更低。

图5为本发明实施例提供的一种基于人工智能的视觉信息处理装置的结构框图;

进一步的,在本发明提供的一个优选实施方式中,还提供了一种基于人工智能的视觉信息处理装置,所述装置300包括:

视频摄像单元301,用于获取原始视频;

视频处理单元302,用于对所述原始视频进行预处理,得到多帧灰度图像;

帧图像确定单元303,用于确定至少一帧满足预设条件的参考帧图像;

图像比对单元304,用于将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;

类型识别单元305,用于根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

图6为本发明实施例提供的一种基于人工智能的视觉信息处理装置中视频处理单元的结构框图;

进一步的,在本发明提供的一个优选实施方式中,所述视频处理单元302包括:

产品图像获取模块3021,用于提取所述原始视频的帧图像集,确定每一帧图像的产品图像;

图像处理模块3022,用于将所述帧图像集中含有预设图像的的多帧图像进行灰度处理。

图7为本发明实施例提供的一种基于人工智能的视觉信息处理装置中产品图像获取模块的结构框图;

进一步的,在本发明提供的一个优选实施方式中,所述产品图像获取模块3021具体包括:

边缘像素点确定子模块30211,用于根据所述帧图像中各像素点的灰度值确定所述帧图像中的目标产品的边缘像素点;

产品边缘确定子模块30212,用于根据所述帧图像的目标产品的边缘像素点确定所述帧图像中目标产品的边缘;

产品图像确定子模块30213,用于根据所述目标产品的边缘确定当前帧图像的产品图像。

进一步的,在本发明提供的一个优选实施方式中,所述装置还包括:模型修正模块,用于根据分类识别结果,对所述分类识别模型进行修正优化。

综上所述,本发明实施例提供的基于人工智能的视觉信息处理方法通过获取原始视频;对所述原始视频进行预处理,得到多帧灰度图像;确定至少一帧满足预设条件的参考帧图像;将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。本发明实施例能够对原始视频中的目标产品的外观进行检测,并通过检测结果对目标产品存在的外观缺陷进行分类,能够有效解决目前自动化行业产品外观质量检测主要是人工检测和接触式检测为主,存在检测效率低、效果差的问题。

图8为本发明实施例提供的计算机设备的结构示意图。本发明实施例提供的计算机设备可以执行基于人工智能的视觉信息处理方法实施例提供的处理流程,如图5所示,计算机设备400包括存储器401、处理器402、计算机程序;其中,计算机程序存储在存储器401中,并被配置为由处理器402执行基于人工智能的视觉信息处理方法。

其中,在本发明提供的实施例中,并被配置为由处理器402执行的所述基于人工智能的视觉信息处理方法包括以下步骤:

获取原始视频;对所述原始视频进行预处理,得到多帧灰度图像;确定至少一帧满足预设条件的参考帧图像;将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

此外,计算机设备400还可具有通讯接口403,用于接收控制指令。

图8所示实施例的计算机设备可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

另外,本实施例还提供一种计算机可读存储介质,计算机可读存储介质可以为非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现基于人工智能的视觉信息处理方法。

其中,被处理器执行的所述基于人工智能的视觉信息处理方法包括:获取原始视频;对所述原始视频进行预处理,得到多帧灰度图像;确定至少一帧满足预设条件的参考帧图像;将多帧灰度图像分别与参考帧图像进行一一比对,得到异常帧图像;提取异常帧图像中的特征信息,将所述特征信息生成描述向量;根据预先训练的分类识别模型对所述描述向量进行分类识别,得到所述灰度图像的类别属性。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(readonlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开的实施例旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1