一种带钢表面面积型缺陷识别分类的方法

文档序号:8544058阅读:426来源:国知局
一种带钢表面面积型缺陷识别分类的方法
【技术领域】
[0001] 本发明设及机器视觉、图像处理、模式识别领域,尤其设及一种带钢表面面积型缺 陷识别分类的方法。
【背景技术】
[0002] 进入21世纪我国制造业已进入飞速发展时代,对基础原材料的质量与产能提出 了更高要求。带钢作为制造业中最为重要的基础原材料之一,在机械、汽车、船体、航空等工 业制造中不可或缺,其产出质量与产能对国家经济发展的重要性可想而知,制造商对带钢 的产品质量要求越来越高。带钢产品的质量由多方面因素控制,主要包括生产的原材料、轴 制生产工艺等。产出的带钢质量表现在带钢的表面,常出现的缺陷有划伤、裂边、孔洞等单 一缺陷,该些缺陷W目前的技术检出率已经达到很高的水准,但是存在很多面积型复杂缺 陷如红诱、椒盐缺陷、灰尘状缺陷等,该些缺陷在识别上还存在非常大的问题。上述表面缺 陷不仅影响带钢外观,而且对带钢本身的耐磨性、硬度、强度等性能也都有很大影响。因此, 对带钢表面缺陷识别分类与及时纠偏非常重要,不仅可W提高产出的带钢质量,而且可极 大降低原材料的消耗。
[0003] 基于机器视觉的带钢表面缺陷检测主要包括带钢缺陷特征提取W及图像分类识 别两大步骤。目前带钢缺陷特征提取的方法很多,比较常见的有灰度共生矩阵(GLCM)、尺 度不变特征变换(SIFT)等,该些方法用于带钢单一缺陷的特征提取效果较佳,但是针对带 钢面积型复杂缺陷效果不是很好,不能详细描述每种复杂缺陷之间的区别;同时,单一的特 征提取不能够克服光照不变性、旋转性等问题。为此,本专利提出将方向梯度直方图(HOG) 与化CM两类特征融合进行面积型复杂缺陷的识别与分类。册G特征对缺陷边缘非常敏感, 即对缺陷细节描述非常细致,但是不能够克服旋转性的问题,并且对整幅图特征把握不好。 化CM能够很好地克服缺陷旋转性问题,且对整幅图缺陷的把握很好,但是其缺点是对细节 描述不佳。将两类特征融合,可W非常好地克服几何、光学不变性W及旋转性等问题,同时 能够详尽地描述各种复杂缺陷之间的区别,W达到识别分类的目的。
[0004] 图像识别分类算法也有很多,比较常用的有支持向量机(SVM)、词袋炬0W)、K均值 等。支持向量机虽然在二分类或者少分类、低数据样本的情况下表现很好,但是在分类种类 达到4种W上、特征维度达到1000W上、训练样本数据变多的时候,支持向量机的识别准确 率就会急剧下降。BOW在对样本差距较大的识别效果特别好,比如在对样本为吉他、蝴蝶、 自行车该几种图片识别分类效果特别好,但是针对带钢缺陷图像,由于无缺陷部分的图像 非常接近,有缺陷图像部分占比例不是非常大,因此会出现识别结果错误率特别高的现象。 K均值在数据特征完成W后不能够很好地确定K的个数,有时设定的K值与要分的种类会 发生冲突、出现不合理的分类状况。随机森林是一种利用多棵决策树对样本进行训练并预 测的分类器,由Leo化eiman和Adele化tier于2001年提出,为一种机器学习算法。随机 森林克服了决策树过拟合问题,对噪声和异常值有较好的容忍性,对高维数据分类问题具 有良好的可扩展性和并行性。随机森林算法相对其他算法的优点在于能够快速处理高维度 数据信息,而且不需要对特征进行加权,同时也不需要对算法剪枝,多分类精准度非常高, 对多维特征训练速率非常快。虽然随机森林在图像识别分类方面相对于其他算法有很多优 势,但是它自身的原理会导致本发明运用的册G与化CM多特征融合不均衡。因此本发明对 随机森林算法进行改进,将森林里面的决策树平均分为两个部分,分别对册G与GLCM的特 征进行随机选取、测试样本预测,且两个部分的决策树分别投票,统计票数记为最终识别结 果。改进后的随机森林算法可W均衡地融合册G与化CM的特征予W分类识别。

【发明内容】

[0005] 本发明所要解决的技术问题是,克服W上【背景技术】中提到的不足和缺陷,提供一 种具有光照、几何和旋转不变性等优点,同时高效区分复杂缺陷特征之间差别的带钢表面 面积型缺陷识别分类方法。
[0006] 为解决上述技术问题,本发明提出的技术方案为一种带钢表面面积型缺陷识别分 类的方法,包括W下步骤:
[0007] 步骤(1)、从训练样本库中提取带钢表面图片,对图片进行定宽高裁剪去除图片 非带钢表面无用背景,使所得图片只剩下带钢表面,将图片所属类别保存至对应标签矩阵 中;
[0008] 步骤(2)、对裁剪后图片进行双线性差值算法缩放;
[000引步骤(3)、采用Gamma校正法,对缩放的图片的图像进行颜色空间归一化,从而调 节图像的对比度、降低图像局部的阴影和光照变化所造成的影响,同时抑制噪声干扰;
[0010]步骤(4)、对校正后图片进行方向梯度直方图(HOG)特征提取,将图片分成若干个 细胞单元,选取细胞单元为8乘8,块的大小为16乘16,块的步进大小为8乘8,W步进的形 式计算特征从而克服缺陷位置变化性、旋转性等问题;每个细胞单元提取9个方向的梯度 直方图,每幅图片共提取1764个向量特征作为训练特征的一部分,W便准确地表述不同纹 理缺陷之间的差别;HOG对缺陷的边缘非常敏感,可W非常精准地描述每一种面积型缺陷 之间的区别,但是它不能够克服缺陷旋转性的问题,对整体粗趟度等特征不敏感,为此需要 用步骤5提出的灰度共生矩阵来弥补该些不足;
[0011] 步骤巧)、选择灰度共生矩阵对校正后图片进行纹理特征提取,其中灰度共生矩阵 佑LCM)表示纹理特征,包括纹理对比度、最大概率、纹理相关性、滴、均值和、方差、方差和、 逆差矩、差的方差、和滴、差滴、聚类阴影、显著阴影、角二阶矩;为了克服缺陷样本的旋转 性,分别提取W上14个纹理特征的4个方向(0°,45°,90° 135° )组成训练数据库的纹 理特征,由此得到56个向量特征;灰度共生矩阵是对图片整体的一个特征的描述,4个方向 的特征统计很好地克服了旋转性的问题,但是其对细节特征描述不是很到位,不过HOG特 征正好弥补该个缺点;
[001引步骤化)、考虑到化CM得到的纹理特征与册G得到的特征各有优缺点,将两者进行 合并,组成一个含1820个特征的特征集作为训练数据库;
[0013] 步骤(7)、利用改进的随机森林(RandomForest)分类算法离线训练特征数据集。 其中由册G计算得到1764个图像特征用50棵最大深度为20的决策树训练,由化CM计算 得到56个图像特征用50棵最大深度为6的决策树训练,融合100棵决策树的分类结果按 照投票统计原则确定当前图像所属的类别i(缺陷种类一共15种),i= 1,2,…,15。
[0014] 步骤巧)、将测试样本数据依次经过双线性插值算法缩放,再进行Gamma校正,然 后进行册G特征和化CM纹理特征提取,再将特征数据输入到改进的随机森林分类器中完成 识别。
[0015] 上述的方法中,优选的,所述双线性差值算法的具体步骤包括;对于一个目的坐 标,通过向后映射法得到其在原始图像的对应浮点坐标(i+u,j+v),其中i、j均为非负整 数,U、V为[0,1]区间的浮点数,则该个像素的值f(i+u,j+v)可由原图像中坐标为(i, j)、(
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1