一种砂岩显微薄片的自动分类方法_3

文档序号:9598233阅读:来源:国知局
F值,重复删除过程;最后得到精化后的训练集。
[0083] 上述步骤5)中采用随机森林分类器自动预测砂岩薄片种类的计算过程是:首先 在训练集上训练随机森林分类器;然后基于目标地域砂岩显微薄片图像的特征向量,删除 其中不必要的特征指标,g卩训练集精化过程中删除的特征指标集,作为输入由随机森林分 类器预测砂岩薄片的种类。
[0084] 本发明方法充分利用砂岩纹理清晰,颗粒形状独特的特性,提取纹理和形状特征 指标,适用于砂岩的自动分类;特别针对由于地域不同导致的砂岩薄片结构差异较大而难 于互相借鉴的问题,本发明提出基于欧氏距离采用近邻法选择与目标砂岩薄片相似的薄片 图像样本构建训练集,并对训练集数据进行精化,训练随机森林分类器,从而达到理想的分 类效果。通过收集西藏地区不同地域的砂岩薄片图像作为实验数据,实验结果表明本发明 方法对不同地域砂岩薄片分类具有较高的准确性:精度达到89. 3%,能够达到地质勘探的 基本要求。另外,本发明方法具有较好的扩展性:其一可以采用其他的机器学习技术;其二 通过砂岩薄片数据的不断储备,可以进一步提高砂岩分类的准确性。
[0085] 本发明方法的具体应用途径很多,以上所述仅是本发明的优选实施方式。应当指 出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干 改进,这些改进也应视为本发明的保护范围。
【主权项】
1. 一种砂岩显微薄片的自动分类方法,其特征在于包括以下步骤: 1) 读取砂岩显微薄片图像,对其进行预处理;之后采用图像分割技术对砂岩显微薄片 图像进行区域分割,获得矿物颗粒图像; 2) 基于砂岩显微薄片图像中的矿物颗粒,分别计算纹理和形状特征指标,构建薄片图 像的特征向量; 3) 对目标地域的砂岩薄片图像,计算其特征向量,采用近邻法选择若干个相似的有标 注的砂岩薄片图像样本,构建训练集合; 4) 精化训练集数据:采用随机取样方法对初始训练集中少数类的样本进行重采样,实 现训练集数据的类间平衡;分别计算每个特征指标的ANOVA F值,设定百分比,排除不必要 的特征指标; 5) 训练随机森林分类器,以目标地域砂岩薄片图像为输入,自动预测其种类。2. 根据权利要求1所述的砂岩显微薄片的自动分类方法,其特征在于, 上述步骤2)基于砂岩显微薄片图像的矿物颗粒构建薄片图像的特征向量的处理过程 是:首先针对薄片图像中的每个矿物颗粒,分别计算纹理特征和形状特征指标,组成矿物颗 粒的特征向量X ;然后对所有矿物颗粒的特征向量加权平均,得到均值特征向量Xni,计算公 式如下:其中k为薄片图像中包含的矿物颗粒总数;再后选取前K个面积最大的矿物颗粒的特 征向量X1Q e [1,K]);最后将X1, X2,...,X10Xni串接,构成薄片图像的特征向量。3. 根据权利要求2所述的砂岩显微薄片的自动分类方法,其特征在于, 上述步骤2)中计算矿物颗粒的纹理特征指标的处理过程是:首先将颗粒图像转换 为灰度图像,计算位移矢量d分别为(1,0)、(1,1)、(0,1)以及(_1,1)的4个归一化 灰度共生矩阵P :矩阵P是一个256X256的矩阵,其第i行第j列的矩阵元素 p[i,j] (0 < i < 255, 0 < j < 255)代表按矢量d分离的像素对的个数除以颗粒图像的总像素数 量,像素对中第一个像素的灰度值为i,另一个像素的灰度值为j ;分别按照4个位移矢量计 算,共得到4个灰度共生矩阵; 然后针对每一个灰度共生矩阵P,计算能量Energy、熵Entropy、对比度Contrast以及 相关系数Correlation指标,计算公式如下,其中p [i, j] (0彡i彡255, 0彡j彡255)代表 矩阵P中元素:基于4个灰度共生矩阵,每个矿物颗粒获得16个纹理特征值。4. 根据权利要求3所述的砂岩显微薄片的自动分类方法,其特征在于, 上述步骤2)中计算矿物颗粒的形状特征指标的处理过程是:首先计算颗粒图像中包 含的像素点总数,即颗粒的区域面积A ;统计其边界像素点的个数,即区域周长C ;然后求 颗粒区域的凸包,指包含颗粒的最小凸多边形;计算凸包面积H,即凸包所包含的像素点总 数;据以计算凸包差⑶和密制度Solidity指标,计算公式如下: CD = H-A Solidity = A/H 接下来求包含颗粒区域的最小外接矩形,计算其面积ERA,即外接矩形包含的像素点 数量;从而获得每个矿物颗粒的5个形状特征值:区域面积A、周长C、凸包差CD、密致度 Solidity、以及外接矩形面积ERA ;合并形状特征和纹理特征,每个矿物颗粒转换为包含21 个特征值的特征向量X。5. 根据权利要求4所述的砂岩显微薄片的自动分类方法,其特征在于, 上述步骤3)的过程是:对目标地域的砂岩薄片图像,首先计算其特征向量与现有样本 集中各砂岩薄片图像特征向量的欧氏距离;给定两个特征向量X1=〈X n, X12, ...,xlm>和X2 =<x21, x22, · · ·,x2m>,其欧氏距离的计算公式如下:其中X1JP x2i分别表示特征向量X JP X2的第i个特征指标值,m为特征向量中特征变 量的总数; 然后按照距离递增顺序对样本集中各砂岩薄片图像排序,选取前s个相似的带标注砂 岩薄片图像,构建训练集;如果有多张目标砂岩薄片图像,则分别针对每一张薄片图像,从 样本集中选取s个近邻薄片图像,取其合集构成训练集。6. 根据权利要求5所述的砂岩显微薄片的自动分类方法,其特征在于, 上述步骤4)中采用重采样技术完成训练集类间平衡的处理过程是:首先统计训练集 中各类砂岩薄片图像的数量;选择数量最多的砂岩种类,以其数量为基准值;如果其他种 类的薄片图像数量少于基准值的80%,则采用随机重采样技术,创建该种类薄片图像的复 本,直至数量达到基准值的80 %。7. 根据权利要求6所述的砂岩显微薄片的自动分类方法,其特征在于, 上述步骤4)中计算每个特征指标的ANOVA F值,排除不必要特征指标的处理过程是: 首先基于训练集中每一个特征指标,计算其ANOVA F值,公式如下:其中i表示特征指标的序号,m表示特征指标的数量,即薄片图像特征向量的长度;η表 示训练集中薄片图像实例的数量;μ i表示特征指标i的均值;μ表示训练集中所有指标值 的均值;Xu表示特征指标i在第j个图像实例中的指标值; 然后设定百分比,保留30%的特征指标,计算要保留的特征指标数量M ; 随后删除ANOVA F值最小的特征指标,如果剩余的特征指标数量大于M,则重新计算特 征指标的ANOVA F值,重复删除过程;最后得到精化后的训练集。8.根据权利要求7所述的砂岩显微薄片的自动分类方法,其特征在于,上述步骤5)中 采用随机森林分类器自动预测砂岩薄片种类的计算过程是:首先在训练集上训练随机森林 分类器;然后基于目标地域砂岩显微薄片图像的特征向量,删除其中不必要的特征指标,即 训练集精化过程中删除的特征指标集,作为输入由随机森林分类器预测砂岩薄片的种类。
【专利摘要】本发明公开了一种砂岩显微薄片的自动分类方法,其步骤是:1)对砂岩的显微薄片图像进行预处理,分割矿物颗粒;2)以颗粒为单位分别提取纹理和形状特征,选择代表颗粒,构成薄片图像的特征向量;3)对目标地域的砂岩薄片,基于欧氏距离采用近邻法选择相似的砂岩薄片样本,构建训练集合;4)精化训练集数据,包括类间平衡和特征降维;5)训练随机森林分类器,预测砂岩薄片的种类。本方法运用图像处理技术和机器学习方法,自动鉴别来自不同地域的砂岩薄片种类,能够解决由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题。
【IPC分类】G06K9/66
【公开号】CN105354600
【申请号】CN201510628405
【发明人】王建翔, 顾庆, 喻黎霞, 陈道蓄
【申请人】南京大学
【公开日】2016年2月24日
【申请日】2015年9月28日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1