一种砂岩显微薄片的自动分类方法

文档序号:9598233阅读:460来源:国知局
一种砂岩显微薄片的自动分类方法
【技术领域】
[0001] 本发明涉及不同地域砂岩显微薄片的自动分类问题,特别针对地域不同导致的砂 岩薄片结构差异较大而难于互相借鉴,运用图像处理技术和机器学习方法,实现不同地域 砂岩薄片的自动分类。
【背景技术】
[0002] 砂岩是一种主要由砂粒胶结而成的陆源沉积岩,主要由石英和长石组成。按照其 成分和成因可划分为:石英砂岩、长石砂岩和岩肩砂岩三大类。砂岩是一种使用最广泛的建 筑用石材,还是石油和天然气的储集层,砂岩的分类在油气和矿物勘探等领域有重要意义。
[0003] 砂岩薄片分类根据砂岩的纹理和形状特征,确定砂岩薄片的种类,进而确定其结 构、来源和成因。现有砂岩薄片分类方法多采用人工,费时费力,且过度依赖个人经验,不可 重复。另外,由于形成的地质地域或环境不同,不同地域砂岩的结构差异较大,给砂岩薄片 的分类带来了很大困难。

【发明内容】

[0004] 本发明所要解决的技术问题是提供一种砂岩显微薄片的自动分类方法,该方法运 用图像处理技术和机器学习方法实现对不同地域砂岩显微薄片的自动分类。
[0005] 为达到上述目的,本方法采用如下的步骤:
[0006] 1)读取砂岩显微薄片图像,对其进行滤波、去噪、平滑等预处理;采用图像分割技 术,对砂岩显微薄片图像进行区域分割,获得矿物颗粒图像;
[0007] 2)基于砂岩显微薄片图像中的矿物颗粒,分别计算纹理和形状特征指标,构建薄 片图像的特征向量;
[0008] 3)对目标地域的砂岩薄片图像,计算其特征向量,采用近邻法选择若干个相似的 有标注的砂岩薄片图像样本,构建训练集合;
[0009] 4)精化训练集数据:采用随机取样方法对初始训练集中少数类的样本进行重采 样,实现训练集数据的类间平衡;分别计算每个特征指标的AN0VAF值,设定百分比,排除不 必要的特征指标;
[0010] 5)训练随机森林分类器,以目标地域砂岩薄片图像为输入,自动预测其种类。
[0011] 上述步骤2)中基于砂岩显微薄片图像的矿物颗粒构建薄片图像的特征向量的处 理过程是:首先针对薄片图像中的每个矿物颗粒,分别计算纹理特征和形状特征指标,组成 矿物颗粒的特征向量X ;然后对所有矿物颗粒的特征向量加权平均,得到均值特征向量xm, 计算公式如下:
[0013] 其中k为薄片图像中包含的矿物颗粒总数;再后选取前K个面积最大的矿物颗粒 的特征向量Xdi e [1,K]);最后将乂1,乂2,...,乂1(3111串接,构成薄片图像的特征向量。
[0014] 上述步骤2)中计算矿物颗粒的纹理特征的处理过程是:首先将颗粒图像转换 为灰度图像,计算位移矢量d分别为(1,0)、(1,1)、(0,1)以及(_1,1)的4个归一化 灰度共生矩阵P:矩阵P是一个256X256的矩阵,其第i行第j列的矩阵元素p[i,j] (0 < i < 255, 0 < j < 255)代表按矢量d分离的像素对的个数除以颗粒图像的总像素数 量,像素对中第一个像素的灰度值为i,另一个像素的灰度值为j ;分别按照4个位移矢量计 算,共得到4个灰度共生矩阵;
[0015] 然后针对每一个灰度共生矩阵P,计算能量Energy、熵Entropy、对比度Contrast 以及相关系数Correlation指标,计算公式如下,其中p [i, j] (0彡i彡255, 0彡j彡255) 代表矩阵P中元素:
[0024] 基于4个灰度共生矩阵,每个矿物颗粒获得16个纹理特征值。
[0025] 上述步骤2)中计算矿物颗粒的形状特征的处理过程是:首先计算颗粒图像中包 含的像素点总数,即颗粒的区域面积A ;统计其边界像素点的个数,即区域周长C ;然后求 颗粒区域的凸包,指包含颗粒的最小凸多边形;计算凸包面积H,即凸包所包含的像素点总 数;据以计算凸包差⑶和密制度Solidity指标,计算公式如下:
[0026] CD = H-A
[0027] Solidity = A/H
[0028] 接下来求包含颗粒区域的最小外接矩形,计算其面积ERA,即外接矩形包含的像素 点数量;从而获得每个矿物颗粒的5个形状特征值:区域面积A、周长C、凸包差CD、密致度 Solidity、以及外接矩形面积ERA ;合并形状特征和纹理特征,每个矿物颗粒转换为包含21 个特征值的特征向量X。
[0029] 上述步骤3)中基于目标地域砂岩薄片图像的特征向量,采用近邻法构建训练 集的计算过程是:对目标地域的砂岩薄片图像,首先计算其特征向量与现有样本集中各 砂岩薄片图像特征向量的欧氏距离;给定两个特征向量X:=〈X n, x12,...,Xim>和X2=<χ21,χ22, · · ·,x2m>,其欧氏距离的计算公式如下:
[0031] 其中xjP x 2i分别表示特征向量X 1和X 2的第i个特征指标值,m为特征向量中特 征变量的总数;
[0032] 然后按照距离递增顺序对样本集中各砂岩薄片图像排序,选取前s个相似的带标 注砂岩薄片图像,构建训练集;如果有多张目标砂岩薄片图像,则分别针对每一张薄片图 像,从样本集中选取s个近邻薄片图像,取其合集构成训练集。
[0033] 上述步骤4)中采用重采样技术完成训练集类间平衡的处理过程是:首先统计训 练集中各类砂岩薄片图像的数量;选择数量最多的砂岩种类,以其数量为基准值;如果其 他种类的薄片图像数量少于基准值的80%,则采用随机重采样技术,创建该种类薄片图像 的复本,直至数量达到基准值的80 %。
[0034] 上述步骤4)中计算每个特征指标的AN0VAF值,排除不必要特征指标的处理过程 是:首先基于训练集中每一个特征指标,计算其AN0VAF值,公式如下:
[0036] 其中i表示特征指标的序号,m表示特征指标的数量,即薄片图像特征向量的长 度;η表示训练集中薄片图像实例的数量;μ ;表示特征指标i的均值;μ表示训练集中所 有指标值的均值;Xlj表示特征指标i在第j个图像实例中的指标值;
[0037] 然后设定百分比,保留30%的特征指标,计算要保留的特征指标数量Μ ;
[0038] 随后删除AN0VAF值最小的特征指标,如果剩余的特征指标数量大于Μ,则重新计 算特征指标的AN0VAF值,重复删除过程;最后得到精化后的训练集。
[0039] 上述步骤5)中采用随机森林分类器自动预测砂岩薄片种类的计算过程是:首先 在训练集上训练随机森林分类器;然后基于目标地域砂岩显微薄片图像的特征向量,删除 其中不必要的特征指标,g卩训练集精化过程中删除的特征指标集,作为输入由随机森林分 类器预测砂岩薄片的种类。
[0040] 本发明方法基于砂岩显微薄片图像,运用图像处理技术和机器学习方法,充分利 用砂岩纹理清晰,颗粒形状独特的特性,提取纹理和形状特征指标,适用于砂岩的自动分 类;特别针对由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题,本发明 提出基于欧氏距离采用近邻法选择与目标砂岩薄片相似的薄片图像样本构建训练集,并对 训练集数据进行精化,训练随机森林分类器,从而达到理想的分类效果。本发明方法计算简 单,具有扩展性,分类效率高,可有效降低砂岩分类时间和成本,可随着砂岩薄片数据储备 的增加而提高自动分类的准确性;在油气勘探、砂岩分类和矿物鉴别中具有应用价值。
【附图说明】
[0041] 图1是不同地域砂岩显微薄片自动分类方法的总体框架;
[0042] 图2是岩石学领域砂岩分类的三角图;
[0043] 图3是来自不同地域的石英砂岩和长石砂岩显微薄片示意图;
[0044] 图4是基于砂岩显微薄片构建并精化训练集的处理流程图。
【具体实施方式】
[004
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1