一种基于卷积神经网络的天然气集输站设备图像分类方法与流程

文档序号:14911772发布日期:2018-07-10 23:36阅读:1867来源:国知局

本发明涉及天然气开采技术领域,特别是涉及一种基于卷积神经网络的天然气集输站设备图像分类方法。



背景技术:

中国页岩气资源储量丰富,开发潜力巨大,2014年在重庆涪陵诞生了我国首个已探明储量超千亿立方米的超大型页岩气田。近年来,石油与天然气领域的研究人员对该页岩气田进行了大量的研究,在钻井、防漏等方面都积累了一批先进技术,实现了复杂地理条件下页岩气的顺利开采。

开采的页岩气需要进入天然气集输站进行汇集、节流、分离、计量,最后通过集输管线外输。因天然气集输站为高危生产场所,设备的安全性巡检非常重要。目前,天然气集输站一般采用人工定期巡检,但这需要投入大量的车辆和巡检人员。这种方式不仅运行成本高,而且可能因巡检周期长以及巡检人员认知不足等原因,无法有效发现安全隐患,也不能及时对站场内存在的安全隐患甚至是突发事故作出响应,给天然气集输站的安全带来诸多的不确定因素。

随着物联网技术的快速发展以及自动化设备可靠性的不断提高,无人值守站场已成为新的发展趋势,而智能化视频监控将是无人值守系统中的重要环节。但是,天然气集输站工艺流程复杂,相关设备种类繁多,若要实现智能化监控,首先要实现基于图像的设备识别与分类。卷积神经网络(Convolutional Neural Network,CNN)凭借对图像特征强大的提取能力,在图像识别与分类领域具有一定的通用性。但是在不同场景下仍然需进行针对性的优化,才能取得良好的效果。



技术实现要素:

本发明的目的在于针对天然气集输站工艺流程复杂,设备繁多,某些设备相似度较高的问题,传统的分类模型难以有效的对其进行区分,识别的难度非常大。拟提出一种基于卷积神经网络的天然气集输站设备图像分类方法,以解决天然气集输站关键设备的识别问题。

本发明的目的是这样实现的:

一种基于卷积神经网络的天然气集输站设备图像分类方法,基于天然气集输站的监控视频,设计集输站设备的深度神经网络模型,所述模型包括输入层、卷积层、池化层、全连接层和输出层;

步骤1输入层

对天然气集输站的监控视频进行图像数据采集,将图像数据总样本数的一部分用于模型训练,其余部分用于模型的测试,输入层读取图像数据信息,并将图像数据信息进行图像处理,得到多维矩阵;

步骤2卷积层-池化层

卷积层使用卷积核对传入的多维矩阵进行卷积运算,卷积层中输出的新的像素点由以下公式计算得出:

其中,f(·)代表激活函数,代表上一层特征图像的某个像素值,代表卷积核,*代表卷积运算;考虑到本层输出可以与上一层多个特征图像关联,表示参与运算的上一层的特征图像的子集;代表偏置项,上标l表示第l层,

采用最大池化法,取卷积运算后领域内的最大值,池化操作每个神经元对应卷积中的每一个位置,其公式为:

其中,u(n,1)是卷积操作的一个窗函数,aj对应图像区域的最大值;

步骤3全连接层和输出层

全连接层将池化操作后的具有最大特征的二维数据变为一维数据,从而进入输出层进行分类处理。

优选地,所述深度神经网络模型针对天然气集输站的监控视频中的天然气集输站关键设备和关键监控点位设计。

优选地,步骤1中,将图像数据总样本数的80%用于模型训练,其余20%用于模型的测试。

优选地,步骤1中,所述图像处理的方法包括数据增强、灰度处理、等比例缩放、归一化处理以及数组转换。

优选地,所述数据增强的方法包括:

平移,图像的平移是指图像沿X轴或Y轴方向(或两者同时)进行的整体移动,设某点向X轴方向移动tx,Y轴方向移动ty,(x,y)为变换前坐标,(X,Y)为变换后坐标,则平移的公式为:

旋转,图像的旋转是指图像以某一点为圆心,以该点与原点连线为半径,逆时针旋转θ度,设该点(x,y),新的位置(X,Y),则旋转的公式为:

缩放,图像的缩放是指图像沿X轴方向与Y轴方向按照一定的比例进行放大或缩小,设图像中某点的坐标为(x,y),在X轴方向缩放sx倍,Y轴方向缩放sy倍,变换后的坐标为(X,Y),则缩放的公式为:

翻转,图像翻转是指图像将X轴或Y轴作为对轴,所得到镜像,设某点坐标(x,y)沿X轴翻转,转换后的坐标(X1,Y1);沿Y轴翻转,转换后的坐标(X2,Y2),翻转表达式为:

优选地,数据增强采用基于Python的深度学习库Keras。

优选地,步骤2中,卷积核里面包含了若干可以学习的参数,这些参数与多维矩阵中相同维度的子矩阵进行卷积运算,并以一定的步长移动,使卷积运算作用于整个矩阵,从而提取出该参数下的图像特征。

优选地,步骤2中,针对天然气集输站关键设备的识别需求,设计第一个卷积层使用了32个大小为3*3*1的卷积核对图像进行步长为3的卷积计算;第一个池化层采用最大池化方法,将特征图像缩小为原来的一半;第二个卷积层使用了64个大小为3*3*1的卷积核对图像进行步长为3的卷积计算;第二个池化层采用最大池化方法,将上一层的输入降采样操作后输出。

优选地,步骤3中,所述输出层为一个分类器,其神经元节点数为k,采集天然气集输站三种设备的图像,采用的分类器为SoftMax分类器,假设输入特征记为x(i),样本标签记为y(i)(y(i)经过矢量编码后变为0、1、2三类),构成训练集S={(x(1),y(1)),…,(x(m),y(m))},对于给定的输入x,利用假设模型对每个类别估算其概率值p(y=j|x),其中假设函数为:

其中,θ1,θ2,…,θk为可学习的模型参数,为归一化项,使得所有概率之和为1,从而得到代价函数

其中,1{·}为一个指示性函数,当括号内的值为真时,函数的结果为1,否则为0;

式(3)是对逻辑回归的推广,因此代价函数可以改为:

对于SoftMax代价函数J(θ)求其偏导数,得到梯度公式:

为一个向量,它的第l个元素是对的第l个分量的偏导数,

得到以上求解偏导数公式后,使用随机梯度下降算法对代价函数J(θ)进行最小化,在每次迭代过程中都需要对参数进行更新:最后实现SoftMax回归分类模型。

由于采用了上述技术方案,本发明与MLP(Multi-layer Perceptron,多层感知器)、RNN(Recurrent Neural Networks,循环神经网络)、LSTM(Long Short-Term Memory,长短期记忆网络)开展对比研究,实验结果表明,所提出的模型具有更高的准确率与可靠性。

附图说明

图1为基于天然气集输站关键设备的卷积神经网络结构;

图2为基于天然气集输站关键设备的卷积神经网络结构设计;

图3为训练次数与模型分类准确率之间的关系图;

图4为准确率曲线图;

图5为损失函数曲线图;

图6a为CNN模型准确率曲线;

图6b为CNN模型损失函数曲线;

图7a为MLP模型准确率曲线;

图7b为MLP模型损失函数曲线;

图8a为RNN模型准确率曲线;

图8b为RNN模型损失函数曲线;

图9a为LSTM模型准确率曲线;

图9b为LSTM模型损失函数曲线;

图10a为2层卷积下模型的准确率曲线;

图10b为2层卷积下模型的损失函数曲线;

图11a为3层卷积下模型的准确率曲线;

图11b为3层卷积下模型的损失函数曲线;

图12a为4层卷积下模型的准确率曲线;

图12b为4层卷积下模型的损失函数曲线;

图13a为5层卷积下模型的准确率曲线;

图13b为5层卷积下模型的损失函数曲线;

图14a为3-3卷积核下模型的准确率曲线;

图14b为3-3卷积核下模型的损失函数曲线;

图15a为4-4卷积核下模型的准确率曲线;

图15b为4-4卷积核下模型的损失函数曲线;

图16a为5-5卷积核下模型的准确率曲线;

图16b为5-5卷积核下模型的损失函数曲线;

图17a为3-4卷积核下模型的准确率曲线;

图17b为3-4卷积核下模型的损失函数曲线;

图18a为3-5卷积核下模型的准确率曲线;

图18b为3-5卷积核下模型的损失函数曲线;

图19a为4-5卷积核下模型的准确率曲线;

图19b为4-5卷积核下模型的损失函数曲线;

图20a为Adadelta优化器下模型的准确率曲线;

图20b为Adadelta优化器下模型的损失函数曲线;

图21a为SGD优化器下模型的准确率曲线;

图21b为SGD优化器下模型的损失函数曲线;

图22a为RMSprop优化器下模型的准确率曲线;

图22b为RMSprop优化器下模型的损失函数曲线;

图23a为Adagrad优化器下模型的准确率曲线;

图23b为Adagrad优化器下模型的损失函数曲线;

图24a为Adam优化器下模型的准确率曲线;

图24b为Adam优化器下模型的损失函数曲线。

具体实施方式

1.本发明的设计思路:

1.1卷积神经网络模型设计

针对天然气集输站工艺流程复杂,设备繁多,某些设备相似度较高的问题,传统的分类模型难以有效的对其进行区分,识别的难度非常大。拟提出一种基于CNN(Convolutional Neural Network,卷积神经网络)的天然气集输站设备图像分类方法,以解决天然气集输站关键设备的识别问题。基于天然气集输站技术改造后的监控视频,设计一种集输站设备的CNN网络结构,用于自动提取站场内设备图像特征;对现有图像数据进行数据增强,解决网络模型泛化能力不足等问题;建立SoftMax分类器,实现设备识别和分类。

1.2数据增强

在提出的模型中,数据量的大小很大程度上影响着训练所得模型的性能。小样本容易导致网络过拟合并影响模型泛化能力。本文中采用了数据增强方法来解决小样本数据问题。即从现有的数据集中取出一些样本,对这些样本进行随机变换,从而生成更多的样本。这种随机变换只是改变图像中目标的位置、尺寸,并未改变图像的本质特征,经数据增强后的数据集与原始数据集在训练过程中具有等同的作用。数据增强还能使分类器能够应对更加多变的环境,使分类器的性能越来越强大。现场实验中,可能会遇到待识别的设备不在图像中心,发生旋转或过大、过小等问题,因而需要对来自原始视频信息中的图片进行平移、旋转、缩放以及翻转处理。实际问题及处理方法如表1所示。

表1天然气集输站场实际问题及应对措施

2本发明的详细技术方案:

2.1卷积神经网络模型设计

基于天然气集输站技改后的监控视频,针对其关键设备和关键监控点位,设计了一种基于CNN的深度神经网络模型,该模型主要由输入层、卷积层、池化层、全连接层和输出层5部分组成(如图1所示)。

2.1.1输入层

基于灯杆搭载监控设备进行图像数据采集,其中设备图像总样本数的80%用于模型训练,其余20%用于模型的测试。输入层直接读取天然气集输站关键设备及关键工位的高清图像信息,这些信息经过一系列图像处理,如数据增强,灰度处理,等比例缩放,归一化处理以及数组转换而得到的多维矩阵。矩阵中的每一个数值代表着该点处的像素值,经灰度处理后,每一个像素值都在0~255范围内;考虑到相邻像素点之间像素值的波动会影响训练结果,所以对每一个像素值同除以255,即归一化处理。处理之后,每一个像素值都位于0~1范围内,减小了因像素值波动而带来的训练不稳定现象。

2.1.2卷积-池化层选取

卷积层使用卷积核对传入输入层的多维矩阵进行卷积操作,卷积核相当于一个宽高相等的“窗口”,里面包含了若干可以学习的参数,这些参数与矩阵中相同维度的子矩阵进行卷积运算,并以一定的步长移动,使卷积运算作用于整个矩阵,从而提取出该参数下的图像特征。卷积层中主要对纵向深度以及横向宽度进行设计。一方面,改变卷积层的堆叠层数。一般情况下,层数越多提取到图像特征越抽象,但具体要视图像的复杂程度而定,图像越复杂,需要的卷积层越多;另一方面,改变卷积核的尺寸、个数。在进行卷积运算过程中,卷积窗口以一定的步长移动,卷积核过大,会导致部分特征信息遗漏;卷积核过小,则会导致卷积运算次数增加。同时每一个卷积核因参数不同而提取的特征也不同,需要针对具体图像的复杂程度,选择合适的卷积核个数。卷积层中输出的新的像素点可由公式(1)计算得出:

其中,f(·)代表激活函数,代表上一层特征图像的某个像素值,代表卷积核,*代表卷积运算;考虑到本层输出可以与上一层多个特征图像关联,表示参与运算的上一层的特征图像的子集;代表偏置项,上标l表示第l层。

在基于CNN的模型中,为减少参数的数量并避免过拟合,一般在卷积层后面接入池化层。常用的池化方法包括:均值池化、最大池化。天然气集输站关键设备视频图像数据背景单一且静止,所以可以考虑采用最大池化法。最大池化法取卷积运算后领域内的最大值,该方法相比于均值池化能够更多保留天然气集输站内关键设备的纹理信息,从而提高分类的准确率。池化操作中每个神经元对应卷积中每一个位置。其公式为:

其中,u(n,1)是卷积操作的一个窗函数,aj对应图像区域的最大值。

针对天然气集输站关键设备的识别需求,设计的第一个卷积层使用了32个大小为3*3*1的卷积核对图像进行步长为3的卷积计算;第一个池化层采用最大池化方法,将特征图像缩小为原来的一半;第二个卷积层使用了64个大小为3*3*1的卷积核对图像进行步长为3的卷积计算;第二个池化层采用最大池化方法,将上一层的输入降采样操作后输出SoftMax层。

2.1.3SoftMax层设计

天然气集输站的设备图像以二维矩阵的形式进入卷积层和池化层进行特征提取与降维,全连接层主要是将池化处理后的具有最大特征的二维数据“抹平”为一维数据,从而进入输出层进行分类处理。基于CNN的神经网络模型输出层是一个分类器,其神经元节点数k(k为样本标签的种类数)根据具体的分类任务确定。实验中共采集了天然气集输站三种设备的图像,所以采用的分类器为SoftMax分类器,该分类器是传统二分类模型在多分类问题上的推广,适合对多种互斥的类别进行分类。假设输入特征记为x(i),样本标签记为y(i)(y(i)经过矢量编码后变为0、1、2三类),这样就构成了训练集对于给定的输入x,利用假设模型对每个类别估算其概率值p(y=j|x),其中假设函数为:

其中,θ1,θ2,…,θk为可学习的模型参数,为归一化项,使得所有概率之和为1,从而得到代价函数

其中,1{·}为一个指示性函数,当括号内的值为真时,函数的结果为1,否则为0。

式(3)是对逻辑回归的推广,因此代价函数可以改为:

对于SoftMax代价函数J(θ)求其偏导数,得到梯度公式:

为一个向量,它的第l个元素是对的第l个分量的偏导数。

得到以上求解偏导数公式后,使用随机梯度下降算法对代价函数J(θ)进行最小化。在每次迭代过程中都需要对参数进行更新:

最后实现SoftMax回归分类模型。

针对天然气集输站设备图像分类问题,设计的一种7层结构的深度神经网络模型如图2所示。

2.2数据增强处理

(1)平移

图像的平移是指图像沿X轴或Y轴方向(或两者同时)进行的整体移动。设某点向X轴方向移动tx,Y轴方向移动ty,(x,y)为变换前坐标,(X,Y)为变换后坐标。则平移的公式为:

(2)旋转

图像的旋转是指图像以某一点为圆心,以该点与原点连线为半径,逆时针旋转θ度。设该点(x,y),新的位置(X,Y),则旋转的公式为:

(3)缩放

图像的缩放是指图像沿X轴方向与Y轴方向按照一定的比例进行放大或缩小。设图像中某点的坐标为(x,y),在X轴方向缩放sx倍,Y轴方向缩放sy倍,变换后的坐标为(X,Y)。则缩放的公式为:

(4)翻转

图像翻转是指图像将X轴或Y轴作为对轴,所得到镜像。设某点坐标(x,y)沿X轴翻转,转换后的坐标(X1,Y1);沿Y轴翻转,转换后的坐标(X2,Y2)。翻转表达式为:

基于Python的深度学习库Keras中提供了可用于数据增强的基本函数,使用这些函数可将原始图像进行随机变换,获得大量的样本。这些经随机变换后产生的样本只是改变图像中目标的位置、尺寸,而并未改变图像的本质特征,所以经数据增强后的数据集与原始数据集在训练过程中具有等同的作用。随机变换函数如下表2所示。

表2随机变换函数

2.3实验

2.3.1实验平台

在表3中所述的实验平台上搭建了基于CNN的深度神经网络模型,对天然气集输站的现场数据进行特征提取,以完成识别、分类和多种分类模型的对比实验任务。实验平台中安装的是谷歌深度学习框架——TensorFlow的CPU版本,即在CPU上进行模型训练。

表3实验平台配置

2.3.2数据预处理

原始数据集与经随机变换后生成的数据集均为彩色图像,首先将两者随机打乱,并作灰度处理,然后将图像尺寸设置为28x28像素,接着按照不同的类别,分别进行标号处理。实验中共选取了10500张设备图像,其中电动阀图像、输气管线图像、储气罐图像各3500张,从每个类别中随机挑选出700张,共计2100张作为测试集,其余图像作为训练集。

2.3.3分类模型对比

MLP是传统的人工神经网络模型;CNN是本文中采用的模型;RNN及其变体LSTM是在处理序列样本任务下常用的模型。表4中显示了分别使用不同的分类模型,在相同的数据集下进行对比测试的结果。从损失函数值,分类准确率以及训练时间三个维度进行综合考量,最终CNN凭借损失函数值最低,分类准确率最高以及训练时长较短,被确定为天然气集输站设备图像数据集下的最优分类模型。

表4模型性能对比

2.3.4CNN深度神经网络结构调整

分别对训练次数,卷积层数,卷积核的大小以及优化器的类型进行不断调整,以测试出它们对卷积神经网络模型性能的影响,最终选择出最适合天然气集输站图像数据集的网络结构。实验中将样本数据分批加载进内存进行训练,选择的批处理大小为90,全连接层中dropout设置为0.5,即随机选择放弃50%的神经元,以防止模型过拟合。

(1)训练次数

图3中直观的显示了训练次数与模型分类准确率之间的关系。经过不断的分析对比,最终我们在批处理大小为90的条件下,选择训练次数70次,作为最佳训练次数。由此我们可以得知:在一定范围内增加训练次数可以提高模型的性能;反之,训练次数过多,导致过拟合,模型性能则会下降。

(2)卷积层数

在基于CNN的深度神经网络模型中,选择合适的卷积层数对提升模型性能具有十分重要的作用。卷积层数过少,网络模型不能有效提取原始图像的本质特征;卷积层数过多,则会导致过拟合,反而使得模型的泛化能力下降。表5中分别搭建2层卷积,3层卷积,4层卷积以及5层卷积的卷积神经网络模型,进行测试对比。实验表明,天然气集输站设备图像所构成的数据集并不复杂,使用2层卷积层的网络结构便能达到很好效果。

表5不同卷积层数下的模型性能

(3)卷积核尺寸

卷积核的尺寸也是影响基于CNN的深度神经网络性能的重要因素之一。表6中使用2层卷积层的网络结构,分别将卷积核尺寸设置为3-3、4-4、5-5、5-4、5-3,从训练时间,损失函数值以及分类准确率这三个维度进行对比。实验表明,当卷积核尺寸为3-3时,该网络能够更加有效的提取天然气集输站关键设备图像的图像特征,并且损失函数值最低,分类准确率最高以及训练时间较短。所以,当卷积层数为2层时,将卷积核尺寸设置为3-3最优。

表6不同卷积核下的模型性能

(4)优化器类型

深度学习库Keras中提供了Adadelta、SGD、RMSprop、Adagrad、Adam等优化器。SGD是按批更新网络参数;Adagrad对低频参数做较大更新,对高频参数做较小更新,用于处理稀疏数据效果较好;Adadelta和RMSprop都是针对Adagrad学习率急剧下降问题做出的改进;Adam则是另一种计算每个参数的自适应学习率的方法。本实验中,不断调整优化器类型并保持每一种优化器的默认参数不变。经过对比,Adam优化器训练时间短,分类准确率高,所以选择Adam作为最佳的优化器。不同优化器类型下的模型性能对比如表7所示。

表7不同优化器下的模型性能

2.3.4实验结果分析

针对天然气集输站设备图像样本数较少,并且现有的视频图像中待识别的设备出现平移、旋转等问题,提出了数据增强的方法。通过增加训练样本数量,以改善模型的泛化性能;对四种分类模型进行对比,选择了基于CNN的神经网络的分类模型;对该模型进行横向和纵向的调整,即改变训练次数,卷积层数,卷积核尺寸以及优化器类型等,最终确定的神经网络模型的结构为7层,包括1个输入层,2个卷积层,2个池化层,1个全连接层,1个输出层。每一次卷积-池化处理中,卷积核尺寸为3*3,激活函数为“relu”,池化尺寸为2*2。编译时选择的优化器类型为Adam,批处理量为90,经过70次迭代训练,测试集的分类准确率为97%。图4为该模型的准确率曲线,图5为损失函数曲线,随着训练次数的增加,网络的准确率不断上升,损失函数值逐渐下降,并在训练30次后网络基本收敛。

最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1