一种基于多视角学习的抽油机井工况识别方法及系统与流程

文档序号:17427739发布日期:2019-04-17 03:05阅读:224来源:国知局
一种基于多视角学习的抽油机井工况识别方法及系统与流程

本发明涉及工况诊断技术领域,特别涉及一种基于多视角学习的抽油机井工况识别方法及系统。



背景技术:

在现有的抽油机井工况识别方法中,多数工况识别方法是基于示功图识别技术,主要是利用泵功图或实测地面示功图结合人工智能方法进行工况识别;还有是基于电参数的识别方法,主要是利用电功图或实测电参数进行工况识别;很少有基于多源数据的识别方法,基于多源数据的识别方法主要是利用泵功图结合油井生产信息(产量、抽汲参数、井况数据等)进行工况识别。

已有技术中的工况识别方法在抽油机井生产中取得了较好成效,但仍存在如下的局限性:(1)在机电液耦合的复杂非线性系统中,用单一信息源判断油井工况易产生误报现象;(2)受阻尼系数和“除零”问题影响,通过模型计算得到的泵功图和电功图会影响特征参数值精度计算;(3)受传统多特征连接识别方法技术限制、先期油井海量实时数据采集和存储技术限制、井况复杂多变、人工统计数据不可靠等因素影响,已有的基于多源数据的工况识别方法的识别效果和模型鲁棒性均比较低;(4)已有技术中的工况识别方法需要大量标记工况训练样本,而实际工程中标记工况样本的获取难度大且获取代价大,而无标记样本训练的方法往往识别精度不佳。

在大数据和油气生产物联网环境下,抽油机井采油生产系统获取了大量多源实时数据,如实测地面示功图、电参数、井口温度、井口压力等,同时也获取了大量未知工况数据,这些多源实时数据能够及时、全面地反映抽油机井工况。

受上述局限性影响,目前已有的工况识别方法在抽油机井生产中的实际应用效果并不理想;此外,已有技术中严重缺乏适合大数据生产环境下有效融合多个实测信息源建立的工况识别模型,因此,亟待研究开发一种抽油机井工况识别方法和系统以提高识别精度和实用性,解决已有技术中的抽油机井工况识别方法不利于智能油田生产建设与发展的技术问题。



技术实现要素:

为了解决现有技术中存在的缺陷,本发明实施例提供一种基于多视角学习的抽油机井工况识别方法及系统,采用基于大数据生产环境下的多视角学习方法,以实测地面示功图和电功率信号为两个不同的主视角,实测井口温度和井口压力信号为两个辅视角,进行有效组合并利用这四个实测视角,通过少量抽油机井工况数据或结合大量未知工况数据建立工况识别模型,进一步提高油井工况识别精准率和工程应用性,最大化地服务于采油生产,降低作业成本,提高油井采收率,促进智能油田生产建设与发展。所述技术方案如下:

第一方面,提供了一种基于多视角学习的抽油机井工况识别方法包括:

构建包含已知抽油机井工况和未知抽油机井工况对应的实测地面示功图、电功率信号、井口温度和井口压力信号四个视角的样本库;

以实测地面示功图和电功率信号为主,实测井口温度和井口压力信号为辅,根据实际需求构建主辅视角组合;

分别对所构建的主辅视角组合中的每一个视角,根据机理分析、先验信息和专家知识进行特征提取,以构建每一个视角的特征数据样本集;

根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成hessian正则化建立相应的工况识别模型;

通过建立的工况识别模型进行抽油机井工况识别。

可选的,所述以实测地面示功图和电功率信号为主,实测井口温度和井口压力信号为辅,根据实际需求构建主辅视角组合,具体为:

以实测地面示功图和电功率信号为2个主视角,实测井口温度和井口压力信号为2个辅视角,构建主辅视角组合,其中,所述主辅视角组合为第一视角组合、第二视角组合和第三视角组合中的一种,其中,所述第一视角组合包括实测地面示功图和实测电功率信号两个主视角,所述第二视角组合包括实测地面示功图、实测电功率信号和实测井口温度信号三个主辅视角,所述第三视角组合包括实测地面示功图、实测电功率信号、实测井口温度信号和实测井口压力信号四个主辅视角。

可选的,所述分别对所构建的主辅视角组合中的每一个视角,根据机理分析、先验信息和专家知识进行特征提取,以构建每一个视角的特征数据样本集,具体包括:

依据抽油泵一个工作周期内功图面积、冲次、载荷、活塞上的液柱重量、冲程、有效冲程、冲程损失、加载和卸载过程关键点位置的变化进行实测地面示功图的特征提取,其中,实测地面示功图的特征参数包括冲程、冲次、功图实际面积、最大载荷、最小载荷、最大最小载荷比、活塞上液注重量、有效冲程、加载冲程损失、卸载冲程损失、提前加载位置、提前卸载位置;

依据“功特征”和“auc特征”进行实测电功率信号的特征提取,其中,实测电功率信号的特征参数包括:上行功、下行功、周期功、上行面积、下行面积、周期面积、平衡率;

依据机理分析和专家知识进行实测井口温度信号的特征提取,其中,实测井口温度信号的特征参数包括:上行热能耗损、下行热能耗损、周期热能耗损;

依据机理分析和专家知识进行实测井口压力信号的特征提取,其中,实测井口压力信号的特征参数包括:上行能量耗损、下行能量耗损、周期能量耗损。

可选的,所述根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成hessian正则化建立相应的工况识别模型,具体包括:

根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,确定对应的多视角学习方法,并有效地集成hessian正则化建立相应的工况识别模型,其中,

若构建的为第一视角组合,则采用加权多核学习方法、协同训练学习方法、加权典型相关分析学习方法中的一种多视角学习方法;

若构建的为第二视角组合,则采用多视角加权多核学习方法;

若构建的为第三视角组合,则采用多视角加权典型相关分析学习方法。

可选的,所述通过建立的工况识别模型进行抽油机井工况识别,具体为:

若建立的工况识别模型为hessian正则化协同训练工况识别模型,则在对应模型上采用svm一对一两分类器进行工况识别;

若建立的工况识别模型为hessian正则化加权典型相关分析工况识别模型和hessian正则化多视角加权典型相关分析工况识别模型,则分别在对应模型上采用余弦最近邻多分类器进行工况识别;

若建立的工况识别模型为加权多核学习工况识别模型和多视角加权多核学习工况识别模型,则在对应模型上采用logistic回归一对多两分类器进行工况识别。

第二方面,提供了一种基于多视角学习的抽油机井工况识别系统包括:

样本库构建模块,用于构建包含已知抽油机井工况和未知抽油机井工况对应的实测地面示功图、电功率信号、井口温度和井口压力信号四个视角的样本库;

视角构建模块,用于以实测地面示功图和电功率信号为主,实测井口温度和井口压力信号为辅,根据实际需求构建主辅视角组合;

特征数据采集模块,用于分别对所构建的主辅视角组合中的每一个视角,根据机理分析、先验信息和专家知识进行特征提取,以构建每一个视角的特征数据样本集;

模型建立模块,用于根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成hessian正则化建立相应的工况识别模型;

工况识别模块,用于通过建立的工况识别模型进行抽油机井工况识别。

可选的,所述视角构建模块具体用于:

以实测地面示功图和电功率信号为2个主视角,实测井口温度和井口压力信号为2个辅视角,构建主辅视角组合,其中,所述主辅视角组合为第一视角组合、第二视角组合和第三视角组合中的一种,其中,所述第一视角组合包括实测地面示功图和实测电功率信号两个主视角,所述第二视角组合包括实测地面示功图、实测电功率信号和实测井口温度信号三个主辅视角,所述第三视角组合包括实测地面示功图、实测电功率信号、实测井口温度信号和实测井口压力信号四个主辅视角。

可选的,所述特征数据采集模块具体用于:

依据抽油泵一个工作周期内功图面积、冲次、载荷、活塞上的液柱重量、冲程、有效冲程、冲程损失、加载和卸载过程关键点位置的变化进行实测地面示功图的特征提取,其中,实测地面示功图的特征参数包括冲程、冲次、功图实际面积、最大载荷、最小载荷、最大最小载荷比、活塞上液注重量、有效冲程、加载冲程损失、卸载冲程损失、提前加载位置、提前卸载位置;

依据“功特征”和“auc特征”进行实测电功率信号的特征提取,其中,实测电功率信号的特征参数包括:上行功、下行功、周期功、上行面积、下行面积、周期面积、平衡率;

依据机理分析和专家知识进行实测井口温度信号的特征提取,其中,实测井口温度信号的特征参数包括:上行热能耗损、下行热能耗损、周期热能耗损;

依据机理分析和专家知识进行实测井口压力信号的特征提取,其中,实测井口压力信号的特征参数包括:上行能量耗损、下行能量耗损、周期能量耗损。

可选的,所述模型建立模块具体用于:

根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,确定对应的多视角学习方法,并有效地集成hessian正则化建立相应的工况识别模型,其中,

若构建的为第一视角组合,则采用加权多核学习方法、协同训练学习方法、加权典型相关分析学习方法中的一种多视角学习方法;

若构建的为第二视角组合,则采用多视角加权多核学习方法;

若构建的为第三视角组合,则采用多视角加权典型相关分析学习方法。

可选的,所述工况识别模块具体用于:

若建立的工况识别模型为hessian正则化协同训练工况识别模型,则在对应模型上采用svm一对一两分类器进行工况识别;

若建立的工况识别模型为hessian正则化加权典型相关分析工况识别模型和hessian正则化多视角加权典型相关分析工况识别模型,则分别在对应模型上采用余弦最近邻多分类器进行工况识别;

若建立的工况识别模型为加权多核学习工况识别模型和多视角加权多核学习工况识别模型,则在对应模型上采用logistic回归一对多两分类器进行工况识别。

本发明实施例提供的技术方案带来的有益效果是:

本发明实施例提供的一种基于多视角学习的抽油机井工况识别方法及系统,采用基于大数据生产环境下的多视角学习方法,以实测地面示功图和电功率信号为两个不同的主视角,实测井口温度和井口压力信号为两个辅视角,进行有效组合并利用这四个实测视角,通过少量抽油机井工况数据或结合大量未知工况数据建立工况识别模型,其中,建立的工况识别模型有效集成了hessian正则化和多视角学习方法,能够充分利用大数据和油气生产物联网环境下有杆泵采油生产系统采集的海量多源实时信息,突破单一信息源识别抽油机井工况的局限性和传统多源信息识别方法的技术瓶颈,从而进一步提高了抽油机井工况识别精准率和工程实用性,最大化地实现降本增效,促进智能油田生产建设和发展;对故障诊断与识别领域存在的故障样本难求且代价大这一共性问题提供了较好的解决方法,同时也为多源信息融合方法及应用提供了一个新思路。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于多视角学习的抽油机井工况识别方法的流程示意图;

图2是本发明实施例提供的图1中的步骤130的执行流程示意图;

图3是本发明实施例提供的一种基于多视角学习的抽油机井工况识别系统的结构框图;

图4是静载荷作用下的理论示功图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

下面将结合附图1~附图4,对本发明实施例的一种基于多视角学习的抽油机井工况识别方法及系统进行详细说明。

参考附图1所示,本发明实施例的一种基于多视角学习的抽油机井工况识别方法包括:

步骤110:构建包含已知抽油机井工况和未知抽油机井工况对应的实测地面示功图、电功率信号、井口温度和井口压力信号四个视角的样本库。

具体的,将和抽油机井工况相关联的实测地面示功图、电功率信号、井口温度、井口压力信号四个视角的数据分别存储在各自的样本库中;其中,每个样本库中的每个样本均由生产现场实际对应抽油机井工况的采集时刻所采集的数据点数组成;每个样本库里均包含已知抽油机井工况样本和未知抽油机井工况样本,其中,已知的抽油机井工况样本严格按照油井的作业记录选取。

步骤120:以实测地面示功图和电功率信号为主,实测井口温度和井口压力信号为辅,根据实际需求构建主辅视角组合。

具体的,以实测地面示功图和电功率信号为2个主视角,实测井口温度和井口压力信号为2个辅视角,构建主辅视角组合,其中,所构建的主辅视角组合为第一视角组合、第二视角组合和第三视角组合中的一种,其中,第一视角组合包括实测地面示功图和实测电功率信号两个主视角,第二视角组合包括实测地面示功图、实测电功率信号和实测井口温度信号三个主辅视角,第三视角组合包括实测地面示功图、实测电功率信号、实测井口温度信号和实测井口压力信号四个主辅视角。

其中,实测地面示功图可以反映抽油机井的泵及地下情况,实测电功率信号能够反映抽油机井的地面及地下情况,二者基本上可以全面反映抽油机井地面、井筒及地层状况,但还有少量抽油机井工况不但示功图形状相似而且电功图特点类似,如连抽带喷和油管底部严重漏失、气体影响和供液不足的抽油机井工况等等,可以借助井口温度、井口压力实时信息进行准确识别,所以选择实测地面示功图和电功率信号为两个主视角,实测井口温度和井口压力信号为两个辅视角,构建主辅视角组合。

步骤130:分别对所构建的主辅视角组合中的每一个视角,根据机理分析、先验信息和专家知识进行特征提取,以构建每一个视角的特征数据样本集。

具体的,参考图2所示,步骤130的实现过程包括如下步骤:

步骤1301:依据抽油泵一个工作周期内功图面积、冲次、载荷、活塞上的液柱重量、冲程、有效冲程、冲程损失、加载和卸载过程关键点位置的变化进行实测地面示功图的特征提取。

其中,实测地面示功图的特征参数包括冲程、冲次、功图实际面积、最大载荷、最小载荷、最大最小载荷比、活塞上液注重量、有效冲程、加载冲程损失、卸载冲程损失、提前加载位置、提前卸载位置。

具体的,实测地面示功图依据抽油泵一个工作周期内功图面积、冲次、载荷、活塞上的液柱重量、冲程、有效冲程、冲程损失、加载和卸载过程关键点位置的变化进行特征提取,其中,实测地面示功图特征参数有12个:冲程(m)、冲次(min-1)、功图实际面积(kn·m)、最大载荷(kn)、最小载荷(kn)、最大最小载荷比、活塞上液注重量(kn)、有效冲程(m)、加载冲程损失(m)、卸载冲程损失(m)、提前加载位置(m)、提前卸载位置(m)。对实测地面示功图或电功率信号不用转换成泵功图或电功图而直接进行特征提取,有利于提高抽油油井工况识别效果和工况识别模型的鲁棒性。

步骤1302:依据“功特征”和“auc特征”进行实测电功率信号的特征提取。

其中,实测电功率信号的特征参数包括:上行功、下行功、周期功、上行面积、下行面积、周期面积、平衡率。

具体的,实测电功率信号依据“功特征”和“auc(曲线下面积)特征”进行特征提取,其中,实测电功率信号的特征参数有7个:上行功(kw)、下行功(kw)、周期功(kw)、上行面积(kw·m)、下行面积(kw·m)、周期面积(kw·m)、平衡率(上下行程做功比)。

步骤1303:依据机理分析和专家知识进行实测井口温度信号的特征提取。

其中,实测井口温度信号的特征参数包括:上行热能耗损、下行热能耗损、周期热能耗损。

具体的,实测井口温度信号依据机理分析和专家知识进行特征提取,其中,实测井口温度信号的特征参数有3个:上行热能(温度)耗损(℃)、下行热能(温度)耗损(℃)、周期热能(温度)耗损(℃)。

步骤1304:依据机理分析和专家知识进行实测井口压力信号的特征提取。

其中,实测井口压力信号的特征参数包括:上行能量耗损、下行能量耗损、周期能量耗损。

具体的,实测井口压力信号依据机理分析和专家知识进行特征提取,其中,实测井口压力信号的特征参数有3个:上行能量(压力)耗损(mpa)、下行能量(压力)耗损(mpa)、周期能量(压力)耗损(mpa)。

进一步的,对上述的实测地面示功图、电功率信号、井口温度信号和井口压力信号四个实测视角中的每一个视角,依据机理分析、先验信息和专家知识进行特征提取,参考图4,各视角特征参数具体计算如下:

一、静载荷作用下的理论示功图如图4所示,横坐标代表光杆位移,用s表示,纵坐标代表光杆上载荷,用p表示。sr为光杆冲程,sp为活塞冲程(有效冲程),sl为加载冲程损失,su为卸载冲程损失,pl为活塞上液柱重量。a(e)点为游动凡尔关闭点(即下死点),b点为固定凡尔打开点,c(f)点为固定凡尔关闭点(即上死点),d点为游动凡尔打开点。a(e)→b→c(f)表示上冲程,是加载并做功过程,c(f)→d→a(e)表示下冲程,是卸载并做功过程,a(e)→b→c(f)→d→a(e)表示一个完整冲程,即抽油泵的一个工作周期。

二、实测地面示功图的特征参数有12个:冲程、冲次、功图实际面积、最大载荷、最小载荷、最大最小载荷比、活塞上液注重量、有效冲程、加载冲程损失、卸载冲程损失、提前加载位置和提前卸载位置;其中,冲程、冲次、最大载荷和最小载荷的数值不用计算,可从实时采集的功图数据中直接获得,功图实际面积为功图采集点围成的封闭曲线面积,最大最小载荷比为最大载荷与最小载荷的比值,活塞上液柱重量为最大载荷与最小载荷之差,有效冲程为游动凡尔打开点与游动凡尔关闭点之间的位移差,加载冲程损失为固定凡尔打开点与游动凡尔关闭点之间的位移差,卸载冲程损失为固定凡尔关闭点与游动凡尔打开点之间的位移差,提前加载位置为从游动凡尔关闭点开始到游动凡尔打开点之间斜率正负反向的第一个点(提前加载点)的位移,提前卸载位置为从固定凡尔关闭点开始到固定凡尔打开点之间斜率正负反向的第一个点(提前卸载点)的位移。

三、实测电功率信号的特征参数有7个:上行功、下行功、周期功、上行面积、下行面积、周期面积、平衡率(平衡率为上下行程做功比);其中,特征参数计算所用到的上死点和下死点位置可以从实时采集的功图数据中直接得到,上死点为位移最大点,下死点为位移最小点,即功图数据的起始点(漂移情况不考虑),上行功等于上冲程时间段内所作的功,下行功等于下冲程时间段内所作的功,周期功等于上行功与下行功之和,上行面积等于上冲程时间段内电功率信号曲线与时间水平轴所围曲线面积,下行面积等于下冲程时间段内电功率信号曲线与时间水平轴所围曲线面积,周期面积等于上行面积与下行面积之和,平衡率等于上行功与下行功的比值;

四、实测井口温度信号的特征参数有3个:上行热能(温度)耗损、下行热能(温度)耗损、周期热能(温度)耗损;现场采集到的井口温度数据大多并不严格遵循对应工况特征状态规律,但从本质上可以反映出对应工况每个冲程的热能耗损,一个冲程内井口温度实时采集点个数通常少于示功图实时采集点个数,可以采用插值拟合方法将二者实时采集点同步,同时从实时采集的示功图数据中得到上死点和下死点来计算其特征参数值,其中上行热能(温度)耗损等于上冲程时间段内所耗损的热能(温度);下行热能(温度)耗损等于下冲程时间段内所耗损的热能(温度);周期热能(温度)耗损等于上行热能(温度)耗损与下行热能(温度)耗损之和。

五、实测井口压力信号的特征参数有3个:上行能量(压力)耗损、下行能量(压力)耗损、周期能量(压力)耗损;现场采集到的井口压力数据大多也并不严格遵循对应工况特征状态规律,但从本质上可以反映出对应工况每个冲程的能量耗损,一个冲程内井口压力实时采集点个数通常少于示功图实时采集点个数,采用插值拟合方法将二者实时采集点同步,同时从实时采集的示功图数据中得到上死点和下死点来计算其特征参数值,其中上行能量(压力)耗损等于上冲程时间段内所耗损的能量(压力);下行能量(压力)耗损等于下冲程时间段内所耗损的能量(压力);周期能量(压力)耗损等于上行能量(压力)耗损与下行能量(压力)耗损之和。

步骤140:根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成hessian正则化建立相应的工况识别模型。

具体的,根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,确定对应的多视角学习方法,并有效地集成hessian正则化建立相应的工况识别模型,其中,若构建的为第一视角组合,则采用加权多核学习方法、协同训练学习方法、加权典型相关分析学习方法中的一种多视角学习方法;若构建的为第二视角组合,则采用多视角加权多核学习方法;若构建的为第三视角组合,则采用多视角加权典型相关分析学习方法。

进而,针对不同的主辅视角组合所构建的工况识别模型并不相同,不同种类的工况识别模型可以处理不同的主辅视角组合下的工况诊断,而且,针对不同的主辅视角组合构建不同的工况识别模型可以提高抽油机井工况识别的精度。其中,本发明实施例所构建的所有种类的工况识别模型是有效集成hessian正则化和多视角学习方法的工况识别模型。其中,有效集成hessian正则化和多视角学习方法建立的工况识别模型可以实现在少量已知训练样本下或通过结合大量未知训练样本来更精准地识别抽油机井工况;两个主视角组合的协同训练学习方法与hessian正则化集成建立的工况识别模型可以实现在少量已知工况样本下利用大量未知工况样本获取较高的工况识别精准率,两个主视角组合的加权典型相关分析学习方法和四个主辅视角组合的多视角加权典型相关分析学习方法与hessian正则化集成建立的工况识别模型可以实现在少量已知工况样本下获取较高的工况识别精准率,而两个主视角组合的加权多核学习方法和三个主辅视角组合的多视角加权多核学习方法不与hessian正则化集成建立的工况识别模型也可以实现在适量已知工况样本下利用未知工况样本获取较高的工况识别精准率。

其中,hessian正则化多视角协同训练工况识别模型的构建过程中,基于算法的正确性、泛化性、时间复杂性、稳定性等方面综合考虑,选择用于支持向量机(svm)的hinge损失函数,采用的核函数为rbf函数,hessian的近邻数可以选定为每类所含的样本个数,迭代次数选取8次,实测地面示功图和电功率信号这两个视角对应的惩罚项调节参数通过调参后分别是1和1e-1、1和1e-2;分析并确定模型关键因素设置后,其构建具体过程是:将存储的实测地面示功图和电功率信号分别通过机理分析、先验知识和专家经验进行特征提取后得到各自的特征数据样本集,从中选出各自的训练样本集,通过hessian正则化svm多视角协同训练算法得到工况识别模型,其中的hessian正则化svm多视角协同训练算法的主要思想是:首先在2个不同视角的训练样本集上分别利用hessian正则化svm算法(hessvm)来训练初始分类器,再通过训练后的分类器预测无标记样本,然后挑选出置信度最高的无标记样本并添加到对方训练集中,再重新训练分类器,这样重复迭代8次后得到两个视角各自的最终输出分类器,最后再利用最终输出分类器分别对各自最终更新的训练集进行预测,预测值高的作为算法的输出分类器。

其中,hessian正则化多视角加权典型相关分析工况识别模型的构建过程中,从算法的正确性、泛化性、时间复杂性、实用性等方面考虑,hessian的近邻数选定为训练样本个数减1,公共子空间维数选取为各视角中维数最低的视角维数,将实测井口温度和实测井口压力两个视角特征数据合并成一个视角特征数据,则公共子空间维数为6,各视角权重采用增大视角倍数方式并通过调参来获取,作用小的视角增大的倍数高于作用大的视角,则实测地面示功图、电功率、井口温度和井口压力合并这三个特征视角权重通过调参后分别是1.2、1.2和9,训练样本个数为每类样本个数的15%时达到或接近工况平均识别率的峰值,所以用于分类的训练样本个数可以远小于待识别样本个数,可以选取每类样本个数的15%以下为训练样本个数,且各视角的样本总数要一样;分析并确定模型关键因素设置后,其构建具体过程是:将存储的实测地面示功图、电功率、井口温度和井口压力信号分别通过机理分析、先验知识和专家经验进行特征提取后得到各自的特征数据样本集,将井口温度和井口压力两个特征数据样本集串接合并成一个新的特征数据样本集,然后从三个特征数据样本集中选出各自的训练样本集,通过hessian正则化多视角加权典型相关分析算法得到三个降维的特征数据样本集,再结合余弦最近邻算法得到工况识别模型,其中的hessian正则化多视角加权典型相关分析算法(hes-weimcca)的主要思想是:利用hessian正则化来更好地保持数据流形局部结构,结合多视角权重,从而找到一组线性的投影来发现多视角数据中的非线性相关,并使投影后的变量两两之间相关性的和最大化。

其中,hessian正则化加权典型相关分析工况识别模型:除了采用实测地面示功图和电功率信号两个视角,两视角权重调参后分别是1.2和1.2外,其模型构建过程、模型关键因素设置、算法思想都和hessian正则化多视角加权典型相关分析工况识别模型相似,本发明实施例在此不再累述。

其中,多视角加权多核学习工况识别模型的构建过程中,从算法的正确性、泛化性、时间复杂性等方面综合考虑,选择用于logistic回归的log损失函数,核函数为rbf,收敛迭代次数为1200次,各视角权重采用各视角权重累加和为1的方式并通过调参来获取,则实测地面示功图、电功率、井口温度信号这三个视角的权重通过调参后分别为0.15、0.8和0.05,惩罚项和正则项的调节参数通过调参后分别是1e-3和1e-1;分析并确定模型关键因素设置后,其构建具体过程是:将存储的实测地面示功图、电功率和井口温度信号分别通过机理分析、先验知识和专家经验进行特征提取后得到各自的特征数据样本集,然后从三个特征数据样本集中选出各自的训练样本集,通过多视角加权多核logistic回归学习算法得到工况识别模型,其中的多视角加权多核logistic回归学习算法的主要思想是:利用多视角的加权和核函数技术,将不同的核函数进行融合来挖掘多视角数据之间的内在联系,可以更加全面、更加灵活地表达多视角数据,再结合正则化约束和log损失函数具有的平滑性、对异常点敏感、可预测概率和适用于大数据实验等优势,从而增强算法的泛化能力和学习效率。

其中,加权多核学习工况识别模型除了采用实测地面示功图和电功率信号两个视角,两视角权重调参后分别是0.15和0.85外,其模型构建流程、模型关键因素设置、算法思想都和多视角加权多核学习工况识别模型相似,本领域技术人员可以参考多视角加权多核学习工况识别模型进行构建,本发明实施例在此不再累述。

需要说明的是,hessian正则化协同训练工况识别模型建立的关键因素是损失函数、核函数、hessian近邻数、协同迭代次数和每个视角的两个惩罚项调节参数;hessian正则化多视角加权典型相关分析工况识别模型和hessian正则化加权典型相关分析工况识别模型建立的关键因素相同,均是hessian近邻数、公共子空间维数、各视角权重和用于分类的样本个数;加权多核学习工况识别模型和多视角加权多核学习工况识别模型建立的关键因素均是损失函数、核函数、各视角权重、惩罚项和正则项的调节参数和收敛迭代次数。

步骤150:通过建立的工况识别模型进行抽油机井工况识别。

具体的,若建立的工况识别模型为hessian正则化协同训练工况识别模型,则在对应模型上采用svm一对一两分类器进行工况识别;若建立的工况识别模型为hessian正则化加权典型相关分析工况识别模型和hessian正则化多视角加权典型相关分析工况识别模型,则分别在对应模型上采用余弦最近邻多分类器进行工况识别;若建立的工况识别模型为加权多核学习工况识别模型和多视角加权多核学习工况识别模型,则在对应模型上采用logistic回归一对多两分类器进行工况识别。

其中,基于本发明实施例的工况识别方法涉及的抽油机井工况包括正常、供液不足、抽油杆断脱、连抽带喷、泵卡、泵游动凡尔失灵、结蜡、油管漏失、泵漏、游动凡尔漏失、固定凡尔漏失11种典型工况,当然,此处仅是举例说明,并不代表本发明实施例的工况识别方法能够识别的抽油机井工况局限于此。

通过将本发明实施例的基于多视角学习的抽油机井工况识别方法构建的hessian正则化多视角协同训练工况识别模型、hessian正则化多视角加权典型相关分析工况识别模型、hessian正则化加权典型相关分析工况识别模型、多视角加权多核学习工况识别模型和加权多核学习工况识别模型应用到工程实践中进行验证,均取得了较高的准确率和良好的识别结果。其中,用于识别效果验证的样本库中每类工况包含150个样本,共11类典型工况,样本总数为1650个,每类典型工况各取一半样本数组成训练集,则用于识别效果验证的训练集包含825个样本。具体的识别效果验证过程如下所示:

其中,hessian正则化多视角协同训练工况识别模型,利用本发明实施例的方法提取的实测地面示功图和电功率信号特征参数,以svm一对一两分类为基础,分别采用训练集样本数的1%、10%、30%、50%、70%、100%作为训练样本,对抽油机井工况的平均识别率分别为97.3%、97.53%、98.37%、99.37%、99.41%、100%,其中训练集样本数的100%作为训练样本时,hessian正则化多视角协同训练工况识别方法在识别效果上比单视角工况识别方法(基于实测地面示功图或实测电功率信号)及传统特征连接多源识别方法分别提高了约3.2%、4.3%、7.4%。

其中,hessian正则化多视角加权典型相关分析工况识别模型,利用上述实测地面示功图、电功率、井口温度和井口压力信号提取的特征参数,以余弦最近邻多分类为基础,分别采用样本总数的5%、7%、10%、15%作为训练样本,测试结果表明对抽油机井工况的平均识别率分别为98.28%、98.34%、98.75%、99.87%,其中样本总数的15%作为训练样本时,hessian正则化多视角加权典型相关分析工况识别方法在识别效果上比单视角工况识别方法(基于实测地面示功图或实测电功率信号)分别提高了约3.44%、1.5%,比传统多特征连接、多视角典型相关分析、无加权hessian正则化多视角典型相关分析工况识别方法分别提高了约4.46%、2.21%、1.62%。

其中,hessian正则化加权典型相关分析工况识别模型,利用上述实测地面示功图、电功率信号提取的特征参数,以余弦最近邻多分类为基础,分别采用样本总数的5%、7%、10%、15%作为训练样本,对抽油机井工况的平均识别率分别为98.27%、98.20%、98.75%、99.87%,其中样本总数的15%作为训练样本时,hessian正则化加权典型相关分析工况识别方法在识别效果上比单视角工况识别方法(基于实测地面示功图或实测电功率信号)分别提高了约3.40%、1.46%,比传统多特征连接、典型相关分析、无加权hessian正则化典型相关分析工况识别方法分别提高了约0.58%、1.69%、0.1%。

其中,对于多视角加权多核学习工况识别模型,利用上述实测地面示功图、电功率和井口温度信号提取的特征参数,以logistic回归一对多两分类为基础,分别采用训练集样本数的10%、30%、50%、70%、100%作为训练样本,对抽油机井工况的平均识别率分别为87.49%、90.80%、92.49%、94.95%、97.23%,其中训练集样本数的100%作为训练样本时,多视角加权多核学习工况识别方法在识别效果上比单视角工况识别方法(基于实测地面示功图或实测电功率信号)及传统特征连接多源识别方法分别提高了约2.4%、11%和13.8%。

其中,加权多核学习工况识别模型,利用上述实测地面示功图、电功率信号提取的特征参数,以logistic回归一对多两分类为基础,分别采用训练集样本数的10%、30%、50%、70%、100%作为训练样本,对抽油机井工况的平均识别率分别为86.59%、89.43%、90.91%、93.33%、96.77%,其中训练集样本数的100%作为训练样本时,加权多核学习工况识别方法在识别效果上比单视角工况识别方法(基于实测地面示功图或实测电功率信号)及传统特征连接多源识别方法分别提高了约1.93%、10.57%和11.79%。

通过上述数据表明,本发明实施例的基于多视角学习的抽油机井工况识别方法,采用基于大数据生产环境下的多视角学习方法,以实测地面示功图和电功率信号为两个不同的主视角,实测井口温度和井口压力信号为两个辅视角,进行有效组合并利用这四个实测视角,通过少量抽油机井工况数据或结合大量未知工况数据建立工况识别模型,其中,建立的工况识别模型有效集成了hessian正则化和多视角学习方法,能够充分利用大数据和油气生产物联网环境下有杆泵采油生产系统采集的海量多源实时信息,突破单一信息源识别抽油机井工况的局限性和传统多源信息识别方法的技术瓶颈,从而进一步提高了抽油机井工况识别精准率和工程实用性,最大化地实现降本增效,促进智能油田生产建设和发展;对故障诊断与识别领域存在的故障样本难求且代价大这一共性问题提供了较好的解决方法,同时也为多源信息融合方法及应用提供了一个新思路。

参见图3所示,本发明实施例提供了一种基于多视角学习的抽油机井工况识别系统包括:

样本库构建模块301,用于构建包含已知抽油机井工况和未知抽油机井工况对应的实测地面示功图、电功率信号、井口温度和井口压力信号四个视角的样本库;

视角构建模块302,用于以实测地面示功图和电功率信号为主,实测井口温度和井口压力信号为辅,根据实际需求构建主辅视角组合;

特征数据采集模块303,用于分别对所构建的主辅视角组合中的每一个视角,根据机理分析、先验信息和专家知识进行特征提取,以构建每一个视角的特征数据样本集;

模型建立模块304,用于根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成hessian正则化建立相应的工况识别模型;

工况识别模块305,用于通过建立的工况识别模型进行抽油机井工况识别。

其中,视角构建模块302具体用于:以实测地面示功图和电功率信号为2个主视角,实测井口温度和井口压力信号为2个辅视角,构建主辅视角组合,其中,所述主辅视角组合为第一视角组合、第二视角组合和第三视角组合中的一种,其中,所述第一视角组合包括实测地面示功图和实测电功率信号两个主视角,所述第二视角组合包括实测地面示功图、实测电功率信号和实测井口温度信号三个主辅视角,所述第三视角组合包括实测地面示功图、实测电功率信号、实测井口温度信号和实测井口压力信号四个主辅视角。

其中,特征数据采集模块303具体用于:依据抽油泵一个工作周期内功图面积、冲次、载荷、活塞上的液柱重量、冲程、有效冲程、冲程损失、加载和卸载过程关键点位置的变化进行实测地面示功图的特征提取,其中,实测地面示功图的特征参数包括冲程、冲次、功图实际面积、最大载荷、最小载荷、最大最小载荷比、活塞上液注重量、有效冲程、加载冲程损失、卸载冲程损失、提前加载位置、提前卸载位置;依据“功特征”和“auc特征”进行实测电功率信号的特征提取,其中,实测电功率信号的特征参数包括:上行功、下行功、周期功、上行面积、下行面积、周期面积、平衡率;依据机理分析和专家知识进行实测井口温度信号的特征提取,其中,实测井口温度信号的特征参数包括:上行热能耗损、下行热能耗损、周期热能耗损;依据机理分析和专家知识进行实测井口压力信号的特征提取,其中,实测井口压力信号的特征参数包括:上行能量耗损、下行能量耗损、周期能量耗损。

其中,模型建立模块304具体用于:根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,确定对应的多视角学习方法,并有效地集成hessian正则化建立相应的工况识别模型,其中,若构建的为第一视角组合,则采用加权多核学习方法、协同训练学习方法、加权典型相关分析学习方法中的一种多视角学习方法;若构建的为第二视角组合,则采用多视角加权多核学习方法;若构建的为第三视角组合,则采用多视角加权典型相关分析学习方法。

其中,工况识别模块305具体用于:若建立的工况识别模型为hessian正则化协同训练工况识别模型,则在对应模型上采用svm一对一两分类器进行工况识别;若建立的工况识别模型为hessian正则化加权典型相关分析工况识别模型和hessian正则化多视角加权典型相关分析工况识别模型,则分别在对应模型上采用余弦最近邻多分类器进行工况识别;若建立的工况识别模型为加权多核学习工况识别模型和多视角加权多核学习工况识别模型,则在对应模型上采用logistic回归一对多两分类器进行工况识别。

需要说明的是:上述实施例提供的一种基于多视角学习的抽油机井工况识别系统在进行抽油机井工况识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种基于多视角学习的抽油机井工况识别系统与一种基于多视角学习的抽油机井工况识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1