一种基于动态集成建模的油井动液面预测方法与流程

文档序号:11904473阅读:264来源:国知局
一种基于动态集成建模的油井动液面预测方法与流程
本发明属于信息
技术领域
,具体涉及一种基于动态集成建模的油井动液面预测方法。
背景技术
:在油田的实际生产过程中,为了实现最大的产液量,抽油机需要根据油井不断变化的参数来调整其抽油频率,使其达到合理的工作状态。油井的动液面是生产过程中油井油套管环形空间的液面深度,是油田的重要生产指导数据之一,是反映抽油机工作状态的一个重要参考指标。只有及时掌握动液面的数据信息才能使抽油机运行在合理的运行方式。目前,大多数油井动液面的测量依然采用的还是传统的人工测量方法,例如回声测量、压力测量法和浮筒法等,传统的人工测量存在着误差大,效率低、实时性差等缺点,不能满足现在的生产要求。近年来,随着软测量方法在各个行业的广泛应用,人们对此提出了单一模型的智能算法软测量方法,然而这种方法在实际应用中存在泛化能力差、容易出现过拟合和精度不高等不足,并且实际的生产过程中,随着生产的动态运行模型的预测精度会下降,需要对模型进行更新,提高模型的动态性能。传统的更新方法就是通过增加训练样本数据来更新模型,这样会使得模型性能随着训练的进行逐渐变差,不能满足生产需求。技术实现要素:针对上述现有技术存在的不足,本发明提供一种基于动态集成建模的油井动液面预测方法。本发明的技术方案:一种基于动态集成建模的油井动液面预测方法,包括如下步骤:步骤1:获取油井生产过程中动液面数据及动液面数据对应的辅助变量构成历史数据即样本,并将样本分为训练样本和测试样本,并分别构成训练集和测试集;步骤2:设置弱学习机个数、误差超限率指标阈值和样本预测误差阈值;步骤3:计算样本权重,并依据权重对训练集样本进行排序;步骤4:利用黑洞优化算法对LSSVM模型参数进行寻优赋值,并将排序后的训练样本进行模型训练,计算训练得到的子模型的误差超限率指标是否超过阈值,是,舍弃该子模型,执行步骤3,否则,计算子模型对应的权重,并更新样本权重,所述样本权重根据样本通过子模型的预测误差计算,所述子模型的权重根据其误差超限率指标和子模型预测均方根误差结合计算,所述样本预测误差为该样本通过子模型进行动液面预测的预测结果相对误差,所述误差超限率指标为样本预测误差大于阈值的样本权重之和;所述误差超限率指标为样本预测误差超过阈值的训练样本权重之和或巡测数据预测误差超过阈值的巡测数据权重之和。步骤5:判断子模型的个数是否达到设置值,是,模型的训练即完成,将所有子模型加权输出得到集成模型,否则,执行步骤3;步骤6:定期对动液面进行巡测,利用采集的巡测数据计算集成模型的误差超限率指标是否超过阈值,是,执行步骤7,否则,执行步骤12;所述巡测数据拥有相同权重;步骤7:根据巡测数据利用相似度原理在历史数据中寻找巡测数据的相似数据构成更新子集,部分替换原训练集中不相似的样本,构成新的训练集,为新训练集分配相同权重;步骤8:利用原有的子模型对新训练集进行预测,计算子模型的误差超限率指标是否超过阈值,是,执行步骤9,否则,保留该原子模型作为新的子模型仅更新权重,执行步骤11;步骤9:计算新训练集中样本权重,并根据权重对样本排序;步骤10:将新训练集中训练样本进行模型训练,计算训练得到的新的子模型的误差超限率是否超过阈值,是,舍弃该新的子模型,执行步骤9,否则,执行步骤11;步骤11:判断新的子模型误差超限率是否为零,是,根据预测水平指标限赋予该新的子模型权重的当前最大值,否则,计算新子模型的权重;所述新的子模型包括生成新的子模型或保留原子模型作为新的子模型,所述新子模型权重根据新训练集中训练样本的误差超限率指标和子模型均方根误差结合计算。步骤12:判断是否有未更新的子模型,是,执行步骤8,否则,将全部新的子模型输出得到新的集成模型;步骤13:在油井实际生产工作过程中,实时采集辅助变量,输入集成模型进行集成油井动液面预测。有益效果:一种基于动态建模的油井动液面预测方法与现有技术相比,具有如下优势:1、迭代集成的软测量建模方法,对比与传统的人工测量方法不但预测精度高,而且效率高的显著优势;2、采用迭代集成建模的方法,对比单一模型算法具有更高的预测精度,因为子模型的加权输出最大化的减少了由于个体误差大而对整体预测精度产生的影响,使得模型的泛化能力有显著提升,输出更具科学性;3、弱学习机子模型中样本权重的改变更加能够提高新模型对样本的适应性;4、弱学习机子模型权重的改变更加体现模型整体误差水平和样本合格率直接的平衡,更有效突出效果好的子模型;5、利用巡测数在历史数据中寻找相似数据构成的更新子集对现有模型进行更新,重复建模过程,得到最终的模型(并且每更新一次确保前期信息不丢失),相比于传统方法只是不断的增加训练数据,这种新的更新方法,使得模型的更新时间明显缩短,并且还能保留模型之前的数据信息,对于实际应用有很大的优势。附图说明图1为本发明实施方式的基于动态集成建模的油井动液面预测方法中集成模型建立方法流程图;图2为本发明实施方式的基于动态集成建模的油井动液面预测方法中模型动态更新方法流程图;图3为本发明实施方式的单一模型预测误差指标图;图4为本发明实施方式的子模型1油井动液面预测结果图;图5为本发明实施方式的子模型2油井动液面预测结果图;图6为本发明实施方式的子模型3油井动液面预测结果图;图7为本发明实施方式的子模型4油井动液面预测结果图;图8为本发明实施方式的子模型5油井动液面预测结果图;图9为本发明实施方式的集成模型油井动液面预测结果图;图10为本发明实施方式的动态模型与静态模型油井动液面预测效果对比图。具体实施方式下面结合附图对本发明的一种实施方式做详细说明。本发明一种实施方式,如图1-2所示,一种基于动态建模的油井动液面预测方法,具体包括如下步骤:步骤1:如图1所示,获取油井生产过程中动液面数据yi及动液面数据yi对应的辅助变量,辅助变量构成辅助向量xi,动液面数据及其辅助向量构成历史数据(xi,yi),其中,i=1,2,…,m,m为历史数据个数,为历史数据(xi,yi)分配权重中间值将历史数据分为用于对模型进行训练的训练集TRt和用于对模型进行测试的测试集TEt,其中,TRt+TEt=m,t表示当前模型为第t个子模型,t=1,2,…,T;所述辅助变量包括:油井套压、泵效和流量;步骤2:设置弱学习机个数T、样本预测误差阈值e0和误差超限率指标阈值ε0;步骤3:计算历史数据(xi,yi)权重并依据历史数据权重对训练集样本进行排序;步骤4:根据样本,利用黑洞优化算法对最小二乘支持向量机(LeastSquaresSupportVectorMachine,LSSVM)模型参数进行寻优赋值,并将排序后的训练样本进行模型训练,模型训练完成后得到子模型Ht:x→y,利用测试集及训练集计算子模型的样本预测误差,并计算误差超限率指标εt是否超过阈值ε0,是,舍弃该子模型Ht,执行步骤3,否则,计算子模型对应的权重即模型预测水平指标βt,并计算更新样本权重中间值wt+1(i),t=t+1;所述子模型的样本预测误差AREt(i)计算方法为:计算误差超限率指标εt,即对于每个样本通过该模型进行测试,将样本预测误差超过阈值的样本的权重进行累计:所述模型预测水平指标βt即模型权重,可平衡个别预测误差大的子模型对整体预测水平的影响,具体采用如下公式计算:其中,RMSE=sqrt(sum(Yt-train_test_out).^2)/M)为模型均方根误差,λ为模型调整因子;所述更新样本权重中间值可增大预测误差大的样本进入训练集的机会,提高新模型对样本的适应性,具体采用如下公式计算:步骤5:判断弱学习机即子模型的个数是否达到设置值,是,模型的训练即完成,将所有子模型加权输出得到集成模型,否则,执行步骤3;所述将所有子模型加权输出得到集成模型为:步骤6:如图2所示,对于原有模型的更新是通过逐步更新每个弱学习机子模型来完成的,定期对动液面进行巡测,利用采集的巡测数据(x'j,y'j)计算集成模型的样本预测误差,并计算误差超限率指标是否超过阈值,是,执行步骤7,否则,执行步骤12,其中,j=1,2,…,n,n为巡测数据个数;所述巡测数据拥有相同的权重;所述样本预测误差采用如下公式计算:其中,k为动态更新次数;步骤7:根据巡测数据利用相似度原理在历史数据中寻找巡测数据的相似数据构成更新子集,替换原训练集中不相似的样本,构成新的训练集,为新训练集中样本分配权重中间值步骤8:利用原有的子模型Ht对新训练集进行预测,计算子模型的样本预测误差,并计算误差超限率指标是否超过阈值,是,执行步骤9,否则,保留该原子模型作为新的子模型,仅更新权重,执行步骤11;所述子模型的样本预测误差为:所述子模型的误差超限率指标为:步骤9:更新新训练集中样本权重,并根据权重对样本排序;步骤10:将新训练集中训练样本进行模型训练,模型训练完成后得到新的子模型,利用测试集和新训练集计算新的子模型的误差超限率是否超过阈值,是,舍弃该新的子模型,并计算新训练集中样本权重,执行步骤9,否则,执行步骤11;步骤11:判断新的子模型误差超限率是否为零,是,根据预测水平指标限赋予该新的子模型权重的当前最大值,否则,计算新子模型的权重即模型的预测水平指标;所述子模型的预测水平指标采用下式计算:步骤12:判断是否有未更新的子模型,是,执行步骤8,否则,将全部新的子模型输出得到新的集成模型即模型动态更新完毕,得到新的集成模型;步骤13:在油井实际生产工作过程中,实时采集辅助变量,输入集成模型进行集成油井动液面预测;本发明主要是通过动态集成建模的软测量方法,以油田实际生产过程为应用背景,来解决实际生产过程中那些难以直接测量的过程变量,重点是对油井的动液面数据进行预测,使油井达到合理的运行状态,实现经济效益最大化。本实施方式中,选择辽河某油田实际生产的历史数据作为样本进行实验,说明本实验的可靠性以及本发明的实际效用。整理实际生产过程中的历史动液面数据,选择油井的套压、流量和泵效作为辅助变量,来实现对被测变量动液面数据的估计。在历史数据中选择200组样本数据,其中150组作为训练集的训练样本,50组检查模型的泛化性,作为测试集,另选择200组数据来检验模型的预测水平。动态过程采集巡测数据和寻找相似度高的样本30组进行子模型更新,采用100组不同工况下数据验证模型在动态情况下是否适应。第一组实验采用单一模型进行动液面预测;第二组实验采用迭代集成模型对动液面数据进行预测;第三组实验选取与训练初始集成模型样本不同工况下的巡测数据,采用动态更新集成模型和静态集成模型对动液面进行预测。实验中以均方根误差(RootMeanSquaredError,RMSE)和平均绝对误差(MeanAbsoluteError,MAE)指标来评价模型的预测水平。第一组实验采用单一模型进行预测,即采用LSSVM模型作为训练模型,利用黑洞优化算法对LSSVM模型参数进行寻优赋值。利用模型对200组测试集样本数据进行预测,最后计算模型的均方根误差(RMSE)和平均绝对误差(MAE)。表1单一模型动液面预测的误差指标IndexMAERMSE测试集29.089043.1890如图3所示,通过对比真实样本的曲线和预测的样本曲线,当用测试集来检验模型时,模型对于新的样本数据预测精度是明显下降,样本的真实曲线和预测曲线在多处明显偏离,预测误差较大。继而观察模型的误差指标RMSE和MAE对模型预测性能进行评价,该模型对应的两项误差指标都比较大,预测效果不是很理想。经过上述对实验结果分析之后得出,单一模型进行动液面预测存在明显的预测精度不高,模型泛化能力不强等不足。第二组实验采用LSSVM模型作为训练模型,利用黑洞优化算法对模型的参数进行寻优赋值,来提高模型的预测水平。与单一模型不同的地方是,迭代集成模型的思路是通过迭代训练多个弱学习机,然后对所有的弱学习机进行加权输出得到最后的集成模型。首先是对训练样本进行加权处理,根据样本权重对训练样本进行排序,将排序后的训练样本加入到模型中进行训练。在模型误差满足要求后,计算该子模型对应的权重,同时计算并更新样本权重。利用新的样本权重对训练样本重新进行排序,目的是增加样本预测误差大的样本进入训练集的机会,然后下一个模型不断地继续对其训练,增加模型的泛化能力。直至训练出的子模型个数达到设定值,按照所有子模型对应的权重进行加权输,便得到最终的集成模型,集成模型动液面预测的误差指标如图2所示:表2集成模型动液面预测的误差指标IndexMAERMSE测试集13.068916.7410集成模型中子模型的个数为5,各子模型的权重值如表3所示:表3集成模型中各子模型对应的权重集成模型子模型子模型1子模型2子模型3子模型4子模型5子模型权重βt1.8572.1492.6243.0982.971如图4-9所示,通过模型的预测误差指标的对比,可以明显的看出,集成模型的预测误差指标比单一模型对应的误差指标要小很多,直观的反应出集成模型具有更好的预测精度。分析仿真图像可以看出,集成模型的预测曲线与样本数据真实曲线之间的误差很小,预测精度已经非常之高。其原因是,虽然子模型的预测精度可能不高在有的数据点误差很大,但是通过子模型的加权输出,让预测误差小的模型对应的权重大,预测误差大的模型对应的权重小的方法,对误差整体进行平衡,则集成模型的预测误差就很小。经过以上分析得出,集成模型对比与单一模型具有非常高的预测精度,且模型的泛化能力强等优点。随着生产的进行,油井相关参数会跟随井况或生产工艺的变化而改变,导致原有测量模型输出会逐渐恶化,第三组实验,利用同一井组另一工况下生产数据100组,分别采用本发明中利用巡测数据动态更新样本的方法和未进行更新的静态模型进行预测,预测效果如图10所示,动态模型与静态模型动液面预测的误差指标如表4所示:表4动态模型与静态模型动液面预测的误差指标IndexMAERMSE动态模型7.159910.8067静态模型33.797138.3507通过模型的预测误差指标的对比,可以明显的看出,动态集成模型的预测误差指标比静态模型对应的误差指标要小很多,直观的反应出动态更新的有效性。综上所述,本发明采用迭代集成软测量动态建模的方法对油井动液面数据进行预测,克服了传统方法的误差大、效率低、实时性差等缺点,改善了单一模型对动液面预测存在的预测精度不高、容易产生过拟合现象和泛化能力差的不足。模型训练时对样本进行加权处理,增加误差大的样本进入训练集的机会使模型对这样的样本多次训练,以提高模型的预测精度和增强模型的泛化能力。同时采用多个子模型加权输出,子模型预测误差小的在集成模型输出中所占权重大,误差大的所占的权重小,使得集成模型具有更高的预测精度。本发明的模型动态更新方法,通过巡测数据构成更新子集对模型进行更新,相比传统的更新办法具有更新时间短、又不会丢失以前数据信息的优点,为模型在线应用提供了有效的保障。若将本发明应用于油田实际生产过程中,可以很好的解决现在油井动液面测量所面临的问题,更好的指导油田油井的运行方式,对提高油田产液量具有重要的实际意义。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1