本发明涉及油气井工程领域,特别涉及基于半监督自编码器的钻塞过程套管损坏实时预警方法。
背景技术:
1、由于油田开发现场要求,由分层开采而产生的完井水泥塞和封井作业产生的封井水泥塞呈增多趋势,钻磨水泥塞(简称钻塞)的任务越来越重。在钻塞作业过程中,由于钻磨周期较长、井下钻头震动幅度大、钻头位置偏心以及井底的水泥塞碎块存在重复钻磨现象等多个因素相互作用下,导致出现不同程度的套管损坏(简称套损)现象。套损严重影响后续钻塞作业的进行,造成大量的时间浪费和不必要的成本损失。
2、针对钻塞过程中出现的套损问题,目前鲜有学者进行相关研究,而且现场是根据单一或少量几个录井数据的不正常变化,以此判断可能出现了套损,但是该方法识别精度低,存在严重的时间滞后,无法实现事前预测。此外,确定套损发生的时间和位置是极其困难的,这就导致了套损标签缺乏,出现了数据集中包含的样本不均衡问题,将造成模型在实际部署中预测效果不佳等问题。
技术实现思路
1、本发明的目的在于提供基于半监督自编码器的钻塞过程套管损坏实时预警方法,旨在解决现有技术中存在的录井数据特征复杂、时间依赖提取不足、无法实现事前预测等问题,保证钻塞作业过程中套管的完整性。
2、为了解决上述问题,本发明提供基于半监督自编码器的钻塞过程套管损坏实时预警方法,包括以下步骤:
3、获取钻塞过程中的录井时序数据和对应的套损信息;
4、对所述录井时序数据和对应的套损信息进行处理,获得切割数据集;
5、根据套损信息将所述切割数据集划分为有标签样本与无标签样本;
6、对有标签样本按照8:2的比例随机抽样,其中80%部分与无标签样本组成训练样本和20%部分形成测试样本;
7、构建半监督自编码器分类模型,经过所述训练样本的训练和所述测试样本的测试,最终得到基于半监督自编码器的钻塞过程套损实时智能预警模型。
8、进一步地,所述录井数据包括:时间、钻速、钻压、扭矩、转速、钻时、大钩负荷、钻头位置、大钩位置、出口密度、入口密度、出口电导率、入口电导率等。
9、进一步地,所述对套损信息进行处理方法为标签编码:数值1表示有标签样本中套管被磨损,数值0表述有标签样本中套管未被磨损。
10、进一步地,所述对录井时序数据和对应的套损标签进行处理方法包括后向差分、归一化、时间错位和时间切片。
11、所述后向差分公式为:
12、δxt=xt-xt-1
13、式中,xt为t时刻的值,xt-1为t-1时刻的值,δxt为t时刻的值增量。
14、所述归一化公式为:
15、
16、式中,x为所有值组成的向量,x为原始值,x’为归一化后的值;
17、所述时间错位是将所有套损标签对应的时间减去某一数值,使得套损标签对应的时间提前于录井数据对应的时间,将时间提前的套损标签按照相同的时刻与录井时序数据重新相互对应,形成错位数据集;
18、所述时间切片是指按照某一时间长度和时间间隔对错位数据集进行切割,每一个切片为一个样本,每个样本包括多个子样本,形成切割数据集。
19、进一步地,根据套损信息将所述切割数据集划分为有标签样本与无标签样本。
20、进一步地,所述半监督自编码分类模型由编码器、无监督解码器和有监督解码器构成:
21、按照从左到右的连接顺序,所述编码器包括输入层、lstm层、激活层、全连接层、dropout层以及输出层,其中,激活层使用relu作为激活函数:
22、relu(z)=max(0,z)
23、式中,z为上一层的输出;
24、输出层使用sigmoid函数对每一个节点进行激活:
25、
26、所述编码器输入为有标签样本或无标签样本,输出为有标签样本信息或无标签样本信息;
27、按照从左到右的连接顺序,所述无监督解码器包括无标签样本信息输入层、dropout层、全连接层、激活层、lstm层以及输出层,其中,激活层使用leakyrelu作为激活函数:
28、
29、输出层输出使用sigmoid函数对每一个节点进行激活:
30、
31、所述无监督解码器输入为无标签样本信息,输出为无标签样本重构;
32、按照从左到右的连接顺序,所述有监督解码器包括有标签样本信息输入层、dropout层、全连接层、激活层、lstm层以及输出层,其中,激活层使用leakyrelu作为激活函数:
33、
34、输出层使用sigmoid函数对每一个节点进行激活:
35、
36、所述有监督解码器输入为有标签样本信息,输出为预测标签。
37、进一步地,所述训练样本的训练采用“预训练+微调”的策略,其中:
38、无标签样本在编码器和无监督解码器上进行预训练,使用均方误差作为损失函数,公式为:
39、
40、式中,s为样本大小,n为每个子样本的分量个数,xij为第i个子样本的第j个分量的真实值,为第i个子样本的第j个分量的预测值;
41、在预设迭代周期t1内,损失不再下降时终止训练,保存最后一次训练的子模型;
42、有标签样本在编码器和无监督解码器上进行微调,在有监督编码器进行预训练,使用二分类交叉熵和均方误差的权重和作为损失函数,公式为:
43、
44、式中,yi为样本真实标签,为模型预测标签,α为权重系数,取值区间为[0,1];
45、在预设迭代周期t2内,损失不再下降时终止训练,保存最后一次训练的模型;
46、将测试样本导入保存的模型,进行评估,不断对模型进行微调,直到预测效果良好并趋于稳定,保存最终的模型作为套损智能预警模型。
47、本发明具有以下有益效果:本发明通过收集整理钻塞过程中的录井时序数据,经过数据预处理:后向差分获得单个数据之间的增量变化,归一化消除不同数据因量纲不一致引起的误差,时间错位和时间切片获得预测样本集,构建半监督自编码器网络架构,自动过滤、压缩数据中的无效、冗余信息,同时加入lstm网络提取数据中的时序信息,由于钻塞作业中套损信息缺乏,为了充分利用大量的无套损信息的数据,在训练过程中,利用无标签样本对模型进行预训练,再利用有标签样本进行有监督学习微调,最终使得训练好的套损预警模型能够实时、高效、精确地对套管状态进行预知。
1.基于半监督自编码器的钻塞过程套管损坏实时预警方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述录井数据包括:时间、钻速、钻压、扭矩、转速、钻时、大钩负荷、钻头位置、大钩位置、出口密度、入口密度、出口电导率、入口电导率等。
3.根据权利要求1所述的方法,其特征在于,所述套损信息进行处理方法为标签编码,数值1表示有标签样本中套管被磨损,数值0表述有标签样本中套管未被磨损。
4.根据权利要求1所述的方法,其特征在于,所述对录井时序数据和对应的套损标签进行处理方法包括后向差分、归一化、时间错位和时间切片。
5.根据权利要求1所述的方法,其特征在于,所述半监督自编码分类模型由编码器、无监督解码器和有监督解码器构成。
6.根据权利要求1所述,其特征在于,所述训练样本的训练采用“预训练+微调”的策略,其中: