基于半监督自编码器的钻塞过程套管损坏实时预警方法

文档序号：37932992发布日期：2024-05-11 00:11阅读：6来源：国知局

本发明涉及油气井工程领域，特别涉及基于半监督自编码器的钻塞过程套管损坏实时预警方法。

背景技术：

1、由于油田开发现场要求，由分层开采而产生的完井水泥塞和封井作业产生的封井水泥塞呈增多趋势，钻磨水泥塞(简称钻塞)的任务越来越重。在钻塞作业过程中，由于钻磨周期较长、井下钻头震动幅度大、钻头位置偏心以及井底的水泥塞碎块存在重复钻磨现象等多个因素相互作用下，导致出现不同程度的套管损坏(简称套损)现象。套损严重影响后续钻塞作业的进行，造成大量的时间浪费和不必要的成本损失。

2、针对钻塞过程中出现的套损问题，目前鲜有学者进行相关研究，而且现场是根据单一或少量几个录井数据的不正常变化，以此判断可能出现了套损，但是该方法识别精度低，存在严重的时间滞后，无法实现事前预测。此外，确定套损发生的时间和位置是极其困难的，这就导致了套损标签缺乏，出现了数据集中包含的样本不均衡问题，将造成模型在实际部署中预测效果不佳等问题。

技术实现思路

1、本发明的目的在于提供基于半监督自编码器的钻塞过程套管损坏实时预警方法，旨在解决现有技术中存在的录井数据特征复杂、时间依赖提取不足、无法实现事前预测等问题，保证钻塞作业过程中套管的完整性。

2、为了解决上述问题，本发明提供基于半监督自编码器的钻塞过程套管损坏实时预警方法，包括以下步骤：

3、获取钻塞过程中的录井时序数据和对应的套损信息；

4、对所述录井时序数据和对应的套损信息进行处理，获得切割数据集；

5、根据套损信息将所述切割数据集划分为有标签样本与无标签样本；

6、对有标签样本按照8：2的比例随机抽样，其中80％部分与无标签样本组成训练样本和20％部分形成测试样本；

7、构建半监督自编码器分类模型，经过所述训练样本的训练和所述测试样本的测试，最终得到基于半监督自编码器的钻塞过程套损实时智能预警模型。

8、进一步地，所述录井数据包括：时间、钻速、钻压、扭矩、转速、钻时、大钩负荷、钻头位置、大钩位置、出口密度、入口密度、出口电导率、入口电导率等。

9、进一步地，所述对套损信息进行处理方法为标签编码：数值1表示有标签样本中套管被磨损，数值0表述有标签样本中套管未被磨损。

10、进一步地，所述对录井时序数据和对应的套损标签进行处理方法包括后向差分、归一化、时间错位和时间切片。

11、所述后向差分公式为：

12、δxt＝xt-xt-1

13、式中，xt为t时刻的值，xt-1为t-1时刻的值，δxt为t时刻的值增量。

14、所述归一化公式为：

15、

16、式中，x为所有值组成的向量，x为原始值，x’为归一化后的值；

17、所述时间错位是将所有套损标签对应的时间减去某一数值，使得套损标签对应的时间提前于录井数据对应的时间，将时间提前的套损标签按照相同的时刻与录井时序数据重新相互对应，形成错位数据集；

18、所述时间切片是指按照某一时间长度和时间间隔对错位数据集进行切割，每一个切片为一个样本，每个样本包括多个子样本，形成切割数据集。

19、进一步地，根据套损信息将所述切割数据集划分为有标签样本与无标签样本。

20、进一步地，所述半监督自编码分类模型由编码器、无监督解码器和有监督解码器构成：

21、按照从左到右的连接顺序，所述编码器包括输入层、lstm层、激活层、全连接层、dropout层以及输出层，其中，激活层使用relu作为激活函数：

22、relu(z)＝max(0,z)

23、式中，z为上一层的输出；

24、输出层使用sigmoid函数对每一个节点进行激活：

25、

26、所述编码器输入为有标签样本或无标签样本，输出为有标签样本信息或无标签样本信息；

27、按照从左到右的连接顺序，所述无监督解码器包括无标签样本信息输入层、dropout层、全连接层、激活层、lstm层以及输出层，其中，激活层使用leakyrelu作为激活函数：

28、

29、输出层输出使用sigmoid函数对每一个节点进行激活：

30、

31、所述无监督解码器输入为无标签样本信息，输出为无标签样本重构；

32、按照从左到右的连接顺序，所述有监督解码器包括有标签样本信息输入层、dropout层、全连接层、激活层、lstm层以及输出层，其中，激活层使用leakyrelu作为激活函数：

33、

34、输出层使用sigmoid函数对每一个节点进行激活：

35、

36、所述有监督解码器输入为有标签样本信息，输出为预测标签。

37、进一步地，所述训练样本的训练采用“预训练+微调”的策略，其中：

38、无标签样本在编码器和无监督解码器上进行预训练，使用均方误差作为损失函数，公式为：

39、

40、式中，s为样本大小，n为每个子样本的分量个数，xij为第i个子样本的第j个分量的真实值，为第i个子样本的第j个分量的预测值；

41、在预设迭代周期t1内，损失不再下降时终止训练，保存最后一次训练的子模型；

42、有标签样本在编码器和无监督解码器上进行微调，在有监督编码器进行预训练，使用二分类交叉熵和均方误差的权重和作为损失函数，公式为：

43、

44、式中，yi为样本真实标签，为模型预测标签，α为权重系数，取值区间为[0,1]；

45、在预设迭代周期t2内，损失不再下降时终止训练，保存最后一次训练的模型；

46、将测试样本导入保存的模型，进行评估，不断对模型进行微调，直到预测效果良好并趋于稳定，保存最终的模型作为套损智能预警模型。

47、本发明具有以下有益效果：本发明通过收集整理钻塞过程中的录井时序数据，经过数据预处理：后向差分获得单个数据之间的增量变化，归一化消除不同数据因量纲不一致引起的误差，时间错位和时间切片获得预测样本集，构建半监督自编码器网络架构，自动过滤、压缩数据中的无效、冗余信息，同时加入lstm网络提取数据中的时序信息，由于钻塞作业中套损信息缺乏，为了充分利用大量的无套损信息的数据，在训练过程中，利用无标签样本对模型进行预训练，再利用有标签样本进行有监督学习微调，最终使得训练好的套损预警模型能够实时、高效、精确地对套管状态进行预知。

技术特征：

1.基于半监督自编码器的钻塞过程套管损坏实时预警方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述录井数据包括：时间、钻速、钻压、扭矩、转速、钻时、大钩负荷、钻头位置、大钩位置、出口密度、入口密度、出口电导率、入口电导率等。

3.根据权利要求1所述的方法，其特征在于，所述套损信息进行处理方法为标签编码，数值1表示有标签样本中套管被磨损，数值0表述有标签样本中套管未被磨损。

4.根据权利要求1所述的方法，其特征在于，所述对录井时序数据和对应的套损标签进行处理方法包括后向差分、归一化、时间错位和时间切片。

5.根据权利要求1所述的方法，其特征在于，所述半监督自编码分类模型由编码器、无监督解码器和有监督解码器构成。

6.根据权利要求1所述，其特征在于，所述训练样本的训练采用“预训练+微调”的策略，其中：

技术总结
本发明涉及一种基于半监督自编码器的钻塞过程套管损坏实时预警方法，该方法包括：收集整理钻塞过程中的录井时序数据；对录井时序数据预处理：后向差分获得单个数据之间的增量变化，归一化消除不同数据因量纲不一致引起的误差，时间错位和时间切片获得预测样本集；构建半监督自编码器网络架构，加入LSTM网络作为时序信息提取层；采用“预训练+微调”的策略进行模型训练，利用大量的无标签样本对模型进行预训练，接着用少量的有标签样本进行有监督学习微调，最终得到钻塞过程套管损坏实时预警模型。本发明能够实时、高效、精确地对套管状态进行预知，以便提前做好应对措施，降低钻塞作业降低风险，提高钻塞效率。

技术研发人员：尹飞,黄干,曾攀,叶鹏举,罗涛,刘夕源,付博然
受保护的技术使用者：成都理工大学
技术研发日：
技术公布日：2024/5/10

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尹飞,黄干,曾攀,叶鹏举,罗涛,刘夕源,付博然
技术所有人：成都理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、汤老师：1.生态环境材料与污染治理 2.新能源材料、矿物材料的教学和无机非金属矿物新材料 3.新技术的开发研究
2、李老师：1.深基坑与深基础工程理论、设计方法与关键施工技术 2.地下结构共同工作集约化分析理论和设计方法
如您是高校老师，可以点此联系我们加入专家库。