一种基于钻孔数据进行机器学习的地层序列模拟方法与流程

文档序号:18548114发布日期:2019-08-27 21:53阅读:530来源:国知局
一种基于钻孔数据进行机器学习的地层序列模拟方法与流程

本发明属于机器学习与地质学交叉领域,该方法利用python语言,在pytorch深度学习框架下进行。特别涉及三维地质建模过程中地层层序的建立。适用于在地层三维建模过程中进行地层序列模型的开发与验证。



背景技术:

地层结构是漫长的地质作用的结果,在时空分布上表现为不均匀、不规则性等,但在宏观上具有统计上的规律性。弄清地层结构及其规律是地质信息化基础,同时不良地层分布也是工程建设的重点关注对象。

在地层序列模拟的过程中,存在两大难点,一是地层三维模型建立过程中,建模方法与插值方法选择受主观因素影响大,具有局限性且缺乏科学合理性。目前钻孔连接插值方法有多重选择,如线性插值、多项式插值、反距离插值以及克里金插值等,不同方法模拟效果存在差异。二是地层结构与分布规律研究,钻孔数据是基础,它可以提供准确地层结构信息,但成本高,耗时长,同时具有离散性。目前可采用方法是采取虚拟钻孔,利用地质学家经验补充,但一则是有经验的地质学家数量有限,其次在地层三维建模过程中数据量大,效率有限,该方法受主观因素影响仍然较大。

本发明提供一种基于钻孔数据进行机器学习的地层序列模拟方法,它将钻孔数据处理为地层序列数据,建立地层类型序列与地层层厚序列模型,实现基于输入钻孔坐标,能较准确判断相应位置地层信息。



技术实现要素:

针对现有技术不足,发明了一种基于钻孔数据进行机器学习的地层序列模拟方法,规避假设与专家经验等主观因素,实现基于输入钻孔坐标,能较为准确判断相应位置地层信息,通过与实际钻孔数据结果对比,上述模型具有较好可行性,可应用于地质信息化研究与工程规划、设计建造等方面。

一种基于循环神经网络原理的地层序列机器学习模拟方法,包括以下步骤:

(1)数据归一化,钻孔数据中,坐标与地层层厚间数量级相差较大。为保证收敛,数据需进行归一化处理——将取值范围压缩为0~1;

(2)地层序列填充,引入终止标记(endofsequence,eos)作为虚拟地层充当填充元素,将不等长地层序列填充为等长地层序列,同时表示地层序列结束。此外,为地层序列添加起始标记(startofsequence,sos),作为rnn预测开始信号;

(3)地层编码,将每一种地层用唯一数字标识表示,并利用独热编码实现地层向量化表示;

(4)建立地层类型序列模型,建立坐标信息与rnn输出过程关联方法,利用坐标信息对rnn进行初始状态赋值,以此使坐标指导地层序列模拟;

(5)模型验证,利用地层准确率以及编辑距离序列相似度为评价标准;

(6)建立地层层厚序列模型,利用坐标信息作为rnn隐藏层初始状态,建立坐标与地层类型连接。

(7)建立地层序列模型,将地层类型序列模型与地层厚度序列模型相连接,以地层类型序列模型模拟结果作为地层厚度序列模型编码器输入,构建完整地层序列模型。

本发明具有以下优点:

(1)一种基于钻孔数据进行机器学习的地层序列模拟方法,区别于传统插值方法,如线性插值、多项式插值、反距离插值与克里金插值等。模型建模与插值方法选取受主观因素影响,具有局限性且缺乏科学合理性。该方法可规避主观因素,利用智能方法模拟地层分布。该方法不依赖数据假设与专家经验等主观因素,通过与实际钻孔数据结果对比,该方法具有较好可行性。

(2)与统计学方法相比,机器学习手段不对数据作假设,而是检验输出与数据标签接近程度,通过bp(backpropagation,误差反向传导)算法不断调整参数以获得更高准确率。

(3)该方法采用导师驱动学习的回合,有正确监督信号指导,可更好拟合训练数据,有助加快循环神经网络模型收敛速度,对地层序列有较高预测能力。

(4)该方法采用地层准确率、基于编辑距离序列相似度作为评价标准,同时引入交叉熵损失函数描述模拟结果与真实地层之间接近程度,在模型进行验证时,地层准确率将模拟结果逐一对比,能够准确描述预测序列与真实地层序列接近程度。

附图说明:

图1是本发明一种基于钻孔数据进行机器学习的地层序列模拟方法。

具体实施方式:

下面结合附图对本发明的一个实施例作进一步说明。

一种基于钻孔数据进行的地层序列模拟方法,主要包括:输入坐标信息,地层类型序列模型,模拟地层类型序列,截取终止标记填充,地层层厚序列模型,模拟层层厚序列模型,地层序列。具体步骤如下:

(1)输入坐标信息,寻求坐标信息与rnn输出过程关联,利用坐标信息对rnn初始状态赋值,使坐标指导地层序列模拟。

(2)按照标准钻孔柱状图比例尺换算钻孔总深度,判断是否需要分页绘制,若需要则将该地层“剪开”,剪开部分分别位于该页尾,与下页首。

(3)建立底层层厚序列模型,采取seq2seq(sequencetosequence,序列-序列)架构,利用两个串联rnn分别作为编码器与解码器建立地层层厚模型,编码器处理地层类型信息,以其最后时刻隐藏层状态作为解码器初始状态,进而预测每种地层类型对应层厚。

(4)截取终止标记,填充地层序列,引入终止标记作为虚拟地层充当填充元素,将不等长地层序列填充为等长地层序列,同时作为表示地层序列结束标记。在每次训练中,rnn输出等长地层序列,终止标记出现时,采样过程停止,取终止标记出现前所有序列作为预测地层序列。

(5)连接地层类型序列模型与地层厚度序列模型,以地层类型序列模型模拟结果作为地层厚度序列模型编码器输入,构建完整地层序列模型。



技术特征:

技术总结
本发明公开了一种基于钻孔数据进行机器学习的地层序列模拟方法,该方法包括:数据归一化、地层序列填充、地层编码、建立地层类型序列模型、建立地层层厚序列模型、地层序列模型;该方法利用python语言,在Pytorch深度学习框架下进行,特别涉及三维地质建模过程中地层层序的建立,适用于在地层三维建模过程中进行地层序列模型的开发与验证。能够较为准确地判断相应位置的地层信息,同时该方法不依赖于数据假设与专家经验等主观因素,通过与实际钻孔数据结果对比表明,上述模型具有较好的可行性,可应用于地质信息化研究与工程规划、设计建造等方面。

技术研发人员:刘镇;张志龙;明伟华;张国豪;周翠英;欧阳进武
受保护的技术使用者:中山大学
技术研发日:2019.05.07
技术公布日:2019.08.27
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1