一种基于数据挖掘的在役油管柱腐蚀失效预测方法

文档序号:9911418阅读:247来源:国知局
一种基于数据挖掘的在役油管柱腐蚀失效预测方法
【技术领域】
[0001]本发明涉及一种预测方法,具体涉及一种基于数据挖掘的在役油管柱腐蚀失效预测方法。
【背景技术】
[0002]随着油气田的开发,油气井下的高温高压多相流环境含有的硫化氢、二氧化碳、氯离子、水及微生物等介质会作为伴生物质出现,使井下油管受到严重腐蚀,不仅影响了油气井的正常生产,而且给试修井作业带来许多困难。
[0003]影响油管钢腐蚀的因素可分为材料因素、环境因素和力学因素等。钢材材质因素包括钢材的化学成分(主要是合金元素)及其热处理状态(钢材的显微组织)。环境因素包括温度、气体分压、腐蚀产物膜、PH值、流速、流型、溶液过饱和度、细菌等。力学因素包括管材所承受的载荷大小、方向及分布情况等。以上这些因素不同程度地影响着油管的腐蚀,因此得到油管腐蚀程度主要从这几方面因素着手,从而对在役油管的使用寿命进行初步分级预塾目ο
[0004]数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover inDatabase,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
[0005]数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
[0006]预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
[0007]数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。数据挖掘完整的步骤如下:
[0008]①理解数据和数据的来源(understanding)。
[0009]②获取相关知识与技术(acquisit1n)。
[0010]③整合与检查数据(integrat1nand checking)。
[0011]④去除错误或不一致的数据(datacleaning)。
[0012]⑤建立模型和假设(modeland hypothesis development)。
[0013]⑥实际数据挖掘工作(data mining)。
[0014]⑦测试和验证挖掘结果(testingand verificat1n) ο
[0015]⑧解释和应用(interpretat1nand use) 0
[0016]由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。
[0017]Composite模式是将对象组合成树形结构以表示“部分——整体”的层次结构。Composite使得用户对单个对象操作和组合对象的操作使用具有一致性。想到Composite就应该想到树形结构图。组合体内这些对象都有共同接口,当组合体一个对象的方法被调用执行时,Composite将遍历整个树形结构,寻找同样包含这个方法的对象并实现调用执行。
[0018]Composite好处:第一,使客户端调用简单,客户端可以一致的使用组合结构或其中单个对象,用户就不必关心自己处理的是单个对象还是整个组合结构,这就简化了客户端代码。第二,更容易在组合体内加入对象部件,客户端不必因为加入了新的对象部件而更改代码。
[0019]WEKA的全名是怀卡托智能分析环境(Waikato Environment for KnowledgeAnalysis),是一款免费的,非商业化的,基于JAVA环境下开源的机器学习以及数据挖掘软件,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。
[0020]目前,国内运用数据挖掘进行油管柱腐蚀失效预测的研究是比较欠缺的,工作现场一般都是靠技术人员的经验和估测进行预警,缺乏可信度和安全度,所以这方面的研究开发具有很好的工程应用价值。

【发明内容】

[0021]本发明的目的在于克服上述现有技术的缺点,提供了一种基于数据挖掘的在役油管柱腐蚀失效预测方法,该方法能够准确的预测油管柱腐蚀失效时间。
[0022]为达到上述目的,本发明所述的基于数据挖掘的在役油管柱腐蚀失效预测方法包括以下步骤:
[0023]I)获取油管的状态信息,再将油管的状态信息存储到数据库中或将油管的状态信息以arff文件形式存储,其中,所述油管的状态信息包括油管的钢材材质信息、油管所处环境信息及受力信息;
[0024]2)训练数据源从数据库及arff文件获取油管的状态信息,然后对获取的油管的状态信息进行预处理,形成训练数据集;
[0025]3)油管失效预报器根据步骤2)得到的训练数据集预测油管柱腐蚀失效时间。
[0026]所述油管的钢材材质信息为油管的组分、以及油管的热处理状态。
[0027]所述油管所处环境信息包括油管所处环境的温度、气体分压、腐蚀产物膜、以及流管内液体的PH值、流速、流型、饱和度及细菌数量。
[0028]所述油管的受力信息包括油管所承受的载荷量、载荷的受力方向及分布信息。
[0029]油管失效预报器为基于随机树算法的预测器、基于可更新朴素贝叶斯算法的预测器、基于LWL算法的预测器、基于IBk算法的预测器、基于SMO回归算法的预测器、基于上瘾回归算法的预测器或基于神经网络算法的预测器。
[0030]油管失效预报器为基于随机树算法的预测器、基于可更新朴素贝叶斯算法的预测器、基于LWL算法的预测器、基于IBk算法的预测器、基于SMO回归算法的预测器、基于上瘾回归算法的预测器及基于神经网络
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1