一种基于大数据技术的油井参数智能预警系统及其预警方法与流程

文档序号:18468684发布日期:2019-08-20 20:01阅读:608来源:国知局
一种基于大数据技术的油井参数智能预警系统及其预警方法与流程

本发明涉及智能预警。尤其是一种基于大数据技术的油井参数智能预警系统及其预警方法。



背景技术:

随着“智能油田”建设的不断推进,油井生产监控平台集成的数据量日益增长,各大油田都在研究利用生产大数据进行数据挖掘,完善报警预警功能模块,从而实现自动预警和超前预警,促进生产管控、生产分析和生产决策的智能化水不断提升。

大数据技术通过对复杂多样的数据进行分析,可建立对数据变化具有“适应”和“学习”能力的模型,使得模型的计算结果随着数据变化动态调整。大数据技术已应用于消防预警服务、医学图像预警提示、交通违法行为预警摄像等多个领域,技术层面已经成熟。

目前,如图2所示,油井参数曲线预警一般采用固定阈值和和手动设定阈值的方法,由系统管理人员根据参数理论上下限和区块内参数均值统一设置固定阈值参考值,确定报警上下限,对超限参数进行报警。实际使用统一阈值时极易发生频繁误报,造成操作人员“报警麻木”,难以动态反映环境(季节、气温等)变化,无法自主区分上措施、停井维修所致超限,无法反映不同区块、不同井位的工况区别,人工干预工作量巨大,容易造成局部预警失效。



技术实现要素:

本发明为了克服现有技术方案的不足,提供了一种基于大数据技术的油井参数智能预警系统及其预警方法,能够根据每口井自身的历史数据设立动态预警模型并且采用,对提升报警预警效益有重要意义。

为了实现上述目的,本发明的技术方案为:一种基于大数据技术的油井参数智能预警系统,包括展示层、应用层、模型层、数据层,数据层用于采集整合各个油井中各类参数的历史数据提供给模型层,模型层存储数据并对数据进行处理预处理通过报警分类器的训练学习建立预测模型对油井的工作进行预警,应用层利用模型层计算曲线阈值从而决定单井异常报警并且进行井间关联分析,分析结果和预警结果通过展示层显示给用户;

其中,数据层包括生产预警大数据资源库、epbp(勘探开发业务协同平台)、油田数据中心以及曲线追踪系统;

其中,模型层包括预警模型、模型优化模块、大数据算法支持模块、分布式计算模块以及分布式存储器,

分布式计算模块为spark大数据平台,用于从曲线追踪系统、勘探开发业务协同平台以及油田数据中心迁移抽取与报警相关的历史数据并发送至生产预警大数据资源库;

大数据算法支持模块包括tensorflow,tensorflow为基于数据流编程的符号数学系统,通过tensorflow实现lstm神经网络模型的运算,构成预警模型,

lstm神经网络模型能够对多种曲线数据进行处理、预测参数变化、具备长期记忆、增量学习以及自动寻优,对照报警样例中的报警标签,lstm神经网络模型自动进行学习,对时间序列型的曲线数据的变化规律进行学习,通过反复迭代,实现对曲线数据的时间序列变化规律和报警标签之间的精确对应;

结合报警样例集,利用lstm神经网络模型对时间序列数据进行学习,通过进行特征工程和参数调节,神经网络学习数据的稳定运行规律,计算出动态的报警阈值。

模型优化模块用于参数优化、专家干预和样例扩充;

应用层用于单井异常报警、井间关联分析以及曲线阈值计算,应用层包括智能预警表达式解析模块,其用于通过交互的方式生成特定油井数据的预测模型,具体为:

步骤1、交互,提示用户业务对象支持的智能预警表达式,提示对象的表达式形式;

步骤2、补全,判断算法可接收参数类型,提示用户选择合适算法对象;

步骤3、反向修正,超出阈值之后提示用户进行调整,生成智能预警表达式;

步骤4、解析,通过语法语义解析业务对象与数据对象,生成预警模型;

展示层包括b/s模式(浏览器/服务器)、c/s模式(客户端/服务器)、移动模式的展示形式;

从图2、3中可以看出相对现有技术,采用lstm神经网络模型的建立的预测模型则能够检测出局部超限,预警成功。

一种基于大数据技术的油井参数智能预警方法,其对油井参数进行预处理,得到规范可用的数据集,基于神经网络算法和智能预警交互生成预警模型,神经网络算法通过对历史数据进行迭代学习、分析,建立反映油井参数曲线自身的变化规律的预测模型,实现动态报警,智能预警交互通过用户的交互结合语法语义分析建立特定油井数据的预测模型,该方法在后续的应用中,可根据专家经验和新增数据,进行自我学习和优化,不断提升报警质量,如图4所示,具体包括以下步骤:

步骤1,历史数据获取,从曲线追踪系统、勘探开发业务协同平台以及油田数据中心迁移抽取与报警相关的历史数据,历史数据包括曲线数据、设备数据、天气数据、自查记录、警情记录以及经验规则,对其进行整合形成生产预警大数据资源库,设备数据为各个油井参数,包括采集时间、运行状态、通讯状态、汇管压力、汇管温度、井口油压、井口温度、井口套压、井下压力以及井下温度,自查记录包括报修记录以及修井记录,警情记录包括抽油杆脱断、蜡卡、供液不足以及抽油泵泄漏,曲线数据为设备数据中油井参数随时间变化的曲线,设备数据与自查记录、问题记录通过时间进行对应整合形成报警或者不报警的标签,并发送至生产预警大数据资源库;

步骤2,数据预处理,从生产预警大数据资源库提取的历史数据需要进行预处理生成机器算法可识别学习的经验数据;

步骤3,报警分类器的训练学习,具体包括如下步骤:

步骤3.1,报警样例为时间序列型的曲线数据;

步骤3.3,自学习,对照报警样例中的报警标签,lstm神经网络模型自动进行学习,对时间序列型的曲线数据的变化规律进行学习,通过反复迭代,实现对曲线数据的时间序列变化规律和报警标签之间的精确对应;

步骤3.4,生成预测值,lstm神经网络模型为利用反向传播和梯度下降方法在报警样例的历史数据集上训练预警模型;

步骤3.5,计算该油井参数的报警阈值,结合报警样例集,利用lstm神经网络模型对时间序列数据进行学习,通过进行特征工程和参数调节,神经网络学习数据的稳定运行规律,计算出动态的报警阈值;

步骤3.6,单井参数异常判断;

步骤3.7,生成预警结果,针对该油井的其他参数进行步骤3.4-步骤3.5的异常判断,结合该油井各个参数的权重以及该油井异常参数的数量计算比值,构成报警概率。

有益效果:

(1)本发明结合油井参数示例数据集,利用lstm神经网络算法对时间序列数据进行了学习,通过进行特征工程和参数调节,使得神经网络能够学习数据的稳定运行规律,据此计算出动态的报警阈值,克服了固定阈值造成的局部预警失效问题;

(2)本发明的生产预警大数据资源库积累了海量的油井参数数据,为基于油井参数大数据开展动态报警模型研究提供了坚实的数据基础;

(3)本发明的预测模型通过动态阈值调整实现了异常问题判断的客观性和准确性;

(4)本发明使用大数据技术通过对复杂多样的数据进行分析,可建立对数据变化具有“适应”和“学习”能力的模型,使得模型的计算结果随着数据变化动态调整;

(5)本发明使用语义分析技术,用户在进行智能预警方法的表达式填写操作时,可使用交互提示、表达式补全等功能,实现算法与数据的自由组合,自动生成针对特定油井数据的预测模型,从而实现对动态预警模型的有效补充。

附图说明

图1为本发明的系统构成框图;

图2为现有技术中检测局部报警失效示意图;;

图3为本发明的采用lstm神经网络模型的预测模型则检测出局部超限示意图;

图4为本发明的智能预警方法流程图;

图5为本发明的历史数据获取流程图;

图6为本发明的数据预处理流程图;

图7为本发明的数据清洗流程图;

图8为本发明的特征加工流程图;

图9为本发明的报警样例示意图;

图10为本发明的lstm神经网络模型建立的曲线数据图;

图11为本发明的智能预警交互建立预测模型的流程图。

具体实施方式

下面结合附图与实施例对本发明作进一步的说明。

如图1所示,一种基于大数据技术的油井参数智能预警系统,包括展示层、应用层、模型层、数据层,数据层用于采集整合各个油井中各类参数的历史数据提供给模型层,模型层存储数据并对数据进行处理预处理通过报警分类器的训练学习建立预测模型对油井的工作进行预警,应用层利用模型层计算曲线阈值从而决定单井异常报警并且进行井间关联分析,分析结果和预警结果通过展示层显示给用户。

其中,数据层包括生产预警大数据资源库、epbp(勘探开发业务协同平台)、油田数据中心以及曲线追踪系统;

模型层包括预警模型、模型优化模块、大数据算法支持模块、分布式计算模块以及分布式存储器,

分布式存储器采用包括hdfs(hadoop分布式文件系统)、hbase(hadoop数据库)、hive(hadoop数据仓库工具软件)、pig(hadoop大数据分析平台)在内的hadoop存储形式,mhaout为hadoop平台的机器学习库,其用于生产预警大数据资源库的存储;

hadoop为大数据分布式存储和计算平台,应用于大型日志分析、电子商务、搜索引擎,具有高扩展、硬件成本低、成熟生态圈的优点。

分布式计算模块为spark大数据平台,用于从曲线追踪系统、勘探开发业务协同平台以及油田数据中心迁移抽取与报警相关的历史数据并发送至生产预警大数据资源库;

大数据算法支持模块包括tensorflow,tensorflow为基于数据流编程的符号数学系统,通过tensorflow实现lstm神经网络模型的运算,构成预警模型,

lstm神经网络模型能够对多种曲线数据进行处理、预测参数变化、具备长期记忆、增量学习以及自动寻优,对照报警样例中的报警标签,lstm神经网络模型自动进行学习,对时间序列型的曲线数据的变化规律进行学习,通过反复迭代,实现对曲线数据的时间序列变化规律和报警标签之间的精确对应

lstm神经网络模型为利用反向传播和梯度下降方法在报警样例的历史数据集上训练模型,训练时,lstm神经网络模型的初级层神经元自动学习抽取报警样例的历史数据集的数据特征,高级层神经元学习调整预测权重,经过大量报警样例的反复迭代学习后,lstm神经网络模型将能准确拟当前点的前置数据点集与当前点预测值之间的关系,从而对曲线数据变化具有预测能力,

结合报警样例集,利用lstm神经网络模型对时间序列数据进行学习,通过进行特征工程和参数调节,神经网络学习数据的稳定运行规律,计算出动态的报警阈值。

其中,预警模型为可执行代码;

其中,lof函数可接收参数为油井对象的油压参数;

其中,智能预警表达式为规则定义下的使用单词符号表的自定义表达式,词法记号为具有单词种别、单词符号属性值的单词序列二元式,语义规则为中间代码。

模型优化模块用于参数优化、专家干预和样例扩充;

应用层用于单井异常报警、井间关联分析以及曲线阈值计算,应用层包括智能预警表达式解析模块,其用于通过交互的方式生成特定油井数据的预测模型,具体为:

步骤1、交互,提示用户业务对象支持的智能预警表达式,提示对象的表达式形式;

步骤2、补全,判断算法可接收参数类型,提示用户选择合适算法对象;

步骤3、反向修正,超出阈值之后提示用户进行调整,生成智能预警表达式;

步骤4、解析,通过语法语义解析业务对象与数据对象,生成预警模型,具体为:

给出智能预警表达式后,通过表达式语法语义分析模块解析为自定义的算法对象和数据对象,表达式语法语义分析模块包括错误处理模块、词法分析模块、语法分析模块、语义分析模块、错误处理模块以及中间语言模块,智能预警表达式以字符的形式提供给词法分析模块,词法分析模块将其中的词法错误提供给错误处理模块,经过处理后生成词法错误恢复反馈给词法分析模块,词法分析模块根据词法错误恢复生成过滤掉无效符号的词法记号,语法分析模块接收词法记号,将其中的语法错误提供给错误处理模块,经过处理后生成语法错误恢复反馈给语法分析模块,语法分析模块根据语法错误恢复生成预测分析表,语法分析模块输出符号给符号表,语义分析模块接收预测分析表以及来自符号表的符号,将其中的语义错误提供给错误处理模块,经过处理后生成语义错误恢复反馈给语义分析模块,语义分析模块根据语义错误恢复生成语义规则,提供给中间语言模块,中间语言模块进行逻辑组合,生成特定油井数据的预测模型,预警模型包括识别定义、解释运算,其中识别定义包括单井、井组、单元构成的业务对象,油压、套压、含水构成的数据对象以及包括lof函数在内的算法对象,解释运算内容为通用的、面向业务对象、数据对象、算法对象的运算方法。

展示层包括b/s模式(浏览器/服务器)、c/s模式(客户端/服务器)、移动模式的展示形式;

从图2、3中可以看出相对现有技术,采用lstm神经网络模型的建立的预测模型则能够检测出局部超限,预警成功。

一种基于大数据技术的油井参数智能预警方法,其对油井参数进行预处理,得到规范可用的数据集,基于神经网络算法和智能预警交互生成预警模型,神经网络算法通过对历史数据进行迭代学习、分析,建立反映油井参数曲线自身的变化规律的预测模型,实现动态报警,智能预警交互通过用户的交互结合语法语义分析建立特定油井数据的预测模型,该方法在后续的应用中,可根据专家经验和新增数据,进行自我学习和优化,不断提升报警质量,如图4所示,具体包括以下步骤:

步骤1,如图5所示,历史数据获取,从曲线追踪系统、勘探开发业务协同平台以及油田数据中心迁移抽取与报警相关的历史数据,历史数据包括曲线数据、设备数据、天气数据、自查记录、警情记录以及经验规则,对其进行整合形成生产预警大数据资源库,设备数据为各个油井参数,包括采集时间、运行状态、通讯状态、汇管压力、汇管温度、井口油压、井口温度、井口套压、井下压力以及井下温度,自查记录包括报修记录以及修井记录,警情记录包括抽油杆脱断、蜡卡、供液不足以及抽油泵泄漏,曲线数据为设备数据中油井参数随时间变化的曲线,设备数据与自查记录、问题记录通过时间进行对应整合形成报警或者不报警的标签,并发送至生产预警大数据资源库;

步骤2,数据预处理,从生产预警大数据资源库提取的历史数据需要进行预处理生成机器算法可识别学习的经验数据,如图6所示,包括如下步骤:

步骤2.1,如图7所示,数据清洗,

从生产预警大数据资源库获取的历史数据中的曲线数据存在噪声,该噪声是测量变量的随机错误或者偏差,应当对曲线数据进行平滑和去噪,由于设备故障和环境变化所导致的曲线分布改变的报警数据具有持续性和周期性,而噪声数据则在曲线数据中表现出瞬变特性和孤立性,根据上述特性使用噪声滤波器对周期持续变化的报警数据和瞬变孤立变化的噪声数据进行区分,对滤波时间窗内的数据实施去噪平滑,并将滤波后的无噪声数据和滤波前的噪声数据进行对应备份;

步骤2.2,如图8所示,特征加工,对生产预警大数据资源库的设备数据和警情记录进行加工,通过参数之间的运算,分别获得报警特征和报警标签,报警特征包括工作日、周末、季节、压力差、温度差、电流差、电压差以及载荷差,通过报警特征和报警标签获取异常报警的指标取值范围;

步骤2.3,归一化,采用统计方法对指标取值范围内的数据进行归一化处理,简化油井数据取值范围;

步骤2.4,样例标注,归一化的数据通过专家标注、样例扩充形成报警样例,提供给报警分类器进行学习;

步骤3,报警分类器的训练学习,具体包括如下步骤;

步骤3.1,报警样例为时间序列型的曲线数据,如图9所示,曲线数据划分为短周期性报警样例、季节趋势性报警样例、一阶差分稳定性报警样例以及自相关回归性报警样例,不同类型的报警样例的序列时段特征作为预警模型的前提条件。

时间序列型的油井参数蕴含前后因果关系、季节变化趋势,其对建立预警模型十分重要,而单独一个时间点的特征聚合则通常没有实际意义,因此需选择适合对序列时段特征进行处理的算法进行建模。

步骤3.2,选择神经网络算法,针对油井的曲线数据种类、数据量、时间跨度的特点,结合理论分析和试验验证,建立lstm神经网络模型,能够对多种曲线数据进行处理、预测参数变化、具备长期记忆、增量学习以及自动寻优;

lstm神经网络模型由多层神经元组成,低层神经元逐层提取特征,高层神经元加权决策,应用于数据够多的前提下,优秀的学习算法。

步骤3.3,自学习,对照报警样例中的报警标签,lstm神经网络模型自动进行学习,对时间序列型的曲线数据的变化规律进行学习,通过反复迭代,实现对曲线数据的时间序列变化规律和报警标签之间的精确对应;

步骤3.4,生成预测值,lstm神经网络模型为利用反向传播和梯度下降方法在报警样例的历史数据集上训练预警模型,

训练时,lstm神经网络模型的初级层神经元自动学习抽取报警样例的历史数据集的数据特征,高级层神经元学习调整预测权重,经过大量报警样例的反复迭代学习后,lstm神经网络模型将能准确拟当前点的前置数据点集与当前点预测值之间的关系,从而对曲线数据变化具有预测能力,

具体为,lstm神经网络模型利用t时刻数据点的前置k最近邻居窗口内的某一油井参数的曲线数据分布,计算t时刻该油井参数的预测值;

步骤3.5,计算该油井参数的报警阈值,结合报警样例集,利用lstm神经网络模型对时间序列数据进行学习,通过进行特征工程和参数调节,神经网络学习数据的稳定运行规律,计算出动态的报警阈值,具体为,如图10所示,基于lstm神经网络模型建立该曲线数据的逐步前向预测模型,并生成预测模型残差的标准差ε,预测值上下浮动标准差ε作为动态报警上限和动态报警下限;

步骤3.6,单井参数异常判断,测量该油井参数t时刻的实际值,并与预测值相减得到的实际差,实际差与标准差ε进行比较,如果超出标准差ε则表明该油井参数异常,否则为正常;

步骤3.7,生成预警结果,针对该油井的其他参数进行步骤3.4-步骤3.5的异常判断,结合该油井各个参数的权重以及该油井异常参数的数量计算比值,构成报警概率。

其中,随着历史数据的不断积累,油井参数种类的不断扩充,预测模型借助专家经验和自我学习机制,逐步提升动态阈值调整和异常问题判断的客观性和准确性;

报警样例能够更新,包括修正标注结论以及学习最新的油井参数数据;

报警阈值能够人为设置,预测模型结合人为设置的参考值进行自学习自优化。

其中,智能预警交互通过用户的交互结合语法语义分析建立特定油井数据的预测模型,如图11所示,具体为:

步骤1、交互,提示用户业务对象支持的智能预警表达式,提示对象的表达式形式;

步骤2、补全,判断算法可接收参数类型,提示用户选择合适算法对象;

步骤3、反向修正,超出阈值之后提示用户进行调整,生成智能预警表达式;

步骤4、解析,通过语法语义解析业务对象与数据对象,生成预警模型,具体为:

给出智能预警表达式后,通过表达式语法语义分析模块解析为自定义的算法对象和数据对象,表达式语法语义分析模块包括错误处理模块、词法分析模块、语法分析模块、语义分析模块、错误处理模块以及中间语言模块,智能预警表达式以字符的形式提供给词法分析模块,词法分析模块将其中的词法错误提供给错误处理模块,经过处理后生成词法错误恢复反馈给词法分析模块,词法分析模块根据词法错误恢复生成过滤掉无效符号的词法记号,语法分析模块接收词法记号,将其中的语法错误提供给错误处理模块,经过处理后生成语法错误恢复反馈给语法分析模块,语法分析模块根据语法错误恢复生成预测分析表,语法分析模块输出符号给符号表,语义分析模块接收预测分析表以及来自符号表的符号,将其中的语义错误提供给错误处理模块,经过处理后生成语义错误恢复反馈给语义分析模块,语义分析模块根据语义错误恢复生成语义规则,提供给中间语言模块,中间语言模块进行逻辑组合,生成特定油井数据的预测模型,预警模型包括识别定义、解释运算,其中识别定义包括单井、井组、单元构成的业务对象,油压、套压、含水构成的数据对象以及包括lof函数在内的算法对象,解释运算内容为通用的、面向业务对象、数据对象、算法对象的运算方法。

其中,预警模型为可执行代码;

其中,lof函数可接收的参数为油井对象的油压参数;

其中,智能预警表达式为规则定义下的使用单词符号表的自定义表达式,词法记号为具有单词种别、单词符号属性值的单词序列二元式,语义规则为中间代码。

采用语法语义分析之后,用户在进行智能预警方法的表达式填写操作时,可使用交互提示、表达式补全等功能,实现算法与数据的自由组合,自动生成针对特定油井数据的预测模型。

以上所述实施方式仅表达了本发明的一种实施方式,但并不能因此而理解为对本发明范围的限制。应当指出,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1