一种基于空间信息约束的数据驱动预测方法、系统

文档序号:36420196发布日期:2023-12-20 08:32阅读:38来源:国知局
一种基于空间信息约束的数据驱动预测方法

本发明属于智能信息处理,尤其涉及一种基于空间信息约束的数据驱动预测方法、系统。


背景技术:

1、借助人工智能技术实现数据或信息处理与解释的自动化,甚至开展从数据出发实现对未知的探索性研究是当下的热点,也是全球数字化进程的重要引擎。但是,以深度学习为代表的人工智能技术,其成功的应用需要充足的数据样本做支撑,这使得许多在传统智能计算领域表现出色的方法无法在数据获取成本昂贵的专业研究领域大展身手。因为越专业的领域其数据获取成本越昂贵,导致其学习样本数据稀缺且缺少代表性。而且,在众多的研究领域中,如地球科学领域,其无论是经地表采集的或是从钻孔中获得的地球物理观测数据都具有空间性,并且,相应的研究目标无论是具象的地下岩层分布还是抽象出来的储层参数分布都是沿三维空间展布的。然而,现有的方法多针对的是结构化数据,对数据间的空间相关性考虑不足,比如,深度全连接神经网络将空间各采样点当成符合某种未知分布但不具空间相关性的孤立点来处理;卷积神经网络虽然在局部上考虑了预测目的的空间展布,但是其主要用于分类问题,如图像识别、图像分割等,而且其利用的空间相关信息受限于输入样本的大小,因此很难做到从全局考虑学习样本的空间相关性。以上这些在一定程度上制约了智能学习方法的推广。

2、通过上述分析,现有技术存在的问题及缺陷为:现有的方法多针对的是结构化数据,对数据间的空间相关性考虑不足,这些在一定程度上制约了智能学习方法的推广。


技术实现思路

1、针对现有技术存在的问题,本发明提供了一种基于空间信息约束的数据驱动预测方法、系统。

2、本发明是这样实现的,一种基于空间信息约束的数据驱动预测方法,所述基于空间信息约束的数据驱动预测方法包括:

3、s1:数据的获取及预处理;

4、s2:基于同位协同克里金的预测目标插值;

5、s3:基于序贯高斯模拟的样本权重求取及基于空间信息约束的损失函数的构建;

6、s4:损失函数的优化及基于深度全连接神经网络的数据驱动预测。

7、进一步,s1中数据的获取及预处理具体包括以下步骤:

8、s11,针对研究对象的具体预测目标y,获得多种采集方式不同的观测数据x1,x2,…,xn,各观测数据的集合形式为:

9、

10、其中,x表示各数据集中的样本,ki为第i个数据集的样本个数;

11、s12,对观测数据进行中值填充的异常值处理;若各观测数据间的量纲相差很大,则对其进一步做归一化处理,变换公式为:

12、

13、其中xnorm表示归一化后的样本,xmax和xmin分别为所述各观测数据的最大值和最小值;

14、s13,对归一化后的x1,x2,…,xn及y进行正态变换,分别得到及

15、进一步,s2中基于同位协同克里金的预测目标插值具体包括以下步骤:

16、s21,将与分别做相关性分析,确定与相关性最高的

17、s22,以为主分量z1,以所述为次级变量z2,建立z1的插值公式:

18、

19、其中αi、β为加权系数,u为空间位置向量,具体地,uo表示待估计点的位置,表示采样点的位置,n为采样点的个数,也即y的样本个数,z1(ui)表示主分量在ui处的取值,z2(uo)表示次级变量在uo处的取值;

20、s23,基于无偏条件及最小方差条件,得到如下方程组:

21、

22、其中c1、c2和c12分别表示z1与z2的方差及协变差函数,具体的:

23、

24、

25、s24,计算z1与z2的实验变差函数,并选择合适的变差函数模型对二者进行拟合,得到γ1、γ2;然后对所述γ1、γ2求取相应的协方差函数c1、c2,求取公式为:

26、γ(h)=c(0)-c(h)

27、其中,h表示距离。

28、s25,构建z1与z2的互相关函数c12,即

29、

30、s26,将所述的c1、c2和c12带入s23求得s22中的加权系数;

31、s27,基于s22对主变量z1实现插值;

32、s28,基于插值后的(用y′表示)及对应位置u建立点对(x(u),y(u)),其中x(u)=[x1(u),x2(u),…,xn(u)]ty(u)∈y′,得到原始学习样本m=min(k1,k2,…,kn)为样本个数。

33、进一步,s3中基于序贯高斯模拟的样本权重求取及基于空间信息约束的损失函数的构建具体包括以下步骤:

34、s31,对空间进行网格划分,并定义一条仅且只有一次经过所有未采样位置的随机路径;

35、s32,按照随机路径在网格上顺序地随机游走,并沿随机路径对每个访问点重复以下步骤:

36、(1)在每个当前访问点uo上,用已知点上的参数值x(ui),i=1,2,…,k和y(uo)计算该点的协克里金值其中k表示当前已知样本点的个数;

37、(2)将上述所得赋值到所在位置;

38、(3)将所有采样数据和模拟值进行正态反变换;

39、s33,重新确定一条随机路径重复以上步骤,直到各点的实现均值与s22中所得的zcok间的差异在可接受范围内;

40、s34,基于各网格点上的多次实现计算方差σ(u),并将其带入标准正态分布公式,求得空间各点的概率密度函数为:

41、

42、以此作为s22中插值所得的的权重ω(u),即

43、

44、s35,建立包含空间信息的损失函数:

45、

46、其中θ表示模型参数,y和分别表示真实值(包括采样点值和插值)和预测值,hθ表示深度全连接神经网络模型。

47、进一步,s4中损失函数的优化及基于深度全连接神经网络的数据驱动预测具体包括以下步骤:

48、s41,将部分采样点处的样本保留构成测试集,剩余的样本构成训练集用于训练深度全连接神经网络;

49、s42,采用批量随机梯度下降算法优化所述损失函数,对深度全连接神经网络的参数进行更新;

50、s43,将训练好后的网络模型用于测试集的预测。

51、本发明的另一目的在于提供一种基于空间信息约束的数据驱动预测方法的基于空间信息约束的数据驱动预测系统,该系统包括:

52、数据获取模块,用于针对研究对象的具体预测目标y,获得多种采集方式不同的观测数据;

53、数据预处理模块,与数据获取模块连接,用于对观测数据进行中值填充的异常值处理;若各观测数据间的量纲相差很大,则对其进一步做归一化处理;若各观测数据的采样网布设差异很大,则在异常值处理及归一化处理之间对所述各观测数据进行简单的插值处理或克里金插值;

54、预测目标插值模块,与数据预处理模块连接,用于基于同位协同克里金实现预测目标插值;

55、样本权重求取模块,与预测目标插值模块连接,用于基于序贯高斯模拟进行样本权重求取;

56、损失函数构建模块,与样本权重求取模块连接,用于基于空间信息约束构建损失函数;

57、损失函数优化模块,与损失函数构建模块连接,用于使用批量随机梯度下降算法优化损失函数;

58、数据驱动预测模块,与损失函数优化模块连接,用于基于深度全连接神经网络进行数据驱动预测。

59、一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行基于空间信息约束的数据驱动预测方法的步骤。

60、一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行基于空间信息约束的数据驱动预测方法的步骤。

61、一种信息数据处理终端,信息数据处理终端用于实现基于空间信息约束的数据驱动预测系统。

62、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:

63、第一,本发明提出一种基于空间信息约束的数据驱动预测方法。该方法利用同位协同克里金对预测目标进行插值,以此获得大量符合空间大尺度分布规律的伪标签,为基于深度学习的数据驱动类预测方法提供充足的数据保障。然后,采用多次序贯高斯随机模拟求取各伪标签所在位置处取值的正态分布,并基于该分布求取各伪标签的权重。最后,将该权重作为衡量各标签可信度的值加入深度全连接神经网络的损失函数中,使网络的学习过程受空间信息约束,以此引导其向更合理的假设收敛。

64、第二,本发明借助空间上分布相对稠密的相关特征实现预测目标的插值,达到了在空间信息的约束下对学习样本进行扩容的目的,给深度学习技术提供了数据保障。

65、本发明以样本权重的形式将空间信息加入到深度全连接神经网络的损失函数中,其功能好比正则项能,能约束网络的学习过程往更合理的假设收敛,从而提高模型的适用性及预测精度。

66、第三,本发明的技术方案采用地质统计方法对小样本数据实现扩容,给深度学习方法带来数据保障,同时用所得的空间信息来约束深度全连接神经的学习过程,在提高数据利用率的同时对智能方法的学习过程进行了合理约束,有助于保障预测解的合理性。

67、本发明的技术方案使得以深度学习为代表的数据驱动方法在小样本数据上亦具备适用性,使得基于小样本实现有效的智能预测成为,使得专业研究领域的智能化实现不再受小样本制约,从而推动专业领域的智能化进程。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1