一种地球化学数据异常信息的提取方法及系统与流程

文档序号:12034687阅读:284来源:国知局
一种地球化学数据异常信息的提取方法及系统与流程

本发明涉及地球化学领域,特别涉及一种地球化学数据异常信息的提取方法及系统。



背景技术:

现有的地球化学异常识别方法,需要事先要求地球化学数据满足假定的分布形式,还需要设定固定阈值,在区分背景与异常的过程中并不能充分考虑元素组合的内在相关性、数据的空间结构性以及区域分布上的周期性特征,并不能准确提取地球化学数据中的异常信息。



技术实现要素:

本发明提供了一种地球化学数据异常信息的提取方法及系统,解决了现有技术不能准确提取地球化学数据中的异常信息的技术问题。

本发明解决上述技术问题的技术方案如下:一种地球化学数据异常信息的提取方法,包括:

s1、从地球化学数据集合中抽取多个样品数据,每个样品数据均具有相同的变量组,所述变量组包含多个变量,将所述变量组设置为原始矩阵;

s2、将所述原始矩阵构造成反映所述地球化学数据集合中数据的实际空间分布信息的典型变量组合,将所述多个样品数据的坐标构造成反映所述地球化学数据集合中数据的模拟空间分布信息的典型坐标组合;

s3、当所述典型变量组合与所述典型坐标组合满足第一预设条件时,计算得到所述典型变量组合的第一系数与所述典型坐标组合的第二系数;

s4、基于所述第一系数和所述第二系数,当所述典型变量组合与所述典型坐标组合满足第二预设条件时,计算得到第一常数向量与第二常数向量之间的关系式;

s5、基于所述第一系数、所述第二系数和所述第一常数向量与所述第二常数向量之间的关系式,当所述典型变量组合与所述典型坐标组合满足第三预设条件时,得到所述地球化学数据集合的组合异常信息。

优选地,步骤s1中,从地球化学数据集合中抽取n个样品数据,所述变量组包括m个变量,所述原始矩阵为x=(β1,β2,,βm),m和n均为正整数。

优选地,步骤s2中,将所述原始矩阵构造成典型变量组合u=a1β1+a2β2+…+amβm,设所述第一系数a=(a1,a2,…,am),则u=xa。

优选地,步骤s2中,设第i个样品数据的坐标(xi,yi),i=1,2,…,n,j=1,2,…,m,设n个样品数据的横坐标x=(x1,x2,…,xn)和纵坐标y=(y1,y2,…,yn),用n个样品数据的坐标的傅里叶有限项级数表达另一典型变量v:

将上式展开,得到将该公式中的各项表达成z1,z2,…,zp,n个样品数据的坐标调和多项式构成矩阵z=(z1,z2,…,zp),将典型变量v转化为典型坐标组合设所述第二系数b=(b1,b2,…,bp),则υ=zb;

其中,k为x方向上的调和阶数,l为y方向上的调和阶数,αkl为第k阶、l阶调和的余弦-余弦项系数,为bkl第k阶、l阶调和的正弦-余弦项系数,ckl为第k阶、l阶调和的余弦-正弦项系数,dkl为第k阶、l阶调和的正弦-正弦项系数,m为x方向上的最高调和阶数,n为y方向上的最高调和阶数,l为x方向上取样长度之半,h为y方向上取样长度之半,p为正整数。

优选地,步骤s3中,当u与υ满足所述第一预设条件:u与υ的相关系数取最大值时,计算得到所述第一系数a与所述第二系数b之间的关系式,当该关系式满足第四预设条件时,计算得到所述第一系数a与所述第二系数b。

优选地,步骤s4中,将所述第一系数a和所述第二系数b代入q=||u-(c+dυ)||2,当q取最小值时,计算得到所述第一常数向量c与所述第二常数向量d的关系式c+dυ。

优选地,步骤s5中,将所述第一系数a、所述第二系数b和所述关系式c+dυ代入r=u-(c+dυ),得到所述组合异常信息r。

一种地球化学数据异常信息的提取系统,包括:

定义模块,用于从地球化学数据集合中抽取多个样品数据,每个样品数据均具有相同的变量组,所述变量组包含多个变量,将所述变量组设置为原始矩阵;

构造模块,用于将所述原始矩阵构造成反映所述地球化学数据集合中数据的实际空间分布信息的典型变量组合,将所述多个样品数据的坐标构造成反映所述地球化学数据集合中数据的模拟空间分布信息的典型坐标组合;

第一计算模块,用于当所述典型变量组合与所述典型坐标组合满足第一预设条件时,计算得到所述典型变量组合的第一系数与所述典型坐标组合的第二系数;

第二计算模块,用于基于所述第一系数和所述第二系数,当所述典型变量组合与所述典型坐标组合满足第二预设条件时,计算得到第一常数向量和第二常数向量;

综合模块,用于基于所述第一系数、所述第二系数、所述第一常数向量和所述第二常数向量,当所述典型变量组合与所述典型坐标组合满足第三预设条件时,得到所述地球化学数据集合的组合异常信息。

附图说明

图1为本发明实施例提供的一种地球化学数据异常信息的提取方法的流程示意图;

图2为本发明另一实施例提供的一种地球化学数据异常信息的提取系统的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

如图1所示,一种地球化学数据异常信息的提取方法,包括:

s1、从地球化学数据集合中抽取多个样品数据,每个样品数据均具有相同的变量组,变量组包含多个变量,将变量组设置为原始矩阵;

s2、将原始矩阵构造成反映地球化学数据集合中数据的实际空间分布信息的典型变量组合,将多个样品数据的坐标构造成反映地球化学数据集合中数据的模拟空间分布信息的典型坐标组合;

s3、当典型变量组合与典型坐标组合满足第一预设条件时,计算得到典型变量组合的第一系数与典型坐标组合的第二系数;

s4、基于第一系数和第二系数,当典型变量组合与典型坐标组合满足第二预设条件时,计算得到第一常数向量与第二常数向量之间的关系式;

s5、基于第一系数、第二系数和第一常数向量与第二常数向量之间的关系式,当典型变量组合与典型坐标组合满足第三预设条件时,得到地球化学数据集合的组合异常信息。

典型变量分析(canonicalvariateanalysis,cva),用来研究两组或两组以上的样本内的相互关系。

应理解,地质现象与过程均具有周期性的特征,因为所形成的各种地质痕迹均携带有这种特征,诸如地层、裙皱、构造断裂、矿带、矿床或矿体、元素分布以及海浪、地球的磁场变化等均表现出周期性重复现象,地质演替过程符合螺旋递进法则。调和分析是研究这类现象的一种方法。每一种地质因子都具有其固有频率,多种地质因子振幅的调和叠加,即可以综合成各种比较复杂的波形。事实上,当调和的数目无限增大时就可以综合成非常广泛的—类周期函数,并且当调和的项数和观测点数足够多时,可以任意地趋近实际曲线或实际曲面,如同用足够高次的多项式按照任意的精确度来拟合实际曲线或实际曲面。反之,一类周期函数可以分解成若干个调和因子。调和分析实质上就是综合、分析周期性现象的一种方法,对于研究周期性现象特别有效。对于沉积岩与变质岩建造等具有多旋回性或周期性分布的地质复合体而言,因其分布范围较广,涵盖地质内容较多,空间趋势面模型一般以调和趋势分析为主,即表达成三角级数多项式模型。

该方法不同于现有应用的地球化学异常识别方法,并不事先要求地球化学数据满足假定的分布形式,也无需设定固定阈值,而是将地球化学背景看成一个连续起伏变化的自然空间曲面,意即每一样品数据的地球化学背景值和异常阈值均为变化值,在区分背景与异常的过程中充分考虑元素组合的内在相关性、数据的空间结构性以及区域分布上的周期性特征,由于这种方法的构造基础是以非线性表达的,属于非线性建模中的一种。大区域大样本地球化学元素的组合信息较强于单元素提供的地球信息;地球化学异常识别方法不应以固定值来考虑地球化学背景,而应考虑为随区域变化而确定为变化值,这样才能保证在一个研究区内可以同时考虑高背景的异常和低背景下有意义的弱小异常,即异常阈值也应考虑成变值。非线性多元调和因子方法综合考虑了元素组合内在相关性,数据的空间结构性及分布的周期性,较贴近于客观实际,线性多元调和因子分析方法用于从区域变化的地球化学背景中识别地球化学异常。

具体地,步骤s1中,从地球化学数据集合中抽取n个样品数据,变量组包括m个变量,原始矩阵为x=(β1,β2,,βm),m和n均为正整数。

具体地,步骤s2中,将原始矩阵构造成典型变量组合u=a1β1+a2β2+…+amβm,设第一系数a=(a1,a2,…,am),则u=xa。

具体地,步骤s2中,设第i个样品数据的坐标(xi,yi),i=1,2,…,n,j=1,2,…,m,设n个样品数据的横坐标x=(x1,x2,…,xn)和纵坐标y=(y1,y2,…,yn),将n个样品数据的坐标的傅里叶有限项级数表达另一典型坐标组合v:

将上式展开,得到将该公式中的各项表达成z1,z2,…,zp,n个样品数据的坐标调和多项式构成矩阵z=(z1,z2,…,zp),将典型变量v转化为典型坐标组合设第二系数b=(b1,b2,…,bp),则υ=zb;

其中,k为x方向上的调和阶数,l为y方向上的调和阶数,αkl为第k阶、l阶调和的余弦-余弦项系数,为bkl第k阶、l阶调和的正弦-余弦项系数,ckl为第k阶、l阶调和的余弦-正弦项系数,dkl为第k阶、l阶调和的正弦-正弦项系数,m为x方向上的最高调和阶数,n为y方向上的最高调和阶数,l为x方向上取样长度之半,h为y方向上取样长度之半,p为正整数。

应理解,构造典型坐标组合,能更好的体现观测数据所具有的周期性特征。对于不同地质背景下的地球化学空间分布状态,更利于进行地球化学信息的识别。

具体地,步骤s3中,当u与υ满足第一预设条件:u与υ的相关系数取最大值时,计算得到第一系数a与第二系数b之间的关系式,当该关系式满足第四预设条件时,计算得到第一系数a与第二系数b。

应理解,相关系数是用以反映变量之间相关关系密切程度的统计指标。构造地球化学数据变量与坐标之间相关关系,充分体现数据的空间结构性。

具体地,步骤s4中,将第一系数a和第二系数b代入q=||u-(c+dυ)||2,当q取最小值时,计算得到第一常数向量c与第二常数向量d的关系式c+dυ。

具体地,步骤s5中,将第一系数a、第二系数b和关系式c+dυ代入r=u-(c+dυ),得到组合异常信息r。

在实施例中,设在研究区内共抽取n个样品,对每个样品均考察m个变量指标,构成原始矩阵x=(βij)n×m=(β1,β2,…,βm),第i样品坐标为(xi,yi),i=1,2,…,n。

将m个变量构造成典型变量组合:

u=a1β1+a2β2+…+amβm(1)

可令a=(a1,a2,…,am),则u=xa。

(1)式用来代表主矿化因子,再用坐标(x,y)的傅里叶有限项级数表达另一典型变量υ:

(2)式中,υ为关于坐标调和趋势的典型组合;k为x方向上的调和阶数;l为y方向上的调和阶数;αkl为第k阶、l阶调和的余弦-余弦项系数;bkl为第k阶、l阶调和的正弦-余弦项系数;ckl为第k阶、l阶调和的余弦-正弦项系数;dkl为第k阶、l阶调和的正弦-正弦项系数;m为x方向上的最高调和阶数;n为y方向上的最高调和阶数;l为x方向上取样长度之半,h为y方向上取样长度之半。其中,设:

k=l=0;k=0,l>0,或k>0,l=0;λkl=1,k>0,l>0.

为方便起见,我们将(2)式υ中各项表达成z1,z2,…,zp。全部坐标(xi,yi)调和多项式构成矩阵z=(z1,z2,…,zp),则作典型坐标组合

可令b=(b1,b2,…,bm),则υ=zb。

现考察u与υ之间满足最大相关条件,即

依(4)式求取两典型组合的典型系数,为此作增广阵:

d=[x,z]n×p(5)

其中,x=(βij)n×m,z=(zij)n×p,两者均是标准化后数据。

依(5)式,则d的协方差阵是:

要求则ρ(u,υ)最大相关转化为如下拉格朗日条件极值问题,即对如下目标函数求导并令其为0.

业已证明,上述典型变量的典型系数a与b可通过求取如下矩阵的特征值与特征向量来完成。具体为:令

则(8)式中u与υ中的典型系数满足如下关系:

根据问题的需要,a与b的选择有一维与多维之分,不妨确定为r维,做法是在全部特征值λ序列中选前r个特征值之算术根:

λ1≥λ2≥…≥λr>0(10)

根据(8)(9)式,可得u1,u2,…,ur,及υ1,υ2,…,υm,对于其中uk,若

akj=max[akl]1≤l≤m(11)

将uk作为以元素xj为主的矿化因子。依具体的实际需要,这一步可适当的应用正规方差极大旋转处理。

考虑异常信息识别过程,由于υk是n维向量(υ'k1,υ'k2,…,υ'kn)作变换:

w=c+dυ(12)

(12)式中c、d为常数向量,则在

q=||u-w||2→min(13)

在(13)式条件下可求得c、d。

主矿化因子可表为:

u=f(x,y)+r=(c+dυ)+r(14)

其中,r即为组合异常。

对每个uk重复上述计算,可作k个剩余系列,k即是矿化因子的个数,重复上述过程可获取实际需要的若干主矿化因子异常信息。

应理解,由于地球化学行为过程是随地理气候及地貌特征变化而变化的,则元素空间分布必然呈现周期性特征;因此,元素地球化学背景在区域上呈现起伏振荡形态,这意味着不应以固定值来考虑地球化学背景的确定,而应考虑为随区域变化而确定为变化值,这样才能保证在一个研究区内可以同时考虑高背景的异常和低背景下有意义的弱小异常,即异常阈值也应考虑成变值。将地球化学背景看成一个连续起伏变化的自然空间曲面,即每一样品数据的地球化学背景值和异常阈值均为变化值,充分体现数据区域分布上的周期性特征。u代表区域地球化学样品所反映出的实际空间分布情况,v代表的是区域上模拟的分布趋势情况,是一种波动的趋势。u与v之间的差异就是剩余的异常信息,即实际区域属性信息去除波动趋势信息后的差异信息。

如图2所示,一种地球化学数据异常信息的提取系统,包括:

定义模块1,用于从地球化学数据集合中抽取多个样品数据,每个样品数据均具有相同的变量组,变量组包含多个变量,将变量组设置为原始矩阵;

构造模块2,用于将原始矩阵构造成反映地球化学数据集合中数据的实际空间分布信息的典型变量组合,将多个样品数据的坐标构造成反映地球化学数据集合中数据的模拟空间分布信息的典型坐标组合;

第一计算模块3,用于当典型变量组合与典型坐标组合满足第一预设条件时,计算得到典型变量组合的第一系数与典型坐标组合的第二系数;

第二计算模块4,用于基于第一系数和第二系数,当典型变量组合与典型坐标组合满足第二预设条件时,计算得到第一常数向量和第二常数向量;

综合模块5,用于基于第一系数、第二系数、第一常数向量和第二常数向量,当典型变量组合与典型坐标组合满足第三预设条件时,得到地球化学数据集合的组合异常信息。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1