基于不确定性空间数据挖掘的区域成矿预测方法

文档序号:6459879阅读:181来源:国知局
专利名称:基于不确定性空间数据挖掘的区域成矿预测方法
技术领域
本发明涉及一种新的区域成矿预测方法,属于资源信息技术领域。
背景技术
区域成矿预测方法经历了从早期的矿床统计预测、中期的"地质异常"预测到最近 的"三联式"定量成矿预测和多重分形非线性成矿预测理论与方法。这些区域成矿预测理 论、技术和方法日趋成熟,在区域成矿预测中发挥了重要作用。但是,随着区域和全球性地 质空间数据的日益采集与获取,面对海量多源的地质空间数据,传统的区域成矿预测方法 很难快速有效地处理海量的地质空间数据。上世纪九十年代兴起的空间数据挖掘技术为海 量空间数据信息提取提供了很好的理论方法。申请人根据空间数据普遍存在的不确定性和 空间自相关性,提出了不确定性空间数据挖掘算法模型。同时,如何快速利用好已有的海量 多源地质空间数据,高效进行区域成矿定量预测,显得极具科学意义和经济价值。

发明内容
本发明目的在于针对现有区域成矿预测方法的不足,提出一种从海量多源地质空 间数据快速提取区域成矿信息,达到高效地进行区域成矿预测的方法。顾及地质空间数据 的不确定性和成矿信息提取的不确定性的基础上,提出基于不确定性空间数据挖掘算法模 型的区域成矿预测方法,并建立相应的评价指标来客观评价区域成矿预测结果。以下是本 发明的具体内容 1、多源多尺度地质空间数据预处理 按照四种不同尺度(区域成矿可行地段、区域成矿有利地段、区域成矿潜在地段、
区域成矿远景地段)成矿预测要求,按四种不同比例尺(i : 50万、1 : 20万、1 : 5万和 i : i万)进行多源地质空间数据的地质要素数字化和坐标投影转换(i : 50万、1 : 20
万和l : 5万采用6度带的高斯-克吕格北京1954平面坐标系,1 : l万采用3度带的高 斯_克吕格北京1954平面坐标系)。遥感数据的投影坐标转换利用同区域的地形图建立对 应控制点,采用多项式拟合方法进行坐标配准。
2、遥感矿化信息提取 根据区域内地物对象的复杂性,对不同地物进行不同的掩膜方法基础上,采用特 征主成分分析和阀值异常分割方法提取铁矿化信息和泥化信息,具体如下(以LandSAT ETM多光谱数据为例) (1)掩膜方法选择(以西北高寒山区为例),对于云和雪,采用TM1高值区(DN值 140 165)作为阀值;对于水体,采用TM7/TM1 (0. 3 0. 4)作为阀值;对于植被,采用TM4/ TM3(1. 05 1. 2)作为阀值;对于沙漠和水体,直接通过目视圈定感兴趣区进行掩膜。
(2)特征主成分分析方法具体如下选择TM1 、 TM3、 TM4和TM5作主成份分析获取 铁矿化信息,在获得的4个PC图像中,选择TM3和TM1特征向量载荷因子绝对值较大且符 号相反的PC图象作为铁矿化异常信息提取的图象;选择TM1、 TM4、 TM5和TM7作主成份分析获取泥化信息,在获得的4个PC图像中,TM5和TM7特征向量载荷因子绝对值较大且两 者符号相反PC图象作为泥化异常信息提取的图象。 (3)阀值异常分割方法具体如下首先对提取的矿化信息进行3X3或5X5的均 值滤波,以2.5 3.0倍标准离差o作为阀值,限定异常水平,对异常进行阀值分割。
3、基于不确定性空间数据挖掘算法模型的成矿预测 (1)根据不同地质空间数据的不确定性类型,采用Monte Carlo模拟法进行空间 数据不确定性模型 ①确定每个待输入空间数据集Di( )的不确定性类型(位置数据的圆形正态模 型,属性数据的一维正态模型); ②取用依空间数据集Di ( )分布的随机采样来代替原输入空间数据; ③对每一次实现,存储其结果Y( ); 随机抽取10000组以上实验数据作为样本数据。 (2)以EM (Expectation Maximization)算法为基础,考虑地质空间数据的空间自 相关性,建立空间自相关矩阵的基础上,采用邻域EM算法对地质空间属性数据进行模糊离 散化,具体如下 ①空间自相关矩阵建立借用Voronoi和Delaunay图,结合距离标准来构建空间 权重矩阵。考虑到空间数据的不确定性,采用三种方法计算空间数据间空间自相关矩阵中 心法、最小法和最大法。假设区域s中有n个位置不确定的点,第i个点Pi的误差带用一 个圆形Qi表示。具体算法如下 输入区域s中的一组点的误差带Q = &, Q2, ...Qn}和邻域距离d 输出区域S中一组点的邻域图和空间自相关距阵 步骤1 :构造点集P的Voronoi多边形 步骤2 :对所有相邻的Voronoi多边形进行如下运算步骤2. 1 :计算cUter(Ci, C》、《 & , Q》、计算& , Q》 步骤2. 2 :如果d <《,则在邻域图中连接Pi和Pj, 为1 ;否则Wij为0其中,d 为邻域距离;cU^(Ci, Cj)表示相邻误差带(Qi, Qj)质心之间的距离;cU(Qi, Qj)表示相邻 误差带(Qi,Qj)内空间数据之间的最大距离;cLn(Qi,Qj)表示相邻误差带(Qi,Qj)内空间数 据之间的最小距离。 ②基于邻域EM算法的地质空间属性数据进行模糊离散化,其算法如下 根据地质空间数据的地理坐标和不确定性模型,按照①算法可建立离散空间数据
的的空间邻近关系矩阵V:<formula>formula see original document page 4</formula>
为了考虑空间数据的空间自相关性,改进函数
<formula>formula see original document page 4</formula> 引入新的项<formula>formula see original document page 4</formula>



然后,建立新的标准函数为U(c, e) =D(c, e) + p *G(C)(|3 >0)
其中,e是控制空间数据集的空间同质性的参数。
则,E-步骤
其最优化必要条件为如下形式
5q = log( " I ) +1 — log c汰+ A, +化;f w
最后得到如下方程
M步l

argmaxZ)(cw+1,0)
6> 6>
(3)成矿关联信息挖掘及不确定性评价 ①顾及不确定性的成矿关联规则挖掘地质空间数据不确定性MonteCarlo模拟 —空间自相关矩阵构建一连续型数据UNEM方法离散化一Apriori空间关联规则提取 [OO43]②成矿关联规则的不确定性评价,采用支持度(su卯ort)、可信度(confidence) 和兴趣度(interesting)三个评价指标进行成矿预测信息的不确定性评价


图1 :青海东昆仑地区成矿关联规则挖掘结果的不确定性评价指标(支持度)图
图2 :青海东昆仑地区成矿关联规则挖掘结果的不确定性评价指标(可信度)图
图3 :青海东昆仑地区成矿关联规则挖掘结果的不确定性评价指标(兴趣度)图
具体实施例方式
为了更好地理解本发明的技术方案,以下以中国西部重要金属成矿带-青海东昆 仑为例,提供具体实施例。 首先,数字化多源地质空间数据,包括地质矿产数据、地球化学数据和矿床数据; 然后提取遥感矿化信息(该说明以LandSAT ETM数据为例);最后采用该发明中的不确定 性空间数据挖掘算法提取成矿关联规则信息指导成矿预测,以下结果为青海东昆仑成矿带 铁矿床的成矿关联规则挖掘结果(如下表1)。 表1青海东昆仑成矿带铁矿床的成矿关联规则挖掘结果及不确定性评价
5编号关联规则
支持度 可信度
兴趣度
1 北西向断裂A矽卡岩化A遥感矿化异常 代-热液型铁矿床
2 北西向断裂A碳酸盐化A遥感矿化异常 代-热液型铁矿床
3 近东西向断裂A矽卡岩化A遥感矿化异常 交代-热液型铁矿床
4 近东西向断裂A绿泥石化A遥感矿化异常 交代-热液型铁矿床
5 近东西向断裂A碳酸盐化A遥感矿化异常 交代-热液型铁矿床
6 近东西向断裂A硅化A遥感矿化异常一5 热液型铁矿床
7 北西向断裂A矽卡岩化-c
8 北西向断裂A碳酸盐化一:=
9 北西向断裂A遥感矿化异常 床
10 近东西向断裂A矽卡岩化-U 近东西向断裂A碳酸盐化-
12 近东西向断裂A硅化一>
13 矽卡岩化A遥感矿化异常-
14 绿泥石化A遥感矿化异常-
15 碳酸盐化A遥感矿化异常-
16 硅化A遥感矿化异常-->
17 北西向断裂一> 接触交代-热液型铁矿床
18 砂卡岩化一> 接触交代-热液型铁矿床
19 绿泥石化一> 接触交代-热液型铁矿床 19 碳酸盐化--> 接触交代-热液型铁矿床
-> 接触交0.17310l細OO0.992736
> 接触交0.08000l細OO0.996772
—> 接触0.096181.000000.995964
-->接触0.096181.000000.995964
> 接触0,08000l細OO0.996772
接触交代-0.057691.000000,997579
接触交代-热液型铁矿床 接触交代-热液型铁矿床 -->接触交代-热液型铁矿
■->接触交代-热液型铁矿床 ->接触交代-热液型铁矿床 接触交代-热液型铁矿床 ->接触交代-热液型铁矿床 ->接触交代-热液型铁矿床 ->接触交代-热液型铁矿床 接触交代-热液型铁矿床
0.38466 0.11541
0.21156
0.13464 0.09618 0.09618 0.34620 0.13464 0.15387
0.48084 0.59623 0.23079 0.21156
0.95238 0.75000
l細OO 1.00000 l細OO 1.00000 0.77778 1.00000 1.00000 0.80645 0.96875
0.84615
0.936239 0.745157
0.78571 0.776836
0.99435 0.995964 0.995964 0.985472 0.772128 0.993543 0.996772 0.786274
0.94373 0.790315 0.837276
21 硅化一> 接触交代-热液型铁矿床
0.13464
0.77778 0.772128
权利要求
基于不确定性空间数据挖掘的区域成矿预测方法,其特征在于充分利用多源海量地质空间数据(基础地质矿产数据、遥感找矿数据、地球化学数据、矿山地质数据、矿床数据),同时顾及地质空间数据的不确定性和成矿信息提取的不确定性,采用申请人建立的不确定性空间数据挖掘算法模型,快速高效地进行区域成矿预测,包括三个主要步骤多源多尺度地质空间数据的标准化处理;遥感矿化信息提取;基于不确定性空间数据挖掘算法模型的成矿预测。
2. 权利要求1所述的多源多尺度地质空间数据的标准化,其特征在于按照不同尺度成 矿预测要求,按不同比例尺进行多源地质空间数据的预处理和几何配准,包括l : 50万、i : 20万、1 : 5万和i : i万四种不同的数据比例尺要求,进行地质要素数字化、投影坐 标转换。
3. 权利要求1所述的遥感矿化信息提取,其特征在于根据区域内地物对象的复杂性,对不同地物(云、雪、水体、植被、沙漠等)进行不同的掩膜方法基础上,采用特征主成分分析和阀值异常分割方法提取铁矿化信息和泥化信息,具体如下(以LandSat ETM多光谱数 据为例)(a) 掩膜方法选择(以西北高寒山区为例),对于云和雪,采用TM1高值区(DN值 140 165)作为阀值;对于水体,采用TM7/TM1 (0. 3 0. 4)作为阀值;对于植被,采用TM4/ TM3(1. 05 1. 2)作为阀值;对于沙漠和水体,直接通过目视圈定感兴趣区进行掩膜;(b) 特征主成分分析方法具体如下选择TM1、 TM3、 TM4和TM5作主成份分析获取铁矿 化信息;选择TM1、 TM4、 TM5和TM7作主成份分析获取泥化信息;(c) 阀值异常分割方法具体如下首先对提取的矿化信息进行均值滤波,以2. 5 3. 0 倍标准离差o作为阀值,限定异常水平,对异常进行阀值分割。
4. 权利要求1所述的基于不确定性空间数据挖掘算法模型的成矿预测,具体如下(a) 根据不同地质空间数据的不确定性类型,采用Monte Carlo模拟法进行空间数据 不确定性模型;(b) 顾及地质空间数据的空间自相关性,建立空间自相关矩阵的基础上,采用邻域EM 算法对地质空间属性数据进行模糊离散化;(c) 对多源海量地质空间数据进行成矿关联信息挖掘,并采支持度(support)、可信度 (confidence)和兴趣度(interesting)三个评价指标进行成矿预测信息的不确定性评价。
全文摘要
一种基于不确定性空间数据挖掘的区域成矿预测方法,属于资源信息处理与应用技术领域。本发明充分利用多源海量地质空间数据(基础地质矿产数据、遥感找矿数据、地球化学数据、矿山地质数据、矿床数据),基于不确定性空间数据挖掘算法模型,高效提取区域成矿关联信息,达到快速高效地进行区域成矿预测的目的。该发明包括三个主要步骤多源多尺度地质空间数据的几何配准;遥感矿化信息提取;基于不确定性空间数据挖掘算法模型的成矿预测。本发明能够更加高效、客观地评价区域成矿远景区。
文档编号G06F17/30GK101739396SQ200810046559
公开日2010年6月16日 申请日期2008年11月14日 优先权日2008年11月14日
发明者何彬彬, 陈翠华 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1