一种地震数据的地震道集并行抽取方法

文档序号:8256047阅读:755来源:国知局
一种地震数据的地震道集并行抽取方法
【技术领域】
[0001] 本发明涉及一种地球勘探中海量地震数据存储技术和设备,尤其涉及一种地震数 据的地震道集并行抽取方法。
【背景技术】
[0002] 随着地震勘探技术的不断进步和多道多分量地震勘探采集技术的应用,使得地震 勘探的数据量巨大,这给地震数据的存储和处理带来了一定的困难。在地震数据存储过程 中,地震数据一般以地震道为单位记录组成一种特殊的文件格式(如SEG-Y、SEG-D文件格 式等),其存储的地震数据信息结构如图1所示,它是由文件卷头信息和地震道信息组成, 其中地震道信息包括地震道头信息和地震道数据两部分。根据卷头和道头信息可从地震数 据文件中获取多种地震道集,地震道集是地震数据中具有某一共同属性的地震道的集合, 它是地震数据处理中的基本模块,比如常用的地震道集有共炮点道集(CSG)、共接收点道集 (CRG)、共中心点道集(CMP)和共偏移距道集(COG)。通常地震数据文件根据某一种地震道 集按顺序方式记录,故该地震道集中的地震道在地震数据文件中是连续的(简称为连续式 地震道集),此时其它几种地震道集中的地震道就无法保持连续,在地震数据文件中呈离散 分布(简称为非连续式地震道集)。根据地震道的不同属性,从图1中的M个地震道获取不 同的地震道集组合,称为道集抽取。
[0003] 当地震数据存储介质为磁盘时,在抽取非连续式地震道集过程中,由于待抽取的 地震道位置不连续,故磁盘读取完一个地震道数据后,磁头需要机械移动到下一个地震道 数据的位置,才能重新开始读数据操作,即磁盘的访问过程属于随机访问。访问数据时,磁 盘的响应时间由磁头的寻道时间、旋转延时时间和传送时间三部分组成。目前市场上主流 磁盘的寻道时间典型值是4. 6ms,旋转延时则取决于磁盘的转速:普通7200RPM硬盘的转动 延迟是4. 2ms,而高端10000RPM的是3ms。传送时间包括内部数据传送时间和外部数据传送 时间,其中内部数据传送时间是指当磁盘存储器的寻址工作完成之后,磁头至硬盘缓存之 间的数据时间;外部数据传送时间为电脑通过数据总线从磁盘内部缓存区中所读取数据的 时间。目前主流磁盘的内部数据传送速率在70?90MB/S,而外部数据传输速率在100MB/ s以上。对于地震道而言,一般单个地震道数据量都不大,约为30KB,其传送时间为0. 3? 0.4ms。因此,磁盘在小数据读写过程中,寻道时间和旋转延时远大于传送时间。可见大量 的随机小数据访问,致使机械磁盘的性能大大下降,成为抽取非连续式地震道集的I/O瓶 颈。
[0004] 在实际地震数据处理方面,地震数据处理动辄需要处理数以TB的海量数据,在对 地震数据进行数理方法如静校正、叠加、DM0、滤波等处理时,处理过程中需要反复抽取不同 的地震道集数据。故地震数据处理具有处理的数据量大、处理过程多和反复处理等特征,这 些特征带来了巨大的磁盘I/O访问量问题,因此,存储设备的I/O性能成为海量地震数据处 理时间的一个关键因素。
[0005] 综上分析,从地震数据存储和处理的特征反映了地震勘探数据处理系统中将面临 的一个关键问题:磁盘I/O所花费的时间占总处理的时间比例越来越大。在地震勘探数据 处理系统中,提供一种专门快速地实现地震数据的存储系统显得尤为重要。磁盘阵列技术 由于其自身所具有的诸多优点正在得到越来越广泛的应用,它是由多块磁盘构成的一种超 大容量存储系统,已成为地震数据存储中常用的存储设备。但目前基于磁盘阵列设计的地 震数据存储系统无法克服随机小数据访问I/O效率低的问题。
[0006] 常规的基于磁盘阵列抽取地震道集的流程如图2所示,地震数据处理软件将地震 道集请求根据索引转换成一系列的读地震道的读请求,即标准的seek和read函数调用。当 操作系统接收到这些函数调用后,会将其发送给磁盘阵列控制器,控制器再根据具体情况 指挥相应的磁盘进行地震道数据的读取操作。地震数据处理软件在接收到地震道数据后, 将发送执行下一个地震道数据读取过程。最后循环直至所有的地震道都正确执行完后,地 震数据处理软件可获得地震道集数据。从常规的地震道集抽取流程可以看出,因为read函 数一般为阻塞调用,所以只有在当前地震道数据访问结束后,才能发起下一地震道指令数 据读取,即是以串行方式来读取地震道集中的各个地震道数据。
[0007] 根据上述流程,分析抽取连续式地震道集的性能:在磁盘上读取一块数据所需要 的时间Tt(rtal可描述为
[0008] Ttotal=tseek+tdelay+ts (1)
[0009] 式中,tSMk为寻道时间,tdday为旋转延时,ts为传送时间。
[0010] 在抽取顺序地震道集时,由于目标数据是连续的,所以文件系统的预读技术及多 I/O合并技术会使得tseek= 0且tdelay= 0,则式(1)可简化为
[0011]
【主权项】
1. 一种地震数据的地震道集并行抽取方法,其特征在于包括以下步骤: 步骤一,将地震数据文件按地震道数据使用均匀化存储技术写入磁盘中; 步骤二,客户端中的地震数据处理软件发出读地震道集请求指令后,地震道集指令以 广播方式发送到各个数据节点上; 步骤三,数据节点对接收到的地震道集指令进行解析,转换为相应的读地震道请求队 列,再根据队列读取本地磁盘中的地震道数据,最后将读出的地震道数据返回给客户端; 步骤四,客户端接收数据节点阵列返回的地震道数据,并对地震道数据按道集的地震 道顺序进行排序,最后返回给地震数据处理软件。
2. 根据权利要求1所述的一种地震数据的地震道集并行抽取方法,其特征在于:所述 步骤一中将地震数据文件按地震道数据均匀化存储技术写入磁盘中的具体方法是:客户端 获取各数据节点信息,包括数据节点总数量N和每个数据节点IP地址;对数据节点进行初 始化,即在每个数据节点中建立相应的文件名或编号与之对应,为每一个数据道用伪随机 编码方式确定存储位置,便于在读取数据时进行查找;客户端向数据节点阵列发送命令表 示将要写入文件,数据节点收到命令后,开始准备接受数据包; 以地震道为单位读取地震数据文件,按照地震道数据均匀化存储技术将地震道数据分 别以网络包的方式发送给数据节点,数据节点接收网络包后将其写入相应的文件中; 当地震数据文件发送完成后,向数据节点发送写文件结束命令,写文件过程结束。
3. 根据权利要求1所述的一种地震数据的地震道集并行抽取方法,其特征在于:所述 数据节点根据解析生成的地震道队列,判断地震道是否存储在本地磁盘上,若存在,则读出 地震道数据,并返回至客户端;若不存在,则执行队列中的下一请求,如此循环直至队列结 束。
4. 根据权利要求1所述的一种地震数据的地震道集并行抽取方法,其特征在于:所述 步骤三中数据节点是通过MCU对接收到的地震道集指令进行解析后,根据索引文件将其转 换为相应的地震道请求队列,数据节点根据请求队列中的任务读取地震道数据,再将该数 据封装为一个网络命令包返回给客户端;所述步骤四中,客户端对地震道数据按道集的地 震道顺序排序,其顺列与请求队列的排序一致。
5. 根据权利要求1-4任意一项所述的一种地震数据的地震道集并行抽取方法,其特征 在于:所述地震数据文件的格式为SEG-Y格式,所述SEG-Y格式以CSG顺序方式记录保存地 震数据,以CRGXMP和COG非连续式地震道集抽取速度为测试对象,并与常规的RAIDO存储 系统进行对比分析;以每秒抽取地震道个数作为设备的性能测试指标。
【专利摘要】本发明涉及一种地震数据的地震道集并行抽取方法,包括以下步骤:将地震数据文件使用均匀化存储技术写入磁盘中;客户端发出读地震道集请求指令后,地震道集指令发送到各个数据节点上;数据节点对地震道集指令进行解析,转换为读地震道请求队列,再根据队列读取地磁盘中的地震道数据,最后地震道数据返回给客户端;客户端接收地震道数据,并对地震道数据按道集进行排序,最后返回给地震数据处理软件。发明解决了常规基于磁盘阵列系统由于串行抽取地震道集从而导致的效率低下的问题,大大提高了地震数据的I/O效率,且可扩展性强;让各个数据节点执行完非连续式地震道集指令的时间趋于一致,保证了存储系统能够达到理论上预期的抽取效率。
【IPC分类】G01V1-24
【公开号】CN104570063
【申请号】CN201510073212
【发明人】武杰, 张捷
【申请人】安徽吉拓电子技术有限公司
【公开日】2015年4月29日
【申请日】2015年2月11日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1