数据并行读取方法及装置的制造方法_4

文档序号:9667444阅读:来源:国知局
08] 存储介质名称查找子模块,用于查找不同的文件编号各自对应的存储介质名称。
[0109] 可选地,待读取数据表以数据块的方式存储在存储介质中;相应地,如图5所示, 第一读取分时长确定模块403可以具体包括:数据块数量确定子模块501、数据块读取速率 确定子模块502及分时长确定子模块503 ;其中:
[0110] 数据块数量确定子模块501,用于若确定出的存储介质为多个,确定待读取数据表 分别存储在每个存储介质中的数据块数量;
[0111] 数据块读取速率确定子模块502,用于确定每个存储介质的数据块读取速率;
[0112] 分时长确定子模块503,用于针对每个存储介质,依据各自的数据块数量及数据块 读取速率,计算自身存储的数据块被读取所需的分时长。
[0113] 更具体地,数据块读取速率确定子模块502可以包括:数据块读取速率确定单元; 其中:
[0114] 数据块读取速率确定单元,用于分别在每个存储介质中读取一个数据块,并将读 取一个数据块的时长分别确定为对应存储介质的数据块读取速率。
[0115] 参见图6,其示出了本申请提供的数据并行读取装置实施例2的结构。如图6所 示,本实施例可以在图1所示的结构基础上,还可以包括:第二读取分时长确定模块406、第 二时长平均分配模块407及第二触发读取设备读取模块408 ;其中:
[0116] 第二读取分时长确定模块406,用于若确定出的存储介质为一个,则确定从存储介 质中读取待读取数据表所需的时长;
[0117] 第二时长平均分配模块407,用于将时长平均分配至多个读取设备;
[0118] 第二触发读取设备读取模块408,用于触发多个读取设备依据各自分配到的平均 时长从存储介质中并行读取待读取数据表。
[0119] 当然,本实施例中其他模块可以参见上文图4所示,此处并不赘述。
[0120] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0121] 还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个 实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间 存在任何这种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体意在 涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些 要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设 备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排 除在包括上述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0122] 对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。 对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的 一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请 将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一 致的最宽的范围。
【主权项】
1. 一种数据并行读取方法,其特征在于,包括: 响应于数据表读取指令,确定待读取数据表及多台读取设备;其中,所述读取设备用于 并行读取存储在存储介质中的所述待读取数据表; 确定存储所述待读取数据表的存储介质; 若确定出的所述存储介质为多个,贝分别确定从每个所述存储介质中读取部分所述待 读取数据表所需的分时长; 将多个所述分时长的总和平均分配至所述多台读取设备; 触发所述多台读取设备依据平均时长从所述多个存储介质中并行读取所述待读取数 据表。2. 根据权利要求1所述的数据并行读取方法,其特征在于,所述确定存储所述待读取 数据表的存储介质,包括: 从测试数据表中,获取所述待读取数据表中每条记录的特征数据;其中,每条记录的特 征数据均包括各自的文件编号,不同的文件编号对应不同的存储介质; 查找不同的所述文件编号各自对应的存储介质名称。3. 根据权利要求1所述的数据并行读取方法,其特征在于,所述待读取数据表以数据 块的方式存储在所述存储介质中; 相应地,所述若确定出的所述存储介质为多个,贝ij分别确定从每个所述存储介质中读 取部分所述待读取数据表所需的分时长,包括: 若确定出的所述存储介质为多个,确定所述待读取数据表分别存储在每个所述存储介 质中的数据块数量; 确定每个所述存储介质的数据块读取速率; 针对每个所述存储介质,依据各自的数据块数量及数据块读取速率,计算自身存储的 所述数据块被读取所需的分时长。4. 根据权利要求3所述的数据并行读取方法,其特征在于,所述确定每个所述存储介 质的数据块读取速率,包括: 分别在每个所述存储介质中读取一个数据块,并将读取所述一个数据块的时长分别确 定为对应存储介质的数据块读取速率。5. 根据权利要求1-4任意一项所述的数据并行读取方法,其特征在于,还包括: 若确定出的所述存储介质为一个,则确定从所述存储介质中读取所述待读取数据表所 需的时长; 将所述时长平均分配至所述多个读取设备; 触发所述多个读取设备依据各自分配到的平均时长从所述存储介质中并行读取所述 待读取数据表。6. -种数据并行读取装置,其特征在于,包括: 数据表及读取设备确定模块,用于响应于数据表读取指令,确定待读取数据表及多台 读取设备;其中,所述读取设备用于并行读取存储在存储介质中的所述待读取数据表; 存储介质确定模块,用于确定存储所述待读取数据表的存储介质; 第一读取分时长确定模块,用于若确定出的所述存储介质为多个,则分别确定从每个 所述存储介质中读取部分所述待读取数据表所需的分时长; 第一时长平均分配模块,用于将多个所述分时长的总和平均分配至所述多台读取设 备; 第一触发读取设备读取模块,用于触发所述多台读取设备依据平均时长从所述多个存 储介质中并行读取所述待读取数据表。7. 根据权利要求6所述的数据并行读取装置,其特征在于,所述存储介质确定模块包 括: 记录特征数据获取子模块,用于从测试数据表中,获取所述待读取数据表中每条记录 的特征数据;其中,每条记录的特征数据均包括各自的文件编号,不同的文件编号对应不同 的存储介质; 存储介质名称查找子模块,用于查找不同的所述文件编号各自对应的存储介质名称。8. 根据权利要求6所述的数据并行读取装置,其特征在于,所述待读取数据表以数据 块的方式存储在所述存储介质中; 相应地,所述第一读取分时长确定模块包括: 数据块数量确定子模块,用于若确定出的所述存储介质为多个,确定所述待读取数据 表分别存储在每个所述存储介质中的数据块数量; 数据块读取速率确定子模块,用于确定每个所述存储介质的数据块读取速率; 分时长确定子模块,用于针对每个所述存储介质,依据各自的数据块数量及数据块读 取速率,计算自身存储的所述数据块被读取所需的分时长。9. 根据权利要求8所述的数据并行读取装置,其特征在于,所述数据块读取速率确定 子模块包括: 数据块读取速率确定单元,用于分别在每个所述存储介质中读取一个数据块,并将读 取所述一个数据块的时长分别确定为对应存储介质的数据块读取速率。10. 根据权利要求6-9任意一项所述的数据并行读取装置,其特征在于,还包括: 第二读取分时长确定模块,用于若确定出的所述存储介质为一个,则确定从所述存储 介质中读取所述待读取数据表所需的时长; 第二时长平均分配模块,用于将所述时长平均分配至所述多个读取设备; 第二触发读取设备读取模块,用于触发所述多个读取设备依据各自分配到的平均时长 从所述存储介质中并行读取所述待读取数据表。
【专利摘要】本申请提供了一种数据并行读取方法实施例,本实施例在确定出待读取的数据表及用于读取数据表的读取设备后,进一步查找出该数据表存储在哪个(些)存储介质上,若存储介质为多个,再确定从每个存储介质中读取数据表需要的时长,进而将多个时长平均分配给以上多台读取设备,并触发该多台读取设备按照平均时长并行从存储介质中读取数据表。可见,与现有技术中以数据表中某列的编号为依据进行数据划分的方式不同,本实施例将从存储介质中读取数据表的时长作为依据,并将各个时长平均分配给读取设备,从而可以保证每台读取设备耗费的时长是相同的,避免现有技术出现的读取时长不平均现象,提高了并行读取的效率。本申请还提供了一种数据并行读取装置。
【IPC分类】G06F17/30
【公开号】CN105426495
【申请号】CN201510824838
【发明人】耿鹏, 郭会, 孙志伟
【申请人】中国农业银行股份有限公司
【公开日】2016年3月23日
【申请日】2015年11月24日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1