基于分块迭代的网络破损文件还原方法及系统的制作方法_4

文档序号:9249237阅读:来源:国知局
方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0041]本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
[0042]虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。
【主权项】
1.基于分块迭代的网络破损文件还原方法,其特征在于,包括: a.获取待还原文件的文件样本集,所述文件样本集为来源于同一网络的待还原的样本文件集合; b.确定对文件样本集中各文件的分块数,计算平均分块大小; c.根据平均分块大小,对文件样本集中的各文件进行分块,并计算各文件分块对应字节码序列的HASH值; d.建立文件样本集中各文件、文件分块及对应HASH的索引列表; e.循环逐层对比文件样本集中各文件同一层文件分块的HASH值,选择HASH值相同数量最多的文件分块作为待还原文件当前层的还原文件块,各层还原文件块组成还原文件; f.计算还原文件的破损率,如果破损率超过预设值,则放弃当前还原文件,返回步骤b,重新确定对文件样本集中各文件的分块数;否则,根据索引列表,找到还原文件各层还原文件块对应文件分块的字节码序列,得到还原后的文件。2.如权利要求1所述的方法,其特征在于,步骤e中,选择HASH值相同数量最多的文件分块作为待还原文件当前层的还原文件块,若HASH值均不相同,则定位前一次被选作还原文件块的文件分块所属文件,获取所属文件的当前层的文件分块作为待还原文件当前层的还原文件块。3.如权利要求1所述的方法,其特征在于,将步骤e替换为: 初始化文件样本集中各文件分类,将文件样本集中所有文件归为一类; 循环逐层遍历文件样本集中各文件同一层文件分块的HASH值,获得当前层的HASH值; 对比当前层HASH值,依据初始化分类或上层文件分类,计算同一分类下HASH值相同的文件分块的数量; 遍历每个分类下HASH值相同的文件分块数量,并判断是否大于1,如果是,则产生新的文件分类,否则丢弃后续文件分块; 判断是否已遍历到最后一层,如果是,则依据文件分类记录各文件分类下各层的还原文件块,组成还原文件,否则继续遍历下一层文件分块; 删除重复的还原文件。4.如权利要求3所述的方法,其特征在于,所述遍历每个分类下HASH值相同的文件分块数量,并判断是否大于1,如果是,则产生新的文件分类,否则丢弃后续文件分块,替换为: 遍历每个分类下HASH值相同的文件分块数量,并判断是否大于1,如果是,则产生新的文件分类,否则将所述文件分块的后续文件块保存到其他文件分类下,用于下一层还原。5.如权利要求3或4所述的方法,其特征在于,步骤f中,在判断破损率是否超出预设值之前,选择破损率最低的还原文件。6.如权利要求1所述的方法,其特征在于,所述破损率为不匹配的文件分块数与文件样本集中各文件分块数的比值,其中不匹配的文件分块为,各文件同一层文件分块的HASH值均不相等的块。7.基于分块迭代的网络破损文件还原系统,其特征在于,包括: 样本获取单元,获取待还原文件的文件样本集,所述文件样本集为来源于同一网络的待还原的样本文件集合; 分块计算单元,确定对文件样本集中各文件的分块数,计算平均分块大小; HASH计算单元,根据平均分块大小,对文件样本集中的各文件进行分块,并计算各文件分块对应字节码序列的HASH值; 索引单元,建立文件样本集中各文件、文件分块及对应HASH的索引列表; 迭代计算单元,循环逐层对比文件样本集中各文件同一层文件分块的HASH值,选择HASH值相同数量最多的文件分块作为待还原文件当前层的还原文件块,各层还原文件块组成还原文件; 文件还原单元,计算还原文件的破损率,如果破损率超过预设值,则放弃当前还原文件,返回分块计算单元,重新确定对文件样本集中各文件的分块数;否则,根据索引列表,找到还原文件各层还原文件块对应文件分块的字节码序列,得到还原后的文件。8.如权利要求7所述的系统,其特征在于,迭代计算单元中中,选择HASH值相同数量最多的文件分块作为待还原文件当前层的还原文件块,若HASH值均不相同,则定位前一次被选作还原文件块的文件分块所属文件,获取所属文件的当前层的文件分块作为待还原文件当前层的还原文件块。9.如权利要求7所述的系统,其特征在于,将迭代计算单元内容替换为: 初始化文件样本集中各文件分类,将文件样本集中所有文件归为一类; 循环逐层遍历文件样本集中各文件同一层文件分块的HASH值,获得当前层的HASH值; 对比当前层HASH值,依据初始化分类或上层文件分类,计算同一分类下HASH值相同的文件分块的数量; 遍历每个分类下HASH值相同的文件分块数量,并判断是否大于1,如果是,则产生新的文件分类,否则丢弃后续文件分块; 判断是否已遍历到最后一层,如果是,则依据文件分类记录各文件分类下各层的还原文件块,组成还原文件,否则继续遍历下一层文件分块; 删除重复的还原文件。10.如权利要求9所述的系统,其特征在于,所述遍历每个分类下HASH值相同的文件分块数量,并判断是否大于1,如果是,则产生新的文件分类,否则丢弃后续文件分块,替换为: 遍历每个分类下HASH值相同的文件分块数量,并判断是否大于1,如果是,则产生新的文件分类,否则将所述文件分块的后续文件块保存到其他文件分类下,用于下一层还原。11.如权利要求9或10所述的系统,其特征在于,文件还原单元中,在判断破损率是否超出预设值之前,选择破损率最低的还原文件。12.如权利要求7所述的系统,其特征在于,所述破损率为不匹配的文件分块数与文件样本集中各文件分块数的比值,其中不匹配的文件分块为,各文件同一层文件分块的HASH值均不相等的块。
【专利摘要】本发明提供了一种基于分块迭代的网络破损文件还原方法及系统,所述方法为,多次获取网络中来源于同一网络的样本集合,根据确定的初始分块数量,确定平均分块大小,并对样本集中的各文件进行分块,并计算各文件分块对应字节码序列的HASH值,循环逐层对比文件样本集中各文件同一层文件分块的HASH值,并确定当前层的还原文件块,根据各层确定的还原文件块,计算还原文件的破损率,如果破损率未超出预设值,则根据还原文件块对应的字节码序列还原文件。相应的本发明还提供了文件还原系统。通过本发明的方法及系统,能够对在网络传输过程中因传输问题导致破损的文件进行还原,最大程度的保证文件的完整性。
【IPC分类】G06F17/30
【公开号】CN104965837
【申请号】CN201410450799
【发明人】肖新光, 黄磊, 童志明, 张栗伟
【申请人】哈尔滨安天科技股份有限公司
【公开日】2015年10月7日
【申请日】2014年9月5日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1