一种动态调整电子文件遍历频率的方法

文档序号:9217272阅读:348来源:国知局
一种动态调整电子文件遍历频率的方法
【技术领域】
[0001]本发明涉及信息安全技术领域,特别涉及一种动态调整电子文件遍历频率的方法。
【背景技术】
[0002]现有技术通过对文件结构解析来提高遍历电子文件或电子数据的效率。现有技术的解析是对数据包本身的优化,包括xml格式、包内格式等,减少了冗余代码出现的几率,加快了遍历速率,但是文件数量很大或文件夹层级较多时遍历文件效率不显著,系统资源利用率低。

【发明内容】

[0003]有鉴于此,本发明的主要目的在于,提供一种动态调整电子文件遍历频率的方法,包括:
[0004]A、确定文件夹列表,以及各文件夹中电子文件的数量;
[0005]B、针对各文件夹内电子文件的数量,生成对于该文件夹的当前遍历频率;
[0006]C、依据当前遍历结果判断各文件夹内电子文件数量的变化量,并针对所述变化量的多少,对应调整各电子文件夹下次遍历频率的高低。
[0007]由上,通过文件夹数量变化动态调整遍历频率,文件数量越多时,遍历频率越快。
[0008]可选的,步骤A包括:
[0009]获取所有电子文件所存储的文件夹目录;
[0010]依据其存储目录将各级文件夹展开,形成图状遍历结构,获取文件夹数量;
[0011]针对每个文件夹,对应生成一单独的单个文件夹遍历线程,通过遍历获取对应各文件夹内电子文件的数量。
[0012]由上,相比于传统树形结构的递归式查询方式,由一顶点出发到该顶点所在队伍的队尾,再返回该顶点访问其他队伍,图状遍历结构可从图中任一点出发对对象进行有且仅有一次的访冋,提尚了访冋效率。
[0013]可选的,步骤A包括:
[0014]获取所有电子文件的所存储的文件夹目录;
[0015]依据其存储目录将各级文件夹展开,形成图状遍历结构;
[0016]生成随机遍历线程,并针对图状遍历结构分配所述遍历线程;
[0017]每条遍历线程获取其负责的文件夹数量,针对每个文件夹,对应生成一单独的单文件夹遍历线程,通过遍历获取对应各文件夹内的电子文件数量。
[0018]由上,采用多遍历线程并行方式获取初始状态下电子文件的数量,单一遍历线程,更进一步的提尚了初始遍历的效率。
[0019]可选的,所述步骤B中当前遍历频率与该文件夹内的电子文件数量呈正比。
[0020]由上,针对每个文件夹内的初始电子文件数量,为其分配遍历频率,相比于所有文件夹采用相同遍历频率,可以节省遍历资源。
[0021]可选的,步骤C中,所述针对所述变化量的多少,对应调整各电子文件夹下次遍历频率的高低包括:
[0022]计算电子文件的增量超过预设增量为X%时,则下次遍历频率提高为初始遍历频率的1_X% ;
[0023]计算电子文件的减量超过预设减量为X%时,则下次遍历频率降低为初始遍历频率的1+X%。
[0024]由上,当文件夹内的电子文件多,则遍历频率高,感知文件夹内文件变化的效率就越高;文件夹内的电子文件少,则遍历频率低,感知文件夹内文件变化的效率越低。
[0025]可选的,所述动态调整电子文件遍历频率还包括:以调整后的遍历频率替换当前遍历频率。
[0026]由上,以每一次调整后的频率作为下一次调整的基础,通过根据文件夹数量动态改变线程数量,用文件夹中文件的数量来动态改变处理频率,巧妙的实现了文件越多,处理的频率越高,使用效率就越高。
【附图说明】
[0027]图1所示为本发明的原理示意图;
[0028]图2所示为图状遍历结构的原理示意图。
【具体实施方式】
[0029]为克服现有技术存在的缺陷,本发明提供一种动态调整电子文件遍历频率的方法,通过文件夹数量动态调整遍历频率,文件数量越多时,遍历频率越高。
[0030]如图1所示,本发明包括以下步骤:
[0031]SlO:依据电子文件所存储的文件夹目录,形成图状遍历结构。
[0032]获取数据库中所有电子文件所存储的文件夹目录,依据其存储目录将各级文件夹展开,形成图状遍历结构。如图2所示,图状遍历结构是指从图中的任一顶点出发,对图中的所有顶点访问且只访问一次的结构。假设图2中顶点Vl?V8表示8个不同文件夹,初始状态下,图中所有文件夹未被访问,则图状遍历是从图中某个文件夹(例如VI)出发,访问此文件夹,然后依次从此文件夹(Vl)起,访问其他未被访问的相邻文件夹,直至图中所有和文件夹Vl有路径相通的其他文件夹都被访问到。若此时图中尚有文件夹未被访问,则另选图中一个未被访问的文件夹作起始点,重复上述过程,直至图中所有文件夹都被访问到为止。
[0033]相比于传统树形结构的递归式查询方式,由一顶点出发到该顶点所在队伍的队尾,再返回该顶点访问其他队伍,图状遍历结构可从图中任一点出发对各顶点进行有且仅有一次的访冋,提尚了访冋效率。
[0034]S20:生成随机数量的遍历线程,并针对图状遍历结构分配所述各遍历线程。
[0035]生成一遍历线程的随机数,基于图状遍历结构中呈现的文件夹数量,采用平均分配原则分配给每条遍历线程相同的业务量。相比于单条遍历线程,多条遍历线程并行,显然可以进一步提高对于图状遍历结构的遍历效率。
[0036]S30:每条遍历线程获取其负责的文件夹数量,针对每个文件夹,对应生成一单独的单个文件夹遍历线程。
[0037]S40:针对各文件夹内的电子文件量,生成文件夹初始遍历频率。
[0038]每条单个文件夹遍历线程通过遍历,获取其所负责的文件夹内电子文件的数量,为该文
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1