多因素复杂环境下电子档案长期保存可靠性综合评估方法与流程

文档序号:15076990发布日期:2018-08-01 02:04阅读:179来源:国知局

本发明涉及一种电子档案保存领域,具体地说是一种多因素复杂环境下电子档案长期保存可靠性综合评估方法。



背景技术:

电子档案的长期保存和传统纸质档案相比较有许多不同之处。电子档案信息和载体可以分离,具有易修改、复制和删除等特点;电子档案的存储载体的寿命比较短,难以长久保管;电子档案的读写依赖于计算机软硬件环境,软硬件环境兼容性问题影响电子档案的读取;计算机硬件故障、自然灾害和人为损坏也会导致电子档案信息丢失。因此,相对于传统的纸质档案的保存来说,电子档案在长期保存方面有相当大的困难,对电子档案进行长期可靠的保存是极其重要和困难的。

近年来,随着《电子文件管理暂行办法》、《电子档案移交与接收办法》和《关于加强和改进新形势下档案工作的意见》等一批政策规范的出台,“国电联办”和国家档案局对于电子档案管理工作持续大力推进,越来越多、类型各异的电子档案成为档案机构收集保管的对象。同时,档案机构中传统纸质载体档案的数字化加工工作逐步提速,形成了大量的档案扫描电子图像文件。这一切都使得档案机构的电子档案保有量飞速上升。如何解决电子档案的长期可靠保存问题已经成为档案机构必须面对的紧迫任务。

对于电子档案的长期可靠保存问题,国内已有一定的理论研究,并发表了一些论文成果,如刘越男的《电子文件的长期保存:多维互动的领域》(《档案学研究》,2014(4):56-60);钱毅的《我国可信电子文件长期保存规范研究》(《档案学通讯》,2014(3):75-79)等,但这些研究偏重于电子档案长期保存的定性理论指导。检索与电子档案、电子文件、数字档案、数字信息或数字资源等长期保存相关的专利,相关专利也非常少见,只有申请号为cn201010227377.2的《一种数字资源长期保存格式过时风险量化评估方法》(发明专利申请公布后的驳回状态)。这些论文或专利,或者专注与理论研究,或者仅关注实践中与电子档案长期保存相关的某一方面。然而在实践工作中,不同的档案机构基于不同的工作环境、管理对象、技术条件和保存要求,所采用的电子档案保存方法和策略会体现出较大的差异,需要有效的方法,对档案机构采用的电子档案长期保存方法和策略的可靠程度进行全面、精确、定量的评估,从而发现其中哪些方面迫切需要进行改进和加强。



技术实现要素:

本发明为解决现有的问题,旨在提供一种多因素复杂环境下电子档案长期保存可靠性综合评估方法。

本发明采用的技术方案包括运用层次分析法进行客观计算,步骤如下:

步骤一,抽象化处理,将各种影响电子档案长期保存可靠性的因素转成目标层、准则层、因素层的结构模型;

步骤二,构造比较矩阵,即根据因素层指标对其指标层相对重要程度,建立两两因素相对重要程度的比度表来构造比较矩阵;

步骤三,一致性检验,即计算因素层各指标的权重值,并对最大特征值进行一致性检验,如果不满足一致性则需对数据进行进一步的归一化处理,得到各因素的相对权重;

步骤四,综合评估,因素层指标的权重值越大,则对电子档案长期保存可靠性的评估的可靠性越强。

本发明还包括运用信息熵法确定准则层指标权重,即主观赋值计算,步骤如下:

步骤一,定义指标层因素;

步骤二,建立对指标层因素可靠程度评估的熵模型,构造评估矩阵;

步骤三,对评估矩阵进行归一化处理,得到各指标层因素的权重向量;

步骤四,根据评估指标权重的大小进行评估。

本发明和现有技术相比,具有如下优势:

(1)全面性:将与电子档案长期可靠保存相关的各项因素综合引入评估方法,避免了片面考虑某些因素而忽视另一些因素的情况。

(2)客观性:通过对指标权重进行一致性检验和归一化处理,消除主观判断可能产生的前后偏差与不一致,达到客观评定的效果。

(3)精确性。通过建立数学模型,对评估结果进行精确评分和分级,将评估的等级分为四级,有助于档案机构准确认识当前电子档案长期保存可靠性状况。

(4)可指导性:通过评估过程某项指标的取值情况,档案机构可以准确认识到当前在哪些方面存在需要改进的地方,从而指导档案机构对电子档案长期可靠保存工作进行改进。

附图说明

图1为评估指标体系的结构图。

具体实施方式

现结合附图对本发明作进一步地说明。

本实施例的设计思想是同构建立一个运用层次分析法和信息熵的评估模型,将抽象、无形、无法量化的电子档案长期保存可靠程度的评估体系转化为具体化、有形、可量化的问题。本实施例将层次分析法(ahp)和信息熵组合起来,计算客观计算和主观赋值的线性组合,得出组合权重值确定判断电子档案长期保存评估指标的组合评估方法。

层次分析法将定量分析法和定性分析法有机结合起来,其基本步骤是:第一,对电子档案长期保存可靠性问题进行抽象化处理,将各种影响因素转成目标层、准则层、因素层的结构模型;第二,根据因素层指标对其指标层相对重要程度,建立两两因素相对重要程度的比度表,构造比较矩阵;第三,计算因素层各指标的权重值,并对最大特征值进行一致性检验,如果不满足一致性则需对数据进行进一步的归一化处理,得到各因素的相对权重;第四,进行电子档案长期保存可靠性的综合评估,因素层指标的权重值越大,则对电子档案长期保存可靠性的评估的可靠性越强。

基于信息熵对电子档案长期保存可靠程度进行评估,基本步骤为:第一,通过采集专家意见,定义影响电子档案长期保存可靠性的指标层因素;第二,建立对指标层因素可靠程度评估的熵模型,构造专家意见的评估矩阵;第三,对评估矩阵进行归一化处理,得到各指标层因素的权重向量;第四,根据评估指标权重的大小对电子档案长期保存可靠性影响程度进行评估。若该指标对电子档案保存工作可靠性的影响程度越大,这个指标所映射工作的信息量越多,信息越有价值,那么电子档案保存工作的不可靠性越低,信息熵越小,指标权重就越大;反之,若该指标对电子档案的保存工作可靠性的影响越弱,该指标所映射工作的信息量越少,信息价值越小,那么电子档案保存工作不可靠性越大,指标的权重越小。

首先,建立基于多层次组合权重的评估模型。

电子档案长期保存可靠性评估模型收集与电子档案长期保存可靠程度相关的影响因素,包括六个一级指标,分别是环境指标、副本指标、封装指标、格式指标、监测指标和迁移指标,记为p={p1,p2,p3,p4,p5,p6}。一级指标环境指标下包括选址、供电、安防、消防、温湿度等二级指标,记为p={p11,p12,p13,p14,p15,p16},其余类推。一级指标副本指标下包括副本数量、副本介质、副本类型、副本位置等二级指标;一级指标封装指标下包括封装格式、封装内容和封装规范等二级指标;一级指标格式指标下包括原始格式、利用格式、长期保存格式等二级指标;一级指标监测指标下包括环境监测、设备监测、介质监测、封装检测、格式检测等二级指标;一级指标迁移指标下包括设备迁移、介质迁移、格式迁移等二级指标。二级指标下又包含若干不同数量的三级指标。

参见图1,需根据决策的目标,建立评估指标体系,对指标进行逻辑分层。即从上至下,依次分为目标层、准则层、因素层,构建层次结构模型。

其次,进行权重计算。

第一步:构造比较矩阵。根据建立的层次模型,每个因素层元素都以对应的准则层元素为准则,按重要性的不同,得出各对应的标度值,组建判断矩阵。以准则层“环境指标”下的因素层指标为例,共有选址、供电、安防、消防、温湿度共5个指标,用aij表示ai相对于aj的相对权重,邀请专家判定对准则层指标在因素层指标中所占比较进行赋值,则比较矩阵为a=(aij)m×n。

第二步:计算因素层指标的权重向量

根据比较矩阵,求出方程aω=λmaxω所对应的最大特征根λmax,将特征向量ω做归一化处理,即得所求的权重向量,记为ωk,ωk=[ωk1,ωk2,...,ωkm],(其中m表示第k个指标所在的因素层的指标个数,ωki表示因素层指标ki在一级指标k中的权重,满足)。

第三步:一致性检验

为验证特征向量法得到的权重是否合理,本专利还需对比较矩阵进行一致性检验。首先计算一致性指标ci,然后计算一致性比例cr,其中ri表示平均随机一致性指标。

当cr<0.10时,比较矩阵a具有比较满意的一致性,可以接受;否则需对比较矩阵进行适当修正。

再次,通过信息熵法确定准则层指标权重。

第一步:专家意见采集。在对电子档案长期保存可靠程度进行评估时,我们建立了6个一级指标,包括环境指标、副本指标、封装指标、格式指标、监测指标、迁移指标。专家根据自己的经验知识对一级评价指标的相对可靠性进行评估,建立评语集,形成专家排序意见。

本实施例中,共有m个专家来对指标进行咨询评估,每一个评估指标对应集合记为u={u1,u2,...,un},则由m个专家构成的评估矩阵记为x,

其中xij表示第i个专家对第j个指标的评价,在本实施例中建立了6个指标进行专家评估排序,取n=6。

第二步:对评估矩阵进行归一化处理

对专家评估矩阵x进行归一化处理后得到矩阵y,y=(yij)m×n,其中

分别表示评估矩阵x第j列的最大值和最小值,表示评估矩阵x第j列的平均值。

第三步:计算评估矩阵的熵值

信息熵函数为我们计算每个评估指标的熵值,第j个指标的熵值为评估指标的熵值越小,表示评估值的可信度越高。

第四步:计算准则层评估指标的权重

第i个评估指标的权重

确定组合权重。通过对电子档案长期保存可靠性评估模型的建立包括准则层的六个一级指标、以及因素层的若干二级指标。首先利用信息熵法确定准则层六个一级指标的权重为ωi,然后利用层次分析法确定各因素层二级指标在一级指标中的权重为ωki,因此第k个评估指标权重为ωk,ωk=ωi×ωki。

最后,建立评估模型。

在对电子档案长期保存工作的可靠性等级进行评估时,根据评估的需要,将评估的等级分为四级:即非常可靠,比较可靠,一般可靠,不可靠。

评估等级的范围记为p,p:

在电子档案长期保存过程中,我们针对电子档案长期保存过程中的各属性进行综合评估,记结果为s,从而得出电子档案的长期保存可靠性的综合评估结果。

本实施例所描述的层次分析法和信息熵法都是首先确定被评估对象的指标集合,分别计算各个指标的权重以及它们的隶属度向量,得出其判断矩阵,然后将判断矩阵与指标的权重值进行计算,对评估的目标的各个指标的权重做出综合评估,最后进行档案属性的评估分数计算,得到电子档案长期保存可靠性的评估方法。

本实施例基于以上分析算法进行计算得出结果,得出一种对电子档案的长期保存可靠度进行综合评估的方法。

本实施例创新地建立了多因素复杂环境下电子档案长期保存可靠性评估模型,通过详细分析和研究与电子档案长期保存可靠性相关的多种因素,引入专家评估筛选和权衡其中的关键因子,采用层次分析法和信息熵组合的方法进行数学建模分析,对可能影响电子档案长期保存过程可靠性的各种因素加以综合考虑,设计出专用于档案机构电子档案长期保存可靠程度的评估体系,从而对档案机构电子档案保存工作的可靠程度进行计算、推断、结论,实现对电子档案长期保存中风险的判断和预警,以进一步指导档案机构对电子档案长期保存工作进行改进。

上面结合附图及实施例描述了本发明的实施方式,实施例给出的并不构成对本发明的限制,本领域内熟练的技术人员可依据需要做出调整,在所附权利要求的范围内做出的修改均在保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1