流程化档案数据数字化处理方法、计算机装置及计算机可读存储介质与流程

文档序号:16901168发布日期:2019-02-19 18:00阅读:358来源:国知局
流程化档案数据数字化处理方法、计算机装置及计算机可读存储介质与流程

本发明涉及计算机技术领域,具体涉及一种流程化档案数据数字化处理方法、计算机装置及计算机可读存储介质。



背景技术:

随着计算机网络技术的快速发展,档案数据数字化已成为档案工作发展的必然趋势。档案数据数字化不仅可以节省档案存贮空间,缓解库房压力,又可以妥善解决档案的利用问题,减少因对档案原件频繁使用而造成的磨损,有利于保护档案原件。按照科学的方法、统一的数据标准进行档案数据著录,根据原始纸质档案对现有档案系统中的电子记录进行校对、补正,实现各种形式的档案记录一致性、电子数据的完整性,各种数据之间逻辑严密性,最终达到提高档案利用效率的目标。

现有的档案数据著录,一般由数据著录人员直接在档案管理系统中校对、补正,档案数据的准性确与数据著录人员素质息息相关,主要存在以下缺点:

(1)由于馆藏档案量巨大,很容易出现张冠李戴的情况,也就是实物档案与电子数据不匹配的情况,档案管理系统无法识别并中止操作。

(2)在数据著录的过程中,由于数据著录人员失误或理解错误,无法避免数据指标录入错误的情况,档案管理系统也不能给出及时的提示。

因此,针对现有技术的不足,有必要设计一种关于流程化档案数据的数字化处理方法,提高档案数据关联的正确性以及档案数据著录过程中的正确性。



技术实现要素:

本发明的第一目的在于提供一种流程化档案数据数字化处理方法。

本发明的第二目的在于提供一种计算机装置。

本发明的第三目的在于提供一种计算机可读存储介质。

为实现上述的第一目的,本发明提供的流程化档案数据数字化处理方法包括:显示档案出库窗口,获取档案出库明细数据,生成档案加工任务。确定档案加工任务,获取档案卷内目录数据。读取档案影像数据,并对读取到的档案影像数据进行字符识别,获取档案关键信息。获取档案一录数据,判断档案一录数据的关键信息与字符识别后所提取的档案关键信息是否一致。如是,获取档案二录数据,并判断档案二录数据与档案一录数据是否一致。如是,进行著录数据质检,判断著录数据是否正确;如是,将著录数据存储在档案数据库中。

优选的,读取档案影像数据后,将档案影像数据按确定的命名规则存储在文件夹中,再对读取到的影像数据进行字符识别。

优选的,档案关键信息包括档案编号、用户姓名和档案类别等基本信息。

优选的,若档案二录数据与档案一录数据不一致,判断档案一录数据是否正确;如是,重新获取档案二录数据。

优选的,进行著录数据质检,判断著录数据是否正确的步骤包括:获取档案系统差异值,判断档案系统差异值与档案影像数据是否一致;如是,确认著录数据正确。

优选的,获取档案系统差异值的步骤包括:获取档案系统数据,计算档案系统数据与著录数据的差异值。

优选的,进行著录数据质检,判断著录数据是否正确的步骤还包括:若档案系统差异值与档案影像数据一致,确认档案系统数据错误,并修改档案系统数据。

为实现上述的第二目的,本发明提供的计算机装置包括处理器和存储器,处理器用于执行存储器中存储的计算机程序时实现如上述方案中的流程化档案数据数字化处理方法。

为实现上述的第三目的,本发明提供的计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述方案中的流程化档案数据数字化处理方法。

相对于现有技术,上述方案提供的流程化档案数据数字化处理方法、计算机装置和计算机可读存储介质的有益效果在于:基于两录一校进行档案数据著录,改变了传统的在档案管理系统中校对、补正的模式。在数据著录过程中,先通过光学字符识别技术(ocr)提取出档案数据的关键信息,再进行档案数据一录,并将一录数据的关键信息与ocr提取出来的关键信息比对,确定一录数据的关键信息是否正确;然后进行数据二录,并将二录的数据与一录数据进行全面比对,确定二录数据与一录数据完全一致后进行数据质检,将著录数据与档案系统数据比对,获取档案系统差异值,根据档案系统差异值判断著录数据是否正确,最终实现档案数据入库。本发明数据著录过程中先后智能校验、比对和提醒,大大提高数据关联的正确性及数据著录的准确性。通过最终的数据入库,实现各种形式的档案记录一致性、电子数据的完整性,各种数据之间逻辑严密性,最终达到提高档案利用效率的目标。

附图说明

图1是本发明流程化档案数据数字化处理方法实施例的流程图。

以下结合附图及实施例对本发明作进一步说明。

具体实施方式

流程化档案数据数字化处理方法实施例

本实施例是依据档案原件进行档案数据著录,通过数字化加工,将档案数据以一定的逻辑顺序存储到数据库中,提高档案数据的使用效率,减少档案原件的使用频率,保护档案原件。本实施例中的选用的档案是不动产登记档案,档案原件为不动产的业务档案。档案数据即不动产登记案卷中所记载相关信息,如不动产主体,客体和权利等。

参见图1,本实施例的流程化档案数据数字化处理方法进行档案数据著录时,首先执行步骤s1,显示档案出库窗口,获取档案出库明细数据,生成档案加工任务。

其中,显示档案出库窗口后,获取多个档案的出库明细数据,如档案的出库批次号、出库日期、档案所属单位等,并将出库明细数据在档案出库窗口中显示,从而在档案出库窗口生成多个具有具体出库明细单的档案加工任务。

执行步骤s2,确定具体的档案加工任务,即将步骤s1中的多个档案加工任务中的一个确定为当前的档案加工任务。确定当前档案加工任务后,获取档案卷内目录数据。档案卷内目录数据,即档案的整套目录中,档案各部分目录的具体数据,如某一部分目录在档案中的总页数、页码范围和起始页号等。例如,档案的卷内目录包括“房产所有权证存根”、“产权登记审批书”、“契税证据”等目录,“房产所有权证存根”的目录数据包括:页数为两页,页码范围为第2至第3页,起始页号为第2页等。确定档案卷内目录数据,是为了使在接下来的比对判断环节中能够准确地进行数据比对。

执行步骤s3,读取档案影像数据,并对读取到的档案影像数据进行字符识别,并且提取所识别的字符,获取档案关键信息。

在步骤s3中,扫描仪或摄像头等具有图像获取功能的电子设备生成各纸质档案的影像后,存储模块获取档案影像数据,将档案影像数据按确定的命名规则存储在指定文件夹中,并在挂载档案影像数据后,由ocr处理模块读取存储模块中的档案影像数据,并对读取到的档案影像数据进行字符识别,通过对档案影像数据进行旋转、纠偏、去污等处理步骤,提取所识别的字符,并从提取到的字符中获取档案关键信息。其中,档案关键信息包括档案编号、档案的用户姓名、档案类别等基本信息。该类的基本信息具有清晰、ocr识别准确度高的特点。

获取档案关键信息后,执行步骤s4,获取档案一录数据。档案一录数据,即数据获取模块第一次获取到的档案的全部数据,包括步骤s3中的档案关键信息以及档案的其他数据,如不动产登记案卷中记载的主体,客体、权利等。

获取档案一录数据后,执行步骤s5,判断档案一录数据中的关键信息与步骤s3中通过ocr字符识别所提取的档案关键信息是否一致。若两者不一致,则提示错误,返回步骤s4,数据获取模块重新获取档案一录数据。档案一录数据中的关键信息与步骤s3中的由ocr字符识别所提取的档案关键信息一致后,再跳转至下一著录步骤。

当档案一录数据中的关键信息与步骤s3中的通过ocr字符识别所提取的档案关键信息一致后,执行步骤s6,获取档案二录数据。档案二录数据为数据获取模块第二次获取到的档案的全部数据。这是因为在步骤s4中档案一录数据只进行档案关键信息的比对判断,档案一录数据中的除关键信息外的其他数据未进行比对判断,并不能确保档案一录数据中的除关键信息外的其他数据的准确性。因此,需要获取档案二录数据,并通过将档案二录数据与档案一录数据进行比对判断,从而确保档案数据的准确度。

数据获取模块获取档案二录数据,执行步骤s7,判断档案二录数据与档案一录数据是否一致。判断过程为全面比对,即将档案二录数据中的每一个数据都与档案一录数据中所对应的每一数据进行一一比对判断。

若档案二录数据与档案一录数据不一致,则判断属于档案一录数据错误或属于档案二录数据错误。若判断结果为档案一录数据错误,则返回步骤s4,同时显示“数据二录值”窗口,并在“数据二录值”窗口中生成第一差异值;其中,第一差异值为档案二录数据与档案一录数据的不同数据,即正确的档案数据;然后,根据第一差异值,重新获取正确的档案一录数据。若判断结果为档案二录数据错误,显示“数据一录值”窗口,并在“数据一录值”窗口中生成第二差异值,第二差异值为档案一录数据与档案二录数据的不同数据,即档案一录数据中的正确档案数据。然后,根据第二差异值重新获取档案二录数据。

当档案一录数据与档案二录数据完全一致后,执行步骤s8,进行著录数据质检,判断著录数据是否正确。著录数据,即最终确定的档案著录数据,亦即档案二录数据与档案一录数据完全一致后最终确定的档案数据。

著录数据质检,判断著录数据是否正确的步骤包括:

获取档案系统差异值的步骤;获取档案系统数据,计算档案系统数据与著录数据的差异值,该差异值即为档案系统差异值,亦即档案系统数据与著录数据的不同之处。其中,档案系统数据为其他的外部数据,即在外部的档案系统中所存储的档案数据。在本步骤中通过数据读取模块读取到档案系统数据,然后通过数据处理模块计算档案系统数据与著录数据的差异值(即档案系统差异值)。

判断档案系统差异值与档案影像数据是否一致的步骤;若档案系统差异值与档案影像数据一致,确认档案系统数据错误,并修改档案系统数据,使档案系统数据与著录数据一致;若档案系统差异值与档案影像数据不一致,确认著录数据错误,并返回步骤s6,重新获取正确的档案二录数据(即著录数据)。

著录数据确认正确后,执行步骤s9,进行著录数据入库,将著录数据存储到档案数据库中,最终完成档案数据著录的整个过程。

计算机装置实施例:

本实施例的计算机装置包括有处理器、存储器以及存储在存储器中并可在处理器上运行的计算机程序,例如用于实现上述档案数据著录方法的信息处理程序。处理器执行计算机程序时实现上述实施例的流程化档案数据数字化处理方法的各个步骤。

本发明所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。

存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

计算机可读存储介质实施例:

本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述实施例的流程化档案数据数字化处理方法的各个步骤。

其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述仅为本发明的较佳实施例,并不用以限制本发明。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1