一种文档数字化归档的装置及其归档和查询方法

文档序号:9750876阅读:196来源:国知局
一种文档数字化归档的装置及其归档和查询方法
【技术领域】
[0001]本发明涉及一种将纸质文件以数字化形式归档的装置,以及涉及一种将纸质文档以数字化形式归档的方法和相应查询方法。
【背景技术】
[0002]企业经营管理过程中会产生各类业务单据,如购销合同、货物签收单、质量保证书等,对于企业的有序经营和权益保障起着非常重要的作用。企业往往会根据内外部质量体系管理的要求,明确各业务单据的保管期限,例如合同通常要求永久保存,质量保证书保存至少十年等。以往,企业通常采用纸质单据分类、集中保管的方式进行单据的留存。
[0003]随着企业的业务规模扩张,纸质单据量数以万计,传统方式下单据的收集、归类、存放、清点和转移均需要耗费大量的人力物力,给日常管理造成不便。纸质单据一旦保管不当,则容易出现损毁、丢失,无法满足企业的管理要求,甚至为企业的稳定经营留下风险和隐患。

【发明内容】

[0004]本发明目的在于克服上述现有技术存在的缺陷提供一种纸质文档数字化归档装置,以及使用该归档装置进行纸质文档的数字化归档的方法和使用该归档装置进行纸质文档数字化查询方法。
[0005]本发明所述的一种文档数字化归档的装置,包括:录入文档数据的采集端、管理和存储数据的服务器端,以及用于外部查询的查询端;
所述的采集端包括:
纸质输入单元,用于接收纸质文档;
扫描识别单元,用于将接收到的纸质文档扫描成图片格式的电子文件,并识别及提取所扫描的电子文件中的文字信息;
采集端通讯接口,用于服务器端与采集端的通讯连接;
所述的服务器端包括:
存储单元,用于缓冲存放输入的电子文件和其所对应的识别及提取的文字信息;第一逻辑单元,用于对电子文件和其所对应的识别及提取的文字信息建立对应的映射关系;
数据库,用于永久存放形成映射关系的电子文件和其所对应的识别及提取的文字信息;
第二逻辑单元,接收查询端发送的查询信息,根据查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,并从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端;
所述的查询端包括:
查询输入单元,用于输入查询目标文档的查询信息; 输出单元,用于接收服务器端第二逻辑单元返回的查询目标文档所对应的电子文件,并将其信息输出;
查询端通讯接口,用于服务器端与查询端的通讯连接。
[0006]本发明所述的文档数字化归档的方法,包括以下步骤:
a.通过采集端,将纸质文档扫描,获取图片格式的电子文件;
b.通过扫描识别单元识别及提取图片格式的电子文件中的文字信息;
c.将电子文件和其所对应的识别及提取的文字信息输入存储单元;
d.通过逻辑运算,将电子文件和其所对应的识别及提取文字信息形成对应的映射关系,并将其存储于数据库中。
[0007]本发明所述的文档数字化查询的方法,包括以下步骤:
通过外部查询端的查询输入单元输入查询信息;
查询信息通过查询端通讯接口输送到服务器端;
服务器端将接收到的查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端。
[0008]本发明所述的文档数字化归档的装置,其将纸质文档进行了电子化存储,不但大幅降低了文档存储的占地空间,还可延长文档的保存时间和保存质量。且其纸质文档转化为图片电子文档的同时,生成了电子的文字信息,并将该文字信息与图片电子文档建立了映射关系,并按该映射关系存储与数据库中,因此在需要查询相关文档时,通过输入查询信息,系统通过文字信息与查询信息匹配后,即可自动调出所需查询的目标文档的图片电子文件,因而查询快速方便,可以提高企业管理的效率和降低管理的成本。
【附图说明】
[0009]图1是本发明装置的结构框图。
[0010]图2是本发明归档和查询方法的流程图。
【具体实施方式】
[0011]根据图1、图2所示,本发明所述的一种文档数字化归档的装置及其归档和查询方法工作流程如下,首先通过纸质文档的接收单元收入要归档的纸质文档。扫描识别单元对纸质文档进行扫描后得到图片格式的电子文件,再利用图片识别技术识别出电子文件中的文字信息。其中文字信息包括了纸质文档的类型,例如合同、支票、收据、协议等等不同的类型;还包括纸质文档的编号,例如合同编号、支票编码等各文档类型所对应的文档编号;文字信息还可以包括金额、公司名称、合同条款等等用字符表达的信息;然后通过采集端通讯接口发送到服务器端的存储单元。
[0012]服务器端的第一逻辑单元将存储单元中的电子文件与其相对应的文字信息形成一一对应的映射关系,并以文档的类型和编号为分类依据,对该纸质文档进行分类归档。最后将处理完毕的电子文件和文字信息同时保存于数据库以供后续查询使用。保存于数据库时相同文档编号和类型有在先数据,则覆盖在先数据。
[0013]查询已归档的纸质文档通过以下工作流程,在查询端的查询输入单元输入目标文档的任一信息或任意信息组合,例如输入日期或金额作为查询参数,并通过查询端通讯接口输入到服务器端的第二逻辑单元。第二逻辑单元获取含义该参数或参数组合的目标所对应的映射关系,然后根据映射关系从数据库获取该目标的电子文件以及对应的文字信息。最后将电子文件和文字信息返回查询端,并通过输出单元将查询结果输出到外设设备。
[0014]对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。
【主权项】
1.一种文档数字化归档的装置,其特征在于,包括:录入文档数据的采集端、管理和存储数据的服务器端,以及用于外部查询的查询端; 所述的采集端包括: 纸质输入单元,用于接收纸质文档; 扫描识别单元,用于将接收到的纸质文档扫描成图片格式的电子文件,并识别及提取所扫描的电子文件中的文字信息; 采集端通讯接口,用于服务器端与采集端的通讯连接; 所述的服务器端包括: 存储单元,用于缓冲存放输入的电子文件和其所对应的识别及提取的文字信息; 第一逻辑单元,用于对电子文件和其所对应的识别及提取的文字信息建立对应的映射关系; 数据库,用于永久存放形成映射关系的电子文件和其所对应的识别及提取的文字信息; 第二逻辑单元,接收查询端发送的查询信息,根据查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,并从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端; 所述的查询端包括: 查询输入单元,用于输入查询目标文档的查询信息; 输出单元,用于接收服务器端第二逻辑单元返回的查询目标文档所对应的电子文件,并将其信息输出; 查询端通讯接口,用于服务器端与查询端的通讯连接。2.一种文档数字化归档的方法,其特征在于,包括以下步骤: a.通过采集端,将纸质文档扫描,获取图片格式的电子文件; b.通过扫描识别单元识别及提取图片格式的电子文件中的文字信息; c.将电子文件和其所对应的识别及提取的文字信息输入存储单元; d.通过逻辑运算,将电子文件和其所对应的识别及提取文字信息形成对应的映射关系,并将其存储于数据库中。3.根据权利要求2所述的方法,其特征在于,步骤b中文字信息包括文档编号和类型。4.根据权利要求3所述的方法,其特征在于,步骤d中保存于数据库时相同文档编号和类型有在先数据,则覆盖在先数据。5.根据权利要求3所述的方法,其特征在于,步骤d中的分类以文档编号和类型为基础依据。6.—种文档数字化查询的方法,包括以下步骤: 通过外部查询端的查询输入单元输入查询信息; 查询信息通过查询端通讯接口输送到服务器端; 服务器端将接收到的查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端。
【专利摘要】本发明公开一种文档数字化归档的装置,包括:录入文档数据的采集端、管理和存储数据的服务器端,以及用于外部查询的查询端;所述的采集端包括:纸质输入单元,扫描识别单元,采集端通讯接口;所述的服务器端包括:存储单元,第一逻辑单元,数据库,第二逻辑单元;所述的查询端包括:查询输入单元,输出单元,查询端通讯接口。其将纸质文档进行了电子化存储,且其纸质文档转化为图片电子文档的同时,生成了电子的文字信息,并将该文字信息与图片电子文档建立了映射关系,并按该映射关系存储与数据库中,因此在需要查询相关文档时,通过输入查询信息,系统通过文字信息与查询信息匹配后,即可自动调出所需查询的目标文档的图片电子文件。
【IPC分类】G06F17/30, G06Q10/06
【公开号】CN105512197
【申请号】CN201510840557
【发明人】邵林峰, 董涛, 梁逸, 王国平
【申请人】广州宝钢南方贸易有限公司
【公开日】2016年4月20日
【申请日】2015年11月27日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1