单据数据管理方法及系统的制作方法

文档序号:6355463阅读:454来源:国知局
专利名称:单据数据管理方法及系统的制作方法
技术领域
本发明涉及数据管理技木,尤其涉及ー种单据数据管理方法及系统。
背景技术
单据是商务交易中不可缺少的凭证,为便于留存及其用于账务信息整理及后续分析、统计等,需将单据数据电子化。现有技术中,通常是以手工双人对比录入(double keyentry)为主,即分别由两人将单据数据手动录入计算机,并通过比对两份数据是否一致来判定数据的准确性。这种依靠手工录入的方式效率过低,不能够应对复杂、庞大的单据数据。

发明内容
针对上述缺陷,本发明提供单据数据管理方法及系统,用以实现可靠、高效的单据数据管理。本发明提供ー种单据数据管理方法,包括步骤SI,获取单据的文本文件;步骤S2,获取与所述单据相对应的读取模板文件,根据所述读取模板文件从所述单据的文本文件中读取所需数据;步骤S3,获取与所述单据相对应的编辑模板文件,根据所述编辑模板文件中预置的规则对所读取的数据进行编辑;步骤S4,对编辑后的数据进行核实;步骤S5,对核实无误的数据进行存储。本发明还提供ー种单据数据管理系统,包括单据扫描索引子系统,用于获取单据的文本文件、与所述单据相对应的读取模板文件和与所述单据相对应的编辑模板文件;单据数据自动读取子系统,用于根据所述读取模板文件从所述单据的文本文件中读取所需数据并存储至临时数据库;单据数据编辑子系统,用于根据所述编辑模板文件中预置的规则对所读取的数据进行编辑;单据数据核实子系统,用于对编辑后的数据进行核实,并将核实无误的数据发送至正式数据库;数据库,包括所述临时数据库和所述正式数据库。 根据本发明的单据数据管理方法及系统,由于首先获取单据的文本文件,自动调取与单据对应的读取模板文件,根据读取模板文件从单据的文本文件中提取所需数据,这种纸张单据的自动处理及数据录入的速度是人工录入的5至10倍,效率极高;而且自动调取与单据对应的编辑模板文件,根据该编辑模板文件对所提取的数据进行进ー步编辑并对编辑后的数据进行核实,能够确保数据获取具有很高的准确率,所以既能够自动获取单据数据又能够确保所获取数据的高准确性,即实现了高效、可靠的单据数据管理。


图I为本发明单据数据管理方法的流程图。图2为本发明单据数据管理系统的结构示意图。图3为单据数据核实子系统中等待核实的显示界面。图4为单据数据核实子系统中数据核实查看的第一显示界面。图5为单据数据核实子系统中数据核实查看的第二显示界面。图6为单据数据核实子系统中详细错误内容的显示界面。图7为单据数据手工录入子系统中手工单据数据录入的显示界面。图8为单据数据手工录入子系统中手工单据数据编辑的显示界面。图9为单据数据手工录入子系统中单据数据比较的显示界面。图10为单据数据搜寻子系统中处理中的单据查询的显示界面。图11为单据数据搜寻子系统中日期查询的显示界面。图12为单据数据搜寻子系统中包查询的显示界面。图13为单据数据搜寻子系统中自定义查询的显示界面。图14为本发明单据数据管理系统进行单据数据管理的流程图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图,对本发明的技术方案进行清楚、完整地描述。图I为本发明单据数据管理方法的流程图。如图I所示,该单据数据管理方法包括以下步骤步骤SI,获取单据的文本文件;具体地,可利用光学字符识别技术(OCR)将单据纸张转换为文本文件,即该步骤具体包括步骤S11,首先用扫描仪对单据纸张进行扫描,获取单据图片(图片格式例如为JPG、TIF 或 PDF);步骤S12,通过OCR自动识别单据图片,将单据图片转换为文本文件。由于通常由单据业务外包企业为客户提供单据数据管理服务,即单据业务外包企业获取客户发送来的单据数据包并对该单据数据包中的单据图片进行处理,此时,需判断接收的单据数据包的类型,如果是OCR单据数据包,则对其进行解压缩处理,并直接通过OCR自动识别获取单据的文本文件;如果是其他类型的数据包(例如可扩展标记语言(XML)文件,电子数据交换(Electronic Data Interchange, EDI)文件,逗号分_值像格(CSV/XLS)文件等),则进行解压缩、读取数据并添加到处理队列。步骤S2,获取与所述单据相对应的读取模板文件,根据所述读取模板文件从所述单据的文本文件中读取所需数据;具体地,首次处理各类单据吋,均需编辑与该类单据对应的读取模板文件(xml文件),且各类单据与相应的xml文件通过单据类型标识形成关联,即各单据类型具有唯一标识(该单据类型标识通常包括在从客户处获取的数据包中的索引文件(例如为CSV/XLS)文件中),且配置有与该标识唯一对应的读取模板文件。该读取模板文件中例如包括处理该类单据时,需要获取的数据内容、该数据内容在单据中的内容及该数据的位数。例如当获取单据类型标识为“0001”的单据吋,自动调取并读取标识为“0001”的读取模板文件,若该模板文件中的内容为“客户编号,第I行,第I 6位字符”,则从该单据的文本文件中读取第I行的第I 6位字符并将该6位字符作为客户编号存储至临时数据库。类似地,根据读取模板文件中的信息从单据的文本文件中读取出全部所需数据,并存储至临时数据库,等待进ー步处理。 更为具体地,步骤S2例如包括步骤S21,获取所述单据的类型标识;步骤S22,根据所述类型标识查找并调用与所述单据相对应的可扩展标记语言xml文件;步骤S23,根据所述xml文件中包含的数据信息从所述单据的文本文件中读取相应数据。步骤S3,获取与所述单据相对应的编辑模板文件,根据所述编辑模板文件中预置的规则对所读取的数据进行编辑;具体地,由于在自动识别及数据读取过程中,通常有一些字符易于产生识别错误,例如将字母“0”识别为数字“O”、将字母“I”识别为数字“ I”等,所以需在读取数据后对所读取的数据进行进ー步的编辑。该编辑步骤主要针对的是日期、金额等比较容易处理的字段,保留编辑前的状态和编辑中修改的记录,在完成整个数据包的录入和编辑后,可通过点击“比较”标识进行比较。还可提供编辑前数据与编辑后数据的比较结果,例如当两者一致(即在编辑过程中未对其进行修正)吋,对该数据以“ V ”标识,当两者不一致(即在编辑过程中对其进行了修正)时,对该数据以“圈叉”标识。与读取模板文件相类似,编辑模板文件(xml文件)也是与单据类型唯一对应、且通过单据类型标识相关联。编辑模板文件中包括对在步骤S2中所读取的数据的进ー步编辑规则,例如“客户编号,I 2位为字母,3 4位为数字”,并设置相应的字母与数字间转换规则“数字‘0’转换为字母‘0’ ”等,通过基于编辑模板文件的进ー步编辑,能够大幅提高所读取的数据的准确性。步骤S4,对编辑后的数据进行核实;步骤S5,对核实无误的数据进行存储,此时数据存储至正式数据库。根据上述实施例的单据数据管理方法,由于首先获取单据的文本文件,自动调取与单据对应的读取模板文件,根据读取模板文件从单据的文本文件中提取所需数据,这种纸张单据的自动处理及数据录入的速度是人工录入的5至10倍,效率极高;而且该方法自动调取与单据对应的编辑模板文件,根据该编辑模板文件对所提取的数据进行进ー步编辑并对编辑后的数据进行核实,能够确保数据获取具有很高的准确率,所以上述实施例的单据数据管理方法既能够自动获取单据数据又能够确保所获取数据的高准确性,即实现了高效、可靠的单据数据管理。进ー步地,在上述实施例的单据数据管理方法中,步骤S4包括步骤S41,对所述单据中的数据进行初步核实,若经核实获知所述数据错误则为所述数据添加错误标识;具体地,根据预置的规则对单据数据的初步核实例如为逻辑核实,即例如核实单张单据中的各项金额之和是否与该张单据的总计金额相等,或例如核实同一客户发来的多张单据的单张金额与所有单据的总额是否相等。若经核实无误,则在该项数据后加以正确标识(例如为“ V”),若经核实有误(例如单张单据中的各项金额之和与该张单据的总计金额不符等),则在该项数据后加以错误标识(例如为“ X ”),并弹跳到人工核实界面。步骤S42,对具有错误标识的数据进行人工核实。根据上述实施例的单据数据管理方法,由于在对数据进行编辑后的数据核实过程中,结合了自动核实和人工核实两种核实方式,并仅当自动核实获知数据错 误时由人工进行核实,所以既能够提高数据核实的效率,又能够确保核实后数据的正确性和有效性,按照上述实施例的核实方式核实后的数据的准确性可达99. 99%。进ー步地,在上述实施例的单据数据管理方法中,还包括步骤S6,获取查询条件,查找所存储的数据中符合所述查询条件的数据并显示。具体地,可以查看已经存入正式数据库的单据信息,并进行分析统计,而且可下载查询或分析统计結果。更为具体地,可根据日期查询、根据单据所在的数据包(客户发送来的原始数据包)查询或根据任意的自定义信息查询从而提高查询的效率。此外,还可以对处理中的单据进行查询,例如查看每天所获取的待处理数据包的处理情况以及处理百分比情況。进ー步地,在上述实施例的单据数据管理方法中,还包括步骤S7,获取所述单据的人工输入数据,将所述人工输入数据与经所述步骤S5核实后的数据进行比较,并生成差异数据报告。具体地,手工录入数据,并将手工录入的数据与自动录入且经编辑的数据进行对比后,对不同的数据、字节自动分类,并生成差异数据报告发送给系统管理员。系统管理员根据报告内容调整数据自动录入、数据编辑及数据核实的控制表,从而提高数据自动录入的准确率。当一种新表格的自动录入准确率达到系统标准后,则可停止手工录入。根据上述实施例的单据数据管理方法,能够根据实际情况不断提高单据自动识别的正确率和效率。本发明还提供ー种单据数据管理系统。图2为本发明单据数据管理系统的结构示意图。如图2所示,该系统包括单据扫描索引子系统10、单据数据自动读取子系统20、单据数据编辑子系统30、单据数据核实子系统40和数据库50。其中,单据扫描索引子系统10用于获取单据的文本文件、与所述单据相对应的读取模板文件和与所述单据相对应的编辑模板文件。具体地,纸张单据经扫描仪扫描处理后,可根据客户约定的设置,生成相应的OCR图像文档;0CR图像文档根据客户单据xml数据提取的要求,加上CSV或xml索引表;把同一客户当天当班扫描好的OCR图像文档和CSV或xml索引表压缩打包。如果这些工作是在客户端完成的,压缩包通过文本传输协议(FTP)上传到FTP服务器。如果这些工作是在该系统公司内部完成的,则将压缩包直接拷贝到图像服务器。单据数据自动读取子系统20,用于根据所述读取模板文件从所述单据的文本文件中读取所需数据并存储至临时数据库;
单 据数据编辑子系统30,用于根据所述编辑模板文件中预置的规则对所读取的数据进行编辑;具体地,可提取存放至临时数据库的单据数据并将其放入迪贝智能数据自动编辑校对引擎处理,合乎要求的单据数据则自动存档并产生相应报告;不合乎要求的单据数据例如弹跳到迪贝安全客户网站,以由客户或签约的数据处理公司处理再存档、产生报告或进行进一歩处理。单据数据核实子系统40,用于对编辑后的数据进行核实,并将核实无误的数据发送至正式数据库;具体地,可包括提交整个数据包,等待核实(如图3所示,图3为单据数据核实子系统中等待核实的显示界面);在导航中点击“数据核实查看”,以查看整个数据包处理状态(如图4所示,图4为单据数据核实子系统中数据核实查看的第一显示界面);点击“查看”按钮,查看子包处理状态(如图5所示,图5为单据数据核实子系统中数据核实查看的第二显示界面);若出现“核实错误”状态的子包,可点击“查看”按钮查看具体的错误,例如为由红色问号标识出现错误具体字段,将鼠标移至红色问号处,便可看到详细的错误内容(如图6所示,图6为单据数据核实子系统中详细错误内容的显示界面);在做完相应修改后,保存,然后再次核实。如果核实仍未通过,继续修改直至通过为止;进行核实操作后,将完全正确的数据存入正式数据库。数据库50,包括临时数据库和正式数据库。根据上述实施例的单据数据管理系统,基于软件暨服务(SAAS)的智能BPO平台和OCR扫描技术将传统的单据手工数据录入升级到单据数据自动扫描录入,利用J2EE和SQL创建的安全网络平台,将客户的单据自动处理归档,并形成相应数据分析报告。具体地,由于首先获取单据的文本文件,自动调取与单据对应的读取模板文件,根据读取模板文件从单据的文本文件中提取所需数据,这种纸张单据的自动处理及数据录入的速度是人工录入的5至10倍,效率极高;而且该单据数据管理系统自动调取与单据对应的编辑模板文件,根据该编辑模板文件对所提取的数据进行进ー步编辑并对编辑后的数据进行核实,能够确保数据获取具有很高的准确率,所以上述实施例的单据数据管理系统既能够自动获取单据数据又能够确保所获取数据的高准确性,即实现了高效、可靠的单据数据管理。进ー步地,在上述实施例的单据数据管理系统中,还包括单据数据手工录入子系统60 (如图2所示),用于手工单据数据录入、手工单据数据比较和手工单据数据核实。图I为单据数据手工录入子系统中手工单据数据录入的显示界面,如图I所示,将单据数据的基本信息录入到父表中,将其详细信息录入到子表中。图8为单据数据手工录入子系统中手工单据数据编辑的显示界面,如图8所示,操作员进入单据数据手工录入子系统查看,在比较之前,可查看录入是否正确,如果出现红色问号标识,则根据单据数据进行相应的更改。
图9为单据数据手工录入子系统中单据数据比较的显示界面,如图9所示,在完成整个数据包的录入和编辑以后,点击“比较”标识进行比较,如果出现红色圈叉标识,则对比数据进行相应的更改。进ー步地,在上述实施例的单据数据管理系统,其特征在于,还包括单据数据搜寻子系统70,用于获取查询条件,查找在所述正式数据库中查找符合所述查询条件的数据并显示。具体地,单据数据搜寻子系统70可进行的查询管理包括上传查询、处理中的单据查询和历史查询。图10为单据数据搜寻子系统70中处理中的单据查询的显示界面。如图10所示,用户登陆系统查看每天发过来的数据包的处理情况以及处理百分比情況。更具体地,历史查询包括日期查询、包查询以及自定义查询。 图11为单据数据搜寻子系统70中日期查询的显示界面。如图11所示,用户输入单个日期(即某天)或者一段时间来进行历史单据的查询。图12为单据数据搜寻子系统70中包查询的显示界面。如图12所示,用户可根据包名来进行查询,如果记不住包名,还可以进行模糊查询。图13为单据数据搜寻子系统70中自定义查询的显示界面。如图13所示,用户可自定义ー些条件来进行自定义查询,这样能够提高查询的效率。进ー步地,在上述实施例的单据数据管理系统中,还包括单据数据智能学习子系统80,用于获取所述单据的人工输入数据,将所述人工输入数据与经所述步骤S5核实后的数据进行比较,并生成差异数据报告。具体地,将单据中处理不了的、需要人工校正的单据数据定时输入单据数据智能学习子系统80中进行分析、归类和报告,然后把需要改正的信息定时反馈给单据数据自动读取子系统20和单据数据编辑子系统30,从而提高自动识别正确率、单据处理速度和效率,并节省人力。进ー步地,在上述实施例的单据数据管理系统中,还包括单据数据报告子系统90,用于根据预定规则和/或预定内容生成报告。具体地,单据数据报告子系统90可即时或定时地通过单据数据自动读取子系统20处理的数据生成不同的报告,也可根据客户的不同需要生成ANSIEDI格式报告、xml格式报告、CSV/XSL格式报告或PDF报告。图14为本发明单据数据管理系统进行单据数据管理的流程图。如图14所示,包括以下步骤步骤SI’,扫描单据纸张;步骤S2’,获取单据图片,并添加条形码;步骤S3’,单据数据自动识别;步骤S4 ’,获取文本文档(TXT文档);步骤S5’,调取读取模板文件,并进行单据数据读取;步骤S6’,将读取的单据数据存储至临时数据库;步骤S7’,调取编辑模板文件,并进行单据数据编辑;步骤S8’,调取核实模板文件,并进行单据数据核实,对于错误数据进行人エ校对核实,对于正确数据生成正确表单;步骤S9’,存储至正式数据库;步骤S10’,对正式数据库中的数据进行查询、分析;步骤SlT,进行智能学习,以提高系统的准确率和效率。
最后应说明的是以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管參照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
权利要求
1.ー种单据数据管理方法,其特征在于,包括 步骤SI,获取单据的文本文件; 步骤S2,获取与所述单据相对应的读取模板文件,根据所述读取模板文件从所述单据的文本文件中读取所需数据; 步骤S3,获取与所述单据相对应的编辑模板文件,根据所述编辑模板文件中预置的规则对所读取的数据进行编辑; 步骤S4,对编辑后的数据进行核实; 步骤S5,对核实无误的数据进行存储。
2.根据权利要求I所述的单据数据管理方法,其特征在于,所述步骤SI具体包括 步骤S11,对所述单据进行扫描,以获取单据图片; 步骤S12,通过光学字符识别OCR将所述单据图片转换为文本文件。
3.根据权利要求I或2所述的单据数据管理方法,其特征在于,所述步骤S2包括 步骤S21,获取所述单据的类型标识; 步骤S22,根据所述类型标识查找并调用与所述单据相对应的可扩展标记语言xml文件; 步骤S23,根据所述xml文件中包含的数据信息从所述单据的文本文件中读取相应数据。
4.根据权利要求I或2所述的单据数据管理方法,其特征在于,所述步骤S4包括 步骤S41,对所述单据中的数据进行初步核实,若经核实获知所述数据错误则为所述数据添加错误标识; 步骤S42,对具有错误标识的数据进行人工核实。
5.根据权利要求I或2所述的单据数据管理方法,其特征在于,还包括 步骤S6,获取查询条件,查找所存储的数据中符合所述查询条件的数据并显示。
6.根据权利要求I或2所述的单据数据管理方法,其特征在于,还包括 步骤S7,获取所述单据的人工输入数据,将所述人工输入数据与经所述步骤S4编辑后的数据进行比较,并生成差异数据报告。
7.ー种单据数据管理系统,其特征在于,包括 单据扫描索引子系统,用于获取单据的文本文件、与所述单据相对应的读取模板文件和与所述单据相对应的编辑模板文件; 单据数据自动读取子系统,用于根据所述读取模板文件从所述单据的文本文件中读取所需数据并存储至临时数据库; 单据数据编辑子系统,用于根据所述编辑模板文件中预置的规则对所读取的数据进行编辑; 单据数据核实子系统,用于对编辑后的数据进行核实,并将核实无误的数据发送至正式数据库; 数据库,包括所述临时数据库和所述正式数据库。
8.根据权利要求7所述的单据数据管理系统,其特征在于,还包括 单据数据手工录入子系统,用于手工单据数据录入、手工单据数据比较和手工单据数据核实。
9.根据权利要求7或8所述的单据数据管理系统,其特征在于,还包括 单据数据搜寻子系统,用于获取查询条件,在所述正式数据库中查找符合所述查询条件的数据并显示。
10.根据权利要求7或8所述的单据数据管理系统,其特征在于,还包括 单据数据智能学习子系统,用于获取所述单据的人工输入数据,将所述人工输入数据与经所述步骤S5核实后的数据进行比较,并生成差异数据报告。
11.根据权利要求7或8所述的单据数据管理系统,其特征在于,还包括 单据数据报告系统,用于根据预定规则和/或预定内容生成报告。
全文摘要
本发明提供单据数据管理方法及系统。本发明的单据数据管理方法包括步骤S1,获取单据的文本文件;步骤S2,获取与所述单据相对应的读取模板文件,根据所述读取模板文件从所述单据的文本文件中读取所需数据;步骤S3,获取与所述单据相对应的编辑模板文件,根据所述编辑模板文件中预置的规则对所读取的数据进行编辑;步骤S4,对编辑后的数据进行核实;步骤S5,对核实无误的数据进行存储。本发明的单据数据管理方法及系统能够提供可靠、高效的单据数据管理。
文档编号G06F17/30GK102654874SQ20111005181
公开日2012年9月5日 申请日期2011年3月2日 优先权日2011年3月2日
发明者吴慧龙, 宋晓东, 陈逎迪, 顾菊林 申请人:吴慧龙, 宋晓东, 陈逎迪, 顾菊林
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1