一种数据处理方法及数据处理系统的制作方法

文档序号:9489711阅读:225来源:国知局
一种数据处理方法及数据处理系统的制作方法
【技术领域】
[0001]本发明涉及计算机技术领域,尤其涉及一种数据处理方法及数据处理系统。
【背景技术】
[0002]目前进行票据整理一般是通过用户手动操作完成。例如第一种情形:用户A在超市购买完物品后,需要将购物明细输入电脑或其他电子设备中以便进行日常记账管理,或者例如第二种情形:公司的财务人员B需要对员工C的报销单据进行整理记账,以便进行财务核算。
[0003]以第二种情形来说,目前一般的操作流程是:财务人员B对员工C递交的报销单据进行分类整理,再针对每张报销单据将该单据中需要录入的关键项目手动录入财务系统,例如需要对发票号码、货物名称、单价、金额等项目进行手动录入,然而,财务人员B在进行识别和录入的过程中,由于为单人的手动操作,很容易出现差错,尤其是对于金额或其它数字类项目时,出现差错的几率更大,同时,一般会耗费较多的时间,工作效率较低,如果再通过另一财务人员(例如财务人员W)进行复核的话,无疑更加大了总的工作量,从而也会增加对人力资源的消耗,提高了公司的人力成本。
[0004]可见,在现有技术中,对于票据信息的识别和记录一般都是通过用户手动完成,效率较低且工作量大,并且对于一些特定信息(例如数字类信息)的处理时的差错率也较高,用户使用起来较为不便。

【发明内容】

[0005]本发明实施例提供一种数据处理方法及数据处理系统,用于解决对票据信息进行手动处理而导致的效率较低且工作量较大的技术问题。
[0006]一方面,提供一种数据处理方法,包括:
[0007]获得与第一纸质单据对应的第一纸质单据图像;其中,所述第一纸质单据中包括Μ个数据要素,Μ为正整数;
[0008]基于所述第一纸质单据图像,从所述Μ个数据要素中确定Ν个数据要素,Ν为小于等于Μ的正整数;
[0009]保存所述Ν个数据要素。
[0010]另一方面,提供一种数据处理系统,包括:
[0011]获得模块,用户获得与第一纸质单据对应的第一纸质单据图像;其中,所述第一纸质单据中包括Μ个数据要素,Μ为正整数;
[0012]确定模块,用于基于所述第一纸质单据图像,从所述Μ个数据要素中确定Ν个数据要素,Ν为小于等于Μ的正整数;
[0013]存储模块,用户保存所述Ν个数据要素。
[0014]本发明实施例中,可以直接获得与第一纸质单据对应的第一纸质单据图像,进而再根据第一纸质单据图像获得Ν个数据要素并将其进行保存,也就是说,本发明实施例中,可以实现设备对N个数据要素的自动识别并录入,这样可以在较大程度上节约用户的手动操作,从而可以减小工作量,提高工作效率。同时,通过设备的自动识别,结合一些特定的高精度识别算法,可以在较大程度上降低由于人工操作所带来的差错,降低出错概率,进一步地提高效率。
【附图说明】
[0015]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0016]图1为本发明实施例中数据处理方法的流程图;
[0017]图2为本发明实施例中第一纸质单据为增值税发票的示意图;
[0018]图3为本发明实施例中包括4张纸质单据图像的纸张图像的示意图;
[0019]图4为本发明实施例中当第二数据要素存在模糊情况的示意图;
[0020]图5为本发明实施例中数据处理系统的框图。
【具体实施方式】
[0021]本发明提供一种数据处理方法及数据处理系统,用于解决对票据信息进行手动处理而导致的效率较低且工作量较大的技术问题,实现了提高工作效率和降低差错率的技术效果。
[0022]本发明实施例的数据处理方法,包括:获得与第一纸质单据对应的第一纸质单据图像;其中,所述第一纸质单据中包括Μ个数据要素,Μ为正整数;基于所述第一纸质单据图像,从所述Μ个数据要素中确定Ν个数据要素,Ν为小于等于Μ的正整数;保存所述Ν个数据要素。
[0023]所以,通过本发明实施例中的方案,可以实现设备对Ν个数据要素的自动识别并录入,这样可以在较大程度上节约用户的手动操作,从而可以减小工作量,提高工作效率。同时,通过设备的自动识别,结合一些特定的高精度识别算法,可以在较大程度上降低由于人工操作所带来的差错,降低出错概率,进一步地提高效率。
[0024]为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0025]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,Α和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
[0026]为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0027]请参见图1,本发明实施例提供一种数据处理方法,该方法的流程描述如下。
[0028]步骤101:获得与第一纸质单据对应的第一纸质单据图像;其中,第一纸质单据中包括Μ个数据要素,Μ为正整数。
[0029]具体来说,第一纸质单据例如是指发票,例如普通发票或增值税发票,或者,第一纸质单据也可以是指收据,例如超市购物小票或收款收据等其他票据。
[0030]其中,第一纸质单据图像可以是指与第一纸质单据对应的电子图像。例如,可以对第一纸质单据进行扫描以获得第一纸质单据的扫描件,那么该扫描件便可以认为是第一纸质单据图像,或者例如,可以直接对第一纸质单据进行拍照,那么通过拍照获得的第一纸质单据的照片便可以认为是第一纸质单据图像。
[0031]例如,请参见图2,第一纸质单据为增值税发票,那么数据要素例如可以是指发票号码、发票代码、购买方名称、销售方名称、纳税人识别号、地址、电话、开户行及账号、规格型号、单位、数量、单价、金额、税率、税额、价税合计等等元素。
[0032]在具体实施过程中,可以通过多种方式获得与第一纸质单据对应的第一纸质单据图像,为了便于阅读者理解,以下列举几种方式进行举例说明。
[0033]第一种方式:
[0034]可选的,本发明另一实施例中,获得与第一纸质单据对应的第一纸质单据图像,包括:
[0035]获得包括至少一张纸质单据图像的纸张图像;其中,至少一张纸质单据图像分别为与至少一张纸质单据对应的图像;
[0036]通过边缘检测方式对纸张图像进行分割识别,以分别获得独立的至少一张纸质单据图像;
[0037]将至少一张纸质单据图像中的任意一张纸质单据图像作为第一纸质单据图像。
[0038]在具体实施过程中,如果用户需要将一张或多张同种类或不同种类的纸质单据上的信息进行处理时,可以将至少一张纸质单据以一版进行扫描而获得包含至少一张纸质单据图像的纸质图像(即电子图像),或者用户也可以将至少一张纸质单据拍摄于一张照片中,那么包含至少一张纸质单据图像的照片即为本发明实施例中的纸张图像。
[0039]以至少一张纸质单据具体为4张纸质单据为例,请参见图3,获得的包括上述4张纸质单据图像的纸质图像为矩形300所表示的图像,而其中的矩形301、矩形302、矩形303和矩形304则表示上述4张纸质单据图像。
[0040]由于多张纸质单据图像之间,以及纸质单据图像与纸张图像的背景之间一般存在较为明显的差别,所以,在获得包括至少一张纸质单据的纸张图像之后,可以通过边缘检测对纸张图像进行处理以便从该纸张图像中获得分别独立的至少一张纸质单据图像。
[0041]其中,边缘检测是图像处理领域中的一种较为实用的图像处理技术,图像的边缘是图像的最基本特征,而所谓边缘,是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合,或者也可以是指图像局部亮度变化最显著的部分,边缘广泛存在与物体与背景之间、物体与物体之间,边缘是图像分割、纹理特征提取和形状特征提取等图像分析的重要基础。
[0042]边缘检测算法的种类较多,在具体实施过程中,例如可以采用Sobel算子算法、Laplacian算子算法、Roberts算子算法、Prewitt算子算法、Krisch算子算法或拉普拉斯算子算法等边缘检测算法中的任意一种来对纸张图像进行边缘识别并进行分割识别,本发明实施例对具体采用的边缘检测算法种类不做限制,只要其能够对纸
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1