一种数据处理方法及数据处理系统的制作方法_4

文档序号:9489711阅读:来源:国知局
设备对Ν个数据要素的自动识别并录入,这样可以在较大程度上节约用户的手动操作,从而可以减小工作量,提高工作效率。同时,通过设备的自动识别,结合一些特定的高精度识别算法,可以在较大程度上降低由于人工操作所带来的差错,降低出错概率,进一步地提高效率。
[0130]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种数据处理方法,其特征在于,包括: 获得与第一纸质单据对应的第一纸质单据图像;其中,所述第一纸质单据中包括Μ个数据要素,Μ为正整数; 基于所述第一纸质单据图像,从所述Μ个数据要素中确定Ν个数据要素,Ν为小于等于Μ的正整数; 保存所述Ν个数据要素。2.如权利要求1所述的方法,其特征在于,获得与第一纸质单据对应的第一纸质单据图像,包括: 获得包括至少一张纸质单据图像的纸张图像;其中,所述至少一张纸质单据图像分别为与至少一张纸质单据对应的图像; 通过边缘检测方式对所述纸张图像进行分割识别,以分别获得独立的所述至少一张纸质单据图像; 将所述至少一张纸质单据图像中的任意一张纸质单据图像作为所述第一纸质单据图像。3.如权利要求1所述的方法,其特征在于,获得与第一纸质单据对应的第一纸质单据图像,包括: 接收用户的第一输入操作;其中,所述第一输入操作用于输入所述第一纸质单据图像; 根据所述第一输入操作,获得所述第一纸质单据图像。4.如权利要求1所述的方法,其特征在于,获得与第一纸质单据对应的第一纸质单据图像,包括: 控制图像采集单元采集获得与所述第一纸质单据对应的所述第一纸质单据图像。5.如权利要求1-4中任一权项所述的方法,其特征在于,基于所述第一纸质单据图像,从所述Μ个数据要素中确定Ν个数据要素,包括: 确定所述第一纸质单据的单据类型; 根据所述单据类型,确定针对所述第一纸质单据图像需要采集的要素采集项目集;通过对所述第一纸质单据图像中的文字进行识别,从所述Μ个数据要素中确定属于所述要素采集项目集的所述Ν个数据要素。6.如权利要求5所述的方法,其特征在于,根据所述单据类型,确定针对所述第一纸质单据图像需要采集的要素采集项目集,包括: 调用与所述单据类型对应的要素采集模板; 根据所述要素采集模板,确定针对所述第一纸质单据图像需要采集的所述要素采集项目集。7.如权利要求5所述的方法,其特征在于,从所述Μ个数据要素中确定属于所述要素采集项目集的所述Ν个数据要素,包括: 若确定第一数据要素与第一要素采集项目匹配且所述第一要素采集项目对应为数字型要素采集项目,判断所述第一数据要素包含的小数位数是否与所述第一要素采集项目所对应的小数位数相等;其中,所述第一数据要素为所述Μ个数据要素中的任意一个,所述第一要素采集项目为所述要素采集项目集中的一个; 若相等,则将所述第一数据要素确定为所述N个数据要素中的一个。8.如权利要求5所述的方法,其特征在于,从所述Μ个数据要素中确定属于所述要素采集项目集的所述Ν个数据要素,包括: 若确定第二数据要素识别的精准度低于预定精准度,则输出与所述第二数据要素对应的要素图像,并判断在第一预定时间内是否接收第二输入操作;其中,所述第二数据要素为所述Μ个数据要素中的任意一个,所述第二输入操作为用户进行的、用于根据与所述要素图像对所述第二数据要素进行人工识别的操作,所述第一预定时长以输出所述要素图像的时刻为起始时刻; 若确定在所述第一预定时间内接收到所述第二输入操作,则根据所述第二输入操作,将通过人工识别的所述第二数据要素作为所述Ν个数据要素中的一个。9.如权利要求8所述的方法,其特征在于,在判断在第一预定时间内是否接收第二输入操作之后,所述方法还包括: 若确定在所述第一预定时间内未接收到所述第二输入操作,则输出用于提醒所述用户对所述第二数据要素进行人工识别的提醒信息; 判断在第二预定时长内是否接收所述第二输入操作;其中,所述第二预定时长以所述提醒信息的输出时刻为起始时刻; 若确定在所述第二预定时长内未接收到所述第二输入操作,则将精准度低于所述预定精准度的所述第二数据要素作为所述Ν个数据要素中的一个,或,则将对所述第二数据要素的识别结果以预定标识代替并将所述预定标识作为所述Ν个数据要素中的一个,所述预定标识为用于表明对所述第二数据要素识别的精准度低于所述预定精准度。10.一种数据处理系统,其特征在于,包括: 获得模块,用户获得与第一纸质单据对应的第一纸质单据图像;其中,所述第一纸质单据中包括Μ个数据要素,Μ为正整数; 确定模块,用于基于所述第一纸质单据图像,从所述Μ个数据要素中确定Ν个数据要素,Ν为小于等于Μ的正整数; 存储模块,用户保存所述Ν个数据要素。11.如权利要求10所述的系统,其特征在于,所述获得模块用于: 获得包括至少一张纸质单据图像的纸张图像;其中,所述至少一张纸质单据图像分别为与至少一张纸质单据对应的图像; 通过边缘检测方式对所述纸张图像进行分割识别,以分别获得独立的所述至少一张纸质单据图像; 将所述至少一张纸质单据图像中的任意一张纸质单据图像作为所述第一纸质单据图像。12.如权利要求10所述的系统,其特征在于,所述获得模块用于: 接收用户的第一输入操作;其中,所述第一输入操作用于输入所述第一纸质单据图像; 根据所述第一输入操作,获得所述第一纸质单据图像。13.如权利要求10所述的系统,其特征在于,所述获得模块用于: 控制图像采集单元采集获得与所述第一纸质单据对应的所述第一纸质单据图像。14.如权利要求10-13中任一权项所述的系统,其特征在于,所述确定模块用于: 确定所述第一纸质单据的单据类型; 根据所述单据类型,确定针对所述第一纸质单据图像需要采集的要素采集项目集; 通过对所述第一纸质单据图像中的文字进行识别,从所述Μ个数据要素中确定属于所述要素采集项目集的所述Ν个数据要素。15.如权利要求14所述的系统,其特征在于,所述确定模块用于根据所述单据类型,确定针对所述第一纸质单据图像需要采集的要素采集项目集,具体为: 调用与所述单据类型对应的要素采集模板; 根据所述要素采集模板,确定针对所述第一纸质单据图像需要采集的所述要素采集项目集。16.如权利要求14所述的系统,其特征在于,所述确定模块用于从所述Μ个数据要素中确定属于所述要素采集项目集的所述Ν个数据要素,具体为: 若确定第一数据要素与第一要素采集项目匹配且所述第一要素采集项目对应为数字型要素采集项目,判断所述第一数据要素包含的小数位数是否与所述第一要素采集项目所对应的小数位数相等;其中,所述第一数据要素为所述Μ个数据要素中的任意一个,所述第一要素采集项目为所述要素采集项目集中的一个; 若相等,则将所述第一数据要素确定为所述Ν个数据要素中的一个。17.如权利要求14所述的系统,其特征在于,所述确定模块用于从所述Μ个数据要素中确定属于所述要素采集项目集的所述Ν个数据要素,具体为: 若确定第二数据要素识别的精准度低于预定精准度,则输出与所述第二数据要素对应的要素图像,并判断在第一预定时间内是否接收第二输入操作;其中,所述第二数据要素为所述Μ个数据要素中的任意一个,所述第二输入操作为用户进行的、用于根据与所述要素图像对所述第二数据要素进行人工识别的操作,所述第一预定时长以输出所述要素图像的时刻为起始时刻; 若确定在所述第一预定时间内接收到所述第二输入操作,则根据所述第二输入操作,将通过人工识别的所述第二数据要素作为所述Ν个数据要素中的一个。18.如权利要求17所述的系统,其特征在于,所述系统还包括输出模块、判断模块和处理模块: 所述输出模块,用于在所述确定模块用于判断在第一预定时间内是否接受第二输入操作之后,若确定在所述第一预定时间内未接收到所述第二输入操作,则输出用于提醒所述用户对所述第二数据要素进行人工识别的提醒信息; 所述判断模块,用于判断在第二预定时长内是否接收所述第二输入操作;其中,所述第二预定时长以所述提醒信息的输出时刻为起始时刻; 所述处理模块,用于若确定在所述第二预定时长内未接收到所述第二输入操作,则将精准度低于所述预定精准度的所述第二数据要素作为所述Ν个数据要素中的一个,或,则将对所述第二数据要素的识别结果以预定标识代替并将所述预定标识作为所述Ν个数据要素中的一个,所述预定标识为用于表明对所述第二数据要素识别的精准度低于所述预定精准度。
【专利摘要】本发明公开了一种数据处理方法及数据处理系统,用于解决对票据信息进行手动处理而导致的效率较低且工作量较大的技术问题。所述方法包括:获得与第一纸质单据对应的第一纸质单据图像;其中,所述第一纸质单据中包括M个数据要素,M为正整数;基于所述第一纸质单据图像,从所述M个数据要素中确定N个数据要素,N为小于等于M的正整数;保存所述N个数据要素。
【IPC分类】G06F17/24, G06K9/00
【公开号】CN105243365
【申请号】CN201510627351
【发明人】胡嘉, 赵欣
【申请人】四川长虹电器股份有限公司
【公开日】2016年1月13日
【申请日】2015年9月28日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1