一种数据处理方法及数据处理系统的制作方法_3

文档序号:9489711阅读:来源:国知局
扫描仪设置不当,或者由于纸质单据本身存在不清晰的情况,都可能会导致在对数据要素识别的过程中存在识别精准度较低的情形,以第二数据要素为例来说,即,可能存在电子设备对识别结果不确定的情形。
[0085]例如,请参见图4,假设第二数据要素为收货人电话,S卩:13388954166,然而,由于第一纸质单据由于被雨水浸湿过所以导致电话号码第3位的“3”和第10位的“6”存在不同程度的模糊,那么,电子设备在对其进行识别的过程中,对“3”识别的精准度假设为0.6,表明该数字有60%的可能为3,对“6”识别的精准度假设为0.7,表明该数字有70%的可能为6,而预定精准度为0.9,此时,表明对“3”和“6”的识别的精准度均低于预定精准度,表明电子设备对其识别结果存在不确定的情形。
[0086]此时,电子设备可以先将与该电话号码(即第二数据要素)对应的图像(即要素图像)进行输出,例如直接显示在电子设备的显示屏幕上,或者直接将其发送到预定人员的手机上,并在第一预定时间内(例如1分钟)检测是否接收到第二输入操作,如果此时用户就在电子设备的旁边,可以很快对图像通过人眼识别来确定最终的识别结果,后者在用户不确定的时候,可以向第一纸质单据的提供者进行询问,在用户人工确定了识别结果之后,便可以通过第二输入操作来对第二数据要素中不确定的部分进行人工识别,即,在本发明实施例中,在电子设备识别到不确定的数据要素时,可以为用户提供人工干预的方式进行的识别和确认,增强了设备与用户之间的交互功能。
[0087]可选的,本发明另一实施例中,在判断在第一预定时间内是否接收第二输入操作之后,所述方法还包括:
[0088]若确定在第一预定时间内未接收到第二输入操作,则输出用于提醒用户对第二数据要素进行人工识别的提醒信息;
[0089]判断在第二预定时长内是否接收第二输入操作;其中,第二预定时长以提醒信息的输出时刻为起始时刻;
[0090]若确定在第二预定时长内未接收到第二输入操作,则将精准度低于预定精准度的第二数据要素作为N个数据要素中的一个,或,则将对第二数据要素的识别结果以预定标识代替并将预定标识作为N个数据要素中的一个,预定标识为用于表明对第二数据要素识别的精准度低于所述预定精准度。
[0091]进一步地,若确定在第一预定时间内未接收到第二输入操作,贝表明用户可能不在电子设备旁边,无法及时对识别结果进行确认或纠正,那么,此时电子设备可以发出例如语音播报或音频提示等类型的提醒信息,以吸引用户的注意力,便于用户及时确定识别结果或进行一些对应处理。
[0092]另外,在具体实施过程中,为了尽量控制对第二数据要素的识别时间以提高效率,电子设备可以为用户手动进行确认的时间预留第二预定时长,即,若在第二预定时长内检测到了第二输入操作,便按照用户的操作来完成对第二数据要素的识别,若在第二预定时长内未检测到第二输入操作,为了节约时间,设备可以采用对应的解决措施。
[0093]例如,在即使识别的精准度不满足要求的情形下,还是可以直接按照识别的结果确定第二数据要素。当然,在具体实施过程中,还可以先判断识别出的精准度是否高于一预定精度准阈值。继续以上述例子为例,假设预定精度准阈值为0.5,虽然对“6”识别的精准度为0.7,低于0.9,但是却高于0.5,便可以直接将识别的最终结果确定为就是7。
[0094]或者例如,电子设备在不确定的情况下,为了尽量提高准确性,电子设备可以以预定标识来代替第一预定要素,例如以“***”代替,这样,当用户后续在进行查看时便可以直接查看到,便于后期再次手动进行纠错调整,以保证整个识别过程的准确性,尽量降低出错的概率。
[0095]步骤103:保存N个数据要素。
[0096]在确定N个数据要素之后,电子设备可以将其进行保存,以便后续对其直接进行调用,或者方便用户后续直接对其查看,等等,对于N个数据要素的使用,此处就不一一进行举例说明了。
[0097]本发明实施例中,可以直接获得与第一纸质单据对应的第一纸质单据图像,进而再根据第一纸质单据图像获得N个数据要素并将其进行保存,也就是说,本发明实施例中,可以实现设备对N个数据要素的自动识别并录入,这样可以在较大程度上节约用户的手动操作,从而可以减小工作量,提高工作效率。同时,通过设备的自动识别,结合一些特定的高精度识别算法,可以在较大程度上降低由于人工操作所带来的差错,降低出错概率,进一步地提高效率。
[0098]请参见图5,基于同一发明构思,本发明实施例提供一种数据处理系统,该数据处理系统包括获得模块501、确定模块502和存储模块503。
[0099]获得模块501,用户获得与第一纸质单据对应的第一纸质单据图像;其中,第一纸质单据中包括Μ个数据要素,Μ为正整数;
[0100]确定模块502,用于基于第一纸质单据图像,从Μ个数据要素中确定Ν个数据要素,Ν为小于等于Μ的正整数;
[0101]存储模块503,用户保存Ν个数据要素。
[0102]可选的,本发明另一实施例中,获得模块501用于:
[0103]获得包括至少一张纸质单据图像的纸张图像;其中,至少一张纸质单据图像分别为与至少一张纸质单据对应的图像;
[0104]通过边缘检测方式对纸张图像进行分割识别,以分别获得独立的至少一张纸质单据图像;
[0105]将至少一张纸质单据图像中的任意一张纸质单据图像作为第一纸质单据图像。
[0106]可选的,本发明另一实施例中,获得模块501用于:
[0107]接收用户的第一输入操作;其中,第一输入操作用于输入第一纸质单据图像;
[0108]根据第一输入操作,获得第一纸质单据图像。
[0109]可选的,本发明另一实施例中,获得模块501用于:
[0110]控制图像采集单元采集获得与第一纸质单据对应的第一纸质单据图像。
[0111]可选的,本发明另一实施例中,确定模块502用于:
[0112]确定第一纸质单据的单据类型;
[0113]根据单据类型,确定针对第一纸质单据图像需要采集的要素采集项目集;
[0114]通过对第一纸质单据图像中的文字进行识别,从Μ个数据要素中确定属于要素采集项目集的Ν个数据要素。
[0115]可选的,本发明另一实施例中,确定模块502用于根据单据类型,确定针对第一纸质单据图像需要采集的要素采集项目集,具体为:
[0116]调用与单据类型对应的要素采集模板;
[0117]根据要素采集模板,确定针对第一纸质单据图像需要采集的要素采集项目集。
[0118]可选的,本发明另一实施例中,确定模块502用于从Μ个数据要素中确定属于要素采集项目集的Ν个数据要素,具体为:
[0119]若确定第一数据要素与第一要素采集项目匹配且第一要素采集项目对应为数字型要素采集项目,判断第一数据要素包含的小数位数是否与第一要素采集项目所对应的小数位数相等;其中,第一数据要素为Μ个数据要素中的任意一个,第一要素采集项目为要素采集项目集中的一个;
[0120]若相等,则将第一数据要素确定为Ν个数据要素中的一个
[0121]可选的,本发明另一实施例中,确定模块502用于从Μ个数据要素中确定属于要素采集项目集的Ν个数据要素,具体为:
[0122]若确定第二数据要素识别的精准度低于预定精准度,则输出与第二数据要素对应的要素图像,并判断在第一预定时间内是否接收第二输入操作;其中,第二数据要素为Μ个数据要素中的任意一个,第二输入操作为用户进行的、用于根据与要素图像对第二数据要素进行人工识别的操作,第一预定时长以输出要素图像的时刻为起始时刻;
[0123]若确定在第一预定时间内接收到第二输入操作,则根据第二输入操作,将通过人工识别的第二数据要素作为Ν个数据要素中的一个。
[0124]可选的,本发明另一实施例中,数据处理系统还包括输出模块、判断模块和处理模块:
[0125]输出模块,用于在确定模块用于判断在第一预定时间内是否接受第二输入操作之后,若确定在第一预定时间内未接收到第二输入操作,则输出用于提醒所述用户对第二数据要素进行人工识别的提醒信息;
[0126]判断模块,用于判断在第二预定时长内是否接收第二输入操作;其中,第二预定时长以提醒信息的输出时刻为起始时刻;
[0127]处理模块,用于若确定在第二预定时长内未接收到第二输入操作,则将精准度低于预定精准度的第二数据要素作为Ν个数据要素中的一个,或,则将对第二数据要素的识别结果以预定标识代替并将预定标识作为Ν个数据要素中的一个,预定标识为用于表明对第二数据要素识别的精准度低于预定精准度
[0128]由于本发明实施例中的数据处理系统与上述数据处理解决问题的原理相似,因此本发明实施例中数据处理系统的实施可以参见上述数据处理方法的实施,在此不再赘述。
[0129]本发明实施例中,可以直接获得与第一纸质单据对应的第一纸质单据图像,进而再根据第一纸质单据图像获得Ν个数据要素并将其进行保存,也就是说,本发明实施例中,可以实现
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1