本发明涉及计算机图形处理技术,具体涉及一种自动识别并裁切扫描件中票据的方法。
背景技术:
当前许多对票据的处理,都是根据票据的扫描影像件来进行的,因为业务方面的需求和财务人员日常的习惯,人们在进行票据记账报销的时候,往往会把许多票据混合且无规律的贴到一张或多张a4纸大小的纸张上,然后对这些粘贴票据的纸张进行扫描,接着对这些扫描件进行进一步的处理。
传统技术中,对于这些票据扫描件的处理都是靠人工进行框选,然后进行裁切,这样就增加了处理周期时间,效率低下,也增加了人力、物力投入成本。
技术实现要素:
本发明所要解决的技术问题是:提出一种自动识别并裁切扫描件中票据的方法,解决传统技术中对票据扫描件采用人工处理方式带来的效率低下,增加人力、物力投入成本的问题。
本发明解决其技术问题所采用的技术方案是:
一种自动识别并裁切扫描件中票据的方法,包括以下步骤:
a.对票据扫描件进行预处理;
b.探测票据扫描件中的票据图像的边缘;
c.根据探测的票据图像的边缘从扫描件中裁切票据;
步骤a、步骤b及步骤c均为自动化处理步骤。
作为进一步优化,步骤a中,所述预处理包括:去噪、二值化、内容线条化、线条膨胀处理;
其中,去噪处理包括对图片进行双边滤波和中值滤波,去除噪声;
二值化处理为获取图片的灰度图内容后,根据设定的阈值对灰度图进行二值化处理;
内容线条化处理为采用canny算法对图片进行线条化轮廓处理;
线条膨胀处理为对当前的轮廓线条进行膨胀处理,使得当前线条更加连贯和清晰。
作为进一步优化,步骤b中,所述探测票据扫描件中的票据图像的边缘,具体包括:
提取票据图像中所有存在的连续轮廓集合,然后从该集合中移除过小和过大的轮廓,接着移除被其它轮廓完全包含的内部轮廓,集合中剩下的就是票据轮廓,之后对这些票据轮廓进行矩形逼近处理,得到所有票据的矩形轮廓。
作为进一步优化,所述票据扫描件为将票据贴到彩色a4纸上进行扫描后获得的扫描件。
本发明的有益效果是:
通过对票据扫描件中的票据图像自动识别和裁切,减小人工干预,不仅可以提高处理效率,还可以降低人力、物力投入成本,同时减小出错几率。
具体实施方式
本发明旨在提出一种自动识别并裁切扫描件中票据的方法,解决传统技术中对票据扫描件采用人工处理方式带来的效率低下,增加人力、物力投入成本的问题。
本发明中的自动识别并裁切扫描件中票据的方法,包括以下实现步骤:
1、对票据扫描件进行预处理;
在具体实现上,本步骤中,为了减小或消除噪声干扰,提高识别几率,采用去噪、二值化、内容线条化、线条膨胀处理的手段对票据扫描件进行预处理;
其中去噪处理包括对图片进行双边滤波和中值滤波,去除噪声;
二值化处理为获取图片的灰度图内容后,根据设定的阈值对灰度图进行二值化处理;
内容线条化处理为采用canny算法对图片进行线条化轮廓处理;
线条膨胀处理为对当前的轮廓线条进行膨胀处理,使得当前线条更加连贯和清晰。
需要说明的是,如果把实体票据贴到彩色a4纸上进行扫描,得到的票据扫描件背景色和票据内容差异更大,这样能大大提高票据识别和裁切的正确率。
2、探测票据扫描件中的票据图像的边缘;
在具体实现上,本步骤中,对扫描件中票据边缘探测,提取所有存在的连续轮廓集合,然后从该集合中移除过小和过大的轮廓,接着移除被其它轮廓完全包含的内部轮廓,集合中剩下的就是票据轮廓,左后对这些票据轮廓进行矩形逼近处理,得到所有票据的矩形轮廓,以便下一步进行裁切处理。
3、根据探测的票据图像的边缘从扫描件中裁切票据;
在具体实现上,本步骤中,根据探测出的票据矩形轮廓,对扫描件内容进行裁切,最终得到裁切好的票据图片。