一种发票数据记录方法

文档序号:6511216阅读:165来源:国知局
一种发票数据记录方法
【专利摘要】本发明涉及一种发票数据记录方法,包括以下步骤:获取发票图像信息,将发票图像信息采集到计算机中;利用matlab软件对发票图像信息进行处理,并且存储数据。本发明节约成本,方便快捷,省时省力。
【专利说明】一种发票数据记录方法
【技术领域】
[0001]本发明涉及票据记录【技术领域】,特别是涉及一种发票数据记录和分类统计预测方法。
【背景技术】
[0002]发票是指一切单位和个人在购销商品、提供劳务或接受劳务、服务以及从事其他经营活动,所提供给对方的收付款的书面证明,是财务收支的法定凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。现在各行各业用到对的发票需要报销,但是对于大型的单位发票进行录入操作非常麻烦,亟需一种方便的发票数据记录方法。

【发明内容】

[0003]本发明所要解决的技术问题是提供一种发票数据记录方法,节约成本,方便快捷,省时省力。
[0004]本发明解决其技术问题所采用的技术方案是:提供一种发票数据记录方法,包括以下步骤:
[0005](I)获取发票图像信息,将发票图像信息采集到计算机中;
[0006](2)利用matlab软件对发票图像信息进行处理,并且存储数据。
[0007]所述步骤(2)包括以下子步骤:
[0008](21)对得到的发票图像信息进行预处理;
[0009](22)采用边缘提取的方式提取发票图像信息,并对发票进行定位;
[0010](23)对定位后的发票进行字符分割和识别;
[0011](24)对识别后的内容进行保存。
[0012]所述步骤(23)包括以下子步骤:
[0013](231)将采集的发票图像定位到一定的区域,将发票图像信息的文字图像区域进行分割;
[0014](232)应用边缘分割的方法将发票上的有用字体进行分割出来,从而分离文字区域中的单个字符;
[0015](233)通过比对识别样本库的方法对单个字符进行识别。
[0016]所述步骤(2)后还包括对部分数据进行求和,当求和的结果大于预设值时通知指定人员的步骤。
[0017]所述步骤(2)后还包括对存储的数据进行svm分类预测的步骤。
[0018]有益效果
[0019]由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明节约成本,方便快捷,省时省力,可以应用到需要大量统一发票信息的单位,具有很好的效果,减轻工作人员的负担。【专利附图】

【附图说明】
[0020]图1是本发明的流程图;
[0021]图2是本发明中步骤(2)的流程图;
[0022]图3是本发明中步骤(23)的流程图。
【具体实施方式】
[0023]下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0024]本发明的实施方式涉及一种发票数据记录方法,如图1所示,包括以下步骤:
[0025]步骤(1),获取发票图像信息,将发票图像信息采集到计算机中;
[0026]步骤(2),利用matlab软件对发票图像信息进行处理,并且存储数据。其中,如图2所示,该步骤还包括以下子步骤:
[0027](21)对得到的发票图像信息进行预处理;
[0028](22)采用边缘提取的方式提取发票图像信息,并对发票进行定位;
[0029](23)对定位后的发票进行字符分割和识别;其中,如图3所示,该步骤还包括以下子步骤:
[0030](231)将采集的发票图像定位到一定的区域,方便后期对这个固定的区域提取有用的信息,将发票图像信息的文字图像区域进行分割;
[0031](232)分离文字区域中的单个字符:应用边缘分割的方法将发票上的有用字体进行分割出来,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘,不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。
[0032](233)对单个字符进行识别:字符的识别的主要应用技术是比对识别样本库,即将所有的字符建立样本库,字符提取后通过比对样本库实现字符的判断,识别过程中可以将产生可信度等中间结果值,给发票录入的人员作为是否应该将识别值作为录入结果的参考依据。
[0033](24)对识别后的内容进行保存。
[0034]其中,步骤(2)后可以对部分数据进行求和,当求和的结果大于预设值时通知指定人员,还可以对存储的数据进行sm分类预测。
[0035]下面以高校的发票录入和分析工作为例阐述本发明,应该理解为,应用到其他行业或者有着类似的观点的操作视为同一个发明。
[0036]首先对发票手动添加一些内容,以高校为例,在发票面值的同一行上添加学院,比如信息,材料,人文,等等,还有发票的用处,比如资料,科研,交通等,这些文字要预先设定在matlab的图像处理识别信息库里面,供在后期识别过程中应用。然后用摄像机或者电脑上带有的摄像头拍摄发票,并且拍摄时需要将学院信息,发票用处等信息全部获取,将拍摄的图片保存为图片格式。启动matlab下设定好的GUI界面,对存贮的图像进行相应的处理,包括预处理、边缘提取、发票定位、字符分割、字符识别,其中字符识别包括正确地分割文字图像区域;正确的分离单个文字;正确识别单个字符。此刻识别出了发票的面值,学院,和用处。通过软件的程序调用识别的内容并且将其保存到指定的EXCEL或者文本文档或者.mat文件中。存储完数据后可以用软件按照学院对发票的面值求和,当某个学院的额度达到了预定值时候,可以利用matlab的通信工具箱进行发送邮件的处理操作,将发送警告到制定实现设置好的邮件。存储完数据后还可以对发票的用处进行分类操作,并且可以用sm的方法进行分类预测,并且相应的分析哪些用处占据相应多少比例,对以后制定发票的预定值具有一定的参考价值。
【权利要求】
1.一种发票数据记录方法,其特征在于,包括以下步骤: (1)获取发票图像信息,将发票图像信息采集到计算机中; (2)利用matlab软件对发票图像信息进行处理,并且存储数据。
2.根据权利要求1所述的发票数据记录方法,其特征在于,所述步骤(2)包括以下子步骤: (21)对得到的发票图像信息进行预处理; (22)采用边缘提取的方式提取发票图像信息,并对发票进行定位; (23)对定位后的发票进行字符分割和识别; (24)对识别后的内容进行保存。
3.根据权利要求2所述的发票数据记录方法,其特征在于,所述步骤(23)包括以下子步骤: (231)将采集的发票图像定位到一定的区域,将发票图像信息的文字图像区域进行分割; (232)应用边缘分割的方法将发票上的有用字体进行分割出来,从而分离文字区域中的单个字符; (233)通过比对识别样本库的方法对单个字符进行识别。
4.根据权利要求1所述的发票数据记录方法,其特征在于,所述步骤(2)后还包括对部分数据进行求和,当求和的结果大于预设值时通知指定人员的步骤。
5.根据权利要求1所述的发票数据记录方法,其特征在于,所述步骤(2)后还包括对存储的数据进行svm分类预测的步骤。
【文档编号】G06K9/62GK103488999SQ201310413333
【公开日】2014年1月1日 申请日期:2013年9月11日 优先权日:2013年9月11日
【发明者】安俊峰, 龚涛, 卢萌萌 申请人:东华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1