电子装置、发票分类的方法及计算机可读存储介质与流程

文档序号:12035712阅读:460来源:国知局
电子装置、发票分类的方法及计算机可读存储介质与流程
本发明涉及通信
技术领域
,尤其涉及一种电子装置、发票分类的方法及计算机可读存储介质。
背景技术
:目前,对于需要进行集中式财务数据处理的操作,例如,寿险理赔、员工费用报销等,在对批量上传的发票图片进行集中业务处理之前,通常需要人工方式预先对发票图片进行角度矫正及对发票图片进行分类,以供进行集中业务处理,集中业务处理包括进行发票核算、发票信息录入等等,现有的采用人工方式对批量上传的发票图片进行角度矫正和分类的方案费时费力,效率低下。技术实现要素:本发明的目的在于提供一种电子装置、发票分类的方法及计算机可读存储介质,旨在快速对批量的发票图片进行角度矫正和分类,提高处理效率。为实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的识别系统,所述识别系统被所述处理器执行时实现如下步骤:s1,在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正;s2,利用预先训练生成的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果;所述预先确定的矫正规则包括:利用霍夫变换hough的概率算法分离出所述发票图片中小于等于第一预设长度的短直线段;基于各分离出的短直线段的x坐标或y坐标将各分离出的短直线段分成若干类;将属于同一类的短直线段作为一个目标类直线,并利用最小二乘法获取与各个目标类直线相似的长直线段;计算各个长直线段的斜率,以及各个长直线段的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小以确定出较小者,并根据确定出的较小者调整发票图片的倾角。优选地,所述发票图片识别模型为深度卷积神经网络模型,所述深度卷积神经网络模型包括目标检测算法。优选地,所述识别系统被所述处理器执行时,还实现如下步骤:为每一预设的发票图片类别分别准备第一预设数量的标注有对应的类别的发票图片样本,将所述发票图片样本分为第一比例的训练子集和第二比例的验证子集;获取每一预设的发票图片类别对应的第二预设数量证件图片样本,将所述证件图片样本分为第一比例的训练子集和第二比例的验证子集;将所有训练子集中的图片样本进行混合以得到训练集,将所有验证子集中的图片样本进行混合以得到验证集;利用所述训练集训练所述深度卷积神经网络模型;利用所述验证集验证训练后的深度卷积神经网络模型的准确率;若所述准确率大于或者等于预设准确率,则训练结束,以训练后的深度卷积神经网络模型作为所述步骤s2中的发票图片识别模型,或者,若所述准确率小于预设准确率,则增加每一预设的发票图片类别对应的证件图片样本的数量,以重新进行训练。优选地,所述识别系统被所述处理器执行时,还实现如下步骤:在训练所述深度卷积神经网络模型前,分析训练集的图片样本及验证集的图片样本的标注信息,将标注信息错误的图片样本进行清理;根据发票图片的高宽比信息以及印章的位置分析清理后剩余的图片样本的转置情况,并对发生转置的进行翻转调整。为实现上述目的,本发明还提供一种发票分类的方法,所述发票分类的方法包括:s1,在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正;s2,利用预先训练生成的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果;所述预先确定的矫正规则包括:利用霍夫变换hough的概率算法分离出所述发票图片中小于等于第一预设长度的短直线段;基于各分离出的短直线段的x坐标或y坐标将各分离出的短直线段分成若干类;将属于同一类的短直线段作为一个目标类直线,并利用最小二乘法获取与各个目标类直线相似的长直线段;计算各个长直线段的斜率,以及各个长直线段的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小以确定出较小者,并根据确定出的较小者调整发票图片的倾角。优选地,所述发票图片识别模型为深度卷积神经网络模型,所述深度卷积神经网络模型包括目标检测算法。优选地,所述步骤s2之前还包括:为每一预设的发票图片类别分别准备第一预设数量的标注有对应的类别的发票图片样本,将所述发票图片样本分为第一比例的训练子集和第二比例的验证子集;获取每一预设的发票图片类别对应的第二预设数量证件图片样本,将所述证件图片样本分为第一比例的训练子集和第二比例的验证子集;将所有训练子集中的图片样本进行混合以得到训练集,将所有验证子集中的图片样本进行混合以得到验证集;利用所述训练集训练所述深度卷积神经网络模型;利用所述验证集验证训练后的深度卷积神经网络模型的准确率;若所述准确率大于或者等于预设准确率,则训练结束,以训练后的深度卷积神经网络模型作为所述步骤s2中的发票图片识别模型,或者,若所述准确率小于预设准确率,则增加每一预设的发票图片类别对应的证件图片样本的数量,以重新进行训练。优选地,所述发票分类的方法还包括:在训练所述深度卷积神经网络模型前,分析训练集的图片样本及验证集的图片样本的标注信息,将标注信息错误的图片样本进行清理;根据发票图片的高宽比信息以及印章的位置分析清理后剩余的图片样本的转置情况,并对发生转置的进行翻转调整。本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有识别系统,所述识别系统被处理器执行时实现上述的发票分类的方法的步骤。本发明的有益效果是:本发明在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正,之后,采用预先训练的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果,相比于现有的采用人工方式对批量上传的发票图片进行角度矫正和分类的方案,本发明能够快速对批量的发票图片进行角度矫正和分类,省时省力,提高业务处理的效率。附图说明图1为本发明各个实施例一可选的应用环境示意图;图2为本发明发票分类的方法一实施例的流程示意图;图3为图2所示预定的矫正规则的示意图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。参阅图1所示,是本发明发票分类的方法的较佳实施例的应用环境示意图。该应用环境示意图包括电子装置1及终端设备2。电子装置1可以通过网络、近场通信技术等适合的技术与终端设备2进行数据交互。所述终端设备2包括,但不限于,任何一种可与用户通过键盘、鼠标、遥控器、触摸板或者声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personaldigitalassistant,pda)、游戏机、交互式网络电视(internetprotocoltelevision,iptv)、智能式穿戴式设备、导航装置等等的可移动设备,或者诸如数字tv、台式计算机、笔记本、服务器等等的固定终端。所述电子装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在本实施例中,电子装置1可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的识别系统。需要指出的是,图1仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,存储设备11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子装置1的内部存储单元,例如该电子装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。本实施例中,存储设备11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件,例如本发明一实施例中的识别系统的程序代码等。此外,存储设备11还可以用于暂时地存储已经输出或者将要输出的各类数据。所述处理器12在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作,例如执行与所述终端设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行识别系统等。所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述电子装置1与其他电子设备之间建立通信连接。本实施例中,网络接口13主要用于将电子装置1与一个或多个终端设备2相连,在电子装置1与一个或多个终端设备2之间建立数据传输通道和通信连接。所述识别系统存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实施例的方法;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模块。在一实施例中,上述识别系统被所述处理器12执行时实现如下步骤:步骤s1,在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正;本实施例中,在接收到批量的待处理的发票图片后,利用预定的矫正规则对发票图片进行倾斜矫正,其中预定的矫正规则包括多种:在一实施例中,预定的矫正规则可以是:获取发票图片倾斜的角度,基于该倾斜的角度矫正该发票图片;在另一实施例中,为了更准确地对发票图片进行矫正,预定的矫正规则可以是:利用霍夫变换(hough)的概率算法分离出所述发票图片中小于等于第一预设长度的短直线段,其中,霍夫变换的概率算法能够从发票图片的黑白图像中检测直线(线段),第一预设长度例如为3mm,分离出的短直线段尽可能多。基于各分离出的短直线段的x坐标或y坐标将各分离出的短直线段分成若干类,具体地,从分离出的短直线段中确定出水平倾角小于等于预设角度(例如预设角度为5度或10度)的短直线段,将确定出的直线段中x坐标值相差小于等于预设阈值(例如预设阈值为0.5mm)的短直线段分为一类,直至将所有分离出的短直线段分为若干类,或者,将所确定出的水平倾角小于等于预设角度的短直线段中y坐标值相差小于等于预设阈值(例如预设阈值为0.5mm)的短直线段分为一类,直至将所有分离出的短直线段分为若干类。将属于同一类的短直线段作为一个目标类直线,并利用最小二乘法获取与各个目标类直线相似的长直线段,其中,最小二乘法通过最小化误差的平方和寻找各个目标类直线的最佳函数匹配(即长直线段)。计算各个长直线段的斜率,以及各个长直线段的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小,以确定出中位数和均值均较小的斜率,并根据确定出的较小的斜率调整发票图片的倾角,在其他实施例中,也可以确定出中位数最小对应的斜率或者均值最小对应的斜率,以中位数最小对应的斜率或者均值最小对应的斜率调整发票图片的倾角,此外,在根据斜率调整发票图片的倾角时,获取该斜率对应的倾角的角度,然后将发票图片反方向调整该倾角的角度即可。步骤s2,利用预先训练生成的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果。本实施例中,预先训练生成的发票图片识别模型为深度卷积神经网络模型,其中,利用深度卷积神经网络模型对倾斜矫正后的发票图片进行类别识别时,优选地,利用可以在caffenet的环境下选取的基于深度卷积神经网络的目标检测算法对倾斜矫正后的发票图片进行类别识别,当然,也可以利用其它算法对倾斜矫正后的发票图片进行类别识别,此处不做过多限定。此外,发票的类别较多,例如对于医院的发票的类别包括门诊发票和住院发票等,在对倾斜矫正后的发票图片进行类别识别后,输出每一发票图片对应的类别。优选地,目标检测算法包括基础架构及辅助架构,具体地,包括1个输入层,13个卷积层,5个池化层,2个全连接层,1个分类层,如下表1所示:layernamebatchsizekernelsizestridesizepadsizeinput128n/an/an/aconv1128311conv2128311maxpool1128220conv3128311conv4128311maxpool2128220conv5128311conv6128311conv7128311maxpool3128220conv8128311conv9128311conv10128311maxpool4128220conv11128311conv12128311conv13128311maxpool5128220fc14096110fc22048110softmax3n/an/an/a表1其中,layername列表示每一层的名称,batchsize表示当前层的输入图像数目,kernelsize表示当前层卷积核的尺度(例如,kernelsize可以等于3,表示卷积核的尺度为3x3),stridesize表示卷积核的移动步长,即做完一次卷积之后移动到下一个卷积位置的距离,padsize表示对当前网络层之中的图像填充的大小。input表示输入层,conv表示卷积层,conv1表示第1个卷积层,maxpool表示最大值池化层,maxpool1表示第1个最大值池化层,fc表示全连接层,fc1表示第1个全连接层,softmax表示softmax分类器。与现有技术相比,本实施例在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正,之后,采用预先训练的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果,相比于现有的采用人工方式对批量上传的发票图片进行角度矫正和分类的方案,本实施例能够快速对批量的发票图片进行角度矫正和分类,省时省力,提高业务处理的效率。在一优选的实施例中,在上述实施例的基础上,所述识别系统被所述处理器12执行类别识别之前,还实现如下步骤:为每一预设的发票图片类别分别准备第一预设数量的标注有对应的类别的发票图片样本,将所述发票图片样本分为第一比例的训练子集和第二比例的验证子集,其中,预设的发票图片类别包括多种,例如包括门诊类发票和住院类发票等,第一预设数量例如为1000张,第一比例例如为75%,第二比例例如为25%,其中,第一比例与第二比例之和小于等于1。获取每一预设的发票图片类别对应的第二预设数量证件图片样本,将所述证件图片样本分为第一比例的训练子集和第二比例的验证子集,其中,每一预设的发票图片类别对应的证件图片样本为该发票图片类别对应的标准的发票图片,该标准的发票图片为正置的、标注信息未出现问题的发票图片,第二预设数量例如为1000张,第一比例例如为75%,第二比例例如为25%,其中,第一比例与第二比例之和小于等于1。将所有训练子集中的图片样本进行混合以得到训练集,将所有验证子集中的图片样本进行混合以得到验证集,利用所述训练集训练所述深度卷积神经网络模型,利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率(预设准确率例如为0.98),则训练结束,以训练后的深度卷积神经网络模型作为所述步骤s2中的发票图片识别模型,或者,若所述准确率小于预设准确率,则增加每一预设的发票图片类别对应的证件图片样本的数量,以重新进行训练。在一优选的实施例中,在上述实施例的基础上,为了提高训练深度卷积神经网络模型的效率,所述识别系统被所述处理器12执行训练深度卷积神经网络模型之前,还实现如下步骤:在训练所述深度卷积神经网络模型前,分析训练集的图片样本及验证集的图片样本的标注信息,将标注信息错误的图片样本进行清理;根据发票图片的高宽比信息以及印章的位置分析清理后剩余的图片样本的转置情况,并对发生转置的进行翻转调整。其中,在训练所述深度卷积神经网络模型前,分析训练集的图片样本及验证集的图片样本的标注信息,例如分析图片样本的关键位置信息是否缺失或超出整张图片范围,以及印章标注位置是否位于发票中央等明显标注错误的数据,若出现上述问题的图片样本,则对其进行清理或丢弃,以确保图片样本的标注信息准确无误。对于清理后剩余的图片样本,根据其高宽比信息以及印章的位置判断图片样本的转置情况,并对发生转置的图片样本做翻转调整:当高宽比大于1时,说明发票图片高宽颠倒,若印章位置在发图片样本左侧,则对图片样本做顺时针旋转九十度处理,若印章位置在发票图片右侧,则对发票图像做逆时针旋转九十度处理;当高宽比小于1时,说明图片样本高宽未颠倒,若印章位置在发票图片下侧,则对发票图像做顺时针旋转一百八十度处理,若印章位置在发票图片上侧,则不做处理。另外,对经过翻转调整的图片样本的标注数据进行修正,每个图片样本的标注数据指的是框出这个图片样本的矩形框的位置信息,用这个矩形框的左上角坐标(xmin,ymin)和右下角坐标(xmax,ymax)四个数来表示,如果xmax<xmin,则颠倒二者位置,对y坐标做同样的处理,以确保max>min。如图2所示,图2为本发明发票分类的方法一实施例的流程示意图,该发票分类的方法包括以下步骤:步骤s1,在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正;本实施例中,在接收到批量的待处理的发票图片后,利用预定的矫正规则对发票图片进行倾斜矫正,其中预定的矫正规则包括多种:在一实施例中,预定的矫正规则可以是:获取发票图片倾斜的角度,基于该倾斜的角度矫正该发票图片;在另一实施例中,为了更准确地对发票图片进行矫正,结合参阅图3,预定的矫正规则可以是:利用霍夫变换hough的概率算法分离出所述发票图片中小于等于第一预设长度的短直线段,其中,霍夫变换的概率算法能够从发票图片的黑白图像中检测直线(线段),第一预设长度例如为3mm,分离出的短直线段尽可能多。基于各分离出的短直线段的x坐标或y坐标将各分离出的短直线段分成若干类,具体地,从分离出的短直线段中确定出水平倾角小于等于预设角度(例如预设角度为5度或10度)的短直线段,将确定出的直线段中x坐标值相差小于等于预设阈值(例如预设阈值为0.5mm)的短直线段分为一类,直至将所有分离出的短直线段分为若干类,或者,将所确定出的水平倾角小于等于预设角度的短直线段中y坐标值相差小于等于预设阈值(例如预设阈值为0.5mm)的短直线段分为一类,直至将所有分离出的短直线段分为若干类。将属于同一类的短直线段作为一个目标类直线,并利用最小二乘法获取与各个目标类直线相似的长直线段,其中,最小二乘法通过最小化误差的平方和寻找各个目标类直线的最佳函数匹配(即长直线段)。计算各个长直线段的斜率,以及各个长直线段的斜率的中位数和均值,比较计算出的斜率的中位数和均值的大小,以确定出中位数和均值均较小的斜率,并根据确定出的较小的斜率调整发票图片的倾角,在其他实施例中,也可以确定出中位数最小对应的斜率或者均值最小对应的斜率,以中位数最小对应的斜率或者均值最小对应的斜率调整发票图片的倾角,此外,在根据斜率调整发票图片的倾角时,获取该斜率对应的倾角的角度,然后将发票图片反方向调整该倾角的角度即可。步骤s2,利用预先训练生成的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果。本实施例中,预先训练生成的发票图片识别模型为深度卷积神经网络模型,其中,利用深度卷积神经网络模型对倾斜矫正后的发票图片进行类别识别时,优选地,利用可以在caffenet的环境下选取的基于深度卷积神经网络的目标检测算法对倾斜矫正后的发票图片进行类别识别,当然,也可以利用其它算法对倾斜矫正后的发票图片进行类别识别,此处不做过多限定。此外,发票的类别较多,例如对于医院的发票的类别包括门诊发票和住院发票等,在对倾斜矫正后的发票图片进行类别识别后,输出每一发票图片对应的类别。优选地,目标检测算法包括基础架构及辅助架构,具体地,包括1个输入层,13个卷积层,5个池化层,2个全连接层,1个分类层,如上述表1所示,此处不再赘述。其中,layername列表示每一层的名称,batchsize表示当前层的输入图像数目,kernelsize表示当前层卷积核的尺度(例如,kernelsize可以等于3,表示卷积核的尺度为3x3),stridesize表示卷积核的移动步长,即做完一次卷积之后移动到下一个卷积位置的距离,padsize表示对当前网络层之中的图像填充的大小。input表示输入层,conv表示卷积层,conv1表示第1个卷积层,maxpool表示最大值池化层,maxpool1表示第1个最大值池化层,fc表示全连接层,fc1表示第1个全连接层,softmax表示softmax分类器。本实施例在接收到待处理的发票图片后,利用预定的矫正规则对所述发票图片进行倾斜矫正,之后,采用预先训练的发票图片识别模型对倾斜矫正后的发票图片进行类别识别,并输出类别识别结果,相比于现有的采用人工方式对批量上传的发票图片进行角度矫正和分类的方案,本实施例能够快速对批量的发票图片进行角度矫正和分类,省时省力,提高业务处理的效率。在一优选的实施例中,在上述图2的实施例的基础上,在所述步骤s2之前还包括:为每一预设的发票图片类别分别准备第一预设数量的标注有对应的类别的发票图片样本,将所述发票图片样本分为第一比例的训练子集和第二比例的验证子集,其中,预设的发票图片类别包括多种,例如包括门诊类发票和住院类发票等,第一预设数量例如为1000张,第一比例例如为75%,第二比例例如为25%,其中,第一比例与第二比例之和小于等于1。获取每一预设的发票图片类别对应的第二预设数量证件图片样本,将所述证件图片样本分为第一比例的训练子集和第二比例的验证子集,其中,每一预设的发票图片类别对应的证件图片样本为该发票图片类别对应的标准的发票图片,该标准的发票图片为正置的、标注信息未出现问题的发票图片,第二预设数量例如为1000张,第一比例例如为75%,第二比例例如为25%,其中,第一比例与第二比例之和小于等于1。将所有训练子集中的图片样本进行混合以得到训练集,将所有验证子集中的图片样本进行混合以得到验证集,利用所述训练集训练所述深度卷积神经网络模型,利用所述验证集验证训练后的深度卷积神经网络模型的准确率,若所述准确率大于或者等于预设准确率(预设准确率例如为0.98),则训练结束,以训练后的深度卷积神经网络模型作为所述步骤s2中的发票图片识别模型,或者,若所述准确率小于预设准确率,则增加每一预设的发票图片类别对应的证件图片样本的数量,以重新进行训练。在一优选的实施例中,在上述实施例的基础上,为了提高训练深度卷积神经网络模型的效率,所述发票分类的方法还包括:在训练所述深度卷积神经网络模型前,分析训练集的图片样本及验证集的图片样本的标注信息,将标注信息错误的图片样本进行清理;根据发票图片的高宽比信息以及印章的位置分析清理后剩余的图片样本的转置情况,并对发生转置的进行翻转调整。其中,在训练所述深度卷积神经网络模型前,分析训练集的图片样本及验证集的图片样本的标注信息,例如分析图片样本的关键位置信息是否缺失或超出整张图片范围,以及印章标注位置是否位于发票中央等明显标注错误的数据,若出现上述问题的图片样本,则对其进行清理或丢弃,以确保图片样本的标注信息准确无误。对于清理后剩余的图片样本,根据其高宽比信息以及印章的位置判断图片样本的转置情况,并对发生转置的图片样本做翻转调整:当高宽比大于1时,说明发票图片高宽颠倒,若印章位置在发图片样本左侧,则对图片样本做顺时针旋转九十度处理,若印章位置在发票图片右侧,则对发票图像做逆时针旋转九十度处理;当高宽比小于1时,说明图片样本高宽未颠倒,若印章位置在发票图片下侧,则对发票图像做顺时针旋转一百八十度处理,若印章位置在发票图片上侧,则不做处理。另外,对经过翻转调整的图片样本的标注数据进行修正,每个图片样本的标注数据指的是框出这个图片样本的矩形框的位置信息,用这个矩形框的左上角坐标(xmin,ymin)和右下角坐标(xmax,ymax)四个数来表示,如果xmax<xmin,则颠倒二者位置,对y坐标做同样的处理,以确保max>min。本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有识别系统,所述识别系统被处理器执行时实现上述的发票分类的方法的步骤。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
技术领域
,均同理包括在本发明的专利保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1