基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质与流程

文档序号:17471213发布日期:2019-04-20 05:50阅读:307来源:国知局
基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质与流程

本发明涉及物质鉴别技术领域,特别是涉及一种基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质。



背景技术:

发票是指一切单位和个人在购销商品和从事其他经营活动所开具和收取的业务凭证,是会计核算、审计机关、税务机关执法检查的重要依据,从管理上分为普通发票和增值税发票两种。

近年来,发票出现造假且愈来愈猖狂,一些不法分子利用假发票来试图获得更多的利益,假发票与真发票相比,明显不同在于发票纸质,发票联以及盖章。而随着科技的发展,现在的伪造技术越来越逼真,急需一种对真假发票的有效的识别方法。目前对于鉴别真假发票的方法一般为紫外线鉴别法,其不足就是鉴别发票的准确度不高。

因此,如何提高真假发票鉴别的准确性,是本领域技术人员亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明的目的在于提供一种基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质,可以快速鉴别真假发票,提高发票鉴别的准确性,减少判断真假发票的错误率。其具体方案如下:

一种基于太赫兹光谱的发票鉴别方法,包括:

对真发票和假发票进行预处理;

将所述真发票和所述假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;

在所述太赫兹吸收光谱图中选择特定的区间进行特征提取;

通过svm分类器对提取的特征进行训练,得到鉴别所述真发票和所述假发票的分割线。

优选地,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,在根据测量采集到的数据生成太赫兹吸收光谱图之后,在所述太赫兹吸收光谱图中选择特定的区间进行特征提取之前,还包括:

采用高斯滤波平滑法对所述太赫兹吸收光谱图进行平滑处理。

优选地,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,根据测量采集到的数据生成太赫兹吸收光谱图,具体包括:

根据测量采集到的数据,获取所述真发票和所述假发票的太赫兹时域光谱;

将获取的所述太赫兹时域光谱进行傅里叶变换,转换为功率谱;

根据转换得到的所述功率谱,计算出透射率;

根据计算出的所述透射率,计算出吸光度;

根据计算出的所述吸光度,得到所述真发票和所述假发票的太赫兹吸收光谱图。

优选地,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,在得到鉴别所述真发票和所述假发票的分割线之后,还包括:

以得到的所述分割线为界限,将在所述分割线下方的所述太赫兹吸收光谱图对应的发票判定为真发票;将在所述分割线上方的所述太赫兹吸收光谱图对应的发票判定为假发票。

本发明实施例还提供了一种基于太赫兹光谱的发票鉴别装置,包括:

发票预处理模块,用于对真发票和假发票进行预处理;

光谱图生成模块,用于将所述真发票和所述假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;

特征提取模块,用于在所述太赫兹吸收光谱图中选择特定的区间进行特征提取;

svm训练模块,用于通过svm分类器对提取的特征进行训练,得到鉴别所述真发票和所述假发票的分割线。

优选地,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别装置中,还包括:

光谱图平滑模块,用于采用高斯滤波平滑法对所述太赫兹吸收光谱图进行平滑处理。

优选地,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别装置中,还包括:

发票判定模块,用于以得到的所述分割线为界限,将在所述分割线下方的所述太赫兹吸收光谱图对应的发票判定为真发票;将在所述分割线上方的所述太赫兹吸收光谱图对应的发票判定为假发票。

本发明实施例还提供了一种基于太赫兹光谱的发票鉴别设备,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现如本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法。

本发明实施例还提供了一种计算机可读存储介质,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法。

本发明所提供的一种基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质,该方法包括:对真发票和假发票进行预处理;将真发票和假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;在太赫兹吸收光谱图中选择特定的区间进行特征提取;通过svm分类器对提取的特征进行训练,得到鉴别真发票和假发票的分割线。

本发明利用太赫兹光谱和svm分类器得到鉴别真发票和假发票的分割线,通过该分割线可以明显区分出真发票和假发票的区别,进而可以快速鉴别真假发票,提高发票鉴别的准确性,减少判断真假发票的错误率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的基于太赫兹光谱的发票鉴别方法的流程图;

图2为本发明实施例提供的基于太赫兹光谱的发票鉴别方法的具体流程图;

图3为本发明实施例提供的未经平滑处理的假发票的太赫兹吸收光谱图;

图4为本发明实施例提供的未经平滑处理的真发票的太赫兹吸收光谱图;

图5为本发明实施例提供的经平滑处理后真假发票的太赫兹吸收光谱图;

图6为本发明实施例提供的利用svm分类器训练后包含分割线的真假发票的太赫兹吸收光谱图;

图7为本发明实施例提供的基于太赫兹光谱的发票鉴别装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种基于太赫兹光谱的发票鉴别方法,如图1所示,包括以下步骤:

s101、对真发票和假发票进行预处理;

s102、将真发票和假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;

s103、在太赫兹吸收光谱图中选择特定的区间进行特征提取;

s104、通过svm分类器对提取的特征进行训练,得到鉴别真发票和假发票的分割线。

在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,首先对真发票和假发票进行预处理;然后将真发票和假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;之后在太赫兹吸收光谱图中选择特定的区间进行特征提取;最后通过svm分类器对提取的特征进行训练,得到鉴别真发票和假发票的分割线。这样利用太赫兹光谱和svm分类器得到鉴别真发票和假发票的分割线,通过该分割线可以明显区分出真发票和假发票的区别,进而可以快速鉴别真假发票,提高发票鉴别的准确性,减少判断真假发票的错误率。

需要说明的是,太赫兹波是介于可见光和微波之间,波段频率通常指0.1thz至10thz之间,属于远红外波段。由于太赫兹波具有较强的穿透性、指纹谱性、低能性等性质,满足了物质鉴别最关心的因素,可以通过分析太赫兹谱线图的特征来鉴别物质。因此,本发明采用太赫兹波来鉴别发票,利用其对非极性物质透过极强的特点,获得透射光谱信息,同时不易损害被鉴别的发票。

进一步地,在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,为了便于观察真发票和假发票的太赫兹吸收光谱图的特征,如图2所示,在执行步骤s102根据测量采集到的数据生成太赫兹吸收光谱图之后,在执行步骤s103在太赫兹吸收光谱图中选择特定的区间进行特征提取之前,还可以包括以下步骤:

s201、采用高斯滤波平滑法对太赫兹吸收光谱图进行平滑处理。

具体地,对发票的太赫兹吸收光谱图进行消除噪声,平滑曲线,采用高斯滤波平滑法,首先引用高斯函数:

对高斯函数进行离散化,以离散点上的高斯函数值为权值,对采集到的灰度矩阵的每个像素点做一定范围的加权平均,即可消除高斯噪声。离散的高斯卷积核,其元素计算方法为:

其中,σ为方差,k为核矩阵的维数。

通过上述公式(2)可以方便地求出高斯模板,从而进行高斯滤波处理。

在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,步骤s101对真发票和假发票进行预处理,具体可以包括:首先收集真发票和假发票作为训练样本;然后在设定湿度范围内,对收集的真发票和假发票在压平机上进行压平。对这两种发票在压平机上进行压平,是为了防止发票有褶皱,压平机适用于不同厚度的薄纸,可以运用到发票上,对其进行压平,使发票的表面平滑,减少对训练结果造成偏差。在进行预处理的过程中,可以用空气湿度仪测量待测环境的湿度,湿度环境必须为10%以下,保证结果的准确性。

在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,步骤s102中使用的太赫兹时域光谱仪可以选用tas7400系列,能够测量0.1thz~5thz的太赫兹光谱,能够提供功率、相位、透过率、反射率、折射率、介电常数等多种物质参数,利用太赫兹波的特性,用于非破坏性的光谱分析,全自动系统保留数据。

步骤s102根据测量采集到的数据生成太赫兹吸收光谱图,具体可以包括:

第一步、根据测量采集到的数据,获取真发票和假发票的太赫兹时域光谱;

第二步、将获取的太赫兹时域光谱进行傅里叶变换,转换为功率谱;

功率谱依照下列公式(3)转换:

其中,plinear(ω)是功率谱,是fft数据(复数);

是复数的绝对值。

第三步、根据转换得到的功率谱,计算出透射率;

透射率依照下列公式(4)计算:

其中tlinear(ω)是透射率,psam(ω)是样本功率谱,pref(ω)是参考功率谱。

第四步、根据计算出的透射率,计算出吸光度;

吸光度依照下列计算公式:

其中a(ω)代表吸光度,tlinear(ω)是透射率。

第五步、根据计算出的吸光度,得到真发票和假发票的太赫兹吸收光谱图;

具体地,以太赫兹频率为横坐标,吸光度为纵坐标,如图3和图4所示,分别绘制出假发票和真发票的太赫兹吸收光谱图。将图3和图4的太赫兹吸收光谱图合并在一起并进行平滑处理后,可以得到如图5所示的光谱图。

在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,在执行步骤s103的过程中,假设曲线集样本s={(x1,y1)...(xn,yn)},选择特定的区间为:

q={(c,d)|c=xa,d=xb}

从图5中可以明显看出在1.5thz到3thz这段区间的峰值都比较明显,即选定xa=1.5,xb=3便于区分真假发票。并且,在特定的区间内,图5中可以明显观察到两条曲线的差异程度,假发票的峰值明显高于真发票的峰值。

在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,步骤s104中svm(支持向量机)原理是在统计学习理论和人工智能上用的比较普遍的一种通用的学习方法,它根据样本的复杂性,可以对指定的样本进行训练即对样本训练的学习精度,凭借训练的样本数据对预期样本做出准确的判断。

线性svm作为一种二分类器,核心就是找到一个超平面,且这个超平面离所有的点都尽可能得远,这个超平面就是一条直线,其对应的方程为:y=wt·x+b,其中wt为法向量,b为截距。对于二维平面其对应方程:

(w1,w2)·(x,y)+b=0→w1·x+w2y+b=0(6)

根据点到直线的距离公式,每个训练样本s到直线的距离:

其中,i=1,2,3…,有了训练样本s到直线的距离公式就方便得到几何间隔:

要区分真假发票的分类,分类的原则是找到一个超平面将真发票的曲线和假发票的曲线尽可能的分开,那么此时应找到一个最大的间距:

其中s.t是限制条件。

解得上式(9),得到一个凸二次规划问题,由于二次规划的解的放缩不影响,可以简化计算另则转化为线性可分支持训练问题其表示:

以分割线wt·xi+b=1为界限,从而来判断真假发票和此项式的比较。如图6所示,光谱图中具有箭头指向的直线就是本发明得到的鉴别真发票和假发票的分割线。

进一步地,在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别方法中,如图2所示,在执行步骤s104得到鉴别真发票和假发票的分割线之后,还可以包括以下步骤:

s202、以得到的分割线为界限,将在分割线下方的太赫兹吸收光谱图对应的发票判定为真发票;将在分割线上方的太赫兹吸收光谱图对应的发票判定为假发票。

具体地,当wt·xi+b≤1,即训练标准线在其下方,可以来判断其为真发票;当wt·xi+b≥1,即训练标准线在其上方,可以判断其为假发票。输入待测样本的数据,就可以对待测样本进行真假发票的区分。

基于同一发明构思,本发明实施例还提供了一种基于太赫兹光谱的发票鉴别装置,由于该基于太赫兹光谱的发票鉴别装置解决问题的原理与前述一种基于太赫兹光谱的发票鉴别方法相似,因此该基于太赫兹光谱的发票鉴别装置的实施可以参见基于太赫兹光谱的发票鉴别方法的实施,重复之处不再赘述。

在具体实施时,本发明实施例提供的基于太赫兹光谱的发票鉴别装置,如图7所示,具体包括:

发票预处理模块11,用于对真发票和假发票进行预处理;

光谱图生成模块12,用于将真发票和假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;

特征提取模块13,用于在太赫兹吸收光谱图中选择特定的区间进行特征提取;

svm训练模块14,用于通过svm分类器对提取的特征进行训练,得到鉴别真发票和假发票的分割线。

在本发明实施例提供的上述基于太赫兹光谱的发票鉴别装置中,可以通过上述四个模块的相互作用,利用太赫兹光谱和svm分类器得到的分割线明显区分出真发票和假发票的区别,进而可以快速鉴别真假发票,提高发票鉴别的准确性,减少判断真假发票的错误率。

进一步地,在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别装置中,为了便于观察真发票和假发票的太赫兹吸收光谱图的特征,如图7所示,还可以包括:

光谱图平滑模块15,用于采用高斯滤波平滑法对所述太赫兹吸收光谱图进行平滑处理。

更进一步地,在具体实施时,在本发明实施例提供的上述基于太赫兹光谱的发票鉴别装置中,如图7所示,还可以包括:

发票判定模块16,用于以得到的分割线为界限,将在分割线下方的太赫兹吸收光谱图对应的发票判定为真发票;将在分割线上方的太赫兹吸收光谱图对应的发票判定为假发票。

关于上述各个模块更加具体的工作过程可以参考前述实施例公开的相应内容,在此不再进行赘述。

相应的,本发明实施例还公开了一种基于太赫兹光谱的发票鉴别设备,包括处理器和存储器;其中,处理器执行存储器中保存的计算机程序时实现前述实施例公开的基于太赫兹光谱的发票鉴别方法。

关于上述方法更加具体的过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。

进一步的,本发明还公开了一种计算机可读存储介质,用于存储计算机程序;计算机程序被处理器执行时实现前述公开的基于太赫兹光谱的发票鉴别方法。

关于上述方法更加具体的过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备、存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

综上,本发明实施例提供的一种基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质,该方法包括:对真发票和假发票进行预处理;将真发票和假发票分别置于太赫兹时域光谱仪的测量区域内进行多次测量,根据测量采集到的数据生成太赫兹吸收光谱图;在太赫兹吸收光谱图中选择特定的区间进行特征提取;通过svm分类器对提取的特征进行训练,得到鉴别真发票和假发票的分割线。这样利用太赫兹光谱和svm分类器得到鉴别真发票和假发票的分割线,通过该分割线可以明显区分出真发票和假发票的区别,进而可以快速鉴别真假发票,提高发票鉴别的准确性,减少判断真假发票的错误率。

最后,还需要说明的是,在本文中,关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的基于太赫兹光谱的发票鉴别方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1