一种基于支持向量机的增值税专票疑点纳税人监控方法与流程

文档序号:12826067阅读:167来源:国知局
一种基于支持向量机的增值税专票疑点纳税人监控方法与流程

本发明属于税务监控技术领域,具体涉及一种基于支持向量机的增值税专票疑点纳税人监控方法。



背景技术:

增值税防伪税控系统的推广使用极大地增加了国家的税收并且已经成为国家税收征管的强有力手段之一,但是仍然有企业利用现有税收征管手段的不足从事违法经营活动。在增值税税收的过程中,税局工作人员反应经常出现商贸企业增值税进项发票与增值税销项发票的物品与金额不对应的情况。但是,与发票相关的税目数据量非常庞大,想要查找出发票的不合规之处,并非易事。

现有技术中,通过对增值税发票的一号多名的检测,判定企业是否存在违规经营。申请号为201310547638.2、申请名称为《一种增值税发票一号多名的检测方法及其系统》的中国专利,公开了一种增值税发票一号多名的检测方法及其系统,所述系统包括:进行数据准备,执行数据查询,在进项发票数据中,逐条取出未做一号多名处理的进项发票数据;建特殊字符字典表;取销方企业的纳税人识别号和企业中文名称;根据纳税人识别号取其在税务机关注册登记的企业中文名称;计算上述纳税人的企业中文名称和注册登记的企业中文名称的相似度;进行一号多名判定。该发明的方法能够检测出增值税发票一号多名的疑点,即:企业在开具增值税发票的时候,如果出现一个销方税号对应多个销方名称的企业即列为一号多名疑点,从而跟踪和监控企业是否有代开发票和虚开发票的行为,为税务机关提供参考,避免企业的违法违规经营。

但是,上述对企业的监控,仅仅通过计算纳税人企业的中文名称与注册登记的企业的中文名称的相似度来判断是否为一号多名,而无法对企业的具体进销状况进行监督,当一个企业同时存在虚开发票和未开票收入时,则会出现无法检测的盲点,不能有效的监控纳税企业的税收情况。



技术实现要素:

本发明实施例的目的是提供一种基于支持向量机的增值税专票疑点纳税人监控方法,通过增值税专票物品与金额维度进行疑点纳税人的筛选与监控,使用了支持向量机的算法来实现物品名称的分类工作,提高词语的识别率,加强增值税的风险管理,强化税源监控,遏制不法分子利用目前税收管理的技术瓶颈偷逃税的行为。

根据本发明的一个方面,提供了一种基于支持向量机的增值税专票疑点纳税人监控方法,所述方法包括:

建立支持向量机模型;

查询待测数据表的增值税专票进项和销项的第一物品信息和纳税人识别号;

运用支持向量机模型根据所述第一物品信息对所述物品进行分类,并建立分类结果表;

从所述分类结果表中查询某一待测纳税人识别号对应的第一物品信息,并将进项中的物品信息与销项中的物品信息进行对比;

当所述进项中的第一物品信息与销项中的第一物品信息不一致时,则判定所述纳税人识别号对应的纳税人为疑点纳税人。

上述方案中,所述建立支持向量机模型,包括:

执行sql语句,从增值税专票进项和销项表中提取出第二物品信息;

汇总所提取的所述第二物品信息,筛选并丢弃重复数据和无效数据,保留有效数据;

根据所述有效数据和国家行业分类标准建立学习过程表;

运用支持向量机对所述学习过程表中的数据进行学习,从而建立支持向量机模型。

上述方案中,所述第一物品信息包括物品名称、物品数量、物品金额中的一种或多种。

上述方案中,所述第二物品信息包括物品名称、物品类型、物品数量、物品金额中的一种或多种。

上述方案中,所述建立分类结果表,进一步为,在待测数据表中插入物品种类列,支持向量机模型根据所述第一物品信息对所述物品进行分类得到分类结果,并将所述分类结果添加到所述物品种类的对应列中,从而得到分类结果表。

根据本发明的另一个方面,还提供了一种基于支持向量机的增值税专票疑点纳税人监控系统,所述系统包括:模型建立单元,待测信息查询单元,分类单元,对比与判定单元;其中,

所述模型建立单元用于建立支持向量机模型;

所述待测信息查询单元用于查询待测数据表的增值税专票进项和销项的第一物品信息和纳税人识别号;

所述分类单元同时与所述模型建立单元和所述待测信息查询单元相连,用于运用支持向量机模型根据所述第一物品信息对所述物品进行分类,并建立分类结果表;

所述比较和判定单元与所述分类单元相连,用于从所述分类结果表中查询某一待测纳税人识别号对应的第一物品信息,并将进项中的物品信息与销项中的物品信息进行对比;还用于:当所述进项中的第一物品信息与销项中的第一物品信息不一致时,则判定所述纳税人识别号对应的纳税人为疑点纳税人。

上述方案中,所述模型建立单元包括:信息提取子单元,信息汇总子单元,学习过程表建立子单元,学习子单元;其中,

所述信息提取子单元用于执行sql语句,从增值税专票进项和销项表中提取出第二物品信息;

所述信息汇总子单元与所述信息提取子单元相连,用于汇总所提取的所述第二物品信息,筛选并丢弃重复数据和无效数据,保留有效数据;

所述学习过程表建立子单元用于根据所述有效数据和国家行业分类标准建立学习过程表;

所述学习子单元与所述学习过程表建立子单元相连,用于运用支持向量机对所述学习过程表中的数据进行学习,从而建立支持向量机模型。

上述方案中,所述分类单元包括:增列子单元,执行分类子单元,添加结果子单元;其中,

所述增列子单元用于在待测数据表中插入物品种类列;

所述执行分类子单元用于支持向量机模型根据所述第一物品信息对所述物品进行分类得到分类结果;

所述添加结果子单元同时与所述增列子单元和所述执行分类子单元相连,用于将所述分类结果添加到所述物品种类的对应列中,从而得到分类结果表。

上述方案中,所述第一物品信息包括物品名称、物品数量、物品金额中的一种或多种。

上述方案中,所述第二物品信息包括物品名称、物品类型、物品数量、物品金额中的一种或多种。

从以上技术方案可以看出,本发明实施例的基于支持向量机的增值税专票疑点纳税人监控方法和系统,根据现有数据和相关标准建立学习过程表,通过监督学习算法建立支持向量机模型,充分利用小样本非线性及高维模式识别的显著优势。从而利用所建立的支持向量机模型对待测数据表中的物品信息进行处理,对所述物品进行分类,通过支持向量机模型的建立和使用提高分类效率和质量。再对分类后的物品信息进行比对,从而分析出疑点纳税人,有效监控和分析不法企业偷逃税款、保障税务收入,提高了税务机关纳税评估、税务稽查等方面的工作效率;同时,减少不规范开具发票的风险,促进企业的合法规范经营,有效地遏制不法企业虚开增值税发票、获得未开票收入等行为,大大减少企业偷逃税款现象的发生。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明第一实施例的基于支持向量机模型的增值税专票疑点纳税人监控方法流程示意图;

图2为图1所示建立支持向量机模型流程示意图;

图3为本发明第二实施例的基于支持向量机的增值税专票疑点纳税人监控系统结构示意图。

具体实施方式

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解,下面详细描述本发明的实施方式,通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

图1为本发明第一实施例的基于支持向量机模型的增值税专票疑点纳税人监控方法流程示意图。如图1所示,本实施例的基于支持向量机模型的增值税专票疑点纳税人监控方法,包括如下步骤:

步骤s101,建立支持向量机模型。

优选的,这里的建立支持向量机模型,可以具体包括以下步骤,如图2所示:

步骤s1011,执行sql语句,从增值税专票进项和销项表中提取出第二物品信息。

步骤s1012,汇总所提取的所述第二物品信息,筛选并丢弃重复数据和无效数据,保留有效数据;

步骤s1013,根据所述有效数据和国家行业分类标准建立学习过程表。

本子步骤中建立学习过程表格数据筛选过程要保持训练样本的数量尽可能小,在覆盖基础样本的情况下不增加过多样本,而这里的筛选过程,去掉了大量的重复数据和无效数据,有效防止出现信息重复,从而覆盖那些相对比较少的样本,形成过拟合现象。学习过程表是通过从国家行业分类表和/或税务局给出的典型数据样本创建的,主要字段有物品单位、物品名称、物品单价、物品类别。

步骤s1014,运用支持向量机对所述学习过程表中的数据进行学习,从而建立支持向量机模型。

所述增值税专票疑点纳税人监控方法还包括:

步骤s102,查询待测数据表的增值税专票进项和销项的第一物品信息和纳税人识别号。优选的,这里的所述第一物品信息包括物品名称、物品数量、物品金额中的一种或多种。

步骤s103,运用支持向量机模型根据所述第一物品信息对所述物品进行分类,并建立分类结果表。优选的,这里的所述第二物品信息包括物品名称、物品类型、物品数量、物品金额中的一种或多种。

步骤s101中使用监督学习算法的支持向量机,对于小样本非线性及高维模式识别问题有着显著的优势。在解决本实施例涉及的增值税专票物品分类过程中通过支持向量机使得筛选准确度和筛选效率显著提高,而传统的人工分类方法容易把物品错误的分类。

本步骤中所述建立分类结果表,可以进一步为,在待测数据表中插入物品种类列,支持向量机模型根据所述第一物品信息对所述物品进行分类得到分类结果,并将所述分类结果添加到所述物品种类的对应列中,从而得到分类结果表。

步骤s104,从所述分类结果表中查询某一待测纳税人识别号对应的第一物品信息,并将进项中的物品信息与销项中的物品信息进行对比。

步骤s105,判断所述进项中的第一物品信息与销项中的第一物品信息是否一致,当不一致时,执行步骤s106;当一致时,则结束监控。

步骤s106,判定所述纳税人识别号对应的纳税人为疑点纳税人。

举例来说,步骤104至步骤s106,利用商贸企业在办理抄报税和认证的过程中采集上来的进项发票和销项发票的物品与金额信息,将同一个商贸企业的进项与销项的物品名称分类进行对比,分析是否属于同一类物品,然后比较其金额是否正常,从而判断其是否为虚开发票的疑点纳税人。

本实施例的基于支持向量机的增值税专票疑点纳税人监控方法,根据现有数据和标准建立学习过程表,通过监督学习算法建立支持向量机模型,充分利用小样本非线性及高维模式识别的显著优势。从而利用所建立的支持向量机模型对待测数据表中的物品信息进行处理,对所述物品进行分类,通过支持向量机模型的建立和使用提高分类效率和质量。再对分类后的物品信息进行比对,从而分析出疑点纳税人,有效监控和分析不法企业偷逃税款、保障税务收入,提高了税务机关纳税评估、税务稽查等方面的工作效率;同时,减少不规范开具发票的风险,促进企业的合法规范经营,有效地遏制不法企业虚开增值税发票、获得未开票收入等行为,大大减少企业偷逃税款现象的发生。

图3为本发明第二实施例的基于支持向量机的增值税专票疑点纳税人监控系统结构示意图。

如图3所示,本实施例的基于支持向量机的增值税专票疑点纳税人监控系统,包括:模型建立单元1,待测信息查询单元2,分类单元3,对比与判定单元4;其中,

所述模型建立单元1用于建立支持向量机模型;

所述待测信息查询单元2用于查询待测数据表的增值税专票进项和销项的第一物品信息和纳税人识别号;

所述分类单元3同时与所述模型建立单元和所述待测信息查询单元相连,用于运用支持向量机模型根据所述第一物品信息对所述物品进行分类,并建立分类结果表;

所述比较和判定单元4与所述分类单元相连,用于从所述分类结果表中查询某一待测纳税人识别号对应的第一物品信息,并将进项中的物品信息与销项中的物品信息进行对比;还用于:当所述进项中的第一物品信息与销项中的第一物品信息不一致时,则判定所述纳税人识别号对应的纳税人为疑点纳税人。

优选的,所述模型建立单元1包括:信息提取子单元11,信息汇总子单元12,学习过程表建立子单元13,学习子单元14;其中,

所述信息提取子单元11用于执行sql语句,从增值税专票进项和销项表中提取出第二物品信息;

所述信息汇总子单元12与所述信息提取子单元相连,用于汇总所提取的所述第二物品信息,筛选并丢弃重复数据和无效数据,保留有效数据,

所述学习过程表建立子单元13与所述信息汇总子单元相连,用于根据所述有效数据和国家行业分类标准建立学习过程表;

所述学习子单元14与所述学习过程表建立子单元相连,用于运用支持向量机对所述学习过程表中的数据进行学习,从而建立支持向量机模型。

所述分类单元3包括:增列子单元31,执行分类子单元32,添加结果子单元33;其中,

所述增列子单元31用于在待测数据表中插入物品种类列;

所述执行分类子单元32用于支持向量机模型根据所述第一物品信息对所述物品进行分类得到分类结果;

所述添加结果子单元33同时与所述增列子单元和所述执行分类子单元相连,用于将所述分类结果添加到所述物品种类的对应列中,从而得到分类结果表。

本实施例的基于支持向量机的增值税专票疑点纳税人监控系统,根据现有数据和标准建立学习过程表,通过监督学习算法建立支持向量机模型,充分利用小样本非线性及高维模式识别的显著优势。从而利用所建立的支持向量机模型对待测数据表中的物品信息进行处理,对所述物品进行分类,通过支持向量机模型的建立和使用提高分类效率和质量。再对分类后的物品信息进行比对,从而分析出疑点纳税人,有效监控和分析不法企业偷逃税款、保障税务收入,提高了税务机关纳税评估、税务稽查等方面的工作效率;同时,减少不规范开具发票的风险,促进企业的合法规范经营,有效地遏制不法企业虚开增值税发票、获得未开票收入等行为,大大减少企业偷逃税款现象的发生。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1