一种计算进项和销项物品列表之间差异度的方法及系统与流程

文档序号:14861569发布日期:2018-07-04 07:45阅读:496来源:国知局
一种计算进项和销项物品列表之间差异度的方法及系统与流程

本发明涉及税控技术领域,具体地,特别涉及一种用于计算进项物品列表和销项物品列表之间差异度的方法及系统。



背景技术:

随着计算机技术的快速发展,各行业中的业务系统趋向完善,各种数据的积累也是越来越全面。税务机关也正走在打造互联网+传统税务机关的新格局的路上,对于监控企业的生产经营活动更是得心应手。由于传统技术的有限,对纳税人的进销项差异分析还停留在相同物品名称的分析层面。对于完全不匹配的进销情况的监控力度还是有欠缺。增值税防伪税控系统的发明、推广和使用极大地增加了国家税收并已成为我国税收征管强有力的手段之一,但仍有不法企业利用现有税收征管手段不足,从事违法违规的经营活动,从而导致了“有进无销、有销无进、销售不实、抵扣不符、阴阳票”等问题的出现。其中,企业利用了防伪税控系统在办理抄报税和认证的过程中,只需要核对七要素的条件,任意修改进项发票和销项发票中的物品数量、单价、金额等要素,从而达到逃税的目的。

因此,需要一种技术,以解决如何监控企业逃税的问题。



技术实现要素:

本发明提供了一种用于计算进项物品列表和销项物品列表之间差异度的方法,以解决监控企业逃税的问题。

为解决上述问题,本发明提供了一种用于计算进项物品列表和销项物品列表之间差异度的方法,所述方法包括:

进行进项物品的数据准备并且执行进项数据查询,对纳税人按照物品名称和单位进行分组统计,得到进项数据的集合;

进行销项物品的数据准备并且执行销项数据查询,对纳税人按照物品名称和单位进行分组统计,得到销项数据的集合;

读取进项物品的列表和销项物品的列表,将进项物品的列表和销项物品的列表按照纳税人的识别号进行分组,得到每个纳税人的进项物品集合和销项物品集合;

获取同一纳税人的进项物品集合和销项物品集合,对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度;以及

将同一纳税人的多个税额差异度相加,以获得进项数据和销项数据之间差异度集合。

优选地,所述对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:进项物品集合为空的纳税人,物品差异度均是1,并且税额差异度是税额总数。

优选地,所述对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:销项物品集合为空的纳税人,物品差异度均是1,并且税额差异度为负的税额总数。

优选地,所述对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:当进项物品集合和销项物品集合均不为空时,通过对比进项物品集合和销项物品集合中物品的相似度,得到相似度从大到小排序的进项物品和销项物品对。

优选地,当进项物品和销项物品对的相似度大于或等于设定值时,计算进项物品和销项物品的差异度和税额差异;当进项物品和销项物品对的相似度小于设定值时,将差异度设置为1并且税额差异度为税额总数。

优选地,其特征在于,在进行进项物品的数据准备并且执行进项数据查询时,根据查询条件“所属期范围”和“纳税人识别号”,在进项发票明细数据中,对该纳税人按物品名称和单位做分组统计,获得由物品名称、单位、单价平均值、金额合计和数量合计构成的进项物品数据集合。

优选地,其特征在于,在进项物品的数据准备过程中,包括判断明细是否完整:累计物品明细中的金额和税额,并与发票数据的金额和税额进行比较,如果相等则明细完整;如果不相等,则明细不完整。

优选地,其特征在于,在进项物品的数据准备过程中,包括判断是否作废发票:根据发票数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票。

优选地,其特征在于,在进行销项物品的数据准备并且执行销项数据查询时,根据查询条件“所属期范围”和“纳税人识别号”,在销项发票明细数据中,对该纳税人按物品名称和单位做分组统计,获得由物品名称、单位、单价平均值、金额合计以及数量合计构成的销项物品数据集合。

优选地,其特征在于,在销项物品数据准备过程中,包括判断明细是否完整:累计物品明细中的金额和税额,并与发票数据的金额和税额进行比较,如果相等则明细完整;如果不相等,则明细不完整。

优选地,其特征在于,在销项物品的数据准备过程中,包括判断是否作废发票:是根据发票数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票。

本发明技术方案通过对进销项物品的对比,将差异分为两种:进销物品类似、进销产品完全不一致。第一种:进销产品类似的情况,通过对比物品名称的相似度,相似度比较大的进行进销差异的计算,差异通过名称差异度和税额差异度进行对比。第二种:进销产品完全无法匹配的情况,通过对比发现相似度小于设定的值,将不进行匹配,直接将名称差异度设为1,税额的大小作为税额差异度。这样分配之后得到的就是比较准确的差异度,更加准确的监控企业是否正常经营。本发明的方法通过对增值税发票中的进销项物品按相似物品和无法匹配物品分类进行差异分析,更加准确的分析了纳税人的进销差异,以此监控企业的生产经营活动,进一步规范企业的正常生产经营,避免企业的违法违规经营。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明实施方式的用于计算进项物品列表和销项物品列表之间差异度的方法的流程图;以及

图2为根据本发明实施方式的用于计算进项物品列表和销项物品列表之间差异度的系统的结构示意图;。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

图1根据本发明实施方式的一种用于计算进项数据和销项数据之间差异度的方法的流程图。本发明的实施方式通过对进项物品进行数据查询,得到进项数据的集合,以及通过对销项物品进行数据查询,得到销项物品数据的集合。通过纳税人的识别号,对进项物品和销项物品进行分组,获得每个纳税人的进项物品数据的集合和销项物品数据的集合。通过对进项物品数据的集合和销项物品数据的集合进行数据分析,得到多个税额差异度。本发明实施方式通过对增值税发票中的进销项物品按相似物品和无法匹配物品分类进行差异分析,更加准确的分析了纳税人的进销差异。如图1所示,方法100从步骤101开始。

优选地,在步骤101:进行进项物品的数据准备并且执行进项数据查询,对纳税人按照物品名称和单位进行分组统计,得到进项数据的集合。

优选地,在进行进项物品的数据准备并且执行进项数据查询时,根据查询条件“所属期范围”和“纳税人识别号”,在进项发票明细数据中,对该纳税人按物品名称和单位做分组统计,获得由物品名称、单位、单价平均值、金额合计和数量合计构成的进项物品数据集合。本发明实施方式在执行进项数据查询的过程中,是根据查询条件“所属期范围”和“纳税人识别号”,在进项发票明细数据中,对该纳税人按物品名称和单位做分组统计,其输出结果为由物品名称、单位、单价平均值、金额合计、数量合计构成的进项物品数据集合。进项物品数据集合分组统计包括将全部明细数据中的单价字段取平均值,即:avg(单价),其可采用oracle函数进行;将全部明细数据中的金额字段和数量字段用oracle函数计算合计值,即:sum(金额)、sum(数量);分组统计时用sql语句,分组统计的sql语句格式为:“select物品名称、单位、avg(单价)、sum(金额)、sum(数量)from进项发票明细数据表where纳税人识别号=‘税号’and所属期范围between‘日期范围’groupby物品名称,单位”。

优选地,在进项物品的数据准备过程中,包括判断明细是否完整:累计物品明细中的金额和税额,并与发票数据的金额和税额进行比较,如果相等则明细完整;如果不相等,则明细不完整。本发明的实施方式中,将累计物品明细中的金额和税额,与本条发票数据的金额和税额进行比较,如果相等则明细完整,如果不相等,则明细不完整,并排除不完整的数据。

优选地,在进项物品的数据准备过程中,包括判断是否作废发票:根据发票数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票。本发明的实施方式中,根据本条数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票,需要排除已经作废的发票。其中,作废标志是企业办理认证、抄报业务时,需要上传到税局的数据项,作废标志直接标明是正常发票还是作废发票。

优选地,在步骤102:进行销项物品的数据准备并且执行销项数据查询,对纳税人按照物品名称和单位进行分组统计,得到销项数据的集合。

优选地,在进行销项物品的数据准备并且执行销项数据查询时,根据查询条件“所属期范围”和“纳税人识别号”,在销项发票明细数据中,对该纳税人按物品名称和单位做分组统计,获得由物品名称、单位、单价平均值、金额合计以及数量合计构成的销项物品数据集合。销项物品数据集合分组统计方式包括:将全部明细数据中的单价字段取平均值,即:avg(单价),其可采用oracle函数进行;将全部明细数据中的金额字段和数量字段用oracle函数计算合计值,即:sum(金额)、sum(数量);分组统计时用sql语句,分组计算的sql语句格式为:“select物品名称、单位、avg(单价)、sum(金额)、sum(数量)from进项发票明细数据表where纳税人识别号=‘税号’and所属期范围between‘日期范围’groupby物品名称,单位”。

优选地,在销项物品数据准备过程中,包括判断明细是否完整:累计物品明细中的金额和税额,并与发票数据的金额和税额进行比较,如果相等则明细完整;如果不相等,则明细不完整。本发明的实施方式中,将累计物品明细中的金额和税额,与本条发票数据的金额和税额进行比较,如果相等则明细完整,如果不相等,则明细不完整,并排除不完整的数据。

优选地,在销项物品的数据准备过程中,包括判断是否作废发票:是根据发票数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票。根据本条数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票,需要排除已经作废的发票。其中,作废标志是企业办理认证、抄报业务时,需要上传到税局的数据项,作废标志直接标明是正常发票还是作废发票。

优选地,在步骤103:读取进项物品的列表和销项物品的列表,将进项物品的列表和销项物品的列表按照纳税人的识别号进行分组,得到每个纳税人的进项物品集合和销项物品集合。本发明实施方式作用spark读取进项物品的列表和销项物品的列表,将进项物品的列表和销项物品的列表按照纳税人的识别号进行分组,得到每个纳税人的进项物品集合和销项物品集合。

优选地,在步骤104:获取同一纳税人的进项物品集合和销项物品集合,对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度。

优选地,对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:进项物品集合为空的纳税人,物品差异度均是1,并且税额差异度是税额总数。

优选地,对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:销项物品集合为空的纳税人,物品差异度均是1,并且税额差异度为负的税额总数。

优选地,对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:当进项物品集合和销项物品集合均不为空时,通过对比进项物品集合和销项物品集合中物品的相似度,得到相似度从大到小排序的进项物品和销项物品对。

优选地,当进项物品和销项物品对的相似度大于或等于设定值时,计算进项物品和销项物品的差异度和税额差异;当进项物品和销项物品对的相似度小于设定值时,将差异度设置为1并且税额差异度为税额总数。

本发明实施方式将相同纳税人的进项物品和销项物品分为3类进行分析:

进项物品为空的纳税人,物品差异度都是1,税额差异度是税额总数。

销项物品为空的纳税人,物品差异度都是1,税额差异度为负的税额总数。

同时又对进项物品数据和销项物品数据的纳税人通过对比物品相似度,得到最相似的进销物品。最大相似度大于设定的值,计算两个物品的差异度和税额差异,当最大相似度小于设定的值,直接作为无法匹配的物品,差异度为1,税额差异为税额总数。

优选地,在步骤105:将同一纳税人的多个税额差异度相加,以获得进项数据和销项数据之间差异度集合。本发明实施方式根据得到的不同差异度及对应的税额差异度结果,将同一个纳税人的税额差异度结果相加得到进销项税额差异度集合。

本发明的实施方式通过对进销项物品的对比,将差异分为两种:进销物品类似、进销产品完全不一致。第一种:进销产品类似的情况,通过对比物品名称的相似度,相似度比较大的进行进销差异的计算,差异通过名称差异度和税额差异度进行对比。第二种:进销产品完全无法匹配的情况,通过对比发现相似度小于设定的值,将不进行匹配,直接将名称差异度设为1,税额的大小作为税额差异度。这样分配之后得到的就是比较准确的差异度,更加准确的监控企业是否正常经营。本发明的方法通过对增值税发票中的进销项物品按相似物品和无法匹配物品分类进行差异分析,更加准确的分析了纳税人的进销差异,以此监控企业的生产经营活动,进一步规范企业的正常生产经营,避免企业的违法违规经营。

图2为根据本发明实施方式的用于计算进项物品列表和销项物品列表之间差异度的系统200的结构示意图。系统200通过对进项物品进行数据查询,得到进项数据的集合,以及通过对销项物品进行数据查询,得到销项物品数据的集合。通过纳税人的识别号,对进项物品和销项物品进行分组,获得每个纳税人的进项物品数据的集合和销项物品数据的集合。通过对进项物品数据的集合和销项物品数据的集合进行数据分析,得到多个税额差异度。本发明实施方式通过对增值税发票中的进销项物品按相似物品和无法匹配物品分类进行差异分析,更加准确的分析了纳税人的进销差异。

优选地,系统200包括:进项数据集合生成单元201、销项数据集合生成单元202、分组单元203、税额差异度计算单元204和差异度集合计算单元205。优选地,进项数据集合生成单元201进行进项物品的数据准备并且执行进项数据查询,对纳税人按照物品名称和单位进行分组统计,得到进项数据的集合。优选地,销项数据集合生成单元202进行销项物品的数据准备并且执行销项数据查询,对纳税人按照物品名称和单位进行分组统计,得到销项数据的集合。优选地,分组单元203读取进项物品的列表和销项物品的列表,将进项物品的列表和销项物品的列表按照纳税人的识别号进行分组,得到每个纳税人的进项物品集合和销项物品集合。优选地,税额差异度计算单元204获取同一纳税人的进项物品集合和销项物品集合,对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度。优选地,差异度集合计算单元205将同一纳税人的多个税额差异度相加,以获得进项数据和销项数据之间差异度集合。

优选地,所述对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:进项物品集合为空的纳税人,物品差异度均是1,并且税额差异度是税额总数。优选地,所述对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:销项物品集合为空的纳税人,物品差异度均是1,并且税额差异度为负的税额总数。优选地,所述对进项物品集合和销项物品集合进行数据分析,得到多个税额差异度包括:当进项物品集合和销项物品集合均不为空时,通过对比进项物品集合和销项物品集合中物品的相似度,得到相似度从大到小排序的进项物品和销项物品对。

优选地,当进项物品和销项物品对的相似度大于或等于设定值时,计算进项物品和销项物品的差异度和税额差异;当进项物品和销项物品对的相似度小于设定值时,将差异度设置为1并且税额差异度为税额总数。优选地,在进行进项物品的数据准备并且执行进项数据查询时,根据查询条件“所属期范围”和“纳税人识别号”,在进项发票明细数据中,对该纳税人按物品名称和单位做分组统计,获得由物品名称、单位、单价平均值、金额合计和数量合计构成的进项物品数据集合。优选地,在进项物品的数据准备过程中,包括判断明细是否完整:累计物品明细中的金额和税额,并与发票数据的金额和税额进行比较,如果相等则明细完整;如果不相等,则明细不完整。优选地,在进项物品的数据准备过程中,包括判断是否作废发票:根据发票数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票。优选地,在进行销项物品的数据准备并且执行销项数据查询时,根据查询条件“所属期范围”和“纳税人识别号”,在销项发票明细数据中,对该纳税人按物品名称和单位做分组统计,获得由物品名称、单位、单价平均值、金额合计以及数量合计构成的销项物品数据集合。优选地,在销项物品数据准备过程中,包括判断明细是否完整:累计物品明细中的金额和税额,并与发票数据的金额和税额进行比较,如果相等则明细完整;如果不相等,则明细不完整。优选地,在销项物品的数据准备过程中,包括判断是否作废发票:是根据发票数据中的是否作废标志判断,如果作废标志为“已作废”,则是作废发票。

已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1