一种虚开增值税发票的预警分析方法及系统与流程

文档序号:15558295发布日期:2018-09-29 01:38阅读:564来源:国知局

本发明涉及企业预警分析领域,更具体地,涉及一种虚开增值税发票的预警分析方法及系统。



背景技术:

增值税是我国1994年开始全面实施的新税种,它对于减少税收环节,合理征税,促进税收具有十分重要的意义。近年来,虚开增值税专用发票的犯罪活动十分猖獗,审判实践中,对虚开增值税专用发票罪的认定存在诸多问题。

虚开是指行为人违反有关发票开具管理的规定、不按照实际情况如实开具增值税专用发票及其他可用于骗取出口退税、抵扣税款的发票之行为,从广义上讲,一切不如实出具发票的行为、都是虚开的行为。狭义的虚开,则是指对发票能反映纳税人纳税情况、数额的有关内容作不实填写致使所开发票的税款与实际缴纳不符的一系列之行为。

为了骗取税款,虚开增值税专用发票或用于骗取出口退税、抵扣税款的其他发票的行为就是违反了发票管理制度,同时虚开增值税专用发票或用于骗取出口退税、抵扣税款的其他发票、可以抵扣大量税款,造成国家税款的大量流失。

随着社会的发展,虚开增值税发票的经济犯罪活动的形态呈现出升级化、产业化、网络化的新特点,面对形势更加严峻,预警发现难、精准打击难、遏制犯罪难等现象更加凸显,成为一个难点、难题。

虚开增值税发票会有显著的资金回流特点,即虚开增值税发票行为中的资金会通过多个账号、多种渠道回到原始起点。传统的虚开增值税检测即是检测银行账户中资金的往来,判断资金往来是否形成了环路来进行反虚开预警。在后文中,我们将以虚开来指代虚开增值税发票。

但是在这个过程中会遇到数据问题,即无法拿到所有的银行账目往来,所以进行账目往来环路检测的想法虽好,但如无根之萍,无法实现。

为了克服环路检测的不足,总结虚开的特点会发现除了资金回流外,还具有如下特点:

1、犯罪地域特性,即向外不实开具增值税发票的公司股东、法人具有明显的地域集聚特性,同时公司股东不存在非自然人;

2、所开发票资金会通过对公账户在短时间内流向个人账号或对公账户,且有一定幅度的资金截留;

3、公司注册地大多为住户,少有正规的写字楼等商用区域;

4、所开具的发票为万元版或十万元版,且大多顶格开具。

因此,基于以上特点,设计一种预警分析方法,利用大数据平台,来对企业的工商信息库、人口信息库、区域gis信息库、嫌疑企业的开票信息、嫌疑企业的银行账目信息进行综合研判分析,以寻找具有作案嫌疑的企业,从而为反虚开进行预警,就成为了本领域技术人员亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明提供了一种虚开增值税发票的预警分析方法及系统,以解决现有技术中的问题。

本发明公开了一种虚开增值税发票的预警分析方法,包括:

数据采集与处理,将不同来源、存储格式的企业信息数据,通过数据仓库技术中的etl工具抽取导入到大数据平台hbase,并在抽取过程中完成数据清理工作,数据清理工作包括剔除关键信息缺失数据、重复数据;

企业工商信息分析,利用分布式系统hadoop平台的分布式计算能力,批量分析已导入的企业信息数据;批量分析过程包括提取企业法人、企业股东的常驻地和籍贯所在地,如果常驻地和籍贯所在地中的任意一者属于涉案高发区,则认为有涉案风险;再利用警用地理信息系统pgis对企业注册所在地进行分析,如果企业注册所在地属于住宅或其它设定的可疑范围,则对该企业进行加权;

企业银行交易信息分析,根据企业工商信息分析的结果,从银行获取嫌疑企业的银行交易信息,并对银行交易信息进行分析;在对银行交易信息分析时,对每一笔入账前后的出账信息进行加和统计,如果出账趋势、总量符合关联交易模型,则识别出该笔交易信息为嫌疑交易;

企业开票信息分析,根据企业银行交易信息分析的结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;开票信息为企业开具的发票信息电子对账单,电子对账单包括企业开具发票的时间、金额的信息;

反虚开预警分析结果展示,将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。

优选的,企业信息数据的来源包括企业工商信息、银行交易信息、开票信息;企业信息数据的存储格式包括:企业工商信息以“成立日期+企业注册号+对公银行账号”为rowkey进行全信息存储;银行交易信息以“银行账号+交易类型+交易时间”为rowkey进行全信息存储;开票信息以“购方识别号+开票日期+金额”为rowkey进行全信息存储。

进一步优选的,企业工商信息分析包括:利用分布式系统hadoop平台的mapreduce技术,分布式计算碰撞企业股东、企业法人的常驻地和籍贯所在地,如有任何一人的常驻地或籍贯所在地符合设定的涉案区域,则将其存储到以企业注册号为key的键值对fxkqy<企业注册号,股东及法人信息、权值>;其中初始的权值为0,并将计算分析结果fxkqy写入到hadoop的文件系统hdfs中;

当涉案区域分析完毕后,再次利用mapreduce技术,分布式遍历fxkqy中的企业,并将其企业注册地通过地理信息系统进行gis信息关联对比,如果其注册所在地为住宅、集中公共注册地、重点关注地中的任意一种,则对其权值+1;

分析完毕后的fxkqy重新写入到hadoop的文件系统hdfs中,供后续步骤利用。

进一步优选的,企业银行交易信息分析包括:

遍历fxkqy企业中的涉公账号,分析其银行交易信息,如果在两个交易日内的,有一笔交易的入账满足:则认为该笔交易有虚开交易嫌疑,并将fxkqy对应的权值加1;其中,n为入账信息两个交易日内的所有出账交易条数,k为出账交易金额;

然后将符合条件的嫌疑交易信息保存到以企业注册号为key的键值对fxktrade<企业注册号,交易编码1、关联交易编码1、交易时间1;交易编码n、关联交易编码n、交易时间n>中。

进一步优选的,企业开票信息分析包括:

遍历fxktrade,并将其嫌疑交易的入账信息和该嫌疑交易的开票信息进行比对,如果开票金额为一万元版以及十万元版连续顶格开具,则视该票有虚开嫌疑,将开票信息保存到以企业注册号为key的键值对fxkkp<企业注册号,发票代码1、开票时间1、交易金额1;发票代码n、开票时间n、交易金额n>中,并将fxkqy对应的权值加1。

至此所有的预警分析计算过程完毕。

另一方面,本发明还公开了一种虚开增值税发票的预警分析系统,包括数据采集与处理模块、企业工商信息分析模块、企业银行交易信息分析模块、企业开票信息分析模块、分析结果展示模块;

数据采集与处理模块,用于通过数据仓库技术中的etl工具将不同来源、存储格式的企业信息数据抽取导入到大数据平台hbase,并在抽取过程中完成数据清理工作;

企业工商信息分析模块,用于利用分布式系统hadoop平台的分布式计算能力,批量分析已导入的企业信息数据;

企业银行交易信息分析模块,用于根据企业工商信息分析模块分析的结果,从银行获取嫌疑企业的银行交易信息,并对银行交易信息进行分析;

企业开票信息分析模块,用于根据企业银行交易信息分析模块的分析结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;

分析结果展示模块,用于将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。

优选的,数据清理工作包括剔除关键信息缺失数据、重复数据。

优选的,企业工商信息分析模块的批量分析过程包括提取企业法人、企业股东的常驻地和籍贯所在地,如果常驻地和籍贯所在地中的任意一者属于涉案高发区,则认为有涉案风险;再利用警用地理信息系统pgis对企业注册所在地进行分析,如果企业注册所在地属于住宅或其它设定的可疑范围,则对该企业进行加权。

优选的,在对银行交易信息分析时,对每一笔入账前后的出账信息进行加和统计,如果出账趋势、总量符合关联交易模型,则识别出该笔交易信息为嫌疑交易。

优选的,开票信息为企业开具的发票信息电子对账单,电子对账单包括企业开具发票的时间、金额的信息。

与现有技术相比,本发明提供的虚开增值税发票的预警分析方法及系统,至少实现了如下的有益效果:

1、本发明的虚开增值税发票的预警分析方法是基于离线的对企业的工商信息库、人口信息库、区域gis信息库、嫌疑企业的开票信息、嫌疑企业的银行账目信息进行综合研判分析,系统数据除人口信息库为公安信息网内的数据,可以进行对接访问外,其余的系统数据为可获取到的离线非实时数据,因此本发明的预警分析方法无需占用过大的网络流量,可减少系统冗余,加快分析过程。

2、本发明的虚开增值税发票的预警分析方法,首先是进行企业工商信息分析研判,选择符合嫌疑条件的企业再进行银行交易信息分析,这是由于银行交易信息分布点较广,而且无法无目的性的从银行获取,所以根据企业工商信息分析的结果,从特定的银行获取嫌疑企业的交易信息,不仅可以增加工作效率,还能提高分析结果的准确性。

3、本发明的虚开增值税发票的预警分析方法所利用的大数据平台hbase、分布式系统hadoop平台均可以建立在廉价的商用机上,并可根据数据量的大小等实际情况确定集群的大小,能够存储海量的数据,在进行统计分析时,可以首先同时利用各节点机器的运算能力进行数据量较大且繁琐的计算,从而降低统计时间。

4、本发明的虚开增值税发票的预警分析方法规避了传统的反虚开环流检测因无法拿到全部的银行交易数据,而导致无法形成交易环流的问题。

5、使用本发明的虚开增值税发票的预警分析方法,可以避开漫无目的的涉公银行账号交易信息调取,而且利用大数据平台的分布式存储、分布式计算能力,可以对涉及的大量数据进行综合存储、分析,其具备的扩展性还可以在发现新的线索时,快速扩展预警研判算法。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是本发明实施例的一种虚开增值税发票的预警分析方法流程图;

图2是本发明实施例的另一种虚开增值税发票的预警分析方法流程图;

图3是本发明实施例的又一种虚开增值税发票的预警分析方法流程图;

图4是本发明实施例的一种虚开增值税发票的预警分析系统的构成示意图;

图5是本发明实施例的一种虚开增值税发票的预警分析方法及系统工作流程图;

图6是本发明实施例图5的方法流程图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

实施例一

如图1所示为本发明实施例的一种虚开增值税发票的预警分析方法流程图,该预警分析方法包括:

步骤101:数据采集与处理,将不同来源、存储格式的企业信息数据,通过数据仓库技术中的etl工具抽取导入到大数据平台hbase,并在抽取过程中完成数据清理工作;

步骤102:企业工商信息分析,利用分布式系统hadoop平台的分布式计算能力,批量分析已导入的企业信息数据;

步骤103:企业银行交易信息分析,根据企业工商信息分析的结果,从银行获取嫌疑企业的银行交易信息,并对银行交易信息进行分析;

步骤104:企业开票信息分析,根据企业银行交易信息分析的结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;

步骤105:反虚开预警分析结果展示,将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。

本实施例中,步骤101的数据清理工作包括剔除关键信息缺失数据、重复数据;步骤104的开票信息为企业开具的发票信息电子对账单,电子对账单包括企业开具发票的时间、金额的信息;

步骤102中的批量分析过程、步骤103中的对银行交易信息分析过程可进行如图2所示的进一步细化,图2是本发明实施例的另一种虚开增值税发票的预警分析方法流程图,批量分析过程包括提取企业法人、企业股东的常驻地和籍贯所在地,如果常驻地和籍贯所在地中的任意一者属于涉案高发区,则认为有涉案风险;再利用警用地理信息系统pgis对企业注册所在地进行分析,如果企业注册所在地属于住宅或其它设定的可疑范围,则对该企业进行加权;在对银行交易信息分析时,对每一笔入账前后的出账信息进行加和统计,如果出账趋势、总量符合关联交易模型,则识别出该笔交易信息为嫌疑交易。

为了更进一步理解本发明实施例,需要说明的是,本实施例中,大数据平台hbase是建立在hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。hbase是一个数据模型,可以提供快速随机访问海量结构化数据。它利用了hadoop的文件系统(hdfs)提供的容错能力。它是hadoop的生态系统,提供对数据的随机实时读/写访问,是hadoop文件系统的一部分。人们可以直接或通过hbase的存储hdfs数据,使用hbase在hdfs读取消费/随机访问数据。hbase在hadoop的文件系统之上,并提供了读写访问。

数据仓库技术中的etl(extract-transform-load)工具,用来将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。etl工具较常用在数据仓库,但其对象并不限于数据仓库。etl工具的典型代表有:informatica、datastage、owb、微软dts、beeload、kettle;etl工具目前有两种技术架构:etl架构和elt架构,

在etl架构中,数据的流向是从源数据流到etl工具,etl工具是一个单独的数据处理引擎,一般会在单独的硬件服务器上,实现所有数据转化的工作,然后将数据加载到目标数据仓库中,如果要增加整个etl过程的效率,则只能增强etl工具服务器的配置,优化系统处理流程(一般可调的东西非常少)。

在elt架构中,elt只负责提供图形化的界面来设计业务规则,数据的整个加工过程都在目标和源的数据库之间流动,elt协调相关的数据库系统来执行相关的应用,数据加工过程既可以在源数据库端执行,也可以在目标数据仓库端执行,主要取决于系统的架构设计和数据属性。当etl过程需要提高效率,则可以通过对相关数据库进行调优,或者改变执行加工的服务器就可以达到。

警用地理信息系统pgis(policegeographicinformationsystem),是以公安信息网络为基础,以警用电子地图为核心,以地理信息技术为支撑,以服务于公安业务管理、信息共享和决策支持的可视化为目标的重要信息化基础设施,是地理信息技术与公安信息系统相结合的产物,是公安信息化的高端应用,可以有效地拉动公安信息整合、信息共享,实现部、省、市互联互通,全面提升公安信息化应用水平。

实施例二

如图3所示为本发明实施例的又一种虚开增值税发票的预警分析方法流程图,该预警分析方法包括:

步骤201:数据采集与处理,将以“成立日期+企业注册号+对公银行账号”为rowkey进行全信息存储的企业工商信息、以“银行账号+交易类型+交易时间”为rowkey进行全信息存储的银行交易信息、以“购方识别号+开票日期+金额”为rowkey进行全信息存储的开票信息,通过数据仓库技术中的etl工具抽取导入到大数据平台hbase,并在抽取过程中完成数据清理工作;

步骤202:利用分布式系统hadoop平台的mapreduce技术,分布式计算碰撞企业股东、企业法人的常驻地和籍贯所在地,如有任何一人的常驻地或籍贯所在地符合设定的涉案区域,则将其存储到以企业注册号为key的键值对fxkqy<企业注册号,股东及法人信息、权值>;其中初始的权值为0,并将计算分析结果fxkqy写入到hadoop的文件系统hdfs中;

当涉案区域分析完毕后,再次利用mapreduce技术,分布式遍历fxkqy中的企业,并将其企业注册地通过地理信息系统进行gis信息关联对比,如果其注册所在地为住宅、集中公共注册地、重点关注地中的任意一种,则对其权值+1;

分析完毕后的fxkqy重新写入到hadoop的文件系统hdfs中,供后续步骤利用。

步骤203:遍历fxkqy企业中的涉公账号,分析其银行交易信息,如果在两个交易日内的,有一笔交易的入账满足:则认为该笔交易有虚开交易嫌疑,并将fxkqy对应的权值加1;其中,其中8%是经过测试验证后得出的最佳临界值,n为入账信息两个交易日内的所有出账交易条数,k为出账交易金额;

然后将符合条件的嫌疑交易信息保存到以企业注册号为key的键值对fxktrade<企业注册号,交易编码1、关联交易编码1、交易时间1;交易编码n、关联交易编码n、交易时间n>中。

步骤204:遍历fxktrade,并将其嫌疑交易的入账信息和该嫌疑交易的开票信息进行比对,如果开票金额为一万元版以及十万元版连续顶格开具,则视该票有虚开嫌疑,将开票信息保存到以企业注册号为key的键值对fxkkp<企业注册号,发票代码1、开票时间1、交易金额1;发票代码n、开票时间n、交易金额n>中,并将fxkqy对应的权值加1,至此所有的预警分析计算过程完毕。

步骤205:将上述步骤研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。

为了更进一步理解本发明实施例,需要说明的是,本实施例中,hbase是一个面向列的数据库,在表中它由行排序。表模式定义只能列族,也就是键值对。一个表有多个列族以及每一个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格值都具有时间戳。总之,在一个hbase,表是行的集合,行是列族的集合,列族是列的集合,列是键值对的集合。hbase是三维有序存储的,通过rowkey(行键),columnkey(列键)和timestamp(时间戳)这个三个维度可以对hbase中的数据进行快速定位。hbase中rowkey可以唯一标识一行记录,在hbase查询的时候,有以下几种方式:通过get方式,指定rowkey获取唯一一条记录;通过scan方式,设置startrow和stoprow参数进行范围匹配;全表扫描,即直接扫描整张表中所有行记录。rowkey是一个二进制码流,可以是任意字符串,最大长度64kb,实际应用中一般为10-100bytes,以byte[]形式保存,一般设计成定长。

mapreduce是一种编程模型,用于大规模数据集的并行运算,极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。具体操作时,指定一个map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

实施例三

如图4所示为本发明实施例的一种虚开增值税发票的预警分析系统的构成示意图,该系统包括:包括数据采集与处理模块31、企业工商信息分析模块32、企业银行交易信息分析模块33、企业开票信息分析模块34、分析结果展示模块35;

数据采集与处理模块31,用于通过数据仓库技术中的etl工具将不同来源、存储格式的企业信息数据抽取导入到大数据平台hbase,并在抽取过程中完成数据清理工作;

企业工商信息分析模块32,用于利用分布式系统hadoop平台的分布式计算能力,批量分析已导入的企业信息数据;

企业银行交易信息分析模块33,用于根据企业工商信息分析模块分析的结果,从银行获取嫌疑企业的银行交易信息,并对银行交易信息进行分析;

企业开票信息分析模块34,用于根据企业银行交易信息分析模块的分析结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;

分析结果展示模块35,用于将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。

实施例四

如图5和图6所示,图5是本发明实施例的一种虚开增值税发票的预警分析方法及系统工作流程图,图6是本发明实施例图5的方法流程图,在实施例一-实施例三的基础上,本实施例为应用实施例:

步骤401:数据采集,基于离线非实时数据,采集企业工商信息、企业开票信息、企业银行交易信息;

步骤402:数据抽取,将采集到的数据进行处理,通过数据仓库技术中的etl工具抽取到大数据平台hbase;

步骤403:数据清洗,在抽取过程中完成剔除关键信息缺失数据、重复数据的数据清理工作;

步骤404:数据存储,将企业工商信息以“成立日期+企业注册号+对公银行账号”为rowkey进行全信息存储,银行交易信息以“银行账号+交易类型+交易时间”为rowkey进行全信息存储,开票信息以“购方识别号+开票日期+金额”为rowkey进行全信息存储;

步骤405:数据导入,通过数据仓库技术中的etl工具导入加载到大数据平台hbase;

以上步骤在数据采集与处理模块31完成。

步骤406:涉案区域分析,利用分布式系统hadoop平台的mapreduce技术,分布式计算碰撞企业股东、企业法人的常驻地和籍贯所在地,如有任何一人的常驻地或籍贯所在地符合设定的涉案区域,则将其存储到以企业注册号为key的键值对fxkqy<企业注册号,股东及法人信息、权值>;其中初始的权值为0,并将计算分析结果fxkqy写入到hadoop的文件系统hdfs中;

步骤407:注册地分析,当涉案区域分析完毕后,再次利用mapreduce技术,分布式遍历fxkqy中的企业,并将其企业注册地通过地理信息系统进行gis信息关联对比,如果其注册所在地为住宅、集中公共注册地、重点关注地中的任意一种,则对其权值+1;

步骤408:分析完毕后的fxkqy重新写入到hadoop的文件系统hdfs中,供后续步骤利用;

以上步骤在企业工商信息分析模块32完成。

步骤409:银行交易分析,遍历fxkqy企业中的涉公账号,分析其银行交易信息,如果在两个交易日内的,有一笔交易的入账满足:则认为该笔交易有虚开交易嫌疑,并将fxkqy对应的权值加1;其中,其中8%是经过测试验证后得出的最佳临界值,n为入账信息两个交易日内的所有出账交易条数,k为出账交易金额;

步骤410:将符合条件的嫌疑交易信息保存到以企业注册号为key的键值对fxktrade<企业注册号,交易编码1、关联交易编码1、交易时间1;交易编码n、关联交易编码n、交易时间n>中;

以上步骤在企业银行交易信息分析模块33完成。

步骤411:开票信息分析,遍历fxktrade,并将其嫌疑交易的入账信息和该嫌疑交易的开票信息进行比对,如果开票金额为一万元版以及十万元版连续顶格开具,则视该票有虚开嫌疑,将开票信息保存到以企业注册号为key的键值对fxkkp<企业注册号,发票代码1、开票时间1、交易金额1;发票代码n、开票时间n、交易金额n>中,并将fxkqy对应的权值加1,至此所有的预警分析计算过程完毕。

以上步骤在企业开票信息分析模块34完成。

步骤412:缺失信息反馈,在上述步骤409-步骤411过程中,若发现有银行交易信息或开票信息缺失,无法进行分析研判时,反馈至步骤401,进行缺失信息的补充;

步骤413:结果展示,将上述步骤研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。

以上步骤在分析结果展示模块35完成。

通过上述实施例可知,本发明提供的虚开增值税发票的预警分析方法及系统,至少实现了如下的有益效果:

1、本发明的虚开增值税发票的预警分析方法是基于离线的对企业的工商信息库、人口信息库、区域gis信息库、嫌疑企业的开票信息、嫌疑企业的银行账目信息进行综合研判分析,系统数据除人口信息库为公安信息网内的数据,可以进行对接访问外,其余的系统数据为可获取到的离线非实时数据,因此本发明的预警分析方法无需占用过大的网络流量,可减少系统冗余,加快分析过程。

2、本发明的虚开增值税发票的预警分析方法,首先是进行企业工商信息分析研判,选择符合嫌疑条件的企业再进行银行交易信息分析,这是由于银行交易信息分布点较广,而且无法无目的性的从银行获取,所以根据企业工商信息分析的结果,从特定的银行获取嫌疑企业的交易信息,不仅可以增加工作效率,还能提高分析结果的准确性。

3、本发明的虚开增值税发票的预警分析方法所利用的大数据平台hbase、分布式系统hadoop平台均可以建立在廉价的商用机上,并可根据数据量的大小等实际情况确定集群的大小,能够存储海量的数据,在进行统计分析时,可以首先同时利用各节点机器的运算能力进行数据量较大且繁琐的计算,从而降低统计时间。

4、本发明的虚开增值税发票的预警分析方法规避了传统的反虚开环流检测因无法拿到全部的银行交易数据,而导致无法形成交易环流的问题。

5、使用本发明的虚开增值税发票的预警分析方法,可以避开漫无目的的涉公银行账号交易信息调取,而且利用大数据平台的分布式存储、分布式计算能力,可以对涉及的大量数据进行综合存储、分析,其具备的扩展性还可以在发现新的线索时,快速扩展预警研判算法。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1