本发明涉及数据挖掘领域,特别是涉及一种发票核定方法及系统。
背景技术
随着“互联网+税务”行动的推进,越来越多的税务机关搭建了自己的大数据平台,引入云计算技术,发挥大数据优势,积极尝试将互联网创新成果与税收工作深度结合,以此推动效率提升和管理变革。提升税收管理水平是“互联网+税务”中的重要一环,自然离不开大数据的支持,需要围绕数据建立精确管理体系,即对各种涉税数据进行收集、分析、整合和使用。而数据挖掘技术是目前处理大数据信息的主要手段之一,数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,又是潜在有用的信息和知识的过程,是一种更深层次的数据分析。随着数据挖掘技术的发展,其涉及众多科学技术,包括数据库技术、统计学、机器学习、信息科学、数据可视化及模式识别等其他科学。
对税收管理而言,发票核定管理困难重重,一是在审批纳税人的发票核定调整申请的过程中缺少足够的多方信息去了解纳税人真实情况,且不同的专管员审批管理粗细不同,规范不一,二是没有准确的评估模型对纳税人进行预判。迫切需要利用大数据技术整合纳税人相关数据,构建精准评估模型,一方面为纳税人提供合理的核定调整建议,另一方面为税务机关的发票核定管理提供决策支撑。
技术实现要素:
针对上述问题,本发明提供了一种发票核定方法及系统。
为实现上述目的,本发明提供了如下方案:
一种发票核定方法,所述方法包括:
获取纳税人的信息;所述纳税人的信息包括纳税人注册资本、从业人数、营业状态、纳税人信用等级、纳税人注册地址信息、经营地址信息、企业法定代表人以及纳税人缴税信息;
根据所述信息生成纳税人相关指数;所述纳税人相关指数包括纳税人基本指数、异地经营指数、一址多照指数、法人记录指数以及缴税指数;
根据所述纳税人相关指数以及预设条件对纳税人进行筛选,得到满足条件的纳税人以及未满足条件的纳税人;
获取所述满足条件的纳税人的发票领用数据以及发票开具数据;
通过所述满足条件的纳税人、所述发票领用数据以及所述发票开具数据,对长短时记忆模型进行训练,得到预测模型;
通过所述预测模型预测所述满足条件的纳税人在预设期限内的发票金额;
根据预测的发票金额给满足条件的纳税人推送核定调整建议。
可选的,所述方法还包括:将所述未满足条件的纳税人推送至税务部端。
可选的,所述预设条件包括:发票开具数据具备增额增量条件以及无走逃或偷漏税风险。
可选的,所述根据所述信息生成纳税人相关指数,具体包括:
根据所述纳税人注册资本、所述从业人数、所述营业状态以及所纳税人信用等级,生成纳税人基本指数;
根据所述纳税人注册地址信息和经营地址信息,确定异地经营指数;
根据所述纳税人注册地址信息,确定一址多照指数;
根据所述企业法定代表人,确定法人记录指数;
根据所述纳税人缴税信息,确定缴税指数。
本发明还提供了一种发票核定系统,所述系统包括:
纳税人的信息获取模块,用于获取纳税人的信息;所述纳税人的信息包括纳税人注册资本、从业人数、营业状态、纳税人信用等级、纳税人注册地址信息、经营地址信息、企业法定代表人以及纳税人缴税信息;
纳税人相关指数生成模块,用于根据所述信息生成纳税人相关指数;所述纳税人相关指数包括纳税人基本指数、异地经营指数、一址多照指数、法人记录指数以及缴税指数;
筛选模块,用于根据所述纳税人相关指数以及预设条件对纳税人进行筛选,得到满足条件的纳税人以及未满足条件的纳税人;
发票获取模块,用于获取所述满足条件的纳税人的发票领用数据以及发票开具数据;
训练模块,用于通过所述满足条件的纳税人、所述发票领用数据以及所述发票开具数据,对长短时记忆模型进行训练,得到预测模型;
预测模块,用于通过所述预测模型预测所述满足条件的纳税人在预设期限内的发票金额;
核定模块,用于根据预测的发票金额给满足条件的纳税人推送核定调整建议。
可选的,所述系统还包括:
推送模块,用于将所述未满足条件的纳税人推送至税务部端。
可选的,所述预设条件包括:发票开具数据具备增额增量条件以及无走逃或偷漏税风险。
可选的,所述纳税人相关指数生成模块包括:
异地经营指数确定单元,用于根据所述纳税人注册地址信息和经营地址信息,确定异地经营指数;
一址多照指数确定单元,用于根据所述纳税人注册地址信息,确定一址多照指数;
法人记录指数确定单元,用于根据所述企业法定代表人,确定法人记录指数;
缴税指数确定单元,用于根据所述纳税人缴税信息,确定缴税指数。
与现有技术相比,本发明具有以下技术效果:本发明通过所述满足条件的纳税人、所述发票领用数据以及所述发票开具数据,对长短时记忆模型进行训练,得到预测模型;通过所述预测模型预测所述满足条件的纳税人在预设期限内的发票金额;根据预测的发票金额给满足条件的纳税人推送核定调整建议。本发明对纳税人相关信息进行综合分析处理,有效的将数据挖掘技术和税务相结合,对纳税人的发票核定调整进行预判,能够有效提高税务人员的工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例发票核定方法的流程图;
图2为本发明实施例发票核定系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例发票核定方法的流程图。如图1所示,一种发票核定方法包括:
步骤101:获取纳税人的信息;所述纳税人的信息包括纳税人注册资本、从业人数、营业状态、纳税人信用等级、纳税人注册地址信息、经营地址信息、企业法定代表人以及纳税人缴税信息。
步骤102:根据所述信息生成纳税人相关指数;所述纳税人相关指数包括纳税人基本指数、异地经营指数、一址多照指数、法人记录指数以及缴税指数。
所述根据所述信息生成纳税人相关指数,具体包括:
根据所述纳税人注册资本、所述从业人数、所述营业状态以及所纳税人信用等级,生成纳税人基本指数。
根据所述纳税人注册地址信息和经营地址信息,确定异地经营指数;以纳税人注册地址和经营地址的距离为基准,根据距离范围将异地经营划分为0~5共六个指数等级。
根据所述纳税人注册地址信息,确定一址多照指数;查询纳税人注册地址是否存在多家企业,确定一址多照指数。
根据所述企业法定代表人,确定法人记录指数;检索企业法定代表人是否为本市居民以及是否曾经或目前为其他非正常户企业法定代表人,确定法人记录指数;具体的,根据企业法定代表人是否曾经或目前为其他非正常户企业法定代表人的记录次数确定0~2三个指数等级。
根据所述纳税人缴税信息,确定缴税指数根据纳税人是否按时缴税、足额缴税情况,确实其缴税指数。
步骤103:根据所述纳税人相关指数以及预设条件对纳税人进行筛选,得到满足条件的纳税人以及未满足条件的纳税人。所述预设条件包括:发票开具数据具备增额增量条件以及无走逃或偷漏税风险。
步骤104:获取所述满足条件的纳税人的发票领用数据以及发票开具数据。
步骤105:通过所述满足条件的纳税人、所述发票领用数据以及所述发票开具数据,对长短时记忆模型进行训练,得到预测模型。
步骤106:通过所述预测模型预测所述满足条件的纳税人在预设期限内的发票金额。
步骤107:根据预测的发票金额给满足条件的纳税人推送核定调整建议。
经过深度神经网络的学习,可以对纳税人开票金额进行预测。lstm模型输出结果即为纳税人登记序号和相应预测的下月开具金额,根据纳税人当前单份发票最大限额分情况进行计算判断:
对当前单份发票最大限额为1万元的纳税人,计算开具金额与税额之差和单份发票最高开票限额的差值,大于零则认为在这一定时间内该纳税人可进行增额,对数据库中该纳税人的数据按如下公式进行计算:
根据不同地区经济情况对该比例设定阈值,当超过阈值时即可对纳税人进行增额推荐;
对当前单份发票最大限额为10万元的纳税人,除上述计算过程外,需统计该纳税人在一天内向同一购货方开具发票金额的总和,当存在金额总额超过100万元的情况时,视纳税人具有大额合同,对其进行增额推荐。
对于发票量调整的判断,按如下公式计算开具量:
其中,
根据实际情况可知,发票增量一般为五的倍数,故对增量推荐进行如下处理:
在实际给纳税人推送时,可再计算如下值:
指标值=最终推荐增量数目-每月最高购票数量;
根据实际情况,设定精确度阈值,最终筛选出精确度小于阈值且指标值不为0纳税人的进行推送,其中指标值大于0为可增量纳税人,小于0为可考虑降量纳税人。等于0则为不调整纳税人。
所述方法还包括:将所述未满足条件的纳税人推送至税务部端,以便加强预防管理。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明通过所述满足条件的纳税人、所述发票领用数据以及所述发票开具数据,对长短时记忆模型进行训练,得到预测模型;通过所述预测模型预测所述满足条件的纳税人在预设期限内的发票金额;根据预测的发票金额给满足条件的纳税人推送核定调整建议。本发明对纳税人相关信息进行综合分析处理,有效的将数据挖掘技术和税务相结合,对纳税人的发票核定调整进行预判,能够有效提高税务人员的工作效率。
图2为本发明实施例发票核定系统的结构框图。如图2所示,本发明还提供了一种发票核定系统,所述系统包括:
纳税人的信息获取模块201,用于获取纳税人的信息;所述纳税人的信息包括纳税人注册资本、从业人数、营业状态、纳税人信用等级、纳税人注册地址信息、经营地址信息、企业法定代表人以及纳税人缴税信息。
纳税人相关指数生成模块202,用于根据所述信息生成纳税人相关指数;所述纳税人相关指数包括纳税人基本指数、异地经营指数、一址多照指数、法人记录指数以及缴税指数。
所述纳税人相关指数生成模块202具体包括:
异地经营指数确定单元,用于根据所述纳税人注册地址信息和经营地址信息,确定异地经营指数;
一址多照指数确定单元,用于根据所述纳税人注册地址信息,确定一址多照指数;
法人记录指数确定单元,用于根据所述企业法定代表人,确定法人记录指数;
缴税指数确定单元,用于根据所述纳税人缴税信息,确定缴税指数。
筛选模块203,用于根据所述纳税人相关指数以及预设条件对纳税人进行筛选,得到满足条件的纳税人以及未满足条件的纳税人;所述预设条件包括:发票开具数据具备增额增量条件以及无走逃或偷漏税风险。
发票获取模块204,用于获取所述满足条件的纳税人的发票领用数据以及发票开具数据。
训练模块205,用于通过所述满足条件的纳税人、所述发票领用数据以及所述发票开具数据,对长短时记忆模型进行训练,得到预测模型。
预测模块206,用于通过所述预测模型预测所述满足条件的纳税人在预设期限内的发票金额。
核定模块207,用于根据预测的发票金额给满足条件的纳税人推送核定调整建议。
所述系统还包括:推送模块,用于将所述未满足条件的纳税人推送至税务部端。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。