一种电子商务税源管理分析方法

文档序号:8282452阅读:357来源:国知局
一种电子商务税源管理分析方法
【技术领域】
[0001]本发明涉及大数据挖掘分析技术领域,具体涉及一种电子商务税源管理分析方法。
【背景技术】
[0002]随着互联网应用的普及,我国电子商务快速发展,网上购物作为一种经济、高效、低碳的购物方式已经逐渐成为主流消费方式。企业纷纷通过建立门户网站、自主B2C网站、加盟B2C/B2B平台、微博推广等各种方式开展企业推广和电子商务经营。网上交易生成了大量的税源数据,可以通过电子商务税源管理云采集系统将这些结构化、半结构化以及非结构化的数据采集下来。这些数据,经过ETL,与税局组织内数据进行整合,挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系等。并进一步利用数据可视化技术呈现给税务人员,为税收精细化管理、精确决策提供数据分析平台,提高税收评估能力,完善税收管理决策模式,提高税收,推进信息管税、科学征税、依法征税。
[0003]ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL —词较常用在数据仓库,但其对象并不限于数据仓库。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

【发明内容】

[0004]本发明要解决的技术问题是:提供一种电子商务税源管理分析方法,为税收精细化管理、精确决策提供数据分析平台。
[0005]本发明所采用的技术方案为:
一种电子商务税源管理分析方法,所述方法通过电子商务税源管理云采集系统爬取解析的多个电子商务网站数据并保存到数据库中,进行采集数据的清洗;将税务局提供的组织内数据进行ETL抽取转换,保存到系统数据库中;将采集数据与税务局提供的组织数据进行整合分析,挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系O
[0006]对采集数据进行清洗流程如下:
将电子商务税源管理云采集系统提供的网店基本信息表和销售信息表导入数据库;将新的网店基本信息与原网店基本信息进行合并,更新网店基本信息:加入新开网店,并为新网店生成网店id,修改网店状态与实际状态一致,更新网店所属公司名称;
将多个电商的网店基本信息进行合并,将不同电商中网店属于同一公司的销售信息归一化,并取得公司名称列表,获得互联网电商信息。
[0007]对税局组织内数据进行ETL的流程如下:
参照产生的公司名称列表,从税局组织内数据中进行查找匹配,获取有效纳税人基本信息;
根据有效纳税人基本信息关联出税种认定信息;
根据有效纳税人基本信息关联纳税人资格信息;
根据有效纳税人基本信息关联增值税认定信息;
根据上述信息关联纳税申报信息和增值税发票开具信息,获得税务信息。
[0008]数据整合分析流程:将清洗过的互联网电商信息与通过ETL获得的税务信息进行关联规则分析、数据挖掘分析以及统计比对,获得非正常缴税纳税人列表,以及网店的关联关系、纳税人关联关系、电商关联关系、电商销售发展趋势、税收预警。
[0009]所述方法业务流程如下:
O电子商务税源管理系统云采集系统采集信息;
2)所采集的电子商务网站的有效数据结构化,并导入数据库并初始化,对数据根据应用需求进行缺失值填充、去重、合并以及抽取转换;
3)网点基本信息更新;
4)多电商基本信息及销售信息合并,获得网店所属公司名称列表;
5)将税务局管理系统提供的组织内数据进行ETL抽取转换,保存到本系统数据库中,并结合网店所属公司名称列表匹配有效纳税人;
6)关联税种、纳税人资格和增值税认定情况;
7)关联纳税申报和增值税开票信息;
8)对步骤4)获得的电商基本信息、销售信息和步骤7)获得的税务信息进行数据挖掘分析、对比统计。
[0010]本发明的有益效果为:采用本发明方法,可以挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系等,并进一步利用数据可视化技术呈现给税务人员,为税收精细化管理、精确决策提供数据分析平台,提高税收评估能力,完善税收管理决策模式,提高税收,推进信息管税、科学征税、依法征税。
【附图说明】
[0011]图1为本发明业务流程图。
【具体实施方式】
[0012]下面参照附图所示,通过【具体实施方式】对本发明进一步说明:
一种电子商务税源管理分析方法,所述方法通过电子商务税源管理云采集系统爬取解析的多个电子商务网站数据并保存到数据库中,进行采集数据的清洗;将税务局提供的组织内数据进行ETL抽取转换,保存到系统数据库中;将采集数据与税务局提供的组织数据进行整合分析,挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系O
[0013]对采集数据进行清洗流程如下:
将电子商务税源管理云采集系统提供的网店基本信息表和销售信息表导入数据库;将新的网店基本信息与原网店基本信息进行合并,更新网店基本信息:加入新开网店,并为新网店生成网店id,修改网店状态与实际状态一致,更新网店所属公司名称; 将多个电商的网店基本信息进行合并,将不同电商中网店属于同一公司的销售信息归一化,并取得公司名称列表,获得互联网电商信息。
[0014]对税局组织内数据进行ETL的流程如下:
参照产生的公司名称列表,从税局组织内数据中进行查找匹配,获取有效纳税人基本信息;
根据有效纳税人基本信息关联出税种认定信息;
根据有效纳税人基本信息关联纳税人资格信息;
根据有效纳税人基本信息关联增值税认定信息;
根据上述信息关联纳税申报信息和增值税发票开具信息,获得税务信息。
[0015]数据整合分析流程:将清洗过的互联网电商信息与通过ETL获得的税务信息进行关联规则分析、数据挖掘分析以及统计比对,获得非正常缴税纳税人列表,以及网店的关联关系、纳税人关联关系、电商关联关系、电商销售发展趋势、税收预警。
[0016]所述方法业务流程如下:
O电子商务税源管理系统云采集系统采集信息;
2)所采集的电子商务网站的有效数据结构化,并导入数据库并初始化,对数据根据应用需求进行缺失值填充、去重、合并以及抽取转换;
3)网点基本信息更新;
4)多电商基本信息及销售信息合并,获得网店所属公司名称列表;
5)将税务局管理系统提供的组织内数据进行ETL抽取转换,保存到本系统数据库中,并结合网店所属公司名称列表匹配有效纳税人;
6)关联税种、纳税人资格和增值税认定情况;
7)关联纳税申报和增值税开票信息;
8)对步骤4)获得的电商基本信息、销售信息和步骤7)获得的税务信息进行数据挖掘分析、对比统计。
[0017]以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
【主权项】
1.一种电子商务税源管理分析方法,其特征在于:所述方法通过电子商务税源管理云采集系统爬取解析的多个电子商务网站数据并保存到数据库中,进行采集数据的清洗;将税务局提供的组织内数据进行ETL抽取转换,保存到系统数据库中;将采集数据与税务局提供的组织数据进行整合分析,挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系。
2.根据权利要求1所述的一种电子商务税源管理分析方法,其特征在于,对采集数据进行清洗流程如下: 将电子商务税源管理云采集系统提供的网店基本信息表和销售信息表导入数据库; 将新的网店基本信息与原网店基本信息进行合并,更新网店基本信息:加入新开网店,并为新网店生成网店id,修改网店状态与实际状态一致,更新网店所属公司名称; 将多个电商的网店基本信息进行合并,将不同电商中网店属于同一公司的销售信息归一化,并取得公司名称列表,获得互联网电商信息。
3.根据权利要求2所述的一种电子商务税源管理分析方法,其特征在于,对税局组织内数据进行ETL的流程如下: 参照产生的公司名称列表,从税局组织内数据中进行查找匹配,获取有效纳税人基本信息; 根据有效纳税人基本信息关联出税种认定信息; 根据有效纳税人基本信息关联纳税人资格信息; 根据有效纳税人基本信息关联增值税认定信息; 根据上述信息关联纳税申报信息和增值税发票开具信息,获得税务信息。
4.根据权利要求2或3所述的一种电子商务税源管理分析方法,其特征在于数据整合分析流程:将清洗过的互联网电商信息与通过ETL获得的税务信息进行关联规则分析、数据挖掘分析以及统计比对,获得非正常缴税纳税人列表,以及网店的关联关系、纳税人关联关系、电商关联关系、电商销售发展趋势、税收预警。
5.根据权利要求4所述的一种电子商务税源管理分析方法,其特征在于,所述方法业务流程如下: O电子商务税源管理系统云采集系统采集信息; 2)所采集的电子商务网站的有效数据结构化,并导入数据库并初始化,对数据根据应用需求进行缺失值填充、去重、合并以及抽取转换; 3)网点基本信息更新; 4)多电商基本信息及销售信息合并,获得网店所属公司名称列表; 5)将税务局管理系统提供的组织内数据进行ETL抽取转换,保存到本系统数据库中,并结合网店所属公司名称列表匹配有效纳税人; 6)关联税种、纳税人资格和增值税认定情况; 7)关联纳税申报和增值税开票信息; 8)对步骤4)获得的电商基本信息、销售信息和步骤7)获得的税务信息进行数据挖掘分析、对比统计。
【专利摘要】本发明公开了一种电子商务税源管理分析方法,所述方法通过电子商务税源管理云采集系统爬取解析的多个电子商务网站数据并保存到数据库中,进行采集数据的清洗;将税务局提供的组织内数据进行ETL抽取转换,保存到系统数据库中;将采集数据与税务局提供的组织数据进行整合分析,挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系。采用本发明方法,可以挖掘出不同类别的非正常缴税纳税人,以及网店的关联关系、纳税人关联关系等,并进一步利用数据可视化技术呈现给税务人员,为税收精细化管理、精确决策提供数据分析平台,提高税收评估能力,完善税收管理决策模式,提高税收,推进信息管税、科学征税、依法征税。
【IPC分类】G06Q40-00, G06F17-30
【公开号】CN104598634
【申请号】CN201510062792
【发明人】范莹, 于治楼
【申请人】浪潮集团有限公司
【公开日】2015年5月6日
【申请日】2015年2月6日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1