一种发票使用异常预警方法和系统的制作方法_3

文档序号:9865510阅读:来源:国知局
为序列S的子序列。若一个序列S不包含在其他的序列当中,贝嚇序列S 是最大的。
[0082] 定义(序列支持度);序列数据库D是元组<sid,S〉的集合,Sid是序列标识号,女口 果序列T是S的子序列(即下CS ),称元组<sid,S〉包含序列T。序列T在数据库D中支持 度,是数据库D中包含序列τ的元组数,即細孤o靖Tl·l{、':sk!,S>!<sk!,S>(6DΛTcS}μ
[0083] 定义(频繁序列模式);给定正整数ε为支持度阔值,如果数据库D中最少有ε 个元组包含序列S,则称序列S为数据库D中的一个(频繁)序列模式。长度为L的序列模 式成为k模式。
[0084] 所述发票操作序列模式挖掘的任务是找出数据库中所有的序列模式即郝些发票 操作序列集合中出现频率超过最小支持度的子序列(用户指定最小支持度阔值)。
[0085] 下面具体举例如下:
[0086] 假设发票操作序列数据库D为:
[0087] 1. <a, e, b, c, d> ;
[0088] 2.〈a, c,d,c,e〉;
[0089] 3. <a,b,c,d〉;
[0090] 4. <a,c,e〉;
[0091] 5. <d,e〉。
[0092] 设定支持度阔值ε = 2来检索最大的频繁序列,挖掘过程如下:
[0093] L1
[0094]

[0104] 本发明实施例采用SPADE序列模式挖掘算法(参见SPADE: an efficient algorithm for mining frequent sequences ZAKI M J,2001, 42(01),Machine Learning) 对发票使用异常数据历史库中的发票操作序列数据,进行频繁序列模式挖掘,获得发票使 用异常数据的频繁序列模式,并将得到的频繁序列模式表示为异常模式,如果有多个最大 频繁序列,则有多个发票使用异常模式。
[0105] 在上述具体举例中,可W表示为下面的形式:
[0106] <Mode2, Algorithm2, T<a, b, c, d>>
[0107] <Mode2, Algorithm2, T<a, c, e?
[0108] <Mode2, Algorithm2, T<d,e>>
[0109] 其中,Mode2表示为:发票使用异常序列模式Ml ;
[0110] Algorithms ;SubSequence最大频繁序列匹配算法,检测最大频繁序列模式是否 是待检索发票操作序列的子序列;
[0111] T<tl,t2,…tm>表示最大频繁序列,而S<sl,s2,…sn>表示为待检测发票操作序 列,具体程序语言如下:
[0112]
[011 引
[0114] 通过税务人员的经验,政策,或者数据统计结果,或者通过各类数据分析算法,对 异常历史数据库进行知识发现,产生所有的备选的发票使用异常模式。
[0115] 本实施例优选的,所述形成异常模式知识库的步骤还包括:
[0116] 通过所述发票使用异常模式添加单元对所述数据挖掘产生的发票使用异常模式 进行判断,如果确认为异常模式,则添加到所述异常模式知识库中;
[0117] 如果判断为非异常模式,则通过所述发票使用异常模式删除单元将其删除。
[0118] 其中所述发票使用异常模式添加单元,对上述数据挖掘产生的备选发票使用异常 模式由决策人员进行决策,将其确认为异常模式,并添加到所述异常模式知识库中。
[0119] 所述发票使用异常模式删除单元,是将所述数据挖掘产生的不合理的备选异常模 式由决策人员,将其删除,或者由于政策变化,一些原本比较合理的异常模式,现在变的不 合理了,也可W由所述发票使用异常模式删除单元将其删除。
[0120] 步骤S104、所述预警评估模块将所述税收信息数据库中待评估的数据与所述异常 模式知识库中的每个异常模式进行逐一匹配,将匹配的发票使用异常数据生成预警评估报 化 no
[0121] 本实施例优选的,还包括;所述数据检索单元对检索匹配满足多个异常模式的发 票使用异常数据进行筛查分析。
[0122] 所述预警评估模块包括数据检索单元、预警评估报告生成单元和预警报告发送单 τη 〇
[0123] 所述数据检索单元是根据所述异常模式挖掘模块产生的所述异常模式知识库,对 所述税务信息数据库近期的数据进行检索,根据每个异常模式对近期税务信息数据进行逐 一匹配。对检索匹配的数据进行筛查分析,因为有些数据满足多个异常模式。所述筛查分 析是指:通过异常模式知识库中的每个异常模式W及相应适配的数据挖掘算法,对目标数 据进行分析,甄别符合异常模式的数据。本发明实施例优选的,还可W设定检索周期,定期 的发现近期发票使用异常的数据,排重处理后,对发票使用异常数据做好标记,为产生预警 评估报告做好数据准备。送里所述的排重处理是指:有可能多个异常模式都指向一张发票 或者一个纳税人,郝么将送些发票异常数据进行汇总排重处理。
[0124] 所述预警评估报告生成单元,是将检索发现的近期所有的发票使用异常数据进行 汇总,统计使用异常的所有发票,识别发票使用异常的开票方和售票方,列出开具异常发票 的纳税人的开票量。按照异常模式对近期发票使用异常进行分类统计,并且按照发票数量 进行排序,识别出近期各类发票使用异常的现象的严重程度。
[0125] 步骤S105、将所述预警评估报告发送给所述稽查处理模块进行处理。
[0126] 所述稽查处理模块是根据所述预警评估报告,将发票使用异常的发票和纳税人数 据信息,分发给各个所属地区的税收管理员和稽查员。税务人员根据预警数据信息与相关 的企业进行巡查和跟踪。确定每个发票数据是否是异常发票,如果确定是发票使用异常,根 据相关法律法规,对相关人员进行处罚,经税务人员确认后此发票异常使用数据将存入所 述发票使用异常数据历史库中。经过调查,如果所述发票使用异常数据是正常的发票使用 逻辑,郝么根据税务人员反馈,对该异常模式规则进行调整或删除。送样既保证了预警方法 或系统的准确性,也提高了预警方法或系统的适应性。
[0127] 本实施例采用数据挖掘方法对发票异常的所有历史数据进行选择、预处理、转换, 形成数据挖掘的元数据,根据各种数据分析算法,对发票异常数据进行聚类、异常操作序列 模式识别、关联规则分析,同时结合税务人员的先验知识,形成发票异常使用的异常模式知 识库。根据异常模式知识库,对近期的税收信息数据进行检索匹配,发现发票使用异常数 据,并根据异常模式,对近期的数据汇总和计算,形成预警评估报告。预警信息按照不同的 级别分发给不同的税务人员或稽查人员,他们对数据进行跟踪,巡查,确认异常数据是否属 实,并对挖掘的异常模式规则进行反馈。
[012引本实施例可有效发现并解决纳税人领购发票、发票开具和发票流通过程中存在的 异常用票问题,对各类发票异常数据提供预警,由W往被动依赖"W票控税"的管理模式,变 为根据发票预警数据进行主动跟踪的"信息控税"的管理模式,杜绝发票管理漏洞,提升发 票管理效率,提高税收征管质量。
[0129] 实施例二、所述发票使用异常预警方法中的异常模式挖掘模块功能实现方法。
[0130] 下面结合图2对本实施例的方法进行详细说明。
[0131] 图2为基于图1所示的发票使用异常预警方法中的异常模式挖掘模块功能实现流 程图,如图2所示,本实施例中的异常模式挖掘模块功能实现方法包括W下步骤:
[0132] 步骤S201、对所述税收信息数据库中的数据进行选择、预处理和转换。
[0133] 步骤S202、形成所述发票使用异常数据历史库。
[0134] 步骤S203、通过所述异常模式挖掘模块中的所述发票使用异常模式产生单元、发 票使用异常模式添加单元和发票使用异常模式删除单元对所述发票使用异常数据历史库 中的数据进行操作,形成所述异常模式知识库。
[0135] 具体的实现细节如上述实施例一中所述,在此不再赏述。
[0136] 本实施例中的方法使用所述发票使用异常模式挖掘模块,可W对异常发票数据的 特征进行提取、量化,形成所述异常模式知识库,可W有效量化异常发票监测的标准和依 据。
[0137] 实施例H、基于图1所示的发票使用异常预警方法中的预警评估模块功能实现流 程图,如图3所示,包括W下步骤:
[013引步骤S301、开始预警评估。
[0139] 步骤S302、对所述税收信息数据库中待评估的数据进行检索。
[0140] 步骤S303、从所述异常模式知识库中载入一个异常模式。
[0141] 步骤S304、从所述待评估的数据中定位一个待评估数据。
[0142] 步骤S305、判断所述数据是否匹配该异常模式;如果匹配,则进入下
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1