一种面向互锁股东利益输送行为的嫌疑群组识别方法

文档序号:10726181阅读:201来源:国知局
一种面向互锁股东利益输送行为的嫌疑群组识别方法
【专利摘要】一种面向互锁股东利益输送行为的嫌疑群组识别方法,包括以下步骤:一、构建有向加权的纳税人利益关联网络;二、基于投资关系添加互锁关系边;三、获取互锁关系对应的共同投资企业列表;四、构建基于互锁关系边的前件路径集合;五、基于前件路径集合,匹配互锁股东利益输送行为;本发明从实际案例中提取互锁股东之间利益输送行为的拓扑特征,通过模式匹配的手段进行识别,在实际税务稽查领域中能够发现隐密的股东互锁关系,并且识别出与之关联的利益输送行为,得到相应的偷漏税嫌疑群组。本方法采用并行化的消息传播机制进行模式匹配,使得模式匹配能够应对海量的税务数据,识别时迅速、高效。
【专利说明】
一种面向互锁股东利益输送行为的嫌疑群组识别方法
技术领域
[0001]本发明涉及运用计算机技术进行偷漏税嫌疑群组识别的方法,具体涉及一种面向互锁股东利益输送行为的嫌疑群组识别方法。
【背景技术】
[0002]如果两个股东共同投资两家及两家以上企业,并能够对投资企业施加控制、间接控制或重大影响,则称这两个股东之间存在互锁关系。存在互锁关系的两个股东之间因为存在共同利益,往往会通过各自分别控制的两家第三方企业进行非法利益输送来减少其投资企业的应纳税额,以达到躲避关联交易稽查,实现偷漏税的目的。
[0003]为了挖掘出这种互锁股东间的利益输送行为,得到对应的偷漏税嫌疑群组,以下专利文献提供了可参考的、旨在识别可疑纳税人及关联企业的技术解决方案:
[0004]文献1.一种基于纳税人利益关联网络的可疑纳税人识别方法(ZL201410328391.X);
[0005]文献2.基于纳税人利益关联网络模型的偷漏税关联企业识别方法(ZL201310293435.5);
[0006]文献I基于纳税人利益关联网络(TPIN)的拓扑特征识别可疑纳税人,对纳税人利益关联网络进行拓扑特征的分析,采用Motif方法寻找频繁子图,并根据度中心度和聚集系数拓扑指标来寻找正常和可疑纳税人的差异,选择拓扑特征,使用C4.5分类器进行实验,从而实现自动识别可疑纳税人的功能。该方法将纳税人和利益关系作为网络进行关系识别,并将拓扑方法中的Motif、聚集系数、度中心度特性应用于纳税人利益关联网络,利用正常和可疑纳税人之间的差异性作为检测可疑纳税行为的方法和依据。
[0007]文献2提出了基于着色加权图的纳税人利益关联网络表示,并给出构建此网络的方法,提出了基于边和节点颜色的五种聚合算子,结合这些聚合算子发现纳税人利益关联最小网络,同时对基于着色加权图的纳税人利益关联网络进行简化。并且引入节点环介数的概念,在简化后的网络中发现最大介数约束的有向闭环集的纳税人利益关联集团,利用企业之间的交易行为权重,识别纳税人利益关联最小网络和纳税人利益关联集团中的偷漏税行为。
[0008]以上文献所述方法主要存在以下问题:1、文献I通过发掘频繁子图和度中心度、聚集系数指标特征构建可疑纳税人特征向量,采用C4.5分类器进行分类识别,而没有针对具体的偷漏税行为,结合业务特征进行识别,对特定偷漏税行为识别准确率较低;2、文献2通过节点的环介数和企业之间交易行为权重来识别利益关联集团中的偷漏税行为中,环介数表示的是通过节点的有向闭环数量占网络中所有有向闭环数量的比值,其针对的是拓扑表现为环形的偷漏税行为,而互锁股东间的关系是潜在的,借助于股东互锁的利益输送行为拓扑并非环形,因此也无法识别互锁股东通过控制第三方企业实现利益输送的行为。

【发明内容】

[0009]本发明的目的在于针对上述现有技术中的问题,提供一种面向互锁股东利益输送行为的嫌疑群组识别方法,有效解决关系相对隐秘的互锁股东之间利益输送行为难以识别的问题。
[0010]为了实现上述目的,本发明采用的技术方案包括以下步骤:
[0011 ] I)构建有向加权的纳税人利益关联网络:利用纳税人利益关联网络的点来结构化表示纳税人及其投资方、法定代表人;利用点的ID来唯一标识这个点,利用点的属性来保存前件路径集合及投资企业列表;利用纳税人利益关联网络的边来结构化表示纳税人的投资关系、法定代表人关系和交易关系,利用投资关系边的权值表示投资方在被投资企业的投资比例;
[0012]2)基于纳税人利益关联网络中的投资关系识别存在互锁关系的投资方,并在存在互锁关系的投资方之间添加互锁关系边,具体包括以下步骤:2.1)设定投资比例阈值,并沿纳税人利益关联网络中投资比例超过阈值的投资关系边,向投资方节点发送被投资企业的ID;2.2)投资方节点对2.1)中的消息进行聚集,得到其投资企业的列表;2.3)沿纳税人利益关联网络中投资比例超过阈值的投资关系边,向被投资企业发送投资方节点的投资企业列表;2.4)被投资企业节点对2.3)中的消息进行聚集,获得其所有投资方的投资企业列表;
2.5)对每个被投资企业节点,两两比较其投资方的投资企业列表,若投资企业列表存在两个及两个以上的共同投资企业,则在这两个投资方节点之间添加双向的互锁关系边;否则不进行任何操作;2.6)对新增的互锁关系边进行去重,保证两点之间不存在多重边;
[0013]3)获取每个互锁关系边对应的两个投资方节点的共同投资企业列表;
[0014]4)构建基于互锁关系边的前件路径集合,所述的基于互锁关系边的前件路径满足以下条件:是由纳税人利益关联网络中的互锁关系边、法定代表人关系边、投资关系边及上述三种边的端点构成的简单路径,且路径经过的节点个数大于等于2,其经过的第一条边为互锁关系边且只有第一条边是互锁关系边,若路径的经过节点个数大于2,则其经过的第二条边的终点必须不在上一条互锁关系边对应的共同投资企业列表中;
[0015]5)基于前件路径集合,通过模式匹配得到所有的互锁股东利益输送行为,利用前件路径还原出所包含的法定代表人关系边、投资关系边、互锁关系边与交易关系边的集合,以及所经过节点的集合,得到构成存在互锁股东利益输送行为的嫌疑群组并进行输出。
[0016]按照如下方式构建有向加权的纳税人利益关联网络:
[0017]将纳税人利益关联网络的边表示为列表格式的Seq(srcNode ,dstNode);其中,srcNode表示边的源点,dstNode表示边的终点,Seq(srcNode,dstNode)表示一个只包含两个元素的列表,其第一个元素是边的源点,其第二个元素是边的终点,使用Seq[A]表示一个组成元素类型均为A的列表,使用Seq(a,b,c)表示一个包含元素a、b、c的列表;纳税人利益关联网络的点的属性中前件路径集合的格式为{Seq1 ,Seq2,...}或{Seq | Seq需要满足的条件},每条前件路径用其依次经过节点所构成的列表来表示;纳税人利益关联网络的点的属性中的投资企业列表用与该投资方节点存在投资关系的被投资企业节点构成的列表来表不O
[0018]所述的步骤3)获取互锁关系对应的共同投资企业列表具体包括以下步骤:
[0019]3.1)沿纳税人利益关联网络中的互锁关系边,向边的终点发送边的源点ID;3.2)互锁关系边的终点对3.1)中的消息进行聚集,得到与之存在互锁关系的所有投资方节点的ID;3.3)沿纳税人利益关联网络中的投资关系边,向投资方节点发送被投资企业的ID;3.4)投资方节点对3.3)中的消息进行聚集,得到其投资企业的列表;3.5)由每个作为互锁关系边终点的投资方节点,沿纳税人利益关联网络中的投资关系边,向被投资企业发送投资方节点的ID和投资企业列表,消息格式形如(HRsrc,Seq[CompanyID]),其中,HRsrc表示投资关系边的源点10,369[(:011^^11710]表示投资方节点的投资企业列表;3.6)被投资企业节点对3.5)中的消息进行聚集,获得其所有投资方的投资企业列表;3.7)对每个被投资企业节点,两两比较其投资方的投资企业列表,若投资企业列表存在两个及两个以上的共同投资企业,则产生一条互锁企业记录,格式形如(Seq(ILsrc, ILdst), Seq[CommonCompanyID]),其中,ILsrc表示互锁边的源点,ILdst表示互锁边的终点,Seq[CommonCompanyID]表示共同投资企业的列表;否则不进行任何操作;3.8)对于每个作为互锁关系边终点的投资方节点,根据3.2)中得到的与之存在互锁关系的所有投资方节点的ID,将对应的互锁企业记录连接到节点属性中,节点属性格式形如:Seq[(Seq( ILsrc, ILdst), Seq[CommonCompanyID])];其中,节点属性格式为一个组成元素类型均为二元组的列表;每个二元组的第一个元素为Seq(ILsrc,ILdst),表示一条列表格式的互锁关系边,只包含两个元素,其第一个元素是ILsrc,其第二个元素是ILdst;每个二元组的第二个元素为Seq[CommonCompanyID],表示互锁关系边Seq(ILsrc,ILdst)所对应的共同投资企业列表。
[0020]所述的步骤4)基于互锁关系边的前件路径集合构建过程具体包含以下步骤:
[0021]4.1)将纳税人利益关联网络中的所有法定代表边、投资边以及上述两种边的端点构成的子网络,定义为前件网络;4.2)由每个作为互锁关系边终点的投资方节点,沿前件网络中的邻接边,向边的终点,发送节点属性中共同投资企业列表不包含边的终点的互锁关系边列表,消息传播过程表述为:f (src = ILdst, dst = CLdst | | HRdst,Msg = Seq[Seq(11^1^,11^81:)]);其中,€表示消息传播函数,sr c = I Lds t表示消息发送方为作为互锁关系边终点的投资方节点;dst = CLdst I I HRdst表示消息接收方为法定代表人关系边的终点或投资关系边的终点,Msg = Seq[Seq(ILsrc,ILdst)]表示消息格式为一个组成元素类型均为互锁关系边的列表;4.3)法定代表人关系边的终点或投资关系边的终点对4.2)中的消息进行聚集,并将自身的节点ID添加到Seq的末尾,节点属性变为多个均经过3个节点的前件路径;4.4)由前件网络中的任意节点,沿前件网络中的邻接边向边的终点发送节点属性中经过节点个数为迭代次数加2的前件路径列表,迭代次数初始为I;消息传播过程形式化表述为:
[0022]f (src = CLsrc I HRsrc ,dst = CLdst HRdst ,Msg= {Seq | Seq.size = IteTime+2});
[0023]其中,src= CLsrc I I HRsrc表示消息发送方为法定代表人关系边的源点或投资关系边的源点;dst = CLdst I I HRdst表示消息接收方为法定代表人关系边的终点或投资关系边的终点;Msg= {Seq | Seq.size = IteTime+2}表示消息内容为经过节点个数等于迭代次数加2的前件路径列表;4.5)法定代表人关系边的终点或投资关系边的终点对4.4)中的消息进行聚集,并将自身的节点ID添加到Seq的末尾;然后去除包含环路的前件路径;最终节点属性新增多条经过节点个数等于迭代次数加3的前件路径;4.6)迭代次数递增I,返回执行
4.4),直到没有任何节点接收到满足条件的前件路径列表消息时,迭代结束;4.7)对所有节点属性中的前件路径进行聚集和去重,得到所有经过节点个数在2到最大迭代次数加I之间的前件路径,构成基于互锁关系边的前件路径集合;其中,每条基于互锁关系边的前件路径的格式如下:Seq(vi,v2,...,Vi,...,vn);其中,:1为路径经过节点Vi的下标,满足Ki彡n;n为这条前件路径经过节点的个数,满足最大迭代次数+1。
[0024]所述步骤5)通过模式匹配得到所有互锁股东利益输送行为的具体包括以下步骤:
[0025]5.1)纳税人利益关联网络中的交易关系边表示为Seq(TRsrc,TRdst),其中TRsrc表不交易边的源点,TRdst表不交易边的终点;5.2)对于每条交易关系边,将交易关系边的源点和终点分别与前件路径集合中前件路径经过的最后一个节点Vn进行连接,得到前件路径集合二元组,形式化表述为:({Seq I Seq.Vn = TRsrc}, {Seq | Seq.Vn = TRdst});其中,最外层的小括号表示这是一个元组,元组的第一个元素是一个前件路径集合,集合内的前件路径满足其经过的最后一个节点Vn与当前交易关系边的源点相同;元组的第二个元素也是一个前件路径集合,集合内的前件路径满足其经过的最后一个节点Vn与当前交易关系边的终点相同;对于每条交易边得到的前件路径集合二元组,将第一个前件路径集合记为PathCollect1nl,第二个前件路径集合记为PathCollect1n2,将PathColIect1nl中的前件路径和PathCollect1n2中的前件路径做笛卡尔积,然后进行两两比较;若两条前件路径,来自PathCollect1nl的记为Pathl、来自PathColIect1n2的记为Path2 J^MPathl.νι= Path2.V2且Path 1.V2 = Path2.vi,Pathl 和Path2 只相交于vi和V2,那么卩&1:111和?&1:112的模式匹配的结果为存在互锁股东利益输送行为,否则这两条前件路径模式匹配的结果为不存在互锁股东利益输送行为;
[0026]由模式匹配的结果为存在互锁股东利益输送行为的两条前件路径,还原出前件路径所包含的法定代表人关系边、投资关系边、互锁关系边与交易关系边的集合,以及所经过节点的集合,构成一个存在互锁股东利益输送行为的嫌疑群组。
[0027]所述的步骤2)中投资比例阈值为20%。
[0028]与现有技术相比,本发明具有如下的有益效果:与税务业务联系紧密,从实际案例中提取互锁股东之间利益输送行为的拓扑特征,然后通过模式匹配的手段进行计算机自动识别,在实际税务稽查领域中能够发现隐密的股东互锁关系,并且识别出与之关联的利益输送行为,得到相应的偷漏税嫌疑群组。本方法采用以点为中心的图计算消息传播机制进行模式匹配,使得模式匹配能够应对海量的税务数据,识别所有互锁股东利益输送行为时迅速、高效。
【附图说明】
[0029]图1本发明识别方法的整体流程图;
[0030]图2基于投资关系添加互锁关系边的示意图;
[0031 ]图3通过模式匹配得到互锁股东利益输送行为及涉及嫌疑群组的示意图。
【具体实施方式】
[0032]下面结合附图对本发明做进一步的详细说明。
[0033]参见图1,本发明偷漏税嫌疑群组识别过程包括:
[0034]—、构建有向加权的纳税人利益关联网络;
[0035]构建有向加权的纳税人利益关联网络,即将非结构化的纳税人信息转化为结构化的纳税人利益关联网络的点和边。利用纳税人利益关联网络的点来结构化表示纳税人及其投资方、法定代表人,利用点的ID来唯一标识这个点,利用点的属性来保存前件路径集合及投资企业列表;利用纳税人利益关联网络的边来结构化表示纳税人的投资关系、法定代表人关系和交易关系,利用投资关系边的权值表示投资方在被投资企业的投资比例。
[0036]将纳税人利益关联网络的边表示为列表格式的Seq(srcNode ,dstNode);其中,srcNode表示边的源点,dstNode表示边的终点,Seq(srcNode,dstNode)表示一个只包含两个元素的列表,其第一个元素是边的源点,其第二个元素是边的终点。后面使用Seq[A]表示一个组成元素类型均为A的列表,使用Seq(a,b,c)表示一个含元素a、b、c的列表。纳税人利益关联网络的点的属性中前件路径集合的格式为{Seqi,Seq2,...}或{Seq| Seq需要满足的条件},每条前件路径用其依次经过节点所构成的列表来表示;纳税人利益关联网络的点的属性中的投资企业列表用与该投资方节点存在投资关系的被投资企业节点构成的列表来表不。
[0037]参见图2,本实施例中,所构建的有向加权的纳税人利益关联网络中有6个节点,节点Vl和V2是投资方节点,节点V3、V4、V5和V6是被投资企业节点;投资方Vl投资了企业V3、V4和V5,分别表示为投资关系边3叫(¥1,¥3)、3叫(¥1,¥4)和3叫(¥1,¥5);投资方¥2投资了企业V3、V4 和 V6,分别表示为投资关系边 369(¥2,¥3)、369(¥2,¥4)和369(¥2,¥6);其中,369(¥1,¥3)、569(¥1,¥4)、569(¥2,¥3)和569(¥2,¥4)的投资比例均为30%,569(¥1,¥5)和569(¥2,V6)的投资比例均为10% ;企业V3与企业V4、企业V5与企业V6之间有交易行为,分别表示为交易关系边 Seq(V3,V4)和 Seq(V5,V6)。
[0038]二、基于投资关系添加互锁关系边;
[0039]基于纳税人利益关联网络中的投资关系识别存在互锁关系的投资方,在投资方之间添加互锁关系边,具体包括以下步骤:
[0040]Stepl.沿纳税人利益关联网络中投资比例超过20%的投资关系边,向投资方节点发送被投资企业的ID;
[0041]Step2.投资方节点对Stepl中的消息进行聚集,得到其投资企业的列表;
[0042]Step3.沿纳税人利益关联网络中投资比例超过20%的投资关系边,向被投资企业发送投资方节点的投资企业列表;
[0043]Step4.被投资企业节点对Step3中的消息进行聚集,获得其所有投资方的投资企业列表;
[0044]Step5.对每个被投资企业节点,两两比较其投资方的投资企业列表,若投资企业列表存在两个及两个以上的共同投资企业,则在这两个投资方节点之间添加双向的互锁关系边;否则,不进行任何操作;
[0045]Step6.对新增的互锁关系边进行去重,保证两点之间不存在多重边。
[0046]如图2所示,本实施例中,投资关系边369(¥1,¥3)、369(¥1,¥4)、369(¥2,¥3)和369(V2,V4)的投资比例超过了 20%,V3和V4分别向投资方Vl和V2发送自身ID;V1对消息进行聚集得到其投资企业列表为Seq(V3,V4),V2对消息进行聚集得到其投资企业列表同样为Seq(¥3,¥4);¥1和¥2将各自的投资企业列表分别发送给被投资企业¥3和¥4;¥3和¥4对消息进行聚集后两两比较,发现Vl和V2的投资企业列表存在两个共同投资企业,因此在Vl和V2之间添加一对双向的互锁关系边,即图2中用虚线进行标注的关系边。
[0047]三、获取互锁关系对应的共同投资企业列表;
[0048]存在互锁关系的两个股东往往通过各自分别控制的两家第三方企业间的非法利益输送手段来减少其投资企业的应纳税额,进行偷漏税活动。为了识别出所有的第三方企业,首先需要获取互锁关系所对应的共同投资企业列表,具体包括以下步骤:
[0049]Stepl.沿纳税人利益关联网络中的互锁关系边,向边的终点发送边的源点ID;
[0050]Step2.互锁关系边的终点对Stepl中的消息进行聚集,得到与之存在互锁关系的所有投资方节点的ID;
[0051]Step3.沿纳税人利益关联网络中的投资关系边,向投资方节点发送被投资企业的ID;
[0052]Step4.投资方节点对Step3中的消息进行聚集,得到其投资企业的列表
[0053]Step5.由每个作为互锁关系边终点的投资方节点,沿纳税人利益关联网络中的投资关系边,向被投资企业发送投资方节点的ID和投资企业列表,消息格式形如(HRsrc’Seq[CompanyID]),其中,HRsrc表示投资关系边的源点ID,Seq[CompanyID]表示投资方节点的投资企业列表;
[0054]Step6.被投资企业节点对Step5中的消息进行聚集,获得其所有投资方的投资企业列表;
[0055]Step7.对每个被投资企业节点,两两比较其投资方的投资企业列表,若投资企业列表存在两个及两个以上的共同投资企业,则产生一条互锁企业记录,格式形如(Seq(ILsrc, ILdst), Seq[CommonCompanyID]),其中,ILsrc表示互锁边的源点,ILdst表示互锁边的终点,Seq [ CommonCompanyID]表示共同投资企业的列表;否则,不进行任何操作;
[0056]StepS.对于每个作为互锁关系边终点的投资方节点,根据Step2中得到的与之存在互锁关系的所有投资方节点的ID,将对应的互锁企业记录连接到节点属性中。最后的节点属性格式形如:Seq[ (Seq( ILsrc, ILdst), Seq[CommonCompanyID])];
[0057]其中,节点属性格式为一个组成元素类型均为二元组的列表;每个二元组的第一个元素为SeqdLsrc,ILdst),表示一条列表格式的互锁关系边,只包含两个元素,其第一个元素是ILsrc,其第二个元素是ILdst;每个二元组的第二个元素为Seq[CommonCompanyID],表示互锁关系边SeqdLsrc,ILdst)所对应的共同投资企业列表。
[0058]本实施例中,投资方Vl的节点属性在获取互锁关系对应的共同投资企业列表后为Seq(Seq(V2,Vl),Seq(V3,V 4)),投资方V2的节点属性在获取互锁关系对应的共同投资企业列表后为Seq(Seq(Vl,V2),Seq(V 3,V 4))。
[0059]四、构建基于互锁关系边的前件路径集合;
[0060]构建过程具体包含以下步骤:
[0061]Stepl.将纳税人利益关联网络中的所有法定代表边、投资边及上述两种边的端点构成的子网络,定义为前件网络;
[0062]Step2.由每个作为互锁关系边终点的投资方节点,沿前件网络中的邻接边,向边的终点,发送节点属性中共同投资企业列表不包含边的终点的互锁关系边列表。消息传播过程可形式化表述为:f(src = ILdst,dst = CLdst| | HRdst ,Msg = Seq[Seq(ILsrc,ILdst)]);
[0063]其中,f表示消息传播函数,src= ILdst表示消息发送方为作为互锁关系边终点的投资方节点;dst = CLdst I I HRdst表示消息接收方为法定代表人关系边的终点或投资关系边的终点,Msg = Seq[Seq(ILsrc, ILdst)]表示消息格式为一个组成元素类型均为互锁关系边的列表;
[0064]Step3.法定代表人关系边的终点或投资关系边的终点对Step2中的消息进行聚集,并将自身的节点ID添加到Seq的末尾,节点属性变为多个均经过3个节点的前件路径;
[0065]Step4.由前件网络中的任意节点,沿前件网络中的邻接边,向边的终点,发送节点属性中经过节点个数为迭代次数加2(迭代次数初始为I)的前件路径列表。消息传播过程可形式化表述为:f (src = CLsrc HRsrc , dst = CLdst | | HRdst, Msg={Seq|Seq.size =IteTime+2});
[0066]其中,src= CLsrc I I HRsrc表示消息发送方为法定代表人关系边的源点或投资关系边的源点;dst = CLdst I I HRdst表示消息接收方为法定代表人关系边的终点或投资关系边的终点;Msg= {Seq | Seq.size = IteTime+2}表示消息为经过节点个数等于迭代次数加2的前件路径列表;
[0067]Step5.法定代表人关系边的终点或投资关系边的终点对Step4中的消息进行聚集,并将自身的节点ID添加到Seq的末尾;然后,去除包含环路的前件路径;最终,节点属性新增多条经过节点个数等于迭代次数加3的前件路径;
[0068]Step6.迭代次数递增I,返回执行Step4,直到没有任何节点接收到满足条件的前件路径列表消息时,迭代结束;
[0069]Step7.对所有节点属性中的前件路径进行聚集和去重,得到所有经过节点个数在2到最大迭代次数加I之间的前件路径,构成基于互锁关系边的前件路径集合。其中,每条基于互锁关系边的前件路径的格式如下:Seq( V1,V2,…,V1,…,vn);
[0070]其中,i为路径经过节点Vi的下标,满足I< i <η; η为这条前件路径经过节点的个数,满足最大迭代次数+1。
[0071]本实施例中,在第二次迭代中,没有任何节点接收到满足条件的前件路径列表消息,此时迭代结束。最终得到的基于互锁关系边的前件路径集合包含以下前件路径:Seq(¥1,¥2)、5叫(¥2,¥1)、5叫(¥1,¥2,¥6)和5叫(¥2,¥1,¥5)。特别的,节点¥3和¥4在互锁关系边Seq(Vl,V2)和Seq(V2,Vl)对应的共同投资企业列表中,因此接收不到任何消息。
[0072]五、基于前件路径集合,匹配互锁股东利益输送行为;
[0073]基于前件路径集合,通过模式匹配得到所有的互锁股东利益输送行为,并输出涉及到的嫌疑群组。具体包括以下步骤:
[0074]Stepl.纳税人利益关联网络中的交易关系边表示为Seq(TRsrc ,TRdst ),其中TRsrc表示交易边的源点,TRdst表示交易边的终点;
[0075]Step2.对于每条交易关系边,将交易关系边的源点和终点分别与前件路径集合中前件路径经过的最后一个节点Vn进行连接,得到前件路径集合二元组,形式化表述为:({Seq|Seq.Vn = TRsrcj,{Seq | Seq.vn = TRdst});其中,最外层的小括号表示这是一个元组,元组的第一个元素是一个前件路径集合,集合内的前件路径满足其经过的最后一个节点Vn与当前交易关系边的源点相同;元组的第二个元素也是一个前件路径集合,集合内的前件路径满足其经过的最后一个节点Vn与当前交易关系边的终点相同;
[0076]Step3.对于每条交易边得到的前件路径集合二元组,将第一个前件路径集合记为PathCollect1nl,第二个前件路径集合记为PathCollect1n2,将PathCollect1nl中的前件路径和PathCollect1n2中的前件路径做笛卡尔积,然后进行两两比较;
[0077]若两条前件路径,来自PathCol lect1nl的记为Pathl、来自PathCo I Iect 1n2的记SPath2j^MPathl.vi = Path2.V2且Path 1.V2 = Path2.νι,且?&1:111和?&1:112只相交于¥1和V2,那么Pathl和Path2的模式匹配的结果为存在互锁股东利益输送行为。否则,这两条前件路径模式匹配的结果为不存在互锁股东利益输送行为;
[0078]Step4.由模式匹配的结果为存在互锁股东利益输送行为的两条前件路径,还原出前件路径所包含的法定代表人关系边、投资关系边、互锁关系边及交易关系边的集合,以及所经过节点的集合,构成了一个存在互锁股东利益输送行为的嫌疑群组。
[0079]如图3所示,本实施例中,由交易关系边Seq(V3,v4)连接没有得到前件路径集合二元组;由交易关系边Seq(V5,V6)连接得到的前件路径集合二元组为:
[0080]({Seq(V2,Vl,V5)},{Seq(Vl,V2,V6)});
[0081]做笛卡尔积后进行两两比较,得到一个模式匹配的结果为存在互锁股东利益输送行为的两条前件路径Seq(V2,Vl,V5)和Seq(Vl,V2,V6),还原出的关系边集合为{Seq(V2,VI),Seq(Vl,V2),Seq(Vl,V5),Seq(V2,V6),Seq(V5,V6)},还原出的节点集合为{VI,V2,V5,V6},构成了一个存在互锁股东利益输送行为的嫌疑群组,即图3中用粗线条标注的节点和关系边。
【主权项】
1.一种面向互锁股东利益输送行为的嫌疑群组识别方法,其特征在于,包括以下步骤: 1)构建有向加权的纳税人利益关联网络:利用纳税人利益关联网络的点来结构化表示纳税人及其投资方、法定代表人;利用点的ID来唯一标识这个点,利用点的属性来保存前件路径集合及投资企业列表;利用纳税人利益关联网络的边来结构化表示纳税人的投资关系、法定代表人关系和交易关系,利用投资关系边的权值表示投资方在被投资企业的投资比例; 2)基于纳税人利益关联网络中的投资关系识别存在互锁关系的投资方,并在存在互锁关系的投资方之间添加互锁关系边,具体包括以下步骤:2.1)设定投资比例阈值,并沿纳税人利益关联网络中投资比例超过阈值的投资关系边,向投资方节点发送被投资企业的ID;2.2)投资方节点对2.1)中的消息进行聚集,得到其投资企业的列表;2.3)沿纳税人利益关联网络中投资比例超过阈值的投资关系边,向被投资企业发送投资方节点的投资企业列表;2.4)被投资企业节点对2.3)中的消息进行聚集,获得其所有投资方的投资企业列表;2.5)对每个被投资企业节点,两两比较其投资方的投资企业列表,若投资企业列表存在两个及两个以上的共同投资企业,则在这两个投资方节点之间添加双向的互锁关系边;否则不进行任何操作;2.6)对新增的互锁关系边进行去重,保证两点之间不存在多重边; 3)获取每个互锁关系边对应的两个投资方节点的共同投资企业列表; 4)构建基于互锁关系边的前件路径集合,所述的基于互锁关系边的前件路径满足以下条件:是由纳税人利益关联网络中的互锁关系边、法定代表人关系边、投资关系边及上述三种边的端点构成的简单路径,且路径经过的节点个数大于等于2,其经过的第一条边为互锁关系边且只有第一条边是互锁关系边,若路径的经过节点个数大于2,则其经过的第二条边的终点必须不在上一条互锁关系边对应的共同投资企业列表中; 5)基于前件路径集合,通过模式匹配得到所有的互锁股东利益输送行为,利用前件路径还原出所包含的法定代表人关系边、投资关系边、互锁关系边与交易关系边的集合,以及所经过节点的集合,得到构成存在互锁股东利益输送行为的嫌疑群组并进行输出。2.根据权利要求1所述面向互锁股东利益输送行为的嫌疑群组识别方法,其特征在于,按照如下方式构建有向加权的纳税人利益关联网络: 将纳税人利益关联网络的边表示为列表格式的Seq(srcNode,dstNode);其中,srcNode表示边的源点,dstNode表示边的终点,Seq(srcNode,dstNode)表示一个只包含两个元素的列表,其第一个元素是边的源点,其第二个元素是边的终点,使用Seq[A]表示一个组成元素类型均为A的列表,使用Seq(a,b,c)表示一个包含元素a、b、c的列表;纳税人利益关联网络的点的属性中前件路径集合的格式为{Seqi,Seq2,...}或{SeqlSeq需要满足的条件},每条前件路径用其依次经过节点所构成的列表来表示;纳税人利益关联网络的点的属性中的投资企业列表用与该投资方节点存在投资关系的被投资企业节点构成的列表来表示。3.根据权利要求2所述面向互锁股东利益输送行为的嫌疑群组识别方法,其特征在于,所述的步骤3)获取互锁关系对应的共同投资企业列表具体包括以下步骤: 3.1)沿纳税人利益关联网络中的互锁关系边,向边的终点发送边的源点ID;3.2)互锁关系边的终点对3.1)中的消息进行聚集,得到与之存在互锁关系的所有投资方节点的ID; 3.3)沿纳税人利益关联网络中的投资关系边,向投资方节点发送被投资企业的ID;3.4)投资方节点对3.3)中的消息进行聚集,得到其投资企业的列表;3.5)由每个作为互锁关系边终点的投资方节点,沿纳税人利益关联网络中的投资关系边,向被投资企业发送投资方节点的ID和投资企业列表,消息格式形如(HRsrc,Seq[CompanyID]),其中,HRsrc表示投资关系边的源点10,3叫[(:01^&好10]表示投资方节点的投资企业列表;3.6)被投资企业节点对3.5)中的消息进行聚集,获得其所有投资方的投资企业列表;3.7)对每个被投资企业节点,两两比较其投资方的投资企业列表,若投资企业列表存在两个及两个以上的共同投资企业,则产生一条互锁企业记录,格式形如(Seq(ILsrc, ILdst) ,Seq[Common Company ID]),其中,ILsrc表示互锁边的源点,ILdst表示互锁边的终点,Seq[&3臟011(:011^^11710]表示共同投资企业的列表;否则不进行任何操作;3.8)对于每个作为互锁关系边终点的投资方节点,根据3.2)中得到的与之存在互锁关系的所有投资方节点的ID,将对应的互锁企业记录连接到节点属性中,节点属性格式形如:Seq[ (Seq(ILsrc,ILdst),Seq[CommonCompanyID])];其中,节点属性格式为一个组成元素类型均为二元组的列表;每个二元组的第一个元素为SeqdLsrc,ILdst),表示一条列表格式的互锁关系边,只包含两个元素,其第一个元素是ILsrc,其第二个元素是ILdst;每个二元组的第二个元素为Seq[CommonCompanyID],表示互锁关系边Seq( ILsrc,ILdst)所对应的共同投资企业列表。4.根据权利要求2所述面向互锁股东利益输送行为的嫌疑群组识别方法,其特征在于:所述的步骤4)基于互锁关系边的前件路径集合构建过程具体包含以下步骤: 4.1)将纳税人利益关联网络中的所有法定代表边、投资边以及上述两种边的端点构成的子网络,定义为前件网络;4.2)由每个作为互锁关系边终点的投资方节点,沿前件网络中的邻接边,向边的终点,发送节点属性中共同投资企业列表不包含边的终点的互锁关系边列表,消息传播过程表述为:f (src = ILdst,dst = CLdst | | HRdst ,Msg = Seq[Seq(ILsrc ,ILdst)]);其中,f表示消息传播函数,Src = ILdSt表示消息发送方为作为互锁关系边终点的投资方节点;dst = CLdst I I HRdst表示消息接收方为法定代表人关系边的终点或投资关系边的终点,Msg = Seq[Seq( ILsrc,ILdst)]表示消息格式为一个组成元素类型均为互锁关系边的列表;4.3)法定代表人关系边的终点或投资关系边的终点对4.2)中的消息进行聚集,并将自身的节点ID添加到Seq的末尾,节点属性变为多个均经过3个节点的前件路径;4.4)由前件网络中的任意节点,沿前件网络中的邻接边向边的终点发送节点属性中经过节点个数为迭代次数加2的前件路径列表,迭代次数初始为I;消息传播过程形式化表述为:f (src = CLsrc | | HRsrc,dst = CLdst | | HRdst ,Msg= {Seq | Seq.size = IteTime+2}); 其中,src = CLsrc | I HRsrc表示消息发送方为法定代表人关系边的源点或投资关系边的源点;dst = CLdst I I HRdst表示消息接收方为法定代表人关系边的终点或投资关系边的终点;Msg= {Seq | Seq.size = IteTime+2}表示消息内容为经过节点个数等于迭代次数加2的前件路径列表;4.5)法定代表人关系边的终点或投资关系边的终点对4.4)中的消息进行聚集,并将自身的节点ID添加到Seq的末尾;然后去除包含环路的前件路径;最终节点属性新增多条经过节点个数等于迭代次数加3的前件路径;4.6)迭代次数递增1,返回执行4.4),直到没有任何节点接收到满足条件的前件路径列表消息时,迭代结束;4.7)对所有节点属性中的前件路径进行聚集和去重,得到所有经过节点个数在2到最大迭代次数加I之间的前件路径,构成基于互锁关系边的前件路径集合;其中,每条基于互锁关系边的前件路径的格式如下:Seq(vi,V2,…,vi,…,vn);其中,:1为路径经过节点Vi的下标,满足Ki彡n;n为这条前件路径经过节点的个数,满足最大迭代次数+1。5.根据权利要求4所述面向互锁股东利益输送行为的嫌疑群组识别方法,其特征在于,所述步骤5)通过模式匹配得到所有互锁股东利益输送行为的具体包括以下步骤: 5.1)纳税人利益关联网络中的交易关系边表示为369(了1^代,了1?(180,其中了1^代表示交易边的源点,TRdst表示交易边的终点;5.2)对于每条交易关系边,将交易关系边的源点和终点分别与前件路径集合中前件路径经过的最后一个节点Vn进行连接,得到前件路径集合二元组,形式化表述为:({Seq I Seq.Vn = TRsrc},{Seq | Seq.vn = TRdst});其中,最外层的小括号表示这是一个元组,元组的第一个元素是一个前件路径集合,集合内的前件路径满足其经过的最后一个节点Vn与当前交易关系边的源点相同;元组的第二个元素也是一个前件路径集合,集合内的前件路径满足其经过的最后一个节点Vn与当前交易关系边的终点相同;对于每条交易边得到的前件路径集合二元组,将第一个前件路径集合记为PathColIect1nl,第二个前件路径集合记为PathCollect1n2,将PathColIect1nl 中的前件路径和PathCollect1n2中的前件路径做笛卡尔积,然后进行两两比较;若两条前件路径,来自PathCollect1nl的记为Pathl、来自PathColIect1n2的记为Path2 J^MPathl.νι= Path2.V2且Path 1.V2 = Path2.vi,Pathl 和Path2 只相交于vi和V2,那么卩&1:111和?&1:112的模式匹配的结果为存在互锁股东利益输送行为,否则这两条前件路径模式匹配的结果为不存在互锁股东利益输送行为; 由模式匹配的结果为存在互锁股东利益输送行为的两条前件路径,还原出前件路径所包含的法定代表人关系边、投资关系边、互锁关系边与交易关系边的集合,以及所经过节点的集合,构成一个存在互锁股东利益输送行为的嫌疑群组。6.根据权利要求1所述面向互锁股东利益输送行为的嫌疑群组识别方法,其特征在于:所述的步骤2)中投资比例阈值为20 %。
【文档编号】G06Q40/00GK106097091SQ201610639426
【公开日】2016年11月9日
【申请日】2016年8月5日 公开号201610639426.0, CN 106097091 A, CN 106097091A, CN 201610639426, CN-A-106097091, CN106097091 A, CN106097091A, CN201610639426, CN201610639426.0
【发明人】董博, 郑庆华, 蔚文达, 阮建飞
【申请人】西安交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1