一种供应链金融中企业数据挖掘方法及系统与流程

文档序号：12470802阅读：264来源：国知局

本发明涉及电子供应链金融技术领域，特别涉及一种供应链金融中企业数据挖掘方法及系统。

背景技术：

供应链金融作为银行针对供应链企业提供的一种融资贷款服务模式，是目前比较流行的融资贷款方式。在供应链金融中，银行等信贷机构根据企业所在的产业，以及企业在供应链中所处的位置，为企业提供保理融资、货权质押以及商业票据融资等金融服务。供应链金融可以和企业的生产经营，以及所在产业的发展紧密结合，是金融服务实业的直接体现。供应链金融提高了金融服务和企业生产经营的匹配度，从供应链角度降低了金融机构的贷款不良风险。供应链金融最大的特点就是在供应链中寻找出大型优质企业作为核心企业，以核心企业为出发点，为供应链提供金融支持。

然而，目前银行主要是通过人工来确定出供应链中的核心企业，这一方面导致效率较低以及人工成本较高，另一方面由于人工分析过程不够全面，容易受到人为主观因素的干扰，导致最终确定的核心企业数据的准确度较低。

综上所述可以看出，如何提升供应链中核心企业数据的准确性并且提高核心企业数据的获取效率是目前有待解决的问题。

技术实现要素：

有鉴于此，本发明的目的在于提供一种供应链金融中企业数据挖掘方法及系统，提升了供应链中核心企业数据的准确性并且提高了核心企业数据的获取效率。其具体方案如下：

一种供应链金融中企业数据挖掘方法，包括：

从税局系统中采集企业的涉税数据；

分别确定N家企业中每家企业的上下游企业清单；其中，所述N家企业均属于同一行业的企业，N为正整数；

根据采集到的涉税数据，分别对所述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，得到所述N家企业各自所对应的交易信息；其中，每家企业所对应的交易信息均包括该企业的上游交易数据和下游交易数据；

利用所述N家企业各自所对应的交易信息，从所述N家企业中确定出所有的核心企业。

优选的，所述从税局系统中采集企业的涉税数据的过程，包括：

从税局系统中采集企业的财务数据、纳税人纳税数据、开票人纳税人识别号、开票人名称、开票人行业、受票人纳税人识别号、受票人名称、受票人行业、开票时间、开票金额、发票代码和发票号码。

优选的，每家企业各自所对应的交易信息均包括上游交易额、下游交易额、上游交易对象总数和下游交易对象总数。

优选的，所述利用所述N家企业各自所对应的交易信息，从所述N家企业中确定出所有的核心企业的过程，包括：

判断任一家企业的上游交易额、下游交易额、上游交易对象总数和下游交易对象总数是否均大于各自所对应的预设阈值，如果是，则判定该企业为所述N家企业中的核心企业，否则，判定该企业为所述N家企业中的非核心企业。

优选的，所述方法，还包括：

判断当前从所述N家企业中确定出的核心企业的总数量是否与预设总数量相一致，如果是，则生成相应的核心企业清单，如果否，则对上游交易额、下游交易额、上游交易对象总数和下游交易对象总数各自所对应的预设阈值进行相应的调整，并利用调整后的各个预设阈值重新进行核心企业的确定过程，直到确定出的核心企业的总数量与所述预设总数量相一致为止，并生成相应的核心企业清单。

优选的，所述利用所述N家企业各自所对应的交易信息，从所述N家企业中确定出所有的核心企业的过程，包括：

利用所述N家企业各自所对应的交易信息，并结合预先设定的分级标准，从所述N家企业中确定所有核心企业以及其他等级的企业。

优选的，所述方法，还包括：

确定与核心企业之间存在业务关联性的关联企业；

对所述关联企业在预设历史时间段内的上游交易数据和下游交易数据进行分析，得到初始分析结果；其中，所述初始分析结果包括所述关联企业的经营周期、年度内不同季度交易金额、年度内不同季度上游厂商的变化信息以及年度内不同季度下游厂商的变化信息；

结合所述关联企业的财务报表，对所述初始分析结果进行再次分析，得到二次分析结果；其中，所述二次分析结果包括所述关联企业的贷款账期、客户关系信息、厂商关系信息以及生产信息；

根据所述二次分析结果，评估所述关联企业的贷款意向以及贷款用途。

本发明还公开了一种供应链金融中企业数据挖掘系统，包括：

数据采集模块，用于从税局系统中采集企业的涉税数据；

企业清单确认模块，用于分别确定N家企业中每家企业的上下游企业清单；其中，所述N家企业均属于同一行业的企业，N为正整数；

交易信息计算模块，用于根据所述数据采集模块采集到的涉税数据，分别对所述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，得到所述N家企业各自所对应的交易信息；其中，每家企业所对应的交易信息均包括该企业的上游交易数据和下游交易数据；

企业级别确定模块，用于利用所述N家企业各自所对应的交易信息，从所述N家企业中确定出所有的核心企业。

优选的，所述数据采集模块，具体用于从税局系统中采集企业的纳税人财务数据、纳税人纳税数据、开票人纳税人识别号、开票人名称、开票人行业、受票人纳税人识别号、受票人名称、受票人行业、开票时间、开票金额、发票代码和发票号码。

优选的，每家企业各自所对应的交易信息均包括上游交易额、下游交易额、上游交易对象总数和下游交易对象总数。

优选的，所述企业级别确定模块，包括：

核心企业确定单元，用于判断任一家企业的上游交易额、下游交易额、上游交易对象总数和下游交易对象总数是否均大于各自所对应的预设阈值，如果是，则判定该企业为所述N家企业中的核心企业，否则，判定该企业为所述N家企业中的非核心企业。

优选的，所述企业级别确定模块，还包括：

核心企业调整单元，用于判断当前从所述N家企业中确定出的核心企业的总数量是否与预设总数量相一致，如果是，则生成相应的核心企业清单，如果否，则对上游交易额、下游交易额、上游交易对象总数和下游交易对象总数各自所对应的预设阈值进行相应的调整，并利用调整后的各个预设阈值重新进行核心企业的确定过程，直到确定出的核心企业的总数量与所述预设总数量相一致为止，并生成相应的核心企业清单。

优选的，所述企业级别确定模块，具体用于利用所述N家企业各自所对应的交易信息，并结合预先设定的分级标准，从所述N家企业中确定所有核心企业以及其他等级的企业。

优选的，所述系统，还包括：

关联企业确定模块，用于确定与核心企业之间存在业务关联性的关联企业；

第一分析模块，用于对所述关联企业在预设历史时间段内的上游交易数据和下游交易数据进行分析，得到初始分析结果；其中，所述初始分析结果包括所述关联企业的经营周期、年度内不同季度交易金额、年度内不同季度上游厂商的变化信息以及年度内不同季度下游厂商的变化信息；

第二分析模块，用于结合所述关联企业的财务报表，对所述初始分析结果进行再次分析，得到二次分析结果；其中，所述二次分析结果包括所述关联企业的贷款账期、客户关系信息、厂商关系信息以及生产信息；

贷款信息评估模块，用于根据所述二次分析结果，评估所述关联企业的贷款意向以及贷款用途。

本发明中，供应链金融中企业数据挖掘方法，包括：从税局系统中采集企业的涉税数据；分别确定N家企业中每家企业的上下游企业清单；其中，上述N家企业均属于同一行业的企业；根据采集到的涉税数据，分别对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，得到上述N家企业各自所对应的交易信息；其中，每家企业所对应的交易信息均包括该企业的上游交易数据和下游交易数据；利用上述N家企业各自所对应的交易信息，从上述N家企业中确定出所有的核心企业。

可见，本发明根据采集到的涉税数据，对同一行业中每家企业与各自上下游企业清单中的纳税人之间交易数据进行递归计算，从而得到每家企业各自对应的上游交易数据和下游交易数据，进而利用每家企业各自对应的上游交易数据和下游交易数据确定出本行业供应链中的核心企业，由于上述核心企业数据的获取过程无需人工参与，从而提高了核心企业数据的获取效率，并且由于本发明是通过涉税数据来分析出某家企业与其上下游企业之间的交易数据，这样能够更加全面客观地得到该企业的真实交易数据，从而使得最终得到的核心企业数据更加准确客观。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的一种企业数据挖掘方法流程图；

图2为本发明实施例公开的一种企业数据挖掘方法子流程图；

图3为本发明实施例公开的一种企业数据挖掘系统结构示意图；

图4为本发明实施例公开的一种企业数据挖掘系统部署示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种供应链金融中企业数据挖掘方法，参见图1所示，该方法包括：

步骤S11：从税局系统中采集企业的涉税数据。

可以理解的是，本实施例中的税局系统是指位于各个地区的各级电子税局系统。另外，从税局系统中采集到的企业涉税数据主要包括企业的基础信息、财务数据、纳税数据和发票数据。具体的，上述采集到的企业涉税数据包括企业的财务数据、纳税人纳税数据、开票人纳税人识别号、开票人名称、开票人行业、受票人纳税人识别号、受票人名称、受票人行业、开票时间、开票金额、发票代码和发票号码。

本实施例中，在从税局系统采集到涉税数据之后，可以把采集到的涉税数据保存至预设搭建的数据库系统。本实施例中，上述数据库系统具体可以是HBase数据库(HBase，即Hadoop Database)。

优选的，本实施例可以按照行业的不同，将采集到的涉税数据分类保存至上述数据库系统，也即，将同一行业中的企业涉税数据保存至上述数据库系统中的同一区域，不同行业的企业涉税数据保存至上述数据库系统中的不同区域。

步骤S12：分别确定N家企业中每家企业的上下游企业清单；其中，上述N家企业均属于同一行业的企业，N为正整数。

本实施例中，上述N家企业均是属于同一行业的企业，其中，上述N值的大小可以由系统用户预先设定，例如可以设为50。

另外，可以理解的是，上述N家企业中每家企业的上下游企业清单具体包括该企业的上游供应商清单和下游客户清单。

本实施例中，上述步骤S12中，具体包括确定属于同一行业的N家企业，然后再确定上述N家企业中每家企业的上下游企业清单。需要说明的是，上述N家企业的确定过程具体可以包括：在采集到企业的涉税数据之后，从这些涉税数据中确定某个特定行业中的任一个纳税人识别号，并将该纳税人识别号作为计算起点，重复采用递归方式确定该行业供应链中的其他纳税人识别号，直到确定出的纳税人识别号的数量与上述N值相一致为止，此时得到的N个纳税人识别号所对应的企业即为上述N家企业。

步骤S13：根据采集到的涉税数据，分别对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，得到上述N家企业各自所对应的交易信息；其中，每家企业所对应的交易信息均包括该企业的上游交易数据和下游交易数据。

具体的，上述每家企业各自所对应的交易信息均可以包括上游交易额、下游交易额、上游交易对象总数和下游交易对象总数。

本实施例中，可以按照预先设定的周期，定期地进行上述步骤S12和步骤S13，也即定期地确定本行业中N家企业中每家企业的上下游企业清单，以及对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，例如以年度、半年度或季度为计算周期，定期地确定本行业中N家企业各自对应的上下游企业清单，以及计算上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据。

本实施例中，在得到上述N家企业各自所对应的交易信息之后，可以以图谱的形式将这些交易信息保存起来，从而得到供应链交易图谱，以方便后期用来进行数据查询和数据分析。可以理解的是，上述供应链交易图谱中以年度或季度为时间区间，内容上包含供应链中纳税人自身以及各纳税人之间的交易关系和交易额。也即，上述供应链交易图谱具体记录了供应链中纳税人自身以及各纳税人之间的交易关系和交易额随年度、半年度或季度的变化情况，通过上述供应链交易图谱，可以获取到某家企业在某个季度内的交易信息。

步骤S14：利用上述N家企业各自所对应的交易信息，从上述N家企业中确定出所有的核心企业。

也即，本实施例可以利用每家企业所对应的上下游交易额的大小以及上下游交易对象总数的大小，来确定出上述N家企业中的核心企业。

可见，本发明实施例根据采集到的涉税数据，对同一行业中每家企业与各自上下游企业清单中的纳税人之间交易数据进行递归计算，从而得到每家企业各自对应的上游交易数据和下游交易数据，进而利用每家企业各自对应的上游交易数据和下游交易数据确定出本行业供应链中的核心企业，由于上述核心企业数据的获取过程无需人工参与，从而提高了核心企业数据的获取效率，并且由于本发明实施例是通过涉税数据来分析出某家企业与其上下游企业之间的交易数据，这样能够更加全面客观地得到该企业的真实交易数据，从而使得最终得到的核心企业数据更加准确客观。

本发明实施例公开了一种具体的供应链金融中企业数据挖掘方法，相对于上一实施例，本实施例对技术方案作了进一步的说明和优化。具体的：

上一实施例中，在得到上述N家企业各自所对应的交易信息之后，将会利用上述N家企业各自所对应的交易信息，从这N家企业中确定出所有的核心企业。本实施例中，上述利用N家企业各自所对应的交易信息，从这N家企业中确定出所有的核心企业的过程，具体可以包括：

判断任一家企业的上游交易额、下游交易额、上游交易对象总数和下游交易对象总数是否均大于各自所对应的预设阈值，如果是，则判定该企业为上述N家企业中的核心企业，否则，判定该企业为上述N家企业中的非核心企业，从而得到当前从上述N家企业中确定出来的所有核心企业。

例如，可以预先设定当前上游交易额对应的预设阈值为1亿元，当前下游交易额对应的预设阈值为1亿元，当前上游交易对象总数对应的预设阈值为10，当前下游交易对象总数对应的预设阈值为10个，当上述N家企业中的某家企业的上游交易额和下游交易额均大于1亿元，并且上游交易对象总数和下游交易对象总数均大于10，则可以判定当前该企业为核心企业，否则判定该企业为非核心企业。

当然，考虑到如果上述各种交易信息对应的预设阈值设定过小或过大，将会导致从上述N家企业中所确定的核心企业的总数量过多或过少，难以真正地反映出供应链中真实的核心企业数据，所以，本实施例可以根据上述核心企业的确定结果，对上述各个预设阈值进行相应的调整，并重复确定核心企业数据，直到最终得到的核心企业的总数量恰当为止。也即，本实施例中的供应链金融中企业数据挖掘方法，还可以进一步包括：

判断当前从上述N家企业中确定出的核心企业的总数量是否与预设总数量相一致，如果是，则生成相应的核心企业清单，如果否，则对上游交易额、下游交易额、上游交易对象总数和下游交易对象总数各自所对应的预设阈值进行相应的调整，并利用调整后的各个预设阈值重新进行核心企业的确定过程，直到确定出的核心企业的总数量与预设总数量相一致为止，并生成相应的核心企业清单。

可以理解的是，若当前从上述N家企业中确定出的核心企业的总数量大于上述预设总数量，则可以适当地调大上游交易额和/或下游交易额和/或上游交易对象总数和/或下游交易对象总数各自所对应的预设阈值，同理，若当前从上述N家企业中确定出的核心企业的总数量小于上述预设总数量，则可以适当地调小上游交易额和/或下游交易额和/或上游交易对象总数和/或下游交易对象总数各自所对应的预设阈值。

另外，本实施例在从上述N家企业中确定出所有核心企业的过程中，还可以确定其他等级的企业，例如二级核心企业、中型企业、小型企业和微型企业等。也即，上一实施例步骤S14中，利用上述N家企业各自所对应的交易信息，从上诉N家企业中确定出所有的核心企业的过程，具体可以包括：利用上述N家企业各自所对应的交易信息，并结合预先设定的分级标准，从上述N家企业中确定所有核心企业以及其他等级的企业。

可以理解的是，本实施例在不同的分级标准中，各种交易信息所对应的预设阈值会有所区别，不同的分级标准用于筛选出不同等级的企业，例如核心企业划分标准用于筛选核心企业，中型企业划分标准用于筛选中型企业等。

例如，当上述N家企业中的某家企业的上游交易额和下游交易额均大于1亿元，并且上游交易对象总数和下游交易对象总数均大于10，则可以判定当前该企业为核心企业；当某家企业的上游交易额和下游交易额均处于5千万至1亿元之间，并且上游交易对象总数和下游交易对象总数均处于5至10之间，则可以判定当前该企业为二级核心企业；当某家企业的上游交易额和下游交易额均处于3千万至5千万之间，并且上游交易对象总数和下游交易对象总数均等于5，则可以判定当前该企业为二级核心企业；当某家企业的上游交易额和下游交易额均处于2千万至3千万之间，并且上游交易对象总数和下游交易对象总数均等于4，则可以判定当前该企业为中型企业；当某家企业的上游交易额和下游交易额均处于500万至2千万之间，并且上游交易对象总数和下游交易对象总数均等于3，则可以判定当前该企业为小型企业；当某家企业的上游交易额和下游交易额均小于500万，并且上游交易对象总数和下游交易对象总数均小于或等于2，则可以判定当前该企业为微型企业。

另外，考虑到与核心企业对应的关联企业时常需要银行等信贷机构的贷款资金的扶持，为了便于银行更好地为这些关联企业提供最为合适的贷款服务，本实施例中，参见图2所示，上述供应链金融中企业数据挖掘方法，还可以进一步包括：

步骤S21：确定与核心企业之间存在业务关联性的关联企业；

步骤S22：对关联企业在预设历史时间段内的上游交易数据和下游交易数据进行分析，得到初始分析结果；其中，初始分析结果包括关联企业的经营周期、年度内不同季度交易金额、年度内不同季度上游厂商的变化信息以及年度内不同季度下游厂商的变化信息；

步骤S23：结合关联企业的财务报表，对初始分析结果进行再次分析，得到二次分析结果；其中，二次分析结果包括关联企业的贷款账期、客户关系信息、厂商关系信息以及生产信息；

步骤S24：根据二次分析结果，评估关联企业的贷款意向以及贷款用途。

例如，本实施例可以利用预先设定的与核心企业的距离参数，来筛选出关联企业清单，比如，当上述设定的距离参数为2时，假设A为核心企业，B为A的下游，C为B的下游，则筛选出的关联企业清单包含B和C；设定关联企业的二次筛选阀值参数，主要是从银行风控角度来进行设置，例如对企业的财务指标、纳税指标进行设置，从而进一步筛选关联企业清单；根据筛选出的关联企业清单，结合供应链交易图谱中企业在不同时间区间的上下游数据，获得关联企业的年度范围内的上下游的数据；对以上数据进一步加工处理，获取关联企业的经营周期、年度内不同季度交易金额、年度内不同季度上游厂商的变化、年度内不同季度下游厂商的变化等数据；从银行评估的角度对数据进一步加工处理，结合财务报表，获得关联企业的货款帐期、客户关系、厂商关系、生产持续等数据；根据计算结果评估贷款意向以及贷款用途，贷款用途包含材料采购、货款回笼、扩大生产、资金周转等等；最后根据贷款用途，银行可提供相适应的金融产品。

需要说明的是，本实施例具体可以基于Spark并行的计算方式，来对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算。以及对关联企业的贷款需求进行评估。

进一步的，本发明实施例在确定出某核心企业的关联企业之后，还可以进一步生成该核心企业与其关联企业之间的交易报告，该交易报告中可以包括某年度双方的交易数据以及双方交易数据在整个供应链交易中所处的具体排位，例如包括交易金额、占比、排名等关键数据。

相应的，本发明实施例还公开了一种供应链金融中企业数据挖掘系统，参见图3所示，该系统包括：

数据采集模块11，用于从税局系统中采集企业的涉税数据；

企业清单确认模块12，用于分别确定N家企业中每家企业的上下游企业清单；其中，上述N家企业均属于同一行业的企业，N为正整数；

交易信息计算模块13，用于根据数据采集模块11采集到的涉税数据，分别对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，得到上述N家企业各自所对应的交易信息；其中，每家企业所对应的交易信息均包括该企业的上游交易数据和下游交易数据；

企业级别确定模块14，用于利用上述N家企业各自所对应的交易信息，从N家企业中确定出所有的核心企业。

可以理解的是，本实施例中的税局系统是指位于各个地区的各级电子税局系统。另外，数据采集模块11从税局系统中采集到的企业涉税数据主要包括企业的基础信息、财务数据、纳税数据和发票数据。具体的，上述采集到的企业涉税数据包括企业的财务数据、纳税人纳税数据、开票人纳税人识别号、开票人名称、开票人行业、受票人纳税人识别号、受票人名称、受票人行业、开票时间、开票金额、发票代码和发票号码。

本实施例中，数据采集模块11在从税局系统采集到涉税数据之后，可以把采集到的涉税数据保存至预设搭建的数据库系统。本实施例中，上述数据库系统具体可以是HBase数据库(HBase，即Hadoop Database)。

本实施例中，上述N家企业均是属于同一行业的企业，其中，上述N值的大小可以由系统用户预先设定，例如可以设为50。

本实施例中，上述企业清单确认模块12，具体用于确定属于同一行业的N家企业，然后再确定上述N家企业中每家企业的上下游企业清单。需要说明的是，上述企业清单确认模块12确定上述N家企业的过程具体可以包括：在采集到企业的涉税数据之后，从这些涉税数据中确定某个特定行业中的任一个纳税人识别号，并将该纳税人识别号作为计算起点，重复采用递归方式确定该行业供应链中的其他纳税人识别号，直到确定出的纳税人识别号的数量与上述N值相一致为止，此时得到的N个纳税人识别号所对应的企业即为上述N家企业。

另外，上述每家企业各自所对应的交易信息均可以包括上游交易额、下游交易额、上游交易对象总数和下游交易对象总数。

本实施例中，可以按照预先设定的周期，定期地启动上述企业清单确认模块12和交易信息计算模块13的工作流程，也即定期地确定本行业中N家企业中每家企业的上下游企业清单，以及对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算，例如以年度、半年度或季度为计算周期，定期地确定本行业中N家企业各自对应的上下游企业清单，以及计算上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据。

本实施例中，上述交易信息计算模块13在得到上述N家企业各自所对应的交易信息之后，可以以图谱的形式将这些交易信息保存起来，从而得到供应链交易图谱，以方便后期用来进行数据查询和数据分析。可以理解的是，上述供应链交易图谱中以年度或季度为时间区间，内容上包含供应链中纳税人自身以及各纳税人之间的交易关系和交易额。也即，上述供应链交易图谱具体记录了供应链中纳税人自身以及各纳税人之间的交易关系和交易额随年度、半年度或季度的变化情况，通过上述供应链交易图谱，可以获取到某家企业在某个季度内的交易信息。

本实施例中，上述企业级别确定模块，具体可以包括：

核心企业确定单元，用于判断任一家企业的上游交易额、下游交易额、上游交易对象总数和下游交易对象总数是否均大于各自所对应的预设阈值，如果是，则判定该企业为N家企业中的核心企业，否则，判定该企业为N家企业中的非核心企业。

进一步的，考虑到如果上述各种交易信息对应的预设阈值设定过小或过大，将会导致从上述N家企业中所确定的核心企业的总数量过多或过少，难以真正地反映出供应链中真实的核心企业数据，所以，本实施例可以根据上述核心企业的确定结果，对上述各个预设阈值进行相应的调整，并重复确定核心企业数据，直到最终得到的核心企业的总数量恰当为止。也即，本实施例中的企业级别确定模块，还可以包括：

核心企业调整单元，用于判断当前从N家企业中确定出的核心企业的总数量是否与预设总数量相一致，如果是，则生成相应的核心企业清单，如果否，则对上游交易额、下游交易额、上游交易对象总数和下游交易对象总数各自所对应的预设阈值进行相应的调整，并利用调整后的各个预设阈值重新进行核心企业的确定过程，直到确定出的核心企业的总数量与预设总数量相一致为止，并生成相应的核心企业清单。

另外，本实施例的企业级别确定模块在从上述N家企业中确定出所有核心企业的过程中，还可以确定其他等级的企业，例如二级核心企业、中型企业、小型企业和微型企业等。也即，上述企业级别确定模块，可以具体用于利用N家企业各自所对应的交易信息，并结合预先设定的分级标准，从N家企业中确定所有核心企业以及其他等级的企业。

另外，考虑到与核心企业对应的关联企业时常需要银行等信贷机构的贷款资金的扶持，为了便于银行更好地为这些关联企业提供最为合适的贷款服务，本实施例中，上述供应链金融中企业数据挖掘系统，还可以进一步包括关联企业确定模块、第一分析模块、第二分析模块和贷款信息评估模块；其中，

关联企业确定模块，用于确定与核心企业之间存在业务关联性的关联企业；

第一分析模块，用于对关联企业在预设历史时间段内的上游交易数据和下游交易数据进行分析，得到初始分析结果；其中，初始分析结果包括关联企业的经营周期、年度内不同季度交易金额、年度内不同季度上游厂商的变化信息以及年度内不同季度下游厂商的变化信息；

第二分析模块，用于结合关联企业的财务报表，对初始分析结果进行再次分析，得到二次分析结果；其中，二次分析结果包括关联企业的贷款账期、客户关系信息、厂商关系信息以及生产信息；

贷款信息评估模块，用于根据二次分析结果，评估关联企业的贷款意向以及贷款用途。

进一步的，本发明实施例还可以进一步包括：报告生成模块，用于在确定出某核心企业的关联企业之后，生成该核心企业与其关联企业之间的交易报告，该交易报告中可以包括某年度双方的交易数据以及双方交易数据在整个供应链交易中所处的具体排位，例如包括交易金额、占比、排名等关键数据。

图4示出了本发明实施例公开的一种具体供应链金融中企业数据挖掘系统部署示意图，在图4中，企业数据挖掘系统包括数据采集模块11、企业清单确认模块12、交易信息计算模块13、企业级别确定模块14、关联企业确定模块15、第一分析模块16、第二分析模块17、贷款信息评估模块18和报告生成模块19。其中，企业清单确认模块12、交易信息计算模块13、企业级别确定模块14、关联企业确定模块15、第一分析模块16、第二分析模块17和贷款信息评估模块18均设置于Spark服务器中，在Spark服务器中，利用Spark并行的计算方式，来对上述N家企业中每家企业与各自上下游企业清单中的纳税人之间的交易数据进行递归计算。以及对关联企业的贷款需求进行评估。其中，上述企业级别确定模块中包括核心企业调整单元，用于对各种交易信息对应的预设阈值进行调整。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种供应链金融中企业数据挖掘方法及系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高翔;胡文彬;刘祥涛;赵彦晖;孙淏添
技术所有人：深圳微众税银信息服务有限公司
我是此专利的发明人

上一篇：一种逻辑树型中医自诊知识学习的方法与流程
上一篇：一种红细胞输注需求量评估与疗效评价的系统和方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。