一种基于图数据库的企业团体欺诈检测方法与流程

文档序号:35206039发布日期:2023-08-22 17:44阅读:35来源:国知局
一种基于图数据库的企业团体欺诈检测方法与流程

本发明涉及一种检测方法,具体为一种基于图数据库的企业团体欺诈检测方法,属于金融数据处理。


背景技术:

1、企业关联关系挖掘是在企业监管和金融领域中重要的一个环节,对于银行、信托、担保中心、证券等金融机构都有十分重要的意义。随着我国经济的快速发展,现代化的公司经营体系也得到了爆炸式的成长。

2、对于企业关联关系信息挖掘方式还是依赖传统的专家经验,这种方式不仅效率低,消耗大量的资源,同时它所完成的企业关联数据量是有很大局限性,不能挖掘出大量企业内部所隐藏的风险关联。


技术实现思路

1、本发明的目的就在于为了解决上述至少一个技术问题而提供一种基于图数据库的企业团体欺诈检测方法。

2、本发明通过以下技术方案来实现上述目的:一种基于图数据库的企业团体欺诈检测方法,包括以下步骤:

3、步骤一、创建企业关联知识图谱,将知识图谱创建分为模式创建、数据处理、知识图谱创建三方面内容,企业关联知识图谱的模式创建是基于自下而上的方式,将企业关系数据库中的数据映射为资源描述框架rdf三元组的形式,数据预处理的数据源是保存在将关系数据库的企业相关数据表,首先选取重要的字段信息,剔除无用和空值较多的字段,然后使用d2r工具将关系型数据转换为rdf三元组的形式,并形成映射文件,对于rdf三元组的数据存储使用neo4j图数据库进行存储;

4、步骤二、从企业关联知识图谱中识别企业关联关系,并计算企业关联的权重值;

5、步骤三、基于图神经网络算法模型训练,先进行数据处理,将图谱中和风险相关子图的拓扑结构表示和其中有关的特征或属性进行工程处理,序列化成为dgl的图对象,再对数据进行模型训练。

6、作为本发明再进一步的方案:步骤一中,资源描述框架的三元组划分为实体、属性、关系三种概念,其中实体划分为企业和自然人两种,企业之间关系有股东、投资、担保、分支四种,企业和自然人之间的关系有股东、投资、担保、高管、联系人五种。

7、作为本发明再进一步的方案:步骤一中,企业相关数据表包括企业登记信息、登记信息补充、登记变更信息、登记信息股东、经营异常名录、严重违法失信企业名单、税务-纳税信息、税务-登记信息、税务-利润信息、税务-变更登记信息、税务-法制信息、税务-投资方信息、税务-登记个人税收、税务-稽查信息、税务-资产负债信息、税务-申报信息、税务-发票数据、欠税纳税人名单、非正常户认定信息、单位缴纳信息、用人单位未按时足额缴纳社会保险费,经责令改正逾期仍不缴纳被处以罚款信息、公积金-单位缴存、单位不缴或少缴公积金-法人、不动产登记基本信息、不动产登记他项信息(融合)、不动产登记产权信息、不动产登记产权人信息、不动产登记土地信息、房屋基本信息、不动产登记房屋信息、高新技术企业、技术先进型服务企业、行政审批-科委技先认定信息、行政审批-科委高企认定信息、报关单信息、报关单回执信息、发明公开、发明申请信息、授权发明专利信息、授权外观设计专利信息、商标、合作社基本信息、各类农业补贴发放情况(企业、合作社)、客户信息、抄表信息、表卡信息、欠费情况、水电煤等公共事业欠费或其他失信行为记录信息、电力法人欠费信息、非居民开账信息、燃气居民客户和非居民客户欠费信息、失信被执行人信息。

8、作为本发明再进一步的方案:步骤一中,neo4j图数据库可以解决传统关系数据在处理知识图谱所遇到的三个问题,一图数据库提供简洁高效的查询方式,二是图数据库提供高效的存储方式,这种效率得益于图数数据库图结构的设计,图数据库中将实体是真的链接在一起,三是图数据库中能够更灵活的创建新的实体关系。

9、作为本发明再进一步的方案:步骤二中,具体包括:

10、关联路径查询,通过图关数据库查询任意两个实体间的关联路径,关联路径可以衡量企业之间的密切程度,进而发现实体间的风险问题;

11、企业实际控制人发现,通过关联路径可以查询到自然人和企业之间的投资关系,把自然人对于企业最终持股比例达到50%以上的实体作为企业实际控制人;

12、企业集团挖掘,企业集团挖掘是通过查询企业之间的分支关系、股东关系,自然人与企业的高管、股东、联系人、实际控制人等关系行成企业集团联系,定义一个集团方法是通过发现实际控制人所有控股企业的路径,行成股权控制架构,且实际控制人控制的具有独立法律地位的企业数量在五个以上,就定义为一个企业集团。

13、作为本发明再进一步的方案:步骤三中,数据处理具体包括:

14、将图谱中和风险相关子图的拓扑结构表示和其中有关的特征或属性进行工程处理,序列化成为dgl的图对象,为了生成dgl图像,制定了三种映射规则,特征直接选取属性的值;特征从属性中经过数学变换;枚举属性值为数字特征,根据制定的映射和转换规则,将neo4j中的顶点、边,和它们的属性按照规则处理成为点、边、和其中的标注(label)与特征(feature),从而构造为dgl的图对象。

15、作为本发明再进一步的方案:步骤三中,模型训练具体包括

16、首先对于数据集进行分割数据集,将整体数据集划分成了训练、验证和测试的子集,三个数据集是不重叠的,划分比例分别为60%训练集、20%验证集、20%测试集,划分依据是根据是否标注欺诈为标准去分割数据集;

17、其次对于数据集进行异构图转换为同构图处理,提取图中能用股权比例表示的关系,将股权比例记为边的数值;

18、最后是基于pytorch深度学习框架使用graphsage算法对dgl图进行模型训练。

19、作为本发明再进一步的方案:步骤三中,对于训练完成的模型,进行推理接口,对新来的一个交易请求数据写进neo4j,然后再从这个点获取一个线上系统可以返回的小子图,可以把该小子图作为模型推理的输入,获得子图的标签。

20、本发明的有益效果是:

21、1.本发明按照自下而上的原则将结构化数据转为为了企业关联图谱,并在此基础上实现了企业关联路径的查询、发现企业的实际控制人以及挖掘企业集团,在企业知识图谱的角度对研究企业关系进行挖掘,能够发现很多隐藏的规律;

22、2.本发明的技术方案能够有助于识别出组团的欺诈、骗贷行为,更全面的了解信贷企业的风险状况,对于预防隐藏在团队企业中的风险能够更好识别,进而最大程度阻断这些风险企业的信贷路径。



技术特征:

1.一种基于图数据库的企业团体欺诈检测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤一中,资源描述框架的三元组划分为实体、属性、关系三种概念,其中实体划分为企业和自然人两种,企业之间关系有股东、投资、担保、分支四种,企业和自然人之间的关系有股东、投资、担保、高管、联系人五种。

3.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤一中,企业相关数据表包括企业登记信息、登记信息补充、登记变更信息、登记信息股东、经营异常名录、严重违法失信企业名单、税务-纳税信息、税务-登记信息、税务-利润信息、税务-变更登记信息、税务-法制信息、税务-投资方信息、税务-登记个人税收、税务-稽查信息、税务-资产负债信息、税务-申报信息、税务-发票数据、欠税纳税人名单、非正常户认定信息、单位缴纳信息、用人单位未按时足额缴纳社会保险费,经责令改正逾期仍不缴纳被处以罚款信息、公积金-单位缴存、单位不缴或少缴公积金-法人、不动产登记基本信息、不动产登记他项信息(融合)、不动产登记产权信息、不动产登记产权人信息、不动产登记土地信息、房屋基本信息、不动产登记房屋信息、高新技术企业、技术先进型服务企业、行政审批-科委技先认定信息、行政审批-科委高企认定信息、报关单信息、报关单回执信息、发明公开、发明申请信息、授权发明专利信息、授权外观设计专利信息、商标、合作社基本信息、各类农业补贴发放情况、客户信息、抄表信息、表卡信息、欠费情况、水电煤等公共事业欠费或其他失信行为记录信息、电力法人欠费信息、非居民开账信息、燃气居民客户和非居民客户欠费信息、失信被执行人信息。

4.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤一中,neo4j图数据库可以解决传统关系数据在处理知识图谱所遇到的三个问题,一图数据库提供简洁高效的查询方式,二是图数据库提供高效的存储方式,这种效率得益于图数数据库图结构的设计,图数据库中将实体是真的链接在一起,三是图数据库中能够更灵活的创建新的实体关系。

5.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤二中,具体包括:

6.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤三中,数据处理具体包括:

7.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤三中,模型训练具体包括

8.根据权利要求1所述的基于图数据库的企业团体欺诈检测方法,其特征在于:所述步骤三中,对于训练完成的模型,进行推理接口,对新来的一个交易请求数据写进neo4j,然后再从这个点获取一个线上系统可以返回的小子图,可以把该小子图作为模型推理的输入,获得子图的标签。


技术总结
本发明公开了一种基于图数据库的企业团体欺诈检测方法,包括创建企业关联知识图谱、从企业关联知识图谱中识别企业关联关系,并计算企业关联的权重值;基于图神经网络算法模型训练。本发明的有益效果是:按照自下而上的原则将结构化数据转为为了企业关联图谱,并在此基础上实现了企业关联路径的查询、发现企业的实际控制人以及挖掘企业集团,在企业知识图谱的角度对研究企业关系进行挖掘,能够发现很多隐藏的规律;能够有助于识别出组团的欺诈、骗贷行为,更全面的了解信贷企业的风险状况,对于预防隐藏在团队企业中的风险能够更好识别,进而最大程度阻断这些风险企业的信贷路径。

技术研发人员:邓中伟,徐兴元,周晶,石薇
受保护的技术使用者:上海卫诚企业征信有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1