基于分布式隐私保护数据挖掘的企业信用评估方法

文档序号:6556465阅读:229来源:国知局
专利名称:基于分布式隐私保护数据挖掘的企业信用评估方法
技术领域
本发明涉及企业信用评估方法,尤其涉及一种基于分布式隐私保护数据挖掘的企业信用评估方法。
背景技术
随着经济全球化,企业在经营中所涉及的因素越来越多,准确对企业信用进行评估需要充分利用包括各级地方政府的财政、税务、工商部门以及各个银行、企业内部各自已积累的大量数据。利用分布式隐私保护数据挖掘的方法可以从存放在政府不同部门或企业内部的数据中发现更多潜在有用的知识,不但可以大大降低因知识不确定而带来的决策风险,而且可以为企业信用评估提供更加科学合理的依据。
传统的企业信用评估方法主要是利用一些评估模型或者专家知识,然后针对具体的企业案例进行评估。该方法虽然操作简单,成本低廉,但是评价中所依据知识的数据来源单一,这个问题严重影响了评估结果的质量。目前虽然有个别企业利用自己的数据以挖掘知识辅助企业信用评估,但这种挖掘所依据知识的数据来源单一,这严重影响了评估结果的质量,另一方面,如果简单地对参与评估的各部门利用分布式数据挖掘进行知识发现,会对各部分的数据安全造成泄漏,造成各部门因为对各自数据的隐私考虑,不愿意或不允许提供自己的私有数据,这严重阻碍了全面、真实知识的获取和挖掘,从而影响了评估质量。因此,传统的企业信用评估方法无法满足实际的需要。

发明内容
本发明的目的是提供一种基于分布式隐私保护数据挖掘的企业信用评估方法。
它的步骤如下1)利用智能Agent技术以及P2P和Grid技术构建适合多个部门需要的大规模分布式数据挖掘架构;2)通过安全多方计算和密码学技术使得各部门能够通过分布式网络来协同挖掘隐私保护数据;3)通过隐私保护数据挖掘所产生的挖掘知识辅助企业信用评估。
本发明利用了分布式数据挖掘的技术,同时强调用户的隐私保护,从实际的需求出发充分考虑到了传统方法存在的不足,明确给出了利用数据挖掘方法,特别是保护用户隐私的数据挖掘方法以辅助实现企业信用评估,充分利用各个组织的数据,不需要数据进行集中处理,促进了数据的共享,解决了评价过程中所依据知识的数据来源单一以及在数据挖掘过程中缺少数据隐私保护机制的问题。因此,本发明的方法不仅可操作性强,而且在实现上具有较高的准确性和安全性。


图1是本发明大规模分布式数据挖掘架构图;图2是本发明部门内部层次网络图;图3是本发明P2P网络中数据处理关系图;图4是本发明数据挖掘辅助信用评估图。
具体实施例方式
本发明所述的利用智能Agent技术(Jennings N R,Sycara K,and Wooldridge M.Aroadmap of agent research and development.Autonomous Agents and Multi-Agent Systems.1275-306,1998.)以及P2P(Singh M P.Peer-to-Peer Computing for information systems.In Proc.Of AP2PC 2002.July 2002.pp.15-20)和Grid技术(Foster I,Kesselman C,Tuecke S.TheAnatomy of the GridEnabling Scalable Virtual Organizations.International J.SupercomputerApplications,15(3),2001)构建适合多个部门需要的大规模分布式数据挖掘架构这种分布式架构是一种虚拟和动态的层次架构,税务、银行、电力不同部门之间通过Grid技术来进行网络构建,这些参与到Grid中的结点具有强大的处理能力和高速的网络带宽;每个部门内部利用P2P技术构建虚拟的层次网络,借助Agent技术,部门内部的每个结点能够动态加入或离开系统当一个结点加入系统时,它连接到一个已经存在的结点,同时可以被其他系统中已经存在的结点连接;当一个结点离开系统时,它通知它所连接的结点和连接到它的结点以使得网络拓扑结构能够动态调整。对于网络中的每个结点,其具有Agent的特点,当它接收网络中的信息后,利用其自身所具有的私有数据和所处的状态来转换和处理这些信息,并把经过处理和转换的信息放入共享数据库中,然后通过发送/接收分配器将数据和信息发送到网络中的其它结点。
所述的通过安全多方计算(Du W.and Atallah,M.J.Secure multi-party computationproblems and their applicationsa review and open problems.InProceedings of the 2001 workshopon New security paradigms,pp.13-22,2001.)和密码学技术(Goldreich O,Micali S,WigdersonA.How to paly any mental game-a completeness theorem for protocols with honest majority.In19th ACM Symposium on the Theory of Computing,pp.218-229,1987)使得各部门之间能够通过分布式网络来协同挖掘隐私保护数据首先针对关联规则挖掘、聚类挖掘、决策树挖掘不同的数据挖掘算法抽取其中通用的操作;其次设计这些通用操作的高效方法,重点是设计分布式环境下安全求和、并、交、数量积操作;最后利用这些操作设计高效的隐私保护数据挖掘算法以进行数据挖掘获取知识补充知识库。
所述的通过隐私保护数据挖掘所产生的挖掘知识辅助企业信用评估基于信用评估模型,同时利用隐私保护数据挖掘算法所获得的“IF-THEN”规则知识在企业信用评估的过程当中辅助金融领域专家进行更加准确和客观的企业信用评估。
基于分布式隐私保护数据挖掘的企业信用评估方法的步骤如下1)利用智能Agent技术以及P2P和Grid技术构建适合多个部门需要的大规模分布式数据挖掘架构(如图1所示)。不同部门之间(例如税务、银行、电力等)通过Grid技术来进行网络构建,这些参与到Grid中的结点(超级结点)具有强大的处理能力和高速的网络带宽。如图2所示,每个部门(例如税务、银行等)内部利用P2P技术构建虚拟的层次网络,借助Agent技术,部门内部的每个结点(一般结点)能够动态加入或离开系统当一个结点加入系统时,它连接到一个已经存在的结点,同时可以被存在的其他结点连接;当一个结点离开系统时,它通知它所连接的结点和连接到它的结点以使得网络拓扑结构能够动态调整。对于网络中的每个结点,其具有Agent的特点,当它接收网络中的信息后,利用其本身所具有的私有数据和所处的状态来转换和处理这些信息,并把经过处理和转换的信息放入共享数据库中,然后通过发送/接收分配器将数据和信息发送到网络中的其它结点(如图3所示)。
2)通过安全多方计算和密码学技术使得各部门之间能够通过分布式网络来协同挖掘隐私保护数据;首先针对不同的数据挖掘算法(关联规则挖掘、聚类挖掘、决策树挖掘)抽取其中通用的操作;其次设计这些通用操作的高效方法(重点是设计分布式环境下安全求和、并、交、数量积操作);最后利用这些操作设计高效的隐私保护数据挖掘算法以进行数据挖掘获取知识补充知识库。
3)通过隐私保护数据挖掘所产生的挖掘知识辅助企业信用评估。在信用评估实际当中,基于信用评估模型,同时利用隐私保护数据挖掘算法所获得的知识(例如,“IF-THEN”规则等)在企业信用评估的过程当中辅助金融领域专家进行更加准确和客观的企业信用评估。
实施例为了能够对企业甲进行信用评估,我们需要利用部门A、B和C的数据,处于隐私的考虑,这些部门不愿意将本部门所拥有的数据和信息提供给对方也不愿意将自己部门的信息提供给一个中心结点,为此,需要利用隐私保护数据挖掘来进行挖掘。
假设部门A、B和C内部拥有众多的结点,因此这些内部的结点各自也具有不同的隐私级别和各自的私有数据,为了能够综合集成这些内部结点所形成的数据,我们需要利用本专利中所提及的大规模分布式数据挖掘架构,利用Agent技术以及P2P技术构建部门内部层次网络图,不同的内部结点可以在保护自己私有数据的前提下,分层将自己所储存的数据向上层递交,最后汇总于每个部门的超级结点,然后在这些超级结点之间利用隐私保护数据挖掘技术来挖掘关联信息(IF-THEN规则)、将数据进行聚类和分类,形成归纳知识以辅助金融领域专家对企业进行信用评估。
权利要求
1.一种基于分布式隐私保护数据挖掘的企业信用评估方法,它的步骤如下1)利用智能Agent技术以及P2P和Grid技术构建适合多个部门需要的大规模分布式数据挖掘架构;2)通过安全多方计算和密码学技术使得各部门能够通过分布式网络来协同挖掘隐私保护数据;3)通过隐私保护数据挖掘所产生的挖掘知识辅助企业信用评估。
2.根据权利要求1所述的一种基于分布式隐私保护数据挖掘的企业信用评估方法,其特征在于所述的利用智能Agent技术以及P2P和Grid技术构建适合多个部门需要的大规模分布式数据挖掘架构这种分布式架构是一种虚拟和动态的层次架构,不同部门之间通过Grid技术来进行网络构建,这些参与到Grid中的结点具有强大的处理能力和高速的网络带宽;每个部门内部利用P2P技术构建虚拟的层次网络,借助Agent技术,部门内部的每个结点能够动态加入或离开系统当一个结点加入系统时,它连接到一个已经存在的结点,同时被其他系统中已经存在的结点连接;当一个结点离开系统时,它通知它所连接的结点和连接到它的结点以使得网络拓扑结构能够动态调整,对于网络中的每个结点,其具有Agent的特点,当它接收网络中的信息后,利用其自身所具有的私有数据和所处的状态来转换和处理这些信息,并把经过处理和转换的信息放入共享数据库中,然后通过发送/接收分配器将数据和信息发送到网络中的其它结点。
3.根据权利要求2所述的一种基于分布式隐私保护数据挖掘的企业信用评估方法,其特征在于所述的不同部门为税务、银行、电力部门。
4.根据权利要求1所述的一种基于分布式隐私保护数据挖掘的企业信用评估方法,其特征在于所述的通过安全多方计算和密码学技术使得各部门之间能够通过分布式网络来协同挖掘隐私保护数据首先针对不同的数据挖掘算法抽取其中通用的操作;其次设计这些通用操作的高效方法,重点是设计分布式环境下安全求和、并、交、数量积操作;最后利用这些操作设计高效的隐私保护数据挖掘算法以进行数据挖掘获取知识补充知识库。
5.根据权利要求4所述的一种基于分布式隐私保护数据挖掘的企业信用评估方法,其特征在于所述的不同的数据挖掘算法为关联规则挖掘、聚类挖掘、决策树挖掘算法。
6.根据权利要求1所述的一种基于分布式隐私保护数据挖掘的企业信用评估方法,其特征在于所述的通过隐私保护数据挖掘所产生的挖掘知识辅助企业信用评估基于信用评估模型,同时利用隐私保护数据挖掘算法所获得的知识在企业信用评估的过程当中辅助金融领域专家进行更加准确和客观的企业信用评估。
7.根据权利要求6所述的一种基于分布式隐私保护数据挖掘的企业信用评估方法,其特征在于所述的获得的知识为“IF-THEN”规则。
全文摘要
本发明公开了一种基于分布式隐私保护数据挖掘的企业信用评估方法,它的步骤如下1)利用智能Agent以及P2P和Grid技术构建适合多个部门需要的大规模分布式数据挖掘架构;2)通过安全多方计算和密码学技术使得各部门能够通过分布式网络来协同挖掘隐私保护数据;3)通过隐私保护数据挖掘所产生的挖掘知识辅助企业信用评估。本发明利用了分布式数据挖掘技术,强调用户隐私保护,明确给出了利用保护用户隐私的数据挖掘方法以辅助实现企业信用评估,促进了数据的共享,解决了评价过程中所依据知识的数据来源单一以及在数据挖掘过程中缺少数据隐私保护机制的问题。因此,本发明的方法不仅可操作性强,而且在实现上具有较高的准确性和安全性。
文档编号G06F17/30GK1804886SQ20061004924
公开日2006年7月19日 申请日期2006年1月24日 优先权日2006年1月24日
发明者蒋云良, 徐从富, 王金龙, 姜飞, 毛福钢 申请人:浙江大学, 湖州师范学院, 成路集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1