基于分布式机器学习的数据主体请求的处理方法及系统与流程

文档序号:25811322发布日期:2021-07-09 13:32阅读:186来源:国知局
基于分布式机器学习的数据主体请求的处理方法及系统与流程

1.本申请涉及信息安全领域,具体而言,涉及一种基于分布式机器学习的数据主体请求的处理方法及系统。


背景技术:

2.在数字化转型中,个人信息作为一类重要的数据,而个人信息的主体即数据主体,需要获得控制权。在当今个人信息广泛应用、个人信息合规成为各方关注的重点的背景下,如何让个人信息在发挥数据价值的前提下保证数据主体的合法权利,是数字化转型的关键。
3.现有技术中,各种企业不同程度获取个人信息,如姓名、身份证、年龄、性别、电话、爱好等,这些个人信息被企业采用不同种方式进行存储,即使是在一个企业中,数据主体想查询或删除全部的个人信息已经变得不可能实现,而传统安全手段重在边界防护或者静态存储防护,没有对个人信息的数据主体诉求进行控制,企业管理者要获得个人信息的价值的同时,保障数据主体的合法权利,并没有有效的手段。
4.针对上述的问题,目前尚未提出有效的解决思路。


技术实现要素:

5.本申请实施例提供了一种基于分布式机器学习的数据主体请求的方法,以解决相关技术中不能对个人信息的数据主体请求进行响应的技术问题。
6.根据本申请实施例的一个方面,提供了一种基于分布式机器学习的数据主体请求的方法,包括:通过分布式机器学习对多源数据中心的数据进行分析,建立多源数据中心中的第一个人信息的索引;依据所述第一个人信息的索引,通过分布式机器学习对互联网的数据进行分析,建立互联网中与所述第一个人信息相关的第二个人信息的索引;通过分布式机器学习,建立所述第一个人信息的索引和所述第二个人信息的索引的关联索引;接收数据主体的数据处理请求,通过第一个人信息的索引鉴别数据主体的真实性;对数据主体触发的请求进行确认,通过第一个人信息的索引、第二个人信息的索引和关联索引,通过分布式机器学习实时获得数据主体请求的相关的所有数据,并执行数据主体的数据处理请求。
7.可选地,通过分布式机器学习对多源数据中心的数据进行分析,建立多源数据中心中的第一个人信息的索引,包括:通过分布式机器学习对多源数据中心的数据进行分析,从包含多种数据的数据中心中,提取归属于个人信息类的数据特征,并对个人信息类的数据建立第一个人信息的索引,其中,第一个人信息的索引不包含个人信息的原始数据或属性,只用于分布式机器学习进一步的分析,任何组件均无法通过第一个人信息的索引推演出个人信息类的原始数据或属性;
可选地,依据所述第一个人信息的索引,通过分布式机器学习对互联网的数据进行分析,建立互联网中与所述第一个人信息相关的第二个人信息的索引,包括:依据多源数据中心的第一个人信息的索引,通过分布式机器学习对互联网的数据进行分析,从包含多种数据的网络中,提取与多源数据中心的个人信息相关的归属于个人信息类的数据特征,并对个人信息类的数据建立第二个人信息的索引,其中,第二个人信息的索引,不包含个人信息的原始数据或属性,只用于分布式机器学习进一步的分析,任何组件均无法通过第二个人信息类的数据特征推演出个人信息类的原始数据或属性。
8.可选地,通过分布式机器学习,建立所述第一个人信息的索引和所述第二个人信息的索引的关联索引,包括:通过分布式机器学习对多源数据中心所提取的第一个人信息的索引与互联网中所提取的第二个人信息的索引进行人工智能分析,为多源数据中心所提取的第一个人信息的索引和互联网中所提取的第二个人信息的索引建立关联索引,其中,关联索引不包含个人信息的原始数据或属性,只用于分布式机器学习进一步的管理以及对数据主体请求的处理,任何组件均无法通过索引推演出个人信息类的原始数据或属性。
9.可选地,所述数据主体的数据处理请求包括查询请求,查询请求的处理方法如下:接收数据主体提出查询个人信息的请求,对数据主体进行身份鉴别,若数据主体与第一个人信息的索引所关联的个人信息一致,通过分布式机器学习启动实时的个人信息查询,并向数据主体反馈查询结果,所述查询结果包括数据主体的个人信息存储情况以及与数据主体关联的个人信息在互联网中存储情况。
10.可选地,所述数据主体的数据处理请求包括删除请求,删除请求的处理方法如下:接收数据主体提出的删除个人信息的请求,依据所掌握的第一个人信息的索引,对数据主体进行身份鉴别,若数据主体与第一个人信息的索引所关联的个人信息一致,通过分布式机器学习启动实时的个人信息查询,并向数据主体反馈查询结果,所述查询结果包括数据主体的个人信息存储情况以及与数据主体关联的个人信息在互联网中存储情况;接收数据主体依据查询结果提交的确认执行删除指令,通过分布式机器学习对数据主体所请求的存储在多源数据中心的个人信息进行删除;同时将存储在互联网中的数据主体的个人信息,反馈给数据主体。
11.可选地,所述分布式机器学习是指:对不同的数据中心启用不同的机器学习组件,加速个人信息学习和建立索引的效率;针对互联网的数据,独立启用机器学习组件,在加速个人信息学习和建立索引的效率的同时,与数据中心的第一个人信息的索引相隔离,隔离第二个人信息的索引过程中对互相的影响;对数据中心的第一个人信息的索引与互联网的第二个人信息的索引建立关联索引时,由独立的机器学习组件对两者进行混合计算,形成个人信息关联索引。
12.可选地,通过分布式机器学习实时获得数据主体请求的相关的所有数据,是由分布式机器学习通过迭代方式获得:基于多源数据中心的数据已建立的第一个人信息的索引,对多源数据中心发生变化的数据进行机器学习,建立的新的第一个人信息的索引,将新的第一个人信息的索引作为多源数据中心的数据的索引,替换旧的第一个人信息的索引;基于互联网数据已建立的第二个人信息的索引,对互联网中发生变化的数据进行机器学习,建立的新的第二个人信
息的索引,将新的索引作为互联网的数据的索引,替换旧的第二个人信息的索引;通过分布式机器学习,对新的第一个人信息的索引和新的第二个人信息的索引进行分析,进一步建立新的关联索引。
13.可选地,所述对数据主体的进行身份鉴别是指:通过数据主体提交的个人信息作为输入,通过分布式机器学习,对输入的个人信息与由多源数据中心的数据所建立的第一个人信息的索引进行人工智能分析与比较,返回需要数据主体回答的问题;数据主体对问题进行应答,应答信息作为输入通过分布式机器学习,再次与由数据中心的数据所建立的第一个人信息的索引进行人工智能分析与比较,验证通过后,数据主体的身份鉴别完成。
14.根据本申请实施例的另一个方面,提供一种基于分布式机器学习的数据主体请求系统,包括:数据主体请求交互平台,包括:个人信息索引展示单元:用于展示个人信息的索引,包括数据中心的第一个人信息的索引、互联网的第二个人信息的索引以及两者的关联索引;数据主体身份鉴别单元:用于数据主体提交身份信息进行鉴别以及对数据主体身份执行鉴别;数据主体请求结果单元:用于对数据主体发起的请求进行审核确认,审核完成后自动获得数据主体所请求的数据或者执行数据主体所请求的删除处理结果;分布式机器学习子系统,包括:数据中心个人信息索引单元:用于发起分析个人信息的任务,将数据中心中属于个人信息类的数据进行分析,建立第一个人信息的索引;互联网个人信息索引单元:用于将数据中心的第一个人信息的索引作为依据,发起分析互联网个人信息的任务,获得互联网第二个人信息的索引;关联个人信息索引单元:对数据中心的第一个人信息的索引和互联网的第二个人信息的索引进行关联分析,建立关联索引;数据主体请求执行子系统,包括:数据主体请求查询单元:用于当数据主体发起查询请求时,经过数据主体请求交互平台的数据主体身份鉴别后,自动向数据中心、互联网进行数据主体请求的个人信息的查询,并将查询结果通过数据主体请求交互平台进行展示;数据主体请求删除单元:用于当数据主体发起删除请求时,经过数据主体请求交互平台的数据主体身份鉴别后,自动将数据中心中数据主体请求的删除的个人信息进行删除,同时获得互联网中仍被存储的数据主体请求的相关信息,并通过数据主体请求交互平台向数据主体进行反馈。
15.采用本申请的技术方案,可实现如下效果:第一,在分布式机器学习子系统中,通过分布式机器学习子系统对多源数据中心的数据和互联网的数据进行自动的分析和择取,获得个人信息类的数据特征并建立数据中心的第一个人信息的索引、互联网的第二个人信息的索引以及两者的关联索引;第二,在数据主体请求交互平台中,数据主体发起查询个人信息的请求的同时,提交数据主体的个人信息用于数据主体的身份鉴别;第三,通过分布式机器学习子系统,对数据主体的身份进行鉴别,直至鉴别通过;第四,在分布式机器学习子系统中,对数据主体发起的查询请求进行快速响应,并将查询结果反馈至数据主体请求交互平台;第五,在分布式机器学习子系统中,对数据主体发起的删除请求进行快速响应,从数据中心获得数据主体请求删除的信息,执行删除,并将删除结果反馈至数据主体请求交互平台;第六,在分布式机器学习子系统中,获得互联网中与数据主体请求删除的信息相关的信息,并将结果反馈至数据主体请求
交互平台。
16.通过这些技术,一方面保证数据主体对个人信息的控制权;另一方面在保证个人信息合规的同时,让企业继续使用数据创造价值。和相关技术相比,本申请的优势在于:本申请基于分布式机器学习,可以帮助企业快速的对数据主体发起的查询、删除请求进行处理。通过人工智能分析,对结构化数据、半结构化数据、非结构化数据,建立了数据中心的第一个人信息的索引、互联网的第二个人信息的索引以及两者的关联索引。数据主体发起查询、删除请求时,除了对企业所存储的与数据主体请求的信息相关的数据进行反馈,同时还能够对互联网中存在的与数据主体请求的信息相关的数据进行反馈。借助于数据中心的第一个人信息的索引与互联网的第二个人信息的索引的关联索引,企业可以为数据主体提供更全面的合规支持,让数据主体快速的、全面的掌握个人信息,并进一步采取控制措施。
附图说明
17.此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的基于分布式机器学习的数据主体请求的系统的示意图;图2是根据本申请实施例的一种可选的建立个人信息索引的流程图;图3是根据本申请实施例的一种可选的数据主体身份鉴别的流程图;图4是根据本申请实施例的一种可选的数据主体请求查询的流程图;图5是根据本申请实施例的一种可选的数据主体请求删除的流程图。
具体实施方式
18.为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
19.需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
20.发明人经过对相关技术进行分析认识到:随着个人对个人信息保护意识的增强,以及国家对个人信息合规的重视,掌握个人信息的企业需要对个人即数据主体提出的个人信息处理进行响应,包括数据主体提出的查询、删除等请求。同时,掌握个人信息的企业经过长期的积累,数据的规模已经非常巨大,数据格式各种各样,要从大量的丰富的数据中找
到数据主体所请求的所有信息,是非常艰巨甚至是难以完成的任务。尤其是国家在《个人信息保护法》(草案)中明确数据主体具有知情权,那么当数据主体提出请求时,企业应当依法对数据主体的请求作出处理。让企业所掌握的个人信息既创造价值,又保证数据主体享有合法权利满足数据主体的诉求显得尤为重要,这也成为企业管理者亟需解决的问题。针对数据主体请求的处理,各企业采取了不同的措施,主要可分为三类:1)数据主体向企业提出查询、删除请求时,企业需要通过人工查找的方式,从存储数据的位置逐一查找相关信息,人力成本很大,同时因为数据主体相关的信息比较分散,靠人力查找无法全部找到;2)数据主体向企业提出删除请求时,企业删除信息时不做整体关联分析,直接删除,可能影响以后关联数据的分析和使用;3)数据主体向企业提出查询、删除请求时,不对数据主体进行身份鉴别,企业直接执行数据主体请求,造成误操作甚至是侵犯被误处理的数据主体的权利。如上所述,传统的处理数据主体请求的方法,企业管理者找不到合适的方法实现业务上的诉求,因此,基于分布式机器学习的数据主体请求,是企业在满足数据主体请求的合规的前提下创造价值的重要手段。
21.基于数据量大、数据格式多样、数据内容丰富以及数据价值高的特点,决定了企业处理数据主体请求具有其特殊性。目前,对数据主体请求的处理,具有以下局限性:1)通过人工识别哪些是数据主体请求的信息,这对少量数据可行,但数据量大,人工无法完成;2)借助通过人工查找、删除的常规手段识别数据主体所请求的信息,这对内容简单的数据可行,但数据内容多、丰富,这种方法的可靠性没有保障;3)个人信息本身具有多样性,通过人工找到各种属性的个人信息之间的关联,是无法完成的;4)个人信息相关的数据比较分散,数据主体提出请求时,管理者很难找到所有与数据主体相关的数据在哪里,相应的,当数据主体提出查询、删除等要求时,管理者也不能给数据主体提供具体的数据,也就违反了个人信息合规的目标; 5)数据中个人信息量巨大,快速的查询、删除数据主体所请求的个人信息,是很耗时的工作,或者是经过长时间的处理,只是处理一部分个人信息,不能处理全部的个人信息。
22.本申请保证企业对数据主体请求作出快速、合规的处理。对个人信息的识别、关联,是由人工智能自动完成,不需要用户手动参与。本申请对所有结构化数据、半结构化数据、非结构化数据进行分析和索引,数据形态涵盖数据流、数据片段和各种文档。本申请在实现企业所掌握的数据主体数据得到合规处理的同时,让数据主体掌握互联网上与数据主体相关的数据,为数据主体提供全面的请求。
23.根据本申请实施例的一个方面,提供了一种基于分布式机器学习的数据主体请求的方法,包括:1)通过分布式机器学习对多源数据中心的数据进行分析,从包含多种数据的数据中心中,提取归属于个人信息类的数据特征,并对个人信息类的数据建立个人信息类的索引。其中,个人信息类的索引,不包含个人信息的原始数据或属性,只用于分布式机器学习进一步的分析,任何组件均无法通过个人信息的索引推演出个人信息类的原始数据或属性。
24.2)依据多源数据中心的第一个人信息的索引,通过分布式机器学习对互联网的数据进行分析,从包含多种数据的网络中,提取与多源数据中心的个人信息相关的归属于个人信息类的数据特征,并对个人信息类的数据建立个人信息类的索引。其中,个人信息类的
索引,不包含个人信息的原始数据或属性,只用于分布式机器学习进一步的分析,任何组件均无法通过个人信息类的数据特征推演出个人信息类的原始数据或属性。
25.3)通过分布式机器学习对数据中心所提取的第一个人信息的索引与互联网中所提取的第二个人信息的索引进行人工智能分析,为数据中心所提取的第一个人信息的索引以及互联网中所提取的第二个人信息的索引建立关联索引。关联索引不包含个人信息的原始数据或属性,只用于分布式机器学习进一步的管理以及对数据主体请求的处理,任何组件均无法通过索引推演出个人信息类的原始数据或属性。
26.4)根据个人信息的索引,可掌握数据中心的个人信息存储情况以及与数据主体关联的互联网中存储情况,由对索引进行统一的管理。
27.5)数据主体提出查询个人信息的请求时,依据所掌握的索引,对数据主体进行身份鉴别,鉴别数据主体与索引所关联的个人信息一致,通过分布式机器学习启动实时的个人信息查询,并向数据主体反馈查询结果。
28.6)数据主体提出删除个人信息的请求时,依据所掌握的索引,对数据主体进行身份鉴别,鉴别数据主体与索引所关联的个人信息一致,通过分布式机器学习启动实时的个人信息查询,并向数据主体反馈查询结果。数据主体依据查询结果,向提交确认执行删除。进一步通过分布式机器学习对数据中心的数据主体所请求的个人信息进行删除。互联网中存储的数据主体所请求的个人信息,同时反馈给数据主体。
29.可选地,所述多源数据中心,包括文件服务器、数据库、私有云数据中心、公有云数据中心;数据格式包括结构化数据、半结构化数据和非结构化数据;数据的形态可以是数据流、数据片段和各种文档。
30.可选地,所述互联网中的数据,包括网络中所有可见的数据,数据格式包括结构化数据、半结构化数据和非结构化数据;数据的形态可以是数据流、数据片段和各种文档。
31.可选地,分布式机器学习,是对不同的数据中心启用不同的机器学习组件,加速个人信息学习和建立索引的效率。针对互联网的数据,独立启用机器学习组件,在加速个人信息学习和建立索引的效率的同时,与数据中心的第一个人信息的索引相隔离,隔离第二个人信息的索引过程中对互相的影响。对数据中心的第一个人信息的索引与互联网的第二个人信息的索引建立关联索引时,由独立的机器学习组件对两者进行混合计算,形成个人信息关联索引。
32.可选地,通过分布式机器学习实时获得数据主体请求的相关的所有数据,是由分布式机器学习通过迭代方式获得:通过由数据中心的数据所建立的索引,快速获得数据主体请求的相关的数据;基于数据中心数据已建立的索引,对数据中心发生变化的数据进行机器学习,建立新的索引,同时获得数据主体请求相关的数据;通过由互联网的数据所建立的索引,快速获得数据主体请求的相关的数据;基于互联网数据已建立的索引,对互联网中发生变化的数据进行机器学习,建立新的索引,同时获得数据主体请求相关的数据。通过上述方法,获得数据主体请求的相关的所有数据。
33.可选地,基于数据中心的数据已建立的索引,对数据中心发生变化的数据进行机器学习,建立的新的索引,新的索引作为数据中心的数据的索引,替换旧的索引。基于互联网数据已建立的索引,对互联网中发生变化的数据进行机器学习,建立的新的索引,新的索引作为互联网的数据的索引,替换旧的索引。通过分布式机器学习,对新的索引进行分析,
进一步建立新的关联索引。
34.可选地,通过迭代方式对个人信息建立索引,加快下一次数据主体请求的处理速度。
35.可选地,所述对数据主体的进行身份鉴别,是通过数据主体提交的个人信息作为输入,通过分布式机器学习,对输入的个人信息与由数据中心的数据所建立的第一个人信息的索引进行人工智能分析与比较,返回需要数据主体回答的问题。数据主体对问题进行应答,应答信息作为输入通过分布式机器学习,再次与由数据中心的数据所建立的第一个人信息的索引进行人工智能分析与比较,验证通过后,数据主体的身份鉴别完成。
36.可选地,所述数据主体请求查询个人信息,完成所述的数据主体的身份鉴别后,通过分布式机器学习快速、自动的获得数据主体请求的相关个人信息,包括数据中心中与数据主体请求相关的信息以及互联网中与数据主体请求相关的信息。
37.可选地,所述数据主体请求删除个人信息,完成所述的数据主体的身份鉴别后,通过分布式机器学习快速、自动的获得数据主体请求的相关个人信息,并进一步由数据主体对个人信息进行确认,确认完成后,通过分布式机器学习进一步执行删除。
38.可选地,所述数据主体请求删除个人信息,对互联网中所存储的与数据主体请求删除的个人信息相关的信息,向数据主体进行反馈。反馈的信息包括但不限于个人信息内容、数量、所在网络位置(ip、url)、所属企业名称。
39.根据本申请实施例的另一方面,还提供了一种基于分布式机器学习的数据主体请求系统,包括:所述分布式机器学习子系统,用于分析数据中心的数据并建立第一个人信息的索引;分析互联网的数据并建立第二个人信息的索引;为数据中心的数据所建立的第一个人信息的索引与互联网的数据所建立的第二个人信息的索引,建立关联索引;对数据主体发起的查询、删除请求进行快速的实时分析和迭代;将索引反馈至数据主体请求交互平台,向进行展示;所述数据主体请求执行子系统,对数据主体发起的查询、删除请求进行响应,并将结果反馈至数据主体请求交互平台,向或数据主体进行展示;所述数据主体请求交互平台,用于展示个人信息的索引、数据主体身份识别的交互以及数据主体请求查询、数据主体请求删除的处理结果。
40.如图1所示,为基于分布式机器学习的数据主体请求系统中组成单元示意图。本申请提供了一种基于分布式机器学习的数据主体请求系统,包括:数据主体请求交互平台包括:个人信息索引展示单元:用于展示个人信息的索引,包括数据中心的第一个人信息的索引、互联网的第二个人信息的索引以及两者的关联索引;数据主体身份鉴别单元:用于数据主体提交身份信息进行鉴别以及对数据主体身份执行鉴别;数据主体请求结果单元:用于对数据主体发起的请求进行审核确认,审核完成后自动获得数据主体所请求的数据或者执行数据主体所请求的删除处理结果。
41.分布式机器学习子系统包括:数据中心个人信息索引单元:发起分析个人信息的任务,将数据中心中属于个人信息类的数据进行分析,建立第一个人信息的索引;互联网个人信息索引单元:将数据中心的第一个人信息的索引作为依据,发起分析互联网个人信息的任务,获得互联网的第二个人信息的索引;关联个人信息索引单元:对数据中心的第一个人信息的索引和互联网的第二个人信息的索引进行关联分析,建立关联索引。不管数据本身是结构化数据、半结构化数据还是非结构化数据,不管形态是数据流、数据片段和各种文
档,都能通过分布式机器学习子系统建立索引。
42.数据主体请求执行子系统包括:数据主体请求查询单元:当数据主体发起查询请求时,经过数据主体请求交互平台的数据主体身份鉴别后,自动向数据中心、互联网进行数据主体请求的个人信息的查询,并将查询结果通过数据主体请求交互平台进行展示;数据主体请求删除单元:当数据主体发起删除请求时,经过数据主体请求交互平台的数据主体身份鉴别后,自动将数据中心中数据主体请求的删除的个人信息进行删除,同时获得互联网中仍被存储的数据主体请求的相关信息,并通过数据主体请求交互平台向数据主体进行反馈。
43.将数据主体请求交互平台、分布式机器学习子系统、数据主体请求执行子系统分别安装在不同的计算机中。其中,数据主体请求交互平台安装到一台计算机上进行控制,布式机器学习子系统、数据主体请求执行子系统安装到用户计算中心计算机中。下面详细说明基于分布式机器学习的数据主体请求系统的工作方法。
44.第一,自动建立个人信息索引。
45.通过分布式机器学习子系统,建立个人信息索引。如图2所示,工作方法步骤如下:步骤201,启动分布式机器学习子系统的分析任务。
46.步骤202,通过分布式机器学习子系统,对多源数据中心的个人信息进行人工智能分析,获得第一个人信息的索引。
47.步骤203,启动分布式机器学习子系统的分析任务。
48.步骤204,通过分布式机器学习子系统,依据多源数据中心的第一个人信息的索引对互联网的个人信息进行人工智能分析,获得相关的个人信息索引,即第二个人信息的索引。
49.步骤205,通过分布式机器学习子系统,依据多源数据中心的第一个人信息的索引和互联网的第二个人信息的索引,建立关联索引。
50.第二,数据主体请求的身份鉴别。
51.在数据主体发起查询、删除的请求前,数据主体提交信息,通过数据主体请求交互子系统进行身份鉴别。如图3所示,工作步骤如下:步骤301,数据主体发起请求。
52.步骤302,数据主体提交个人身份信息。
53.步骤303,启动身份鉴别,由数据主体请求交互子系统自动对个人身份信息进行鉴别。
54.步骤304,身份鉴别完成,对身份鉴别结果进行确认。
55.步骤305,身份鉴别结果反馈给数据主体。
56.第三,数据主体请求查询。
57.数据主体发起查询个人信息的请求,并经过身份鉴别通过后,进一步执行查询。如图4所示的数据主体请求查询处理流程:步骤401,数据主体发起查询请求。
58.步骤402,通过数据主体请求交互平台对请求进行身份鉴别和确认,数据主体发起的请求与数据主体身份一致,确认成功,执行步骤404,否则执行步骤403。
59.步骤403,数据主体发起的请求与数据主体身份不一致,与不允许对个人信息执行
查询。
60.步骤404,确认继续执行查询,继续执行步骤405。
61.步骤405,数据主体请求子系统依据多源数据中心第一个人信息的索引,获得多源数据中心中与数据主体请求查询的信息相关的数据。
62.步骤406,数据主体请求子系统依据数据中心第一个人信息的索引与互联网的第二个人信息的索引的关联索引,获得互联网中与数据主体请求查询的信息相关的数据。
63.步骤407,综合上述信息,向数据主体反馈查询的结果。
64.第四,数据主体请求删除。
65.数据主体发起删除个人信息的请求,并经过身份鉴别通过后,进一步执行删除。如图5所示的数据主体请求删除处理流程:步骤501,数据主体发起删除请求。
66.步骤502,通过数据主体请求交互平台对请求进行身份鉴别和确认,数据主体发起的请求与数据主体身份一致,确认成功,执行步骤504,否则执行步骤503。
67.步骤403,数据主体发起的请求与数据主体身份不一致,与不允许对个人信息执行删除。
68.步骤504,确认继续执行删除,继续执行步骤505。
69.步骤505,数据主体请求子系统依据数据中心的第一个人信息的索引,删除数据中心中与数据主体请求删除的信息相关的数据。
70.步骤506,数据主体请求子系统依据数据中心的第一个人信息的索引与互联网的第二个人信息的索引的关联索引,获得互联网中与数据主体请求删除的信息相关的数据。
71.步骤507,综合上述信息,向数据主体反馈已经删除的结果以及互联网中仍可见的数据主体请求的相关信息。
72.根据本申请实施例的另一个方面,还提供了一种用于实施上述方法的装置。该装置可以包括:分布式机器学习索引模块,用于分析数据中心的数据并建立第一个人信息的索引;分析互联网的数据并建立第二个人信息的索引;为数据中心的数据所建立的第一个人信息的索引与互联网的数据所建立的第二个人信息的索引,建立关联索引;数据主体请求执行模块,通过分布式机器学习执行数据主体发起的查询、删除请求;数据主体请求交互模块,用于数据主体发起请求以及对数据主体进行身份鉴别;当数据主体发起删除请求时,展示互联网中需要进一步处理的待删除的个人信息。
73.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read

only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
74.上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
75.上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所
述方法的全部或部分步骤。
76.在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
77.在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
78.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
79.另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
80.以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1