一种医疗大数据共享分析方法及装置与流程

文档序号：22433555发布日期：2020-10-02 10:20阅读：121来源：国知局

本发明涉及大数据处理技术领域，具体而言，涉及一种医疗大数据共享分析方法及装置。

背景技术：

大数据的应用已经较为普遍，各行各业都有涉及，医疗行业也在使用大数据，而随着数据量的日益增加，数据类型的多样化，用户在进行数据分享时，若直接将所有数据进行发送，由于过于庞大的数据量，会占用较多资源，而医疗相关用户一般不具备能够处理庞大数据量的专业设备。不仅如此，各个医疗相关用户之间的数据传输的逻辑、格式也并不完全相同，这使得医疗相关用户之间进行数据分享的时候，每次分享都需要制定对应的分享策略，十分复杂不便。

有鉴于此，如何提供一种便捷的医疗大数据共享分析方案，是本领域技术人员需要解决的。

技术实现要素：

本发明的目的在于提供一种医疗大数据共享分析方法、装置、计算机设备和可读存储介质。

第一方面，本发明实施例提供一种医疗大数据共享分析方法，应用于计算机设备，包括：

接收多个服务器发送的预设医疗大数据信息，基于所述预设医疗大数据信息，通过与所述多个服务器进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱，其中，所述预设医疗大数据信息表征服务器中的共享大数据的地址索引；

接收所述多个服务器发送的多个第二逻辑关系树，并对所述多个第二逻辑关系树进行整合，得到第二待处理知识图谱；

对所述第一待处理知识图谱和所述第二待处理知识图谱进行整合，得到目标知识图谱，并将所述目标知识图谱发送给所述多个服务器，以使所述多个服务器利用所述目标知识图谱进行大数据分享；

获取待处理医疗大数据信息，并将所述待处理医疗大数据信息分别发送给所述多个服务器，其中，所述待处理医疗大数据信息表征待分享的待处理共享大数据的地址索引；

当接收到所述多个服务器基于所述目标知识图谱针对所述待处理医疗大数据信息所返回的多个子分享标识时，利用所述多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析。

可选地，所述对所述第一待处理知识图谱和所述第二待处理知识图谱进行整合，得到目标知识图谱的步骤，包括：

从所述多个服务器获取到多个样本大数据，并对所述多个样本大数据进行整合，得到第一大数据样本对象集，其中，样本大数据表征服务器中的私有大数据；

对所述多个服务器所发送的预设医疗大数据信息的整合，得到第二大数据样本对象集；

基于所述第一大数据样本对象集和所述第二大数据样本对象集，得到目标大数据样本对象集；

利用所述第一大数据样本对象集和所述目标大数据样本对象集，计算出第一关联关系，以及利用所述第二大数据样本对象集和所述目标大数据样本对象集，计算出第二关联关系；

根据所述第一关联关系和所述第二关联关系，对所述第一待处理知识图谱和所述第二待处理知识图谱进行整合，得到所述目标知识图谱。

可选地，所述基于所述预设医疗大数据信息，通过与所述多个服务器进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱的步骤，包括：

利用所述预设医疗大数据信息，将所述多个服务器划分成至少一个集群，并向每个集群中的主服务器发送与其属于同一集群的匹配服务器的信息，其中，所述主服务器是所述共享大数据中具有预设文件夹的服务器，所述匹配服务器是所述共享大数据中不具有预设文件夹的服务器；

接收所述主服务器发送的第一待整合大数据，以及所述匹配服务器发送的第二待整合大数据，并对所述第一待整合大数据和所述第二待整合大数据进行整合，得到已整合大数据，其中，所述第一待整合大数据是所述主服务器通过与所述匹配服务器的信息所确定出的所述匹配服务器进行预设大数据交互得到的；

将所述已整合大数据分别返回给所述主服务器和所述匹配服务器；

接收所述主服务器针对所述已整合大数据发送的第一阶段第一逻辑关系树，以及接收所述匹配服务器针对所述已整合大数据发送的第二阶段第一逻辑关系树，并将所述第一阶段第一逻辑关系树和所述第二阶段第一逻辑关系树进行整合，得到所述每个集群对应的所述第一逻辑关系树，进而得到至少一个第一逻辑关系树；

对所述至少一个第一逻辑关系树进行整合，得到所述第一待处理知识图谱。

可选地，所述接收所述多个服务器发送的多个第二逻辑关系树，并对所述多个第二逻辑关系树进行整合，得到第二待处理知识图谱的步骤，包括：

接收每个服务器发送的第二逻辑关系树，从而得到所述多个第二逻辑关系树；

对所述多个第二逻辑关系树进行整合，得到所述第二待处理知识图谱。

可选地，在所述接收多个服务器发送的预设医疗大数据信息之前，所述方法还包括：

生成安全验证码，并将所述安全验证码发送给所述多个服务器；所述安全验证码用于在待整合大数据交互时所述服务器对待整合大数据进行加密；相应的，所述基于所述预设医疗大数据信息，通过与所述多个服务器进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱，包括：基于所述预设医疗大数据信息，通过与所述多个服务器进行加密后的待整合大数据交互所得到的所述第一逻辑关系树，构造出所述第一待处理知识图谱。

可选地，所述对待整合大数据进行加密的步骤，包括：

获取目标服务器发送的安全验证触发动作，其中，所述目标服务器为所述多个服务器中与待整合大数据所在服务器相关联的服务器，所述安全验证触发动作用于指示所述计算机设备向所述目标服务器发送用于获取第一安全特征向量的验证动作；

接收所述目标服务器基于所述验证动作返回的与待整合大数据所在服务器对应的目标待整合大数据的所述第一安全特征向量；

根据所述第一安全特征向量确定与所述目标待整合大数据相关联的安全验证向量，从第一验证向量集合中获取用于验证所述安全验证向量的预设验证向量，其中，所述安全验证向量为与所述目标待整合大数据相关联的第一安全特征向量中的内容信息，所述安全验证向量中包含所述第一安全特征向量对应的向量类型指标号和向量数值指标，所述安全验证向量中包含与所述目标待整合大数据相关的目标安全特征向量，所述预设验证向量是由与所述计算机设备相关联的第三方安全平台所确定的；

获取与所述预设验证向量相关联的特征元素集；

若所述特征元素集中包含与所述向量类型指标和所述向量数值指标相关联的第一安全特征向量，且所述第一安全特征向量的来源标识属于所述第一安全特征向量对应的预设来源数据库，则确定所述安全验证向量的安全置信度超过预设置信度阈值；

在所述安全验证向量的安全置信度超过预设置信度阈值时，从所述安全验证向量中提取所述目标安全特征向量；

从与所述计算机设备相关联的大数据信息处理平台中获取目标集群，遍历所述目标集群上的服务器；

若在所述目标集群上遍历到的与所述目标安全特征向量相关联的服务器，则将遍历到与所述目标安全特征向量相关联的服务器确定为参考服务器，确定完成对所述目标待整合大数据的安全验证，且安全验证通过；

根据安全验证触发动作从与所述计算机设备相关联的第一验证向量集合中获取第二安全特征向量，将所述第二安全特征向量作为所述安全验证触发动作对应的响应信息返回给目标服务器，以使所述目标服务器对所述第二安全特征向量进行安全验证，其中，所述第二安全特征向量中携带与所述计算机设备相关联的第一安全验证子码；

接收所述目标服务器基于所述第一安全验证子码发送的加密流程处理结果，其中，所述加密流程处理结果中携带利用所述第一安全验证子码对目标字符串进行安全转码操作后的安全映射文件；

通过所述第一安全验证子码对应的第二安全验证子码对所述安全映射文件进行解密，得到与所述安全验证触发动作相关联的目标字符串；

根据所述目标字符串，生成用于与所述目标服务器之间进行通信连接时的安全验证码；

在安全验证通过且完成与所述安全验证触发动作相关联的加密流程时，建立与所述目标服务器之间的通信连接，基于所述通信连接对应的安全验证码获取所述目标服务器发送的服务器更新触发动作；

基于所述服务器更新触发动作将在所述目标集群中除所述参考服务器之外的且与所述目标安全特征向量无关的服务器确定为无关服务器，其中，所述目标安全特征向量中包含用于表征所述目标待整合大数据的身份地址索引信息；

对所述目标集群中的所述无关服务器进行排查，将排查后的目标集群中的参考服务器确定为与所述目标待整合大数据相关联的关联服务器，在所述关联服务器中查找与所述身份地址索引信息相匹配的大数据类型信息；

将查找到的大数据类型信息用所述安全验证码进行安全转码操作，将安全转码操作后的大数据类型信息作为安全验证结果，将所述安全验证结果返回给所述目标服务器，以完成所述待整合大数据的加密，其中，所述安全验证码是由参与所述加密流程的所述目标服务器和所述计算机设备所共同确定的，所述安全验证结果为通过所述安全验证码对与所述目标待整合大数据相关联的大数据类型信息进行安全转码操作后所得到的，与所述目标待整合大数据相关联的大数据类型信息为从与所述计算机设备相关联的大数据信息处理平台中获取的参考服务器中与所述目标安全特征向量相匹配的大数据类型信息。

可选地，所述当接收到所述多个服务器基于所述目标知识图谱针对所述待处理医疗大数据信息所返回的多个子分享标识时，利用所述多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析的步骤，包括：

接收每个服务器基于所述目标知识图谱针对所述待处理医疗大数据信息所发送的子分享标识，从而得到所述多个子分享标识；

对所述多个子分享标识进行整合，得到所述大数据分享结果，完成所述大数据分享。

第二方面，本发明实施例提供一种医疗大数据共享分析装置，应用于计算机设备，包括：

接收模块，用于接收多个服务器发送的预设医疗大数据信息，基于所述预设医疗大数据信息，通过与所述多个服务器进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱，其中，所述预设医疗大数据信息表征服务器中的共享大数据的地址索引；接收所述多个服务器发送的多个第二逻辑关系树，并对所述多个第二逻辑关系树进行整合，得到第二待处理知识图谱；

处理模块，用于对所述第一待处理知识图谱和所述第二待处理知识图谱进行整合，得到目标知识图谱，并将所述目标知识图谱发送给所述多个服务器，以使所述多个服务器利用所述目标知识图谱进行大数据分享；

获取模块，用于获取待处理医疗大数据信息，并将所述待处理医疗大数据信息分别发送给所述多个服务器，其中，所述待处理医疗大数据信息表征待分享的待处理共享大数据的地址索引；

分享模块，用于当接收到所述多个服务器基于所述目标知识图谱针对所述待处理医疗大数据信息所返回的多个子分享标识时，利用所述多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析。

第三方面，本发明实施例提供一种计算机设备，所述计算机设备包括处理器及存储有计算机指令的非易失性存储器，所述计算机指令被所述处理器执行时，所述计算机设备执行第一方面所述的医疗大数据共享分析方法。

第四方面，本发明实施例提供一种可读存储介质，所述可读存储介质包括计算机程序，所述计算机程序运行时控制所述可读存储介质所在计算机设备执行第一方面所述的医疗大数据共享分析方法。

相比现有技术，本发明提供的有益效果包括：本发明实施例采用一种医疗大数据共享分析方法、装置、计算机设备和可读存储介质，通过接收多个服务器发送的预设医疗大数据信息，基于所述预设医疗大数据信息，通过与所述多个服务器进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱，其中，所述预设医疗大数据信息表征服务器中的共享大数据的地址索引；进而接收所述多个服务器发送的多个第二逻辑关系树，并对所述多个第二逻辑关系树进行整合，得到第二待处理知识图谱；然后对所述第一待处理知识图谱和所述第二待处理知识图谱进行整合，得到目标知识图谱，并将所述目标知识图谱发送给所述多个服务器，以使所述多个服务器利用所述目标知识图谱进行大数据分享；再获取待处理医疗大数据信息，并将所述待处理医疗大数据信息分别发送给所述多个服务器，其中，所述待处理医疗大数据信息表征待分享的待处理共享大数据的地址索引；最终当接收到所述多个服务器基于所述目标知识图谱针对所述待处理医疗大数据信息所返回的多个子分享标识时，利用所述多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析，能够便捷地实现分享大数据的操作。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定。对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的医疗大数据共享分析系统的结构示意框图；

图2为本发明实施例提供的医疗大数据共享分析方法的步骤流程示意图；

图3为本发明实施例提供的医疗大数据共享分析装置的结构示意框图；

图4为本发明实施例提供的计算机设备的结构示意框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一阶段实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

此外，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

下面结合附图，对本发明的具体实施方式进行详细说明。

目前，大数据已经深入各个行业、领域，为人们生活水平的提升做出贡献。然而对于医疗行业来说，随着大数据相关业务的发展，其数据量越来越大，不同用户的需求也越来越多。而又由于大数据的特性，直接将所有数据进行分享，会占用较多的计算资源，同时各个医疗相关用户（例如医院）之间在对接时采取的数据处理逻辑、格式等并不完全相同，医疗相关用于与专门用于进行信息处理的用户存在区别，不具备较为成熟的大数据处理能力，这使得用户每次在进行大数据分享时，都需要进行一次数据分享策略的定制，十分的不便。为了解决前述提出的问题，请参考图1，图1为本发明实施例提供的医疗大数据共享分析系统的交互示意图。医疗大数据共享分析系统可以包括计算机设备100以及和计算机设备100通信连接的多个服务器200。图1所示的医疗大数据共享分析系统仅为一种可行的实施例，在其他可行的实施例中，该医疗大数据共享分析系统也可以仅包括图1所示组成部分的其中一部分或者还可以包括其他组成部分。

服务器200可以包括移动设备、平板计算机、膝上型计算机等或其任意组合。在一些实施例中，移动设备可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等，或其任意组合。在一些实施例中，智能家居设备可以包括智能电器设备的控制设备、智能监控设备、智能电视、智能摄像机等，或其任意组合。在一些实施例中，可穿戴设备可包括智能手环、智能鞋带、智能玻璃、智能头盔、智能手表、智能服装、智能背包、智能配件等，或其任何组合。在一些实施例中，智能移动设备可以包括智能手机、个人数字助理、游戏设备等，或其任意组合。在一些实施例中，虚拟现实设备和/或增强现实设备可以包括虚拟现实头盔、虚拟现实玻璃、虚拟现实贴片、增强现实头盔、增强现实玻璃、或增强现实贴片等，或其任意组合。例如，虚拟现实设备和/或增强现实设备可以包括各种虚拟现实产品等。

本发明实施例中，医疗大数据共享分析系统中的计算机设备100和多个服务器200可以通过配合执行以下方法实施例所述的医疗大数据共享分析方法，请结合参考图2，图2为本发明实施例提供的医疗大数据共享分析方法的步骤流程示意图。下面对本发明提出的医疗大数据共享分析方法进行详细的介绍，本发明提供的医疗大数据共享分析方法，由图1中计算机设备100执行。

步骤201，接收多个服务器200发送的预设医疗大数据信息，基于预设医疗大数据信息，通过与多个服务器200进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱。

其中，预设医疗大数据信息表征服务器200中的共享大数据的地址索引。

步骤202，接收多个服务器200发送的多个第二逻辑关系树，并对多个第二逻辑关系树进行整合，得到第二待处理知识图谱。

步骤203，对第一待处理知识图谱和第二待处理知识图谱进行整合，得到目标知识图谱，并将目标知识图谱发送给多个服务器200，以使多个服务器200利用目标知识图谱进行大数据分享。

步骤204，获取待处理医疗大数据信息，并将待处理医疗大数据信息分别发送给多个服务器200。

其中，待处理医疗大数据信息表征待分享的待处理共享大数据的地址索引。

步骤205，当接收到多个服务器200基于目标知识图谱针对待处理医疗大数据信息所返回的多个子分享标识时，利用多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析。

在本发明实施例中，计算机设备100也可以是多个服务器200中的一个，再此不做限制。由于用户之间的大数据分享大多并不是只分享一次，因此可以先进行分享规则的构建。具体的，可以接收多个服务器200发送的预设医疗大数据信息，在本发明实施例中，预设医疗大数据信息可以是已知的样本，可以预先获取其数据内容、类型、地址索引等基础信息（例如患者的基础相关信息以及患者的基础相关信息在服务器200的存储位置）。可以通过与多个服务器200进行待整合大数据交互，即模拟进行大数据传输，获取第一逻辑关系树，应当理解的是，第一逻辑关系树可以通过进行多次待整合大数据交互获取，进而可以基于第一逻辑关系树构建第一待处理知识图谱。同时可以获取多个服务器200发送的多个第二逻辑关系树，值得说明的是，数据由计算机设备100传输至服务器200对应第一逻辑关系树，即第一待处理知识图谱，而数据由服务器200传输至计算机设备100则可以对应第二逻辑关系树，即第二待处理知识图谱。将第一知识图谱和第二知识图谱进行整合，可以得到目标知识图谱，可以基于目标知识谱图进行大数据的分享。具体的，可以获取待处理医疗大数据信息，待处理医疗大数据信息可以是用户输入的，即想要获取的大数据信息的相关数据，待处理医疗大数据信息可以表征待分享的待处理共享大数据的地址索引。可以将待处理医疗大数据信息发送至每个服务器200，以使每个服务器200基于预先构建的目标知识图谱进行大数据分享。可以是服务器200通过目标知识图谱生成子分享标识，子分享标识可以表征对应的服务器200中的待分享的待处理共享大数据的相关信息，包括地址索引、名称、类型等，可以基于多个子分享标识确定得到大数据分享结果，以实现大数据分享。通过上述步骤，能够通过目标知识图谱，解决不同用户之间的由于数据传输逻辑、规则不同导致的数据分享不流畅的问题，帮助用户不需要每次进行数据分享时制定对应的分享策略，减少了用户的无用工作量，实现了便捷分享医疗大数据的目的。

在前述基础上，作为一种可替换的实施例，前述步骤203可以由以下具体的实施方式实现。

子步骤203-1，从多个服务器200获取到多个样本大数据，并对多个样本大数据进行整合，得到第一大数据样本对象集。

其中，样本大数据表征服务器200中的私有大数据。

子步骤203-2，对多个服务器200所发送的预设医疗大数据信息的整合，得到第二大数据样本对象集。

子步骤203-3，基于第一大数据样本对象集和第二大数据样本对象集，得到目标大数据样本对象集。

子步骤203-4，利用第一大数据样本对象集和目标大数据样本对象集，计算出第一关联关系，以及利用第二大数据样本对象集和目标大数据样本对象集，计算出第二关联关系。

子步骤203-5，根据第一关联关系和第二关联关系，对第一待处理知识图谱和第二待处理知识图谱进行整合，得到目标知识图谱。

具体的，可以从多个服务器200中获取多个样本大数据，样本大数据的地址索引、数据内容、数据类型（例如医疗相关数据）、数据名称等基础信息可以是预先晓得的。对多个样本大数据进行整合，可以获取第一大数据样本对象集。可以将多个服务器200发送的前述预设医疗大数据信息进行整合，得到第二大数据样本对象集。然后可以将二者进行整合，获取目标大数据样本对象集。可以分别采用第一大数据样本对象集和第二大数据样本对象集与目标大数据样本对象集进行比对处理，得到对应的第一关联关系和第二关联关系。然后便可以基于第二关联关系和第二关联关系，将第一待处理知识图谱和第二待处理知识图谱进行整合，获取前述目标知识图谱。通过上述步骤，便能够便捷的得到计算机设备100在进行数据分享时所需的参考依据，即目标知识图谱，减少了人为操作，提高了医疗相关用户在进行大数据分享的便捷性。

在前述基础上，为了能够对前述步骤201进行详细的解释，下面提供一种步骤201的具体实施方式。

子步骤201-1，利用预设医疗大数据信息，将多个服务器200划分成至少一个集群，并向每个集群中的主服务器发送与其属于同一集群的匹配服务器的信息。

其中，主服务器是共享大数据中具有预设文件夹的服务器200，匹配服务器是共享大数据中不具有预设文件夹的服务器200。

子步骤201-2，接收主服务器发送的第一待整合大数据，以及匹配服务器发送的第二待整合大数据，并对第一待整合大数据和第二待整合大数据进行整合，得到已整合大数据。

其中，第一待整合大数据是主服务器通过与匹配服务器的信息所确定出的匹配服务器进行预设大数据交互得到的。

子步骤201-3，将已整合大数据分别返回给主服务器和匹配服务器。

子步骤201-4，接收主服务器针对已整合大数据发送的第一阶段第一逻辑关系树，以及接收匹配服务器针对已整合大数据发送的第二阶段第一逻辑关系树，并将第一阶段第一逻辑关系树和第二阶段第一逻辑关系树进行整合，得到每个集群对应的第一逻辑关系树，进而得到至少一个第一逻辑关系树。

子步骤201-5，对至少一个第一逻辑关系树进行整合，得到第一待处理知识图谱。

可以通过预设医疗大数据信息的类型、数据内容等作为划分依据，将多个服务器200划分为至少一个集群，不同集群之间的划分标准可以参考同一划分依据。可以在集群中选取一主服务器，用于协调其他剩余匹配服务器的交互。可以分别获取主服务器和匹配服务器对应的第一待整合大数据和得让待整合大数据，处理得已整合大数据，并反馈给主服务器和匹配服务器。主服务器获取已整合大数据后，可以进行第一阶段第一逻辑关系树的构造，同时匹配服务器也可以在接受到已整合大数据后进行第二阶段第一逻辑关系树的构造。通过将第一逻辑关系树和第二逻辑关系树记性整合，便可以得到至少一个集群对应的第一逻辑关系树。应当理解的是，一个集群可以对应一个逻辑关系树，通过对所有获取的第一逻辑关系树进行整合，便可以获取第一待处理知识图谱。

对于上述子步骤201-5，本发明实施例提供了如下具体的实施方式。

（1）对每个集群中的预设医疗大数据信息进行数据量统计，得到每个集群所对应的集群大数据。

（2）对多个服务器200所发送的预设医疗大数据信息的总和大数据进行统计，得到第二大数据样本对象集。

（3）利用集群大数据和第二大数据样本对象集，为至少一个第一逻辑关系树中的每个第一逻辑关系树计算出权重信息。

（4）根据权重信息，对至少一个第一逻辑关系树进行加权，得到第一待处理知识图谱。

前述的参考依据可以是预设医疗大数据信息的数据量，可以统计每个集群对应的预设医疗大数据信息，获取每个对应的集群大数据。而后可以确定所有服务器200的预设医疗大数据信息对应的总和大数据。可以将总和大数据放置处理为第二大数据样本集，可以基于每个集群大数据的数据量与第二大数据样本集的数据量之间的关系，确定每个集群大数据对应的第一逻辑关系树匹配对应权重信息。通过对第一逻辑关系树进行加权操作，便可以构建得到第一待处理知识图谱。

具体的，预设医疗大数据信息中带有能够表征服务器200是否具有预设文件夹的身份证明文件，对于前述子步骤201-1，本发明实施例也提供了如下更为详尽的实施方式。

（1）对每个服务器200所发送的预设医疗大数据信息进行比对，得到比对结果。

（2）当比对结果表征存在至少两个服务器200所发送的预设医疗大数据信息相同时，将至少两个服务器200划分为一个集群，从而得到至少一个集群。

（3）根据身份证明文件，从至少一个集群中的每个集群的各个服务器200中，确定出主服务器和匹配服务器，并将匹配服务器的信息发送给主服务器。

如前，划分至同一集群的服务器200的划分依据可以是同一个，在本发明实施例中，可以是预设医疗大数据信息中的数据类型信息，当数据类型信息相同时，可以将其划分至同一集群。在划分至同一集群后，可以根据预设文件夹中的身份证明文件确定主服务器。具体的，主服务器可以是预先设置的具备较强数据处理能力的服务器200。

除了提供第一待处理知识图谱的获取步骤，本发明实施例还提供一种前述步骤202的具体实施方式，用于描述如何通过以下步骤获取第二待处理知识图谱。

子步骤202-1，接收每个服务器200发送的第二逻辑关系树，从而得到多个第二逻辑关系树。

子步骤202-2，对多个第二逻辑关系树进行整合，得到第二待处理知识图谱。

构建第二待处理知识图谱的方式可以参考前述构建第一知识图谱的方式，在此不再赘述。

除此之外，在步骤201之前，为了保证数据分享的安全性，本发明实施例还提供如下步骤。

步骤301，生成安全验证码，并将安全验证码发送给多个服务器200，其中，安全验证码用于在待整合大数据交互时服务器200对待整合大数据进行加密。相应的，在前述基础上，步骤201可以包括以下的具体实施方式。

子步骤201-6，基于预设医疗大数据信息，通过与多个服务器200进行加密后的待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱。

为了能够保证大数据分享的安全性，包括发送的大数据的安全性以及接受的大数据的安全性。可以生成安全验证码，基于此，可以通过与多个服务器200进行加密后的待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱。

在前述基础上，本发明实施例提供一种对待整合大数据进行加的步骤，具体可以由以下方式实现。

子步骤301-1，获取目标服务器发送的安全验证触发动作。

其中，目标服务器为多个服务器200中与待整合大数据所在服务器200相关联的服务器200，安全验证触发动作用于指示计算机设备100向目标服务器发送用于获取第一安全特征向量的验证动作。

子步骤301-2，接收目标服务器基于验证动作返回的与待整合大数据所在服务器200对应的目标待整合大数据的第一安全特征向量。

子步骤301-3，根据第一安全特征向量确定与目标待整合大数据相关联的安全验证向量，从第一验证向量集合中获取用于验证安全验证向量的预设验证向量。

其中，安全验证向量为与目标待整合大数据相关联的第一安全特征向量中的内容信息，安全验证向量中包含第一安全特征向量对应的向量类型指标号和向量数值指标，安全验证向量中包含与目标待整合大数据相关的目标安全特征向量，预设验证向量是由与计算机设备100相关联的第三方安全平台所确定的。

子步骤301-4，获取与预设验证向量相关联的特征元素集。

子步骤301-5，若特征元素集中包含与向量类型指标和向量数值指标相关联的第一安全特征向量，且第一安全特征向量的来源标识属于第一安全特征向量对应的预设来源数据库，则确定安全验证向量的安全置信度超过预设置信度阈值。

子步骤301-6，在安全验证向量的安全置信度超过预设置信度阈值时，从安全验证向量中提取目标安全特征向量。

子步骤301-7，从与计算机设备100相关联的大数据信息处理平台中获取目标集群，遍历目标集群上的服务器200。

子步骤301-8，若在目标集群上遍历到的与目标安全特征向量相关联的服务器200，则将遍历到与目标安全特征向量相关联的服务器200确定为参考服务器，确定完成对目标待整合大数据的安全验证，且安全验证通过。

子步骤301-9，根据安全验证触发动作从与计算机设备100相关联的第一验证向量集合中获取第二安全特征向量，将第二安全特征向量作为安全验证触发动作对应的响应信息返回给目标服务器，以使目标服务器对第二安全特征向量进行安全验证。

其中，第二安全特征向量中携带与计算机设备100相关联的第一安全验证子码。

子步骤301-10，接收目标服务器基于第一安全验证子码发送的加密流程处理结果。

其中，加密流程处理结果中携带利用第一安全验证子码对目标字符串进行安全转码操作后的安全映射文件。

子步骤301-11，通过第一安全验证子码对应的第二安全验证子码对安全映射文件进行解密，得到与安全验证触发动作相关联的目标字符串。

子步骤301-12，根据目标字符串，生成用于与目标服务器之间进行通信连接时的安全验证码。

子步骤301-13，在安全验证通过且完成与安全验证触发动作相关联的加密流程时，建立与目标服务器之间的通信连接，基于通信连接对应的安全验证码获取目标服务器发送的服务器更新触发动作。

子步骤301-14，基于服务器更新触发动作将在目标集群中除参考服务器之外的且与目标安全特征向量无关的服务器200确定为无关服务器。

其中，目标安全特征向量中包含用于表征目标待整合大数据的身份地址索引信息。

子步骤301-15，对目标集群中的无关服务器进行排查，将排查后的目标集群中的参考服务器确定为与目标待整合大数据相关联的关联服务器，在关联服务器中查找与身份地址索引信息相匹配的大数据类型信息。

子步骤301-16，将查找到的大数据类型信息用安全验证码进行安全转码操作，将安全转码操作后的大数据类型信息作为安全验证结果，将安全验证结果返回给目标服务器，以完成待整合大数据的加密。

其中，安全验证码是由参与加密流程的目标服务器和计算机设备100所共同确定的，安全验证结果为通过安全验证码对与目标待整合大数据相关联的大数据类型信息进行安全转码操作后所得到的，与目标待整合大数据相关联的大数据类型信息为从与计算机设备100相关联的大数据信息处理平台中获取的参考服务器中与目标安全特征向量相匹配的大数据类型信息。

在本发明实施例的其他实施方式中，服务器更新触发动作中携带参考服务器安全系数；参考服务器安全系数为在目标服务器的第二验证向量集合中所存储的本地安全验证区间中的目标安全系数，前述步骤301还可以包括以下实施方式来确定安全验证结果。

子步骤301-17，基于服务器更新触发动作从大数据信息处理平台中拉取目标集群上的所有服务器200的安全验证区间，在所有服务器200的安全验证区间中获取对照安全系数，其中，对照安全系数为目标集群上的目标安全系数。

子步骤301-18，基于对照安全系数与参考服务器安全系数之间的安全系数差异参数，确定用于在目标服务器和计算机设备100之间进行服务器同步的待同步安全验证区间。

子步骤301-19，将待同步安全验证区间作为安全验证结果，将安全验证结果返回给目标服务器。

安全验证触发动作可以是用户在对应的交互屏幕点击某按键的操作，也可以是外部输入的物理信号，在此不做限制。安全验证触发信号可以指示计算机设备100向目标服务器发送用于获取第一安全特征向量的验证动作。在接收到目标服务器返回的第一安全特征向量后，可以确定第一安全特征向量确定与目标待整合大数据相关联的安全验证向量，并进一步地从第一验证向量集合中获取用于验证安全验证向量的预设验证向量。第一验证向量集合可以是预先设置的用于验证安全验证向量的向量集合。

可以获取与预设验证向量相关联的特征元素集，在判读出特征元素集中包含与向量类型指标和向量数值指标相关联的第一安全特征向量，且第一安全特征向量的来源标识属于第一安全特征向量对应的预设来源数据库，则确定安全验证向量的安全置信度超过预设置信度阈值。具体的，置信度阈值可以是0或者1中的整数，而预设置信度阈值可以设置为0，当安全验证向量的安全置信度超过预设置信度阈值，即安全验证向量的安全置信度为1，可以进一步获取目标安全特征向量。

可以从大数据信息处理平台中获取目标集群，应当理解的是，与计算机设备100相关联的服务器200组成的多个集群都可以认为在大数据信息处理平台上。当遍历目标集群上的服务器200时出现与目标安全特征向量相关联的服务器200，则将遍历到与目标安全特征向量相关联的服务器200确定为参考服务器，确定完成对目标待整合大数据的安全验证，且安全验证通过。

基于前述安全验证相关操作，再次根据安全验证触发动作从与计算机设备100相关联的第一验证向量集合中获取第二安全特征向量，将第二安全特征向量作为安全验证触发动作对应的响应信息返回给目标服务器，以使目标服务器对第二安全特征向量进行安全验证。可以将第二安全特征向量中的第一安全验证子码进行加密流程处理得到的加密流程处理结果进行接收。同时可以设置第一安全验证子码对应的第二安全验证子码对安全映射文件进行解密，得到与安全验证触发动作相关联的目标字符串，值得说明的是，目标字符串可以理解为安全映射文件的解密规则。可以是固定参数，也可以是随机参数，在本发明实施例中不做限制。在获取安全验证码后，为了能够减小计算机设备100和服务器200的运算压力，可以对与目标安全特征向量无关的服务器200进行排查，即将无关服务器从目标集群中除去。确定了安全验证码，可以基于安全验证码对大数据类信息进行安全转码操作，进而确定安全验证结果，将安全验证结果发送至目标服务器，可以认为完成了前述对待整合大数据的加密流程。通过上述步骤，能够在减小计算量的同时，实现待整合大数据的加密，能够较为稳定对分享相关的大数据进行保密。

在前述基础上，作为一种可替换的实施方式，本发明实施例提供一种前述步骤205的具体实施方式。

子步骤205-1，接收每个服务器200基于目标知识图谱针对待处理医疗大数据信息所发送的子分享标识，从而得到多个子分享标识。

子步骤205-2，对多个子分享标识进行整合，得到大数据分享结果，完成医疗大数据共享分析。

除了上述步骤，本发明实施例在安全验证的状态为失败状态时，可以生成与安全验证触发动作对应的请求失败信息，将请求失败信息返回给目标服务器，以使目标服务器基于请求失败信息进行失败分析。

本发明实施例提供一种医疗大数据共享分析装置，应用于计算机设备100，包括：

接收模块1101，用于接收多个服务器200发送的预设医疗大数据信息，基于预设医疗大数据信息，通过与多个服务器200进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱，其中，预设医疗大数据信息表征服务器中的共享大数据的地址索引；接收多个服务器200发送的多个第二逻辑关系树，并对多个第二逻辑关系树进行整合，得到第二待处理知识图谱。

处理模块1102，用于对第一待处理知识图谱和第二待处理知识图谱进行整合，得到目标知识图谱，并将目标知识图谱发送给多个服务器200，以使多个服务器200利用目标知识图谱进行大数据分享。

获取模块1103，用于获取待处理医疗大数据信息，并将待处理医疗大数据信息分别发送给多个服务器200，其中，待处理医疗大数据信息表征待分享的待处理共享大数据的地址索引。

分享模块1104，用于当接收到多个服务器200基于目标知识图谱针对待处理医疗大数据信息所返回的多个子分享标识时，利用多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析。

进一步地，处理模块1102具体用于：

从多个服务器200获取到多个样本大数据，并对多个样本大数据进行整合，得到第一大数据样本对象集，其中，样本大数据表征服务器中的私有大数据；对多个服务器200所发送的预设医疗大数据信息的整合，得到第二大数据样本对象集；基于第一大数据样本对象集和第二大数据样本对象集，得到目标大数据样本对象集；利用第一大数据样本对象集和目标大数据样本对象集，计算出第一关联关系，以及利用第二大数据样本对象集和目标大数据样本对象集，计算出第二关联关系；根据第一关联关系和第二关联关系，对第一待处理知识图谱和第二待处理知识图谱进行整合，得到目标知识图谱。

进一步地，接收模块1101具体用于：

利用预设医疗大数据信息，将多个服务器200划分成至少一个集群，并向每个集群中的主服务器发送与其属于同一集群的匹配服务器的信息，其中，主服务器是共享大数据中具有预设文件夹的服务器200，匹配服务器是共享大数据中不具有预设文件夹的服务器200；接收主服务器发送的第一待整合大数据，以及匹配服务器发送的第二待整合大数据，并对第一待整合大数据和第二待整合大数据进行整合，得到已整合大数据，其中，第一待整合大数据是主服务器通过与匹配服务器的信息所确定出的匹配服务器进行预设大数据交互得到的；将已整合大数据分别返回给主服务器和匹配服务器；接收主服务器针对已整合大数据发送的第一阶段第一逻辑关系树，以及接收匹配服务器针对已整合大数据发送的第二阶段第一逻辑关系树，并将第一阶段第一逻辑关系树和第二阶段第一逻辑关系树进行整合，得到每个集群对应的第一逻辑关系树，进而得到至少一个第一逻辑关系树；对至少一个第一逻辑关系树进行整合，得到第一待处理知识图谱。

进一步地，接收模块1101具体用于：

接收每个服务器200发送的第二逻辑关系树，从而得到多个第二逻辑关系树；对多个第二逻辑关系树进行整合，得到第二待处理知识图谱。

医疗大数据共享分析装置110还包括安全模块1105，安全模块1105用于：

生成安全验证码，并将安全验证码发送给多个服务器200；安全验证码用于在待整合大数据交互时服务器200对待整合大数据进行加密。相应的，接收模块1101具体用于：

基于预设医疗大数据信息，通过与多个服务器200进行加密后的待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱。

进一步地，安全模块1105具体用于：

获取目标服务器发送的安全验证触发动作，其中，目标服务器为多个服务器200中与待整合大数据所在服务器200相关联的服务器200，安全验证触发动作用于指示计算机设备100向目标服务器发送用于获取第一安全特征向量的验证动作；接收目标服务器基于验证动作返回的与待整合大数据所在服务器200对应的目标待整合大数据的第一安全特征向量；根据第一安全特征向量确定与目标待整合大数据相关联的安全验证向量，从第一验证向量集合中获取用于验证安全验证向量的预设验证向量，其中，安全验证向量为与目标待整合大数据相关联的第一安全特征向量中的内容信息，安全验证向量中包含第一安全特征向量对应的向量类型指标号和向量数值指标，安全验证向量中包含与目标待整合大数据相关的目标安全特征向量，预设验证向量是由与计算机设备100相关联的第三方安全平台所确定的；获取与预设验证向量相关联的特征元素集；若特征元素集中包含与向量类型指标和向量数值指标相关联的第一安全特征向量，且第一安全特征向量的来源标识属于第一安全特征向量对应的预设来源数据库，则确定安全验证向量的安全置信度超过预设置信度阈值；在安全验证向量的安全置信度超过预设置信度阈值时，从安全验证向量中提取目标安全特征向量；从与计算机设备100相关联的大数据信息处理平台中获取目标集群，遍历目标集群上的服务器200；若在目标集群上遍历到的与目标安全特征向量相关联的服务器200，则将遍历到与目标安全特征向量相关联的服务器200确定为参考服务器，确定完成对目标待整合大数据的安全验证，且安全验证通过；根据安全验证触发动作从与计算机设备100相关联的第一验证向量集合中获取第二安全特征向量，将第二安全特征向量作为安全验证触发动作对应的响应信息返回给目标服务器，以使目标服务器对第二安全特征向量进行安全验证，其中，第二安全特征向量中携带与计算机设备100相关联的第一安全验证子码；接收目标服务器基于第一安全验证子码发送的加密流程处理结果，其中，加密流程处理结果中携带利用第一安全验证子码对目标字符串进行安全转码操作后的安全映射文件；通过第一安全验证子码对应的第二安全验证子码对安全映射文件进行解密，得到与安全验证触发动作相关联的目标字符串；根据目标字符串，生成用于与目标服务器之间进行通信连接时的安全验证码；在安全验证通过且完成与安全验证触发动作相关联的加密流程时，建立与目标服务器之间的通信连接，基于通信连接对应的安全验证码获取目标服务器发送的服务器更新触发动作；基于服务器更新触发动作将在目标集群中除参考服务器之外的且与目标安全特征向量无关的服务器200确定为无关服务器，其中，目标安全特征向量中包含用于表征目标待整合大数据的身份地址索引信息；对目标集群中的无关服务器进行排查，将排查后的目标集群中的参考服务器确定为与目标待整合大数据相关联的关联服务器，在关联服务器中查找与身份地址索引信息相匹配的大数据类型信息；将查找到的大数据类型信息用安全验证码进行安全转码操作，将安全转码操作后的大数据类型信息作为安全验证结果，将安全验证结果返回给目标服务器，以完成待整合大数据的加密，其中，安全验证码是由参与加密流程的目标服务器和计算机设备100所共同确定的，安全验证结果为通过安全验证码对与目标待整合大数据相关联的大数据类型信息进行安全转码操作后所得到的，与目标待整合大数据相关联的大数据类型信息为从与计算机设备100相关联的大数据信息处理平台中获取的参考服务器中与目标安全特征向量相匹配的大数据类型信息。

进一步地，分享模块1104具体用于：

接收每个服务器200基于目标知识图谱针对待处理医疗大数据信息所发送的子分享标识，从而得到多个子分享标识；对多个子分享标识进行整合，得到大数据分享结果，完成医疗大数据共享分析。

需要说明的是，上述医疗大数据共享分析装置110的实现原理可以参考前述医疗大数据共享分析方法的实现原理，在此不再赘述，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，接收模块1101可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上接收模块1101的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所描述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(applicationspecificintegratedcircuit，asic)，或，一个或多个微处理器(digitalsignalprocessor，dsp)，或，一个或者多个现场可编程门阵列(fieldprogrammablegatearray，fpga)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(centralprocessingunit，cpu)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，soc)的形式实现。

本发明实施例提供一种计算机设备100，计算机设备100包括处理器及存储有计算机指令的非易失性存储器，计算机指令被处理器执行时，计算机设备100执行前述的医疗大数据共享分析方法。如图4所示，图4为本发明实施例提供的计算机设备100的结构框图。计算机设备100包括医疗大数据共享分析装置、存储器111、处理器112及通信单元113。

为实现数据的传输或交互，存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接。例如，可通过一条或多条通讯总线或信号线实现这些元件相互之间电性连接。医疗大数据共享分析装置包括至少一个可以软件或固件（firmware）的形式存储于存储器111中或固化在计算机设备100的操作系统（operatingsystem，os）中的软件功能模块。处理器112用于执行存储器111中存储的可执行模块，例如医疗大数据共享分析装置所包括的软件功能模块及计算机程序等。

本发明实施例提供一种可读存储介质，可读存储介质包括计算机程序，计算机程序运行时控制可读存储介质所在计算机设备100执行前述的医疗大数据共享分析方法。

综上所述，采用本发明实施例提供的一种医疗大数据共享分析方法、装置、计算机设备和可读存储介质，通过接收多个服务器发送的预设医疗大数据信息，基于所述预设医疗大数据信息，通过与所述多个服务器进行待整合大数据交互所得到的第一逻辑关系树，构造出第一待处理知识图谱，其中，所述预设医疗大数据信息表征服务器中的共享大数据的地址索引；进而接收所述多个服务器发送的多个第二逻辑关系树，并对所述多个第二逻辑关系树进行整合，得到第二待处理知识图谱；然后对所述第一待处理知识图谱和所述第二待处理知识图谱进行整合，得到目标知识图谱，并将所述目标知识图谱发送给所述多个服务器，以使所述多个服务器利用所述目标知识图谱进行大数据分享；再获取待处理医疗大数据信息，并将所述待处理医疗大数据信息分别发送给所述多个服务器，其中，所述待处理医疗大数据信息表征待分享的待处理共享大数据的地址索引；最终当接收到所述多个服务器基于所述目标知识图谱针对所述待处理医疗大数据信息所返回的多个子分享标识时，利用所述多个子分享标识整合出大数据分享结果，完成医疗大数据共享分析，能够便捷地实现分享医疗大数据的操作，以便帮助用户基于分享的医疗大数据提高在处理医疗相关业务的处理效率。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：文建全;王先知;吴翊;唐起华;李熙;姜赳赳
技术所有人：湖南创星科技股份有限公司
我是此专利的发明人

上一篇：一种绿色环保型PET瓶片生产用污水净化工艺及其设备的制作方法
上一篇：一种环保型生活用水处理装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。