本发明涉及医疗大数据处理关键,具体涉及一种跨院区数据的分布处理方法。
背景技术:
1、随着医院建设规模越来越大,信息应用形式越来越复杂,由于处理业务的方式和采用的技术架构不同,导致医疗数据分散在多家医疗机构,并在结构形式上呈现异构性。在这种数据类型不统一、来源广泛、非结构化程度高的情况下,虽然已有了海量数据且数据量还在不断增长,但医疗数据难以得到综合性有效利用,难以体现其巨大价值,呈现出“有量无价”的状态。通过对整合的数据集进行分析,能够发现数据间的关联和趋势,对医疗方向、卫生服务、疾病探索等有重大的指导意义。
2、现有技术中存在的医疗大数据处理工作由于不够完善而导致多源异构医疗数据分散的问题,使得最终关于医疗数据知识图谱无法合理构建。
技术实现思路
1、本申请提供了一种跨院区数据的分布处理方法,解决了现有技术中存在的医疗大数据处理工作由于不够完善而导致多源异构医疗数据无法融合汇聚的问题,实现了关于知识图谱的合理构建。
2、鉴于上述问题,本申请提供了一种跨院区数据的分布处理方法。
3、第一方面,获取多个跨院区用户,根据多个跨院区用户得到对应的原始多源数据集,其中,每个院区对应的原始多源数据集均包括结构化数据和非结构化数据;对原始多源数据集进行异构性识别,建立结构化处理模板和非结构化处理模板;基于结构化处理模板和非结构化处理模板对各个院区的原始多源数据集进行模板化处理,得到处理后的模板多源数据集;将处理后的模板多源数据集存储至云端服务器中,云端服务器包括多个存储单元,每个存储单元存储一个用户对应的模板多源数据集;根据云端服务器对各个存储单元中的模板多源数据集进行调用集成,搭建多源共享数据平台,其中,多个跨院区用户与多源共享数据平台通信连接;基于多源共享数据平台,建立数据知识图谱,当多源共享数据平台接收到任一跨院区用户的数据请求信息,对数据知识图谱进行遍历,输出被调数据集。
4、第二方面,本申请提供了一种跨院区数据的分布处理系统,系统包括:数据获取模块:所述数据获取模块用于获取多个跨院区用户,根据所述多个跨院区用户得到对应的原始多源数据集,其中,每个院区对应的原始多源数据集均包括结构化数据和非结构化数据;异构识别模块:所述用于对所述原始多源数据集进行异构性识别,建立结构化处理模板和非结构化处理模板;模板处理模块:所述模板处理模块用于基于所述结构化处理模板和所述非结构化处理模板对各个院区的所述原始多源数据集进行模板化处理,得到处理后的模板多源数据集;数据存储模块:所述数据存储模块用于将处理后的所述模板多源数据集存储至云端服务器中,所述云端服务器包括多个存储单元,每个存储单元存储一个用户对应的模板多源数据集;平台搭建模块:所述平台搭建模块用于根据所述云端服务器对各个存储单元中的模板多源数据集进行调用集成,搭建多源共享数据平台,其中,所述多个跨院区用户与所述多源共享数据平台通信连接;图谱建立模块:所述图谱建立模块用于基于多源共享数据平台,建立数据知识图谱,当所述多源共享数据平台接收到任一跨院区用户的数据请求信息,对所述数据知识图谱进行遍历,输出被调数据集。
5、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
6、本申请实施例提供的一种跨院区数据的分布处理方法,通过获取多个跨院区用户得到对应的原始多源数据集,建立结构化处理模板和非结构化处理模板基于结构化处理模板和非结构化处理模板对各个院区的原始多源数据集进行模板化处理,得到处理后的模板多源数据集将处理后的模板多源数据集存储至云端服务器中,由于云端服务器包括多个存储单元,每个存储单元存储一个用户对应的模板多源数据集根据云端服务器对各个存储单元中的模板多源数据集进行调用集成,搭建多源共享数据平台,最后建立数据知识图谱,当多源共享数据平台接收到任一跨院区用户的数据请求信息,对数据知识图谱进行遍历,输出被调数据集。解决了现有技术中存在的医疗大数据处理工作由于不够完善而导致多源异构医疗数据无法融合汇聚的问题,实现了关于知识图谱的合理构建,本发明涉及医疗大数据处理关键技术,可为医疗大数据行业解决数据处理难题。医疗数据作为敏感性较高的数据,目前市场上涉及多院区数据处理的产品较少,本产品可为涉及跨域海量数据处理的问题提供最优处理方法,有广阔的市场应用前景。
1.一种跨院区数据的分布处理方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,对所述原始多源数据集进行异构性识别,建立结构化处理模板和非结构化处理模板,方法还包括:
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
6.如权利要求1所述的方法,其特征在于,基于多源共享数据平台,建立数据知识图谱,方法包括:
7.如权利要求1所述的方法,其特征在于,对所述原始多源数据集进行异构性识别之前,方法还包括:
8.一种跨院区数据的分布处理系统,其特征在于,所述系统包括: