本公开涉及数据处理,尤其涉及一种多源异构数据整合系统。
背景技术:
1、从20世纪60年代开始,经过60年的发展,遥感、全球定位系统和地理信息系统等应用领域变得越来越广泛,随着国产卫星在轨数量不断增加,自然资源、农业、林业、水利、矿产等不同政府部门和行业已经积累了大量的数据资源,数据量的剧增,大大减少了传统的野外作业工作量,实现了时空地理信息的快速获取以及快速应用。
2、然而,大量的数据资源的来源不同、数据格式等也不同,随之出现了大量的数据资源的存储和管理问题,即多源异构数据的存储和管理的问题,给多源异构数据整合系统带来了巨大的挑战。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种多源异构数据整合系统。
2、本公开实施例提供了一种多源异构数据整合系统,该系统包括数据适配器、数据采集模块、数据管理模块和数据发布模块;
3、数据适配器用于获取不同来源的原始数据;
4、数据采集模块用于提取原始数据对应的第一元数据,并对原始数据和第一元数据进行第一处理,得到第一目标数据和第二元数据,并将第一目标数据和第二元数据存储至发布数据库;
5、数据管理模块用于对发布数据库中的第一目标数据和第二元数据进行预设管理,预设管理包括实体管理、血缘管理和标签管理;
6、数据发布模块用于对发布数据库中的待发布数据进行发布。
7、在本公开一些实施例中,数据采集模块包括第一路径获取单元、数据下载单元、第二路径获取单元和处理单元;
8、第一路径获取单元用于获取原始数据的第一下载路径,并将第一下载路径进行记录,将第一下载路径和原始数据放入采集任务列表中;
9、数据下载单元用于从采集任务列表中获取原始数据,并基于预设下载技术将原始数据下载至本地磁盘,并从原始数据中提取出第一元数据;
10、第二路径获取单元用于确定原始数据、第一元数据在本地磁盘的第二下载路径;
11、处理单元用于对原始数据和第一元数据进行第一处理,其中,第一处理包括坐标转换处理、格式标准化处理。
12、在本公开一些实施例中,原始数据为原始影像数据;
13、数据下载单元还用于在原始数据为原始影像数据时,从原始影像数据中提取出原始影像数据对应的元数据和落图;
14、处理单元还用于对原始影像数据对应的元数据和落图进行第一处理。
15、在本公开一些实施例中,该系统还包括缓存数据库和预检模块;
16、缓存数据库用于在将第一目标数据和第二元数据存储至发布数据库之前,存储第一目标数据和第二元数据;
17、预检模块用于对缓存数据库中的第一目标数据和第二元数据进行预检查处理,确定第一目标数据和第二元数据是否完整,在确定第一目标数据和第二元数据完整时,将第一目标数据和第二元数据从缓存数据库迁移至发布数据库。
18、在本公开一些实施例中,该系统还包括数据处理模块;
19、数据处理模块用于对第一目标数据和第二元数据进行第二处理,得到第二目标数据和第三元数据,将第二目标数据和第三元数据存储至发布数据库;
20、缓存数据库还用于在将第二目标数据和第三元数据存储至发布数据库之前,存储第二目标数据和第三元数据;
21、预检模块用于对缓存数据库中的第二目标数据和第三元数据进行预检查处理,确定第二目标数据和第三元数据是否完整,在确定第二目标数据和第三元数据完整时,将第二目标数据和第三元数据从缓存数据库迁移至发布数据库。
22、在本公开一些实施例中,数据管理模块包括实体管理单元、血缘管理单元和标签管理单元;
23、实体管理单元用于对发布数据库中的待发布数据对应的实体进行创建、更新、删除;
24、血缘管理单元用于对发布数据库中的待发布数据对应的实体进行血缘关系的建立、更新、删除;
25、标签管理单元用于对发布数据库中的待发布数据对应的实体进行标签的创建、更新、删除。
26、在本公开一些实施例中,数据发布模块包括数据形式确定单元;
27、数据形式确定单元用于确定发布数据库中的待发布数据的数据形式,其中数据形式包括栅格形式和矢量形式。
28、在本公开一些实施例中,数据发布模块还包括第一发布单元和第二发布单元;
29、第一发布单元用于在待发布数据的形式为栅格形式时,基于镶嵌数据集技术对待发布数据进行发布;
30、第二发布单元用于在待发布数据的形式为矢量形式时,基于矢量瓦片技术对待发布数据进行发布。
31、在本公开一些实施例中,第一发布单元具体用于采用金字塔式多级缓存的方式,按照第一预设显示比例对待发布数据进行发布,在原始数据为原始影像数据时,对待发布数据进行渲染后发布;
32、第二发布单元具体用于获取第二预设显示比例,基于第二预设显示比例对待发布数据进行预处理,对预处理后的待发布数据进行发布,在原始数据为原始影像数据时,对预处理后的待发布数据进行渲染后发布。
33、在本公开一些实施例中,第一元数据包括原始数据的基本描述信息、来源描述信息、空间信息描述、数据质量描述。
34、本公开实施例提供的技术方案与现有技术相比具有如下优点:
35、本公开实施例提供的多源异构数据整合系统,包括数据适配器、数据采集模块、数据管理模块和数据发布模块,数据适配器用于获取不同来源的原始数据,数据采集模块用于提取原始数据对应的第一元数据,并对原始数据和第一元数据进行第一处理,得到第一目标数据和第二元数据,并将第一目标数据和第二元数据存储至发布数据库,数据管理模块用于对发布数据库中的第一目标数据和第二元数据进行预设管理,预设管理包括实体管理、血缘管理和标签管理,数据发布模块用于对发布数据库中的待发布数据进行发布,由此,能够通过数据适配器获取到不同来源的原始数据,并对不同来源的原始数据进行元数据提取、第一处理,存储至发布数据库,并对发布数据库中的数据进行发布,实现了多源异构数据的管理和整合,提高了多源异构数据的管理效率和数据处理的准确性,同时进一步方便用户更好的使用多源异构数据。
1.一种多源异构数据整合系统,其特征在于,所述系统包括数据适配器、数据采集模块、数据管理模块和数据发布模块;
2.根据权利要求1所述的多源异构数据整合系统,其特征在于,所述数据采集模块包括第一路径获取单元、数据下载单元、第二路径获取单元和处理单元;
3.根据权利要求2所述的多源异构数据整合系统,其特征在于,所述原始数据为原始影像数据;
4.根据权利要求1所述的多源异构数据整合系统,其特征在于,所述系统还包括缓存数据库和预检模块;
5.根据权利要求4所述的多源异构数据整合系统,其特征在于,所述系统还包括数据处理模块;
6.根据权利要求1所述的多源异构数据整合系统,其特征在于,所述数据管理模块包括实体管理单元、血缘管理单元和标签管理单元;
7.根据权利要求1所述的多源异构数据整合系统,其特征在于,所述数据发布模块包括数据形式确定单元;
8.根据权利要求7所述的多源异构数据整合系统,其特征在于,所述数据发布模块还包括第一发布单元和第二发布单元;
9.根据权利要求8所述的多源异构数据整合系统,其特征在于,所述第一发布单元具体用于采用金字塔式多级缓存的方式,按照第一预设显示比例对所述待发布数据进行发布,在所述原始数据为原始影像数据时,对所述待发布数据进行渲染后发布;
10.根据权利要求1所述的多源异构数据整合系统,其特征在于,所述第一元数据包括所述原始数据的基本描述信息、来源描述信息、空间信息描述、数据质量描述。