一种数据清理、索引方法与流程

文档序号:11063575阅读:来源:国知局
技术总结
本发明公开了一种数据清理、索引方法,属于数据检索领域,具体流程为:1)数据清理、导入:包括对于结构化数据的清理及对于非结构化数据的清理;2)元数据的建立:(1)元数据获取,通过元数据获取流程整合数据中心多个源中的不同元数据,使用数据库作为元数据知识库进行统一存储管理;(2)元数据发布,建立一套元数据的发布流程来管理元数据的发布;(3)元数据访问,建立一套元数据访问权限的授予、管理流程机制,控制合法用户对元数据资料的有效访问;3)索引构建:通过元数据访问,得出数据中心的分布式数据集群上的数据属性。本发明整体的数据属性非常清晰,结构化和非结构化数据区分的很明确,针对不同数据结构类型,有针对性选择清洗工具,使其达到最好的清洗转换效果,大大的提高了数据整合转换效率。

技术研发人员:张国杰;邵晓艳;郭晓丽;郭学明
受保护的技术使用者:河南信安通信技术股份有限公司
文档号码:201611219279
技术研发日:2016.12.26
技术公布日:2017.05.03

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1