海量非结构化电子文件的结构化处理方法及系统与流程

文档序号:12596333阅读:来源:国知局
技术总结
本发明公开了一种海量非结构化电子文件的结构化处理方法及系统。该系统包括元数据形式化约束配置模块,用于根据核电技术资料的编码规范及匹配规则制定元数据形式化约束条件;结构化处理模块,用于根据元数据形式化约束条件对海量非结构化电子文件进行结构化处理,得到满足核电企业内容管理系统结构要求的海量结构化数据;以及内容管理系统集成模块,用于将该海量结构化数据导入核电企业内容管理系统。应用本发明海量非结构化电子文件的结构化处理方法及系统,可显著提高海量半结构化或非结构化电子文件的结构化转换效率及准确率,降低人工成本。本系统还可完整记录海量非结构化数据结构化转变过程中产生的报错信息,利于后期追踪及回滚。

技术研发人员:白鹤;杨帆;罗亚林;王云福;涂红兵;侯斌;刘东海;戴伟琦
受保护的技术使用者:中广核工程有限公司;中国广核集团有限公司
文档号码:201510870916
技术研发日:2015.12.01
技术公布日:2017.06.09

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1