技术特征:
技术总结
本发明提供了一种大规模数据处理平台的构建方法,该方法包括:在MapReduce模型增加多个预处理负载节点;通过XML标记数据的信息及Map过程中的多值处理,实现数据处理的操作;在云存储资源中采用状态转移和动态规划机制对负载平衡进行优化。本发明提出了一种大规模数据处理平台的构建方法,基于改进的分布式处理架构将来自不同异构源的多种小文件进行统一规范组织,便于高效存储、分析与检索。
技术研发人员:赖真霖;文君
受保护的技术使用者:成都四象联创科技有限公司
技术研发日:2017.05.19
技术公布日:2017.08.18