基于大数据分布式计算的分类预测方法与流程

文档序号:16208768发布日期:2018-12-08 07:27阅读:来源:国知局

技术特征:

技术总结
本发明提供一种基于大数据分布式计算的分类预测方法,包括如下步骤:步骤1:针对分布式文件系统中数据进行数据清洗,去除分布式文件系统中的噪声,并形成标准化数据集;步骤2:对标准化数据集中的数据使用聚类算法打上标签,并获得训练样本和测试样本;步骤3:基于使用聚类算法打上标签的所述标准化数据集,使用大数据平台的Mapreduce计算框架,针对训练样本迭代计算出训练模型参数,使用训练模型参数,对测试样本进行预测分类。根据本发明的基于大数据分布式计算的分类预测方法,便于对标签化数据进行数据分类预测和校验。

技术研发人员:魏素扬
受保护的技术使用者:江苏鸣鹤云科技有限公司
技术研发日:2018.04.25
技术公布日:2018.12.07
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1