基于大数据分析组件快速自定义图表展现方法、装置及存储介质与流程

文档序号:24689372发布日期:2021-04-16 10:08阅读:来源:国知局

技术特征:
1.一种基于大数据分析组件快速自定义图表展现方法,其特征在于,包括以下步骤:获取用户上传的训练数据、测试数据以及相关的自定义配置数据;对训练数据和测试数据进行清洗、转换、挖掘以及分类处理得到训练集和测试集;利用训练集和测试集对用户配置的分析组件模型进行训练和测试得到结果最优的预测模型;将用户配置的预测设定数据输入预测模型得到数据结果集;根据用户配置的图表类型及样式将数据结果集转换成相应的图形或图像进行展示。2.如权利要求1所述的基于大数据分析组件快速自定义图表展现方法,其特征在于,所述对训练数据和测试数据进行清洗、转换、挖掘以及分类处理具体包括:通过hive进行数据清洗、转换、挖掘,运用java语言和spark mllib对数据进行分类。3.如权利要求1所述的基于大数据分析组件快速自定义图表展现方法,其特征在于:所述用户配置的分析组件模型为用户在时间序列组件、分类组件、回归组件、聚类组件、文本分析组件的各种模型中选择的一种模型;所述时间序列组件包括对应的时间序列分析任务的arima模型;所述分类分析组件包括特征选择模型、神经网络模型、神经网络预测模型、贝叶斯网络模型、贝叶斯网络预测模型、随机森林模型、随机森林预测模型中的一种或多种;所述回归分析组件包括线性回归模型、线性回归预测模型、逻辑回归模型、逻辑回归预测模型中的一种或多种;所述聚类分析组件包括k

means聚类分析模型、k

medoids聚类分析模型、层次聚类分析模型中的一种或多种;所述文本分析组件包括关键字提取模型、分词模型、噪声词过滤模型、情感分析模型、词云模型中的一种或多种。4.如权利要求1所述的基于大数据分析组件快速自定义图表展现方法,其特征在于,所述将用户配置的预测设定数据输入预测模型得到数据结果集之后还包括:将数据结果集输出到excel文件或者数据库中,将数据数据结果集与可视化图表配置模块进行绑定。5.如权利要求1所述的基于大数据分析组件快速自定义图表展现方法,其特征在于:所述用户配置的图表类型为用户在条形图、柱状图、折线图、散点图、甘特图和饼状图中选择的一种或多种类型,所述用户配置的图表属性为用户在标题、图例、标签、系列、背景以及图表鼠标悬浮提示图表属性中选择的一种或多种属性。6.如权利要求1所述的基于大数据分析组件快速自定义图表展现方法,其特征在于,该方法还包括:采用jquery ui

draggable插件将用户通过鼠标选中的目标图表拖拽到与可视化区域相对应的配置区域上。7.一种基于大数据分析组件快速自定义图表展现装置,其特征在于,包括:数据获取模块,用于获取用户上传的训练数据、测试数据以及相关的自定义配置数据;数据预处理模块,用于对训练数据和测试数据进行清洗、转换、挖掘以及分类处理得到训练集和测试集;模型训练模块,用于利用训练集和测试集对用户配置的分析组件模型进行训练和测试得到结果最优的预测模型;结果获取模块,用于将用户配置的预测设定数据输入预测模型得到数据结果集;图表展示模块,用于根据用户配置的图表类型及样式将数据结果集转换成相应的图形或图像进行展示。8.一种基于大数据分析组件快速自定义图表展现装置,其特征在于,所述装置包括:
处理器;存储器,其上存储有可在所述处理器上运行的计算机程序;其中,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的基于大数据分析组件快速自定义图表展现方法的步骤。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1至6中任一项所述的基于大数据分析组件快速自定义图表展现方法的步骤。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1