一种基于动态平行坐标的关联规则可视化系统及方法_2

文档序号:8430878阅读:来源:国知局
table O函数,将csv、txt等格式的待挖掘的文本数据集加载至用户空间中,并以数据框的形式保存。
[0023]2)数据预处理:在此要自定义一个函数,用于将加载的数据框格式的数据集转换为关联规则挖掘模型支持的数据格式,函数流程如图3所示。具体的转换方式是用for循环遍历数据框的每个属性,调用is.factor O函数查找出返回值为no的属性,即这些非因子的属性不能作为挖掘模型的输入文件,接着借助R语言的as.factor O函数将此类属性转化为因子factor,以保证其能作为后续关联规则挖掘模型的输入文件。
[0024]3)关联规则挖掘:核心工作是为关联规则挖掘模型设置适当的参数,使得挖掘出的项集之间的相关关系更加准确、紧密。首先结合数据集特点设置关联规则的最小支持度,进而设置最小置信度,相关参数设置好后将预处理过的数据集作为输入文件,调用关联规则挖掘模型,从而得到初始挖掘结果。此时可以调用R语言的insepctO函数完成基于表、二维矩阵的可视化。
[0025]步骤2,设计第一、第二函数,其中,第一函数用于将步骤I中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存。
[0026]这一步骤的工作主要是将步骤I中的挖掘结果进行转换,使其能够满足后续生成可视化结果的要求。首先封装R语言的write, table O函数作为第一函数,用以将挖掘结果以数据框格式导出至磁盘空间的CSV或txt文件中;然后设计第二函数,读取磁盘空间的挖掘结果文件,并将其转换为JQuery支持的Json等数据格式作为中间结果。
[0027]步骤3,基于JQuery技术将步骤2中保存的挖掘结果绘制成平行坐标图。这一步骤中将步骤2中的中间结果作为输入文件,基于JQuery技术绘制出平行坐标图,并在浏览器可视化出来。平行坐标图的基本组成情况是:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
[0028]本发明中的交互性在于,用户可以过滤并选择感兴趣的项目来部分显示,并且可以通过拖动的方式选中竖直轴上的一小段连续的数值,即选择以此项目作为前项或后项,且支持度落在选中区间的部分关联规则进行显示。用户可直接在浏览器与该平行坐标图进行交互,平行坐标图响应用户请求并即时动态变化。
[0029] 以上所述,仅为本发明中的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
【主权项】
1.一种基于动态平行坐标的关联规则可视化系统,其特征在于,包括逻辑处理单元、数据转换单元、可视化结果生成单元; 逻辑处理单元,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果; 数据转换单元,设计第一、第二函数,其中,第一函数用于将逻辑处理单元中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存; 可视化结果生成单元,基于JQuery技术将数据转换单元中保存的挖掘结果绘制成平行坐标图。
2.根据权利要求1所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,数据加载构件将待挖掘的数据集加载至用户空间,并以数据框的形式保存。
3.根据权利要求2所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子。
4.根据权利要求3所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。
5.根据权利要求1所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,平行坐标图的组成为:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
6.一种基于动态平行坐标的关联规则可视化方法,其特征在于,包括以下具体步骤: 步骤1,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果; 步骤2,设计第一、第二函数,其中,第一函数用于将步骤I中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存; 步骤3,基于JQuery技术将步骤2中保存的挖掘结果绘制成平行坐标图。
7.根据权利要求6所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤I中数据加载构件将待挖掘的源数据集加载至用户空间,并以数据框的形式保存。
8.根据权利要求7所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤I中数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子。
9.根据权利要求8所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤I中关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。
10.根据权利要求6所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤3中平行坐标图的组成为:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
【专利摘要】本发明公开了一种基于动态平行坐标的关联规则可视化系统及方法,依赖R语言完成关联规则挖掘工作,转而借助JQuery的相关技术实现挖掘结果的可视化,生成的平行坐标图可以根据给定约束条件动态地部分显示,有效解决了现有技术中的问题。本发明依赖JQuery技术实现平行坐标,用户可以通过与图形的交互,过滤并显示感兴趣的关联规则,实现了动态的、交互式的可视化。
【IPC分类】G06F17-30
【公开号】CN104750847
【申请号】CN201510167946
【发明人】范仕良, 张雪洁, 叶枫, 骆融臻
【申请人】河海大学
【公开日】2015年7月1日
【申请日】2015年4月10日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1