均值二分法分块排序的正方化树图布局算法

文档序号:6635203阅读:969来源:国知局
均值二分法分块排序的正方化树图布局算法
【专利摘要】本发明涉及一种均值二分法分块排序的正方化树图布局算法,包括:步骤一、定义原始数据集;步骤二、对数据集A中元素进行首尾相减推移计算;步骤三、结合长边摆放策略对数据元素进行正方化计算。本发明减少了矩形平均长宽比的损失,保留了可视化结果的部分顺序信息,同时在数据集更新时可以提高可视化布局的稳定性。
【专利说明】均值二分法分块排序的正方化树图布局算法

【技术领域】
[0001] 本发明涉及信息可视化算法【技术领域】,具体涉及均值二分法分块排序的正方化树 图布局算法。

【背景技术】
[0002] 层次数据是一种常见的数据类型,主要用于表达个体之间的层次关系。用于层次 数据可视化的算法众多,树图是一种被广泛使用的算法。数据集中的元素本身具有在原 始数据集中的顺序性,用户可以根据这样的顺序性记忆识别元素,但是Squarified算法没 有考虑元素本身具有的顺序性。例如,用户通过强大的视觉认知功能,可以根据直观的图 形化效果记住其中某些元素,但一旦数据集更新,所有的元素都将被重新排序和被重新可 视化,这对用户视觉会有强烈的冲击感,同时造成不友好的图形混乱效果,用户也会无法 通过记忆分辨记住的元素当前所在的位置,因此Squarified算法破坏了数据集的顺序性。 Squarified-SP算法分割原始数据集时,考虑到数据靠矩形短边摆放会减少矩形长宽比,但 是双向靠边算法证明,数据元素靠矩形短边摆放并不一定可以得到最优的矩形长宽比,结 合长边摆放策略可以得到更优的矩形长宽比。同时,Squarified-SP算法在分割数据集时, 当n等于2时,对分割不会造成困难,但是当n大于2时甚至更大时,将会对分割造成困难, 因为即将分成的n个数据子集之间在权值之和上相互联系,每一个数据子集的分割都会影 响其他所有的数据子集,从而给整个数据子集的分割带来很大的开销和分割结果的不确定 性。


【发明内容】

[0003] 针对上述现有技术中的不足,本发明提供一种均值二分法分块排序的正方化树图 布局算法,按照权值二分原则使用元素首尾相减推移法快速确定数据集分割点,按照数据 子集的权值之和比例关系分割待绘制矩形。
[0004] 本发明采用以下技术方案:均值二分法分块排序的正方化树图布局算法,其特征 在于,包括以下步骤,
[0005] 步骤一、原始数据集为 A = U1, X2, ? ? ?,X」,? ? ?,xm},j = 1,2, ? ? ?,m,其中 m为元素 个数,用户自定义矩形混乱阈值为U,初始待绘制矩形为R,Hi1, m2分别为A1, A2数据子集中 的元素个数,qp q2分别为A1, A2数据子集中元素的起始序号,则有Q1 = 1,q2 = qi+nii ; & 分别为A1, A2数据子集中元素权值之和,

【权利要求】
1.均值二分法分块排序的正方化树图布局算法,其特征在于,包括以下步骤, 步骤一、原始数据集为A = (X1, X2,. . .,Xj,. . .,xm},j = 1,2,. . .,m,其中m为元素个数, 用户自定义矩形混乱阈值为μ,初始待绘制矩形为R,Hl1, m2分别为A1, A2数据子集中的元素 个数,qp q2分别为A1, A2数据子集中元素的起始序号,则有Q1 = 1,q2 = 分别 为A1, A2数据子集中元素权值之和,\ \ =Σ7=%Χ/,数据集A的分割点t 为每次分割时第二个数据子集中第一个元素的序号,用户自定义长宽比阈值L ; 步骤二、对数据集A中元素进行首尾相减推移计算, (1) 将A中的首尾元素依次相减,并计算相减所得到的值之和S,
(2) 若S > 0,则抟芏W;,毋则右m刃司双,S加上斤亏刃Uii+i;/Z的兀系仪值之后, 开始依次向后加元素 2倍权值;若m为偶数,S从序号为(m+1)/2的元素开始依次向后加元 素 2倍权值,记录每次操作对应的元素序号j、SnOT和前一步操作的Stjld,直至Smw > 0,转至 (4); (3) 若m为奇数,S减去序号为(m+1)/2的元素权值之后,开始依次向前减元素 2倍权 值;若m为偶数,S从序号为的元素开始依次向前减元素 2倍权值,分别记录每次 操作对应的元素序号j和Smw和前一步操作的Stjld,直至Smw < 0,转至步骤(5); ⑷比较Is1J和|s。」,若Is1J > |s。」,则分割点t = j,否则t = j+i; (5)比较|5_|和|5。1(1|,若|5_|>|5。1(1|,则分割点七=」+1,否则七=」 ; 步骤三、结合长边摆放策略对数据元素进行正方化计算, (a) 比较m和μ,若m < μ,贝Ij跳转至(e); (b) 按照步骤二(4)和(5)确定数据集的分割点t,并分割数据子集为A11A2 ; (c) 计算数据子集A1, A2的权值之和,根据的比例关系分割待绘制矩形 R的长边,从而得到数据子集A1, A2对应的待绘制子矩形R1, R2 ; (d) 将数据子集A1, A2分别设置为A,将待绘制子矩形R1, R2设置为待绘制矩形R,重复 (a)到(c),直到分割得到的所有数据子集中的元素个数均小于μ ; (e) 依次设置每个数据子集为当前的数据集,设置每个待绘制子矩形为当前的待绘制 矩形,每个数据集按照数据权值从大到小的顺序进行排序; (f) 若当前待绘制子矩形的长宽比大于长宽比阈值L,则转到⑴; (g) 从当前数据子集按照数据权值从大到小的顺序依次取出当前数据集中的元素,放 在待绘制子矩形的长边,记录平均长宽比; (h) 重复步骤(g),直到当前加入数据元素增加了平均长宽比,计算当前阶段加入的数 据元素的平均长宽比Ic1 ; (i) 按照数据权值从大到小的顺序依次取出当前数据集中的元素,放在待绘制子矩形 的短边,记录平均长宽比; (j) 重复步骤(i),直到当前加入的数据元素增加了平均长宽比,计算当前阶段加入的 数据元素的平均长宽比ks ; (k) 比较Ic1和匕,选择平均长宽比小的摆放策略; (l) 返回步骤(e),直至所有数据子集中的元素均被插入。
【文档编号】G06F19/00GK104376218SQ201410670722
【公开日】2015年2月25日 申请日期:2014年11月20日 优先权日:2014年11月20日
【发明者】杜景林, 朱兴宇, 沈晓燕, 周光胜, 侯大俊 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1