一种高维数据可视化方法及装置的制作方法

文档序号:6370171阅读:173来源:国知局
专利名称:一种高维数据可视化方法及装置的制作方法
技术领域
本发明涉及模式识别领域,尤其涉及一种高维数据可视化方法及装置。
背景技术
在模式识别中,通常涉及到对高维数据进行处理或分类,高维数据可以看作是高维欧式空间中的点,为了便于研究高维数据,一般需要将其进行降维处理,例如将5维空间中的数据投影到不同的二维平面上,现有的高维数据可视化方法只能将投影后的不同的二维平面分别进行显示,通过显示结果可以观察到高维数据在不同的二维投影平面上的分布状态,却不能观察到或分析出高维数据在原始的高维空间中的空间位置关系。

发明内容
有鉴于此,本发明提供了一种高维数据可视化方法及装置,目的在于解决现有的高维数据可视化方法无法观察到或分析出高维数据在原始的高维空间中的空间位置关系的问题。为实现上述目的,本发明实施例提供以下技术方案一种高维数据可视化方法,包括依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量;将所述高维数据分别投影到所述投影平面上;
将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示。优选地,所述依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面包括任意设定与所述高维数据的维数相同的轴向量、起始向量和终止向量;利用预设的数量值及所述起始向量和终止向量,依据预设的计算规则,计算出所述预设数量的投影平面中每个投影平面的转动向量;由所述轴向量分别和每个转动向量确定出所述预设数量的投影平面。优选地,所述预设的计算规则具体为Pj 二^Ιβ +丄γ j=0, I,…,m,其中,m为所述预设的数量值,β」为第j个投影平
m m
面的转动向量,β为所述起始向量,Y为所述终止向量。优选地,所述将所述高维数据分别投影到所述投影平面上包括计算所述高维数据···,『,JC1中的巧分别与投影平面Aj的轴向量和转动向量的内积,得到第一投影坐标值和第二投影坐标值;将所述ri投影到所述投影平面上由第一投影坐标值和第二投影坐标值确定的位置,其中,η为所述高维数据的维数,j=0, 1,2......m,m为预设的数量值。
优选地,所述将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示包括
将所述预设数量的投影平面在同一预设的坐标系中以预设的步长值进行连续显
/Jn ο优选地,所述预设的坐标系包括直角坐标系。一种高维数据可视化装置,包括投影平面确定模块,用于依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量;投影模块,用于将所述高维数据分别投影到所述投影平面上;显示模块,用于将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示。优选地,所述投影平面确定模块包括设置单元,用于任意设定与所述高维数据的维数相同的轴向量、起始向量和终止向量;转动向量计算单元,用于利用预设的数量值及所述起始向量和终止向量,依据预设的计算规则,计算出所述预设数量的投影平面中每个投影平面的转动向量;确定单元,用于由所述轴向量分别和每个转动向量确定出所述预设数量的投影平面。优选地,所述投影模块包括投影坐标值计算单元,用于计算所述高维数据^ =( ,中的ri分别与投影平面Ak的轴向量和转动向量的内积,得到第一投影坐标值和第二投影坐标值;投影单元,用于将所述A投影到所述投影平面 上由第一投影坐标值和第二投影坐标值确定的位置,其中,η为所述高维数据的维数,j=0, 1,2......m,m为预设的数量值。优选地,所述显示模块包括步长值获取单元,用于获取预设的步长值;显示单元,用于将所述预设数量的投影平面在同一预设的坐标系中以所述预设的步长值进行连续显示。本发明实施例提供的高维数据可视化方法及装置,将高维数据投影到具有相同的轴向量的投影平面上,并将所述投影平面在同一坐标系中进行连续显示,因为投影平面具有相同的轴向量,所以在其连续显示时,会产生不同的投影平面以轴向量为旋转轴进行旋转的动态显示效果,从而能够显示出高维数据在原始的高维空间中的空间位置关系。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本发明实施例公开的一种高维数据可视化方法的流程图2为本发明实施例公开的一种高维数据可视化方法中确定投影平面的方法的流程图;图3为本发明实施例公开的一种高维数据可视化方法中投影算法的流程图;图4为本发明实施例公开的一种高维数据可视化装置的结构示意图;图5为本发明实施例公开的一种高维 数据可视化装置中投影平面确定模块的结构示意图;图6为本发明实施例公开的一种高维数据可视化装置中投影模块的结构示意图;图7为本发明实施例公开的一种高维数据可视化装置中显示模块的结构示意图。
具体实施例方式本发明提供了一种高维数据可视化方法,其核心发明点在于,依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量,将所述高维数据分别投影到所述投影平面上,并将所述预设数量的投影平面在同一预设的坐标系中进行连续显示。因为预设数量的投影平面具有相同的轴向量,所以,在同一预设的坐标系中进行连续显示时,能够呈现出以所述轴向量为转动轴,所有投影平面围绕转动轴旋转的显示效果,实现了将高维数据在高维空间的位置关系展现的目的。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例公开的一种高维数据可视化方法,如图I所示,包括SlOl :依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面;其中,高维数据是指维数大于2的数据。具体地,确定投影平面的过程如图2所示,可以包括S201 :任意设定与所述高维数据的维数相同的轴向量、起始向量和终止向量;本实施例中,可以设定高维数据的维数为L,则可以设定L维的轴向量,记为a,L维的起始向量,记为P,L维的终止向量,记为Y。需要注意的是,α、β、Y中的元素不能全部为零。S202:利用预设的数量值及所述起始向量和中止向量,依据预设的计算规则,计算出所述预设数量的投影平面中每个投影面的转动向量;其中,预设的数量值指的是预先设定的高维数据的投影平面的数量,为了充分展现高维数据的空间位置关系,投影平面的数量需要足够大,本实施例中,将预设的数量值记
为 IIlo本实施例中,预设的计算规则优选为;P ^z/p + J_y J=0) 1; ···,!!!,其中,m为所
m m
述预设的数量值,为第j个投影平面的转动向量,β为所述起始向量,Y为所述终止向量。从上述计算规则可以看出当j=0时,β C1= β ,当j=m时,β m= Y ,即根据此计算规则确定的第一个投影平面的转动向量等于起始向量,最后一个投影平面的转动向量为终止向量,其它投影平面的转动向量位于起始向量和终止向量之间。需要说明的是,预设的数量值为m,计算出的转动向量的数量为m+1。S203:由所述轴向量分别和每个转动向量确定出所述预设数量的投影平面。因为两条线段可以唯一确定一个平面,所以计算出的每个转动向量都可以分别与轴向量共同确定出一个投影平面,m+1个转动向量可以分别与轴向量确定出m+1个投影平面。所述m+1个投影平面以转动向量为β的投影平面为起始投影平面,以转动向量为Y的投影平面为终止投影平面,由于所有的m+1个投影平面具有相同的轴向量,所以m+1个投影平面以轴向量为公共边。S102:确定出预设数量的高维数据的投影平面后,将高维数据分别投影到投影平面上; 也就是说,将高维数据分别向上述m+1个投影平面上投影,本实施例中,可以将L维高维数据记为^ =(厂,其中每个&都为L维向量,将每个巧都向m+1个投影平面分别做投影,优选地,投影的具体实现方法可以为计算1^分别与投影平面Ak的轴向量和转动向量的内积,得到第一投影坐标值和第二投影坐标值;将所述ri投影到所述投影平面上由第一投影坐标值和第二投影坐标值确定的
位置,其中,η为所述高维数据的维数,j=0, 1,2......m, m为预设的数量值,由预设的数量
值确定的投影平面的数量为m+1。为了更加详细地描述投影过程,本实施例提供以下投影算法流程,如图3所示,投影算法流程包括S301 :将循环计数器初始化,即j = O ;S302 :为循环计数器赋值,i = l;S303 :将(a,ri)赋值给 Xi,将(β」,Γ )赋值给 ;其中,(a, Ti) > ( β j, Ti)均为内积运算,(a , Ti) =a1ril+a2ri2+......+aLriL,
(β」,Α) = β ιΓη+β ιΓη+. . .+^LriLO经过内积运算后的结果均为一维数值,将运算结果分别赋给第一投影坐标值Xi和第二投影坐标值yi。(Xi,yi)为高维数据中的元素&在本次循环中投影到投影平面AjI的坐标,其中投影平面Aj由轴向量α与转动向量β」确定。S304 :更新循环计数器i = i+1,S305 :判断i ( η是否成立,如果是,返回执行S303,如果否,执行S306 ;S306 :更新循环计数器j = j+1 ;S307 :判断j ( m是否成立,如果是,返回执行S302,如果否,则结束。上述投影算法流程执行简单,易于硬件实现。S103:将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示。高维空间中全部的数据均向预设数量的投影平面投影后,可以将所有的投影平面显示在同一坐标系中,本实施例中优选直角坐标系,因为所有投影平面的轴向量相同,所以,所有的投影平面以轴向量为公共边。可以将所有的投影平面都进行显示,也可以显示部分投影平面,显示投影平面的数量可以由预设的步长值进行控制,例如,当预设的步长值为I时,则显示所有的投影平面,当预设的步长值为2时,则显示起始投影平面后将跳过投影平面A1,而显示投影平面A2,依此类推,,预设的步长值为I时可以看作向前步进的显示状态;当预设的步长值为-I时,则显示当前投影平面的前一个投影平面,例如当前显示的是A2,后续则显示A1,如果当前显示的是Atl,即起始投影平面,则后续可以显示终止起始平面,或者停止显示,提示用户重新设定步长值。本实施例中,可以将预设的步长值的设置过程设置为人机交互的形式,即用户在高维数据的可视化过程中,可以随时对预设的步长值进行设定,以控制投影平面的显示过程,当预设的步长值发生变化时,表现在高维数据可视化过程中的效果为,投影平面转动速快的改变,预设的步长值越大,投影平面以轴向量为转动轴,从起始平面转到终止平面的速快越快。另外,本实施例中,还可以设置停止控制,用以终止可视化过程或是停止显示中的投影平面的旋转。需要说明的是,本实施例中的方法在操作过程中涉及到循环操作,可以先完成一 个投影平面的投影就将其显示出来,也可以完成全部投影平面的投影后再进行依次显示,本实施例不做限定。进一步地,在将投影平面进行显示过程中,也可以随时重新设定轴向量、起始向量和终止向量,以改变投影平面显示中的转动轴和起始平面、终止平面。本实施例所述的高维数据可视化方法,通过给所有投影平面设置相同的轴向量,使得所有投影平面具有了公共边,在可视化过程中,使得用户在显示设备上可以直观地看到高维数据在连续变换的投影平面上的投影产生的动态旋转效果,使得用户对高维数据在高维空间中的空间位置关系进行直观的分析和判断。与上述高维数据可视化方法相对应的,本发明实施例还公开了一种高维数据可视化装置,如图4所示,包括投影平面确定模块401,用于依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量;投影模块402,用于将所述高维数据分别投影到所述投影平面上;显示模块403,用于将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示。本实施例所述的高维数据可视化装置将高维数据可视化的过程为投影平面确定模块依据用户输入的高维数据和预设的数量值,获取高维数据的维数,并依据高维数据的维数和预设的数量值确定预设数量的投影平面,需要注意的是,本实施例中,确定的投影平面的数量为预设的数量值+1 ;投影模块将高维数据依次投影到投影平面上,显示模块将经高维数据投影后的投影平面进行显示,显示的具体方式可以为在预设的坐标系中进行将所有的投影平面进行连续显示。本实施例所述的高维数据显示装置可以集成与电子设备的处理芯片上,也可以单独设在独立的处理芯片上。本实施所述的装置,能够使得高维数据在二维平面上显示出原始的空间位置关系,有利于对高维数据进行直观的分析。进一步地,如图5所示,本实施例中所述的投影平面确定模块包括
设置单元501,用于任意设定与所述高维数据的维数相同的轴向量、起始向量和终止向量;转动向量计算单元502,用于利用预设的数量值及所述起始向量和终止向量,依据预设的计算规则,计算出所述预设数量的投影平面中每个投影平面的转动向量;确定单元503,用于由所述轴向量分别和每个转动向量确定出所述预设数量的投影平面。进一步地,如图6所示,本实施例中所述的投影模块包括 投影坐标值计算单元601,用于计算所述高维数据中的ri分别与投影平面Aj的轴向量和转动向量的内积,得到第一投影坐标值和第二投影坐标值;投影单元602,用于将所述ri投影到所述投影平面上由第一投影坐标值和第二投影坐标值确定的位置,其中,η为所述高维数据的维数,j=0, 1,2......m,m为预设的数量值。进一步地,如图7所示,本实施例中所述的显示模块包括步长值获取单元701,用于获取预设的步长值;显示单元702,用于将所述预设数量的投影平面在同一预设的坐标系中以所述预设的步长值进行连续显示。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括u盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
权利要求
1.一种高维数据可视化方法,其特征在于,包括 依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量; 将所述高维数据分别投影到所述投影平面上; 将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显
2.根据权利要求I所述的方法,其特征在于,所述依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面包括 任意设定与所述高维数据的维数相同的轴向量、起始向量和终止向量; 利用预设的数量值及所述起始向量和终止向量,依据预设的计算规则,计算出所述预设数量的投影平面中每个投影平面的转动向量; 由所述轴向量分别和每个转动向量确定出所述预设数量的投影平面。
3.根据权利要求2所述的方法,其特征在于,所述预设的计算规则具体为
4.根据权利要求I所述的方法,其特征在于,所述将所述高维数据分别投影到所述投影平面上包括 计算所述高维数据沅=(, ,…,&)}L中的A分别与投影平面Aj的轴向量和转动向量的内积,得到第一投影坐标值和第二投影坐标值; 将所述^投影到所述投影平面 上由第一投影坐标值和第二投影坐标值确定的位置,其中,n为所述高维数据的维数,j=0, 1,2......m,m为预设的数量值。
5.根据权利要求I所述的方法,其特征在于,所述将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示包括 将所述预设数量的投影平面在同一预设的坐标系中以预设的步长值进行连续显示。
6.根据权利要求I或5所述的方法,其特征在于,所述预设的坐标系包括 直角坐标系。
7.一种高维数据可视化装置,其特征在于,包括 投影平面确定模块,用于依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量; 投影模块,用于将所述高维数据分别投影到所述投影平面上; 显示模块,用于将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示。
8.根据权利要求7所述的装置,其特征在于,所述投影平面确定模块包括 设置单元,用于任意设定与所述高维数据的维数相同的轴向量、起始向量和终止向量; 转动向量计算单元,用于利用预设的数量值及所述起始向量和终止向量,依据预设的计算规则,计算出所述预设数量的投影平面中每个投影平面的转动向量; 确定单元,用于由所述轴向量分别和每个转动向量确定出所述预设数量的投影平面。
9.根据权利要求7所述的装置,其特征在于,所述投影模块包括 投影坐标值计算单元,用于计算所述高维数据悅=(rfl,G,…,/^丨^中的ri分别与投影平面Ak的轴向量和转动向量的内积,得到第一投影坐标值和第二投影坐标值; 投影单元,用于将所述A投影到所述投影平面上由第一投影坐标值和第二投影坐标值确定的位置,其中,n为所述高维数据的维数,j=0, 1,2......m,m为预设的数量值。
10.根据权利要求7所述的装置,其特征在于,所述显示模块包括 步长值获取单元,用于获取预设的步长值; 显示单元,用于将所述预设数量的投影平面在同一预设的坐标系中以所述预设的步长值进行连续显示。
全文摘要
本发明提供了一种高维数据可视化方法及装置,所述方法包括依据预先输入的高维数据,确定预设数量的所述高维数据的投影平面,所述投影平面具有相同的轴向量;将所述高维数据分别投影到所述投影平面上;将所述预设数量的经高维数据投影后的投影平面在同一预设的坐标系中进行连续显示,因为投影平面具有相同的轴向量,所以在其连续显示时,会产生不同的投影平面以轴向量为旋转轴进行旋转的动态显示效果,从而能够显示出高维数据在原始的高维空间中的空间位置关系。
文档编号G06F17/30GK102707917SQ20121016303
公开日2012年10月3日 申请日期2012年5月23日 优先权日2012年5月23日
发明者吴远峰, 孙旭, 张兵, 申茜, 高建威, 高连如 申请人:中国科学院对地观测与数字地球科学中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1