1.一种基于距离相关系数检验的非高斯中性矢量判断方法,其过程包括以下几步骤:
1)样本预判断步骤:判断矢量变量样本是否非负并且加和为一,成立则满足非高斯特性;
2)正态性检验步骤:运用正态性检验生成正态概率图,并进行假设检验,以检查输入的矢量变量样本是否服从正态分布;若不服从,则说明变量样本具有“非高斯”特性;
3)中性特性判断步骤:根据非高斯中性矢量满足协方差矩阵负相关的特点,通过判断协方差矩阵为负相关,以判断非高斯矢量变量样本为中性向量;
4)非线性去相关步骤:运用“并行”方法,对矢量变量样本进行非线性变换,以得到一组相互独立的非高斯矢量;
5)置换检验步骤:通过检验所得变量之间的相互独立,判定原矢量变量样本满足“中性”特性。
2.根据权利要求1所述,在样本预判断步骤中,对样本矢量变量进行简单的加和计算,根据非高斯矢量的特点,当样本矢量变量的和为一时,该样本才有可能为非高斯矢量。
3.根据权利要求1所述,在正态性检验步骤中,对于已经满足变量加和为一的矢量样本,再次进行正态性检验,通过生成正态概率图,查看样本散点与假设回归直线呈现出的图像结果,得出样本与正态分布的关系,不服从情况下,则说明样本有“非高斯”特性。
4.根据权利要求1所述,在中性特性判断步骤中,通过计算样本矢量的协方差矩阵,判断其相关性,在矩阵负相关的情况下,样本矢量变量才为中性向量。
5.根据权利要求1所述,在非线性去相关步骤中,得到一组相互独立的非高斯矢量变量;假设x=[x1,x2,···,xK]T非高斯矢量变量,通过非线性变换,可以获得K-1维的非高斯矢量变量u=[μ1,μ2,···,μK-1]T,时间复杂度为O(log2K);此步骤的具体计算过程如下:
1)从第二次迭代开始,每次迭代前对矢量变量样本进行归一化操作,得到一组新的满足“非高斯”特性的矢量变量x;
2)对非高斯矢量变量进行迭代非线性变化:
以六维向量为例,首次迭代得到三个相互独立的变量u1,u2,u3分别为:
第二次迭代得到向量u4:
最后一轮迭代得到向量u5:
u5=x1+x2+x3+x4
在六维矢量的情况下,本方法仅用三步就完成了矢量的非线性变化,有效的在时间复杂度相对小的情况下得到一组相互独立的新的非高斯中性矢量。
6.根据权利要求1所述,在置换检验步骤中,相关系数可以测量两个随机变量或任意维度的两个随机向量间的统计独立性,当它等于零时说明变量之间相互独立;基于距离相关系数判定变量之间独立性的方法可通过置换检验实现,具体步骤如下:
1)给定来自两个不同变量的两组样本X=[x1,···,xN]和Y=[y1,···,yN],分别逐一计算样本间的欧式距离
aij=||xi-xj||2和bij=||yi-yj||2
然后计算
和
上式中,表示第i行的均值,表示第j列的均值,表示整个矩阵的均值,
对和也采用同样的计算方法;
此样本序列的距离相关系数为:
其中,
2)保持X中样本的顺序不变。通过对从1到N的序号进行随机置换(Random Permutation),可从Y得到新的样本序列Y*,对于X和Y*,按照步骤一中的方法重新计算DC;
3)重复步骤二Q次(Q应为较大的正整数),统计所得到的DC值小于步骤一中得到的DC的次数为P,那么P/Q即为p-value;
此检验的零假设(Null Hypothesis)是两个变量统计上相互不独立。当通过计算距离相关系数得到的p-value小于显著性阈值(如0.05)时,此零假设被拒绝,则可判定两个变量相互独立;K维非高斯中性矢量变量共需要计算(K-1)(K-2)/2组变量对的p-value,与K!/2相比,有效降低了计算量;
当通过置换检验判断步骤四得到的变量相互独立后,可以确定矢量变量满足“中性”特性,结合之前步骤,可知该矢量变量是非高斯中性矢量。