一种基于降维超平面的多元线性回归方法

文档序号:6552375阅读:957来源:国知局
一种基于降维超平面的多元线性回归方法
【专利摘要】本发明涉及概率论与数理统计领域,特别是涉及一种基于降维超平面的多元线性回归方法。设具有线性相关关系的变量x1,x2,...,xn,y的观测值矩阵为(X,Y),将(X,Y)或其归一化矩阵(X1,Y1)进行主成分分析,求取与第n+1个主成分垂直且通过数据重心的超平面方程,将超平面方程整理为的形式,则为基于观测数据(X,Y)的估计的多元线性回归方程。
【专利说明】-种基于降维超平面的多元线性回归方法

【技术领域】
[0001] 本发明涉及概率论与数理统计领域,特别是涉及一种基于降维超平面的多元线性 回归方法。

【背景技术】
[0002] 线性回归分析是数理统计中最基本的研究方法之一,用以研究变量间的相关关 系。在社会经济领域,很多变量间的关系即使在宏观上不是线性的,在微观上仍可近似做线 性化处理。另外,有的时候通过对变量进行取对数等预处理,可以将变量间的非线性关系变 换为线性关系。目前主流的统计分析、数值计算软件都以矩阵运算为基础。因此,对变量进 行高精度的线性回归具有重要的基础作用。
[0003] 线性回归根据自变量及因变量的数量可分为一重一元、一重多元、多重多元等几 种情况,其中,一重多元线性回归是其中基本的问题之一,简述如下:
[0004] 设有变量 Xp x2, . . .,xn,y 满足线性关系式 y = β。+ β A+. . . + β ηχη+ ε,其 中Mi = 0,1,...,η)是常数,ε是随机误差。对各变量进行Ν次观测,观测值为:

【权利要求】
1. 一种基于降维超平面的多元线性回归方法,其特征在于,步骤如下: (1) 设有变量χρ χ2, ...,χη,y满足线性关系式y = β〇+β ιΧι+... +βηχη+ ε,其中 Mi = 0,1,. . .,η)是常数,ε是随机误差,η > 2,对各变量进行Ν次观测,观测值为
,其中表示变量\的第i次观测值,以 上数据与散点集
等价,基于以上观测数据的估计 的多元线性回归方程为_
(2) 对(X,Y)进行主成分分析,设主成分依次为匕,...,Gn+1,对应于以上主成分的单 位向量分别表示为5,...,5,(X,Y)在n+1维空间( gl,. . .,gn)中的对应矩阵为G = (gij) (n+1) XN ; (3) 在n+1维空间(gl,...,gn)内,计算与Fn+1垂直且经过各样本点的几何中心
4勺超平面方程为
⑷将式
中gn+1用X。χ2,…,x n,y表示,整理为
的 形式,则
为基于观测数据(X,Y)的估计的多元线性回归方程。
2. -种基于降维超平面的多元线性回归方法,其特征在于,步骤如下: (1) 设有变量χρ χ2, ...,χη,y满足线性关系式y = β〇+β ιΧι+... +βηχη+ ε,其中 Mi = 0,1,. . .,η)是常数,ε是随机误差,η > 2,对各变量进行Ν次观测,观测值为
,其中表示变量\的第i次观测值,以 上数据与散点集S= {(Xil,...,Xin,yi)|i e (1,...,N)}等价,基于以上观测数据的估计 的多元线性回归方程为
(2) 将Y与X中列向量分别进行归一化处理,处理结果合并为矩阵(XSY1),(Χ^Υ1)中 各列向量对应的变量为χ?,. . . d^y1,归一化处理的方法为:设Z为列向量,mean(Z)为 Z的各分量的均值,std⑵为Z的各分量的标准差,则Z的归一化向量为
设Z与Z1对应的变量分别为z和z1,其关系式为
(3) 对(XSY1)进行主成分分析,设主成分依次为,对应于以上主成分的单位 向量分别表示为
(X1,Y1)在n+1维空间(f\,. . .,fn)中的对应矩阵为F = (t) (n+1) XN ? (4) 在n+1维空间(f\,...,fn)内,计算与Fn+1垂直且经过各样本点的几何中心 的超平面方程为 (5) 将式/"+1 -1 = 0中fn+1用,x、,…,x^,y1表示,整理为
的形式; (6) 将式
中各变量用Xl,x2, ...,xn,y表示,整理为
的形式,则
为基于观测数据(X,Y)的估计的多 元线性回归方程。
【文档编号】G06F19/00GK104063617SQ201410318782
【公开日】2014年9月24日 申请日期:2014年7月7日 优先权日:2014年7月7日
【发明者】许蔚蔚 申请人:许蔚蔚
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1