一种鞅差序列下高维半参数测量误差方法

文档序号:36806069发布日期:2024-01-23 12:35阅读:21来源:国知局
一种鞅差序列下高维半参数测量误差方法

本发明主要涉及高维半参数模型研究的,具体为一种鞅差序列下高维半参数测量误差方法。


背景技术:

1、随着社会的发展和技术的进步,各个领域都在产生大量复杂的数据。这些数据的维数可能达到成千上万,甚至增长速度快于样本容量。例如:基因组数据、微阵数据、卫星提供的大量图像数据等等,其维数可能达到成千上万,甚至维数增加的速度比样本容量增加的速度快很多。这种用多个变量描述某一现象的数据被称为高维数据。这些数据提供了更丰富和完整的信息,但同时也给数据分析和处理带来了困难。因此高维数据的统计推断问题研究己经成为近些年来炙手可热的研究热点。一般来说,在数据分析中引入的自变量越多,得到的模型的偏差会越小,但同时也会有一些冗余的信息被纳入到模型中,进而造成模型的复杂度很高。为了降低模型的复杂度,变量选择自然也就成为非常重要的问题。因此,在“大数据”时代已经降临的今天,高维数据的统计推断理论以及新型变量选择方法的研究具有重要理论和实际意义。

2、对于半参数模型的研究,以及高维半参数模型的研究都较多,但是对于高维数据的半参数变系数模型的研究来说,目前来说有一些问题还有待解决,特别是对于一些复杂数据,例如响应变量缺失,协变量缺失,或者是两者都缺失的半参数变系数模型还需要更好的变量选择方法。亦或者是我们将会结合b样条估计,大大的加快非参数的估计效率,并且结合惩罚的思想使我们的模型识别具有相合性。而且对于一些数据集来说是无法对于误差项做出任何分布假设的,但是结合经验似然的优点,就可以分析这些数据集,这大大的提高了对数据的处理分析能力。


技术实现思路

1、基于此,本发明的目的是提供一种鞅差序列下高维半参数测量误差方法,以解决上述背景技术中提出的技术问题。

2、为实现上述目的,本发明提供如下技术方案:

3、一种鞅差序列下高维半参数测量误差方法,对于半参数变系数部分线性模型主要包括拟采取局部多项式方法、b样条方法和经验似然方法,所述局部多项式方法优点是没有边界效应,不需要在边界点处用特殊的权函数来减少边界效应;所述b样条方法是用样条函数来估计未知的非参数回归函数,相对于光滑样条方法来说具有所需要的节点个数较少,需要估计的参数也较少的优点;所述经验似然的方法相对于传统的统计方法相比具有构造置信域时所得置信域的形状完全由数据决定,并不需要估计渐进方差,大大减少了计算量。

4、本技术方案具体的,所述拟采取局部多项式方法包括有采用局部二次逼近算法,当采用局部二次逼近算法时,在βj的初始值βj0不接近0时,对应每个j=1,k,p,可以通过定义为:

5、[py(|βj|)]′=pγ′(|βj|)sgn(βj)≈{pγ′(|βj0|/|βj0|)}βj的二次函数来局部逼近。

6、本技术方案具体的,当采用所述局部二次逼近算法在βj的初始值βj0接近0时,我们设置βj=0,也就是说,在给定的非零βj0的邻域中,设:

7、py(|βj|)≈py(|βj|)+2﹣1{pγ′(|βj0|/|βj0|)}(βj2-β2j0)

8、然后,并应用所述经验似然算法,通过非线性γ优化得到最小值,这个过程重复进行,直到收敛。

9、本技术方案具体的,参数β的估计值的渐近特性依赖于调节参数,因此根据文献,当采用bic型准则来选择调节参数γ,其定义为:

10、bic(γ)=-2ln(βγ)+log(n)dfγ

11、其中,βy为β的估计值,dfγ为非零估计参数的数量,那么,最优调优参数为bic的最小值,对于模型的变量选择问题,通过我们的变量选择方法并通过选取合适的调整参数,通过假设检验是可以证明所提出的方法可以相合的识别出真实模型,并且所得回归系数的正则估计具有oracle性质即非参数分量的估计达到了最优的收敛速度,以及结合数据模拟,实际数据应用等证明方法是可行的。

12、一种鞅差序列下高维半参数测量误差方法,包括以下步骤:

13、s1、当采用局部二次逼近算法时,在βj的初始值βj0不接近0时,对应每个j=1,k,p,可以通过定义为:[py(|βj|)]′=pγ′(|βj|)sgn(βj)≈{pγ′(|βj0|/|βj0|)}βj的二次函数来局部逼近;

14、s2、在βj的初始值βj0接近0时,我们设置βj=0,也就是说,在给定的非零βj0的邻域中,设:py(|βj|)≈py(|βj|)+2﹣1{pγ′(|βj0|/|βj0|)}(βj2-β2j0_,然后,并应用经验似然算法,通过非线性γ优化得到最小值,这个过程重复进行,直到收敛;

15、s3、当采用bic型准则来选择调节参数γ,其定义为:bic(γ)=-2ln(βγ)+log(n)dfγ,其中,βy为β的估计值,dfγ为非零估计参数的数量,那么,最优调优参数为bic的最小值,对于模型的变量选择问题,通过我们的变量选择方法并通过选取合适的调整参数,通过假设检验是可以证明所提出的方法可以相合的识别出真实模型,并且所得回归系数的正则估计具有oracle性质即非参数分量的估计达到了最优的收敛速度。

16、综上所述,本发明主要具有以下有益效果:

17、(1)深入研究高维数据下变量选择的理论性质,包括模型选择一致性、参数估计效率等。

18、(2)针对高维数据的特点,研究半参数变系数部分线性模型的变量选择问题,并提出关于模型中参数分量以及非参数分量的变量选择方法,改进并推进已有的成果。

19、(3)通过这些研究工作,希望能够解决高维数据分析中的关键问题,如模型复杂度过高、计算负担重、估计不稳定等问题。



技术特征:

1.一种鞅差序列下高维半参数测量误差方法,其特征在于,对于半参数变系数部分线性模型主要包括拟采取局部多项式方法、b样条方法和经验似然方法,所述局部多项式方法优点是没有边界效应,不需要在边界点处用特殊的权函数来减少边界效应;所述b样条方法是用样条函数来估计未知的非参数回归函数,相对于光滑样条方法来说具有所需要的节点个数较少,需要估计的参数也较少的优点;所述经验似然的方法相对于传统的统计方法相比具有构造置信域时所得置信域的形状完全由数据决定,并不需要估计渐进方差,大大减少了计算量。

2.根据权利要求1所述的一种鞅差序列下高维半参数测量误差方法,其特征在于,所述拟采取局部多项式方法包括有采用局部二次逼近算法,当采用局部二次逼近算法时,在βj的初始值βj0不接近0时,对应每个j=1,k,p,可以通过定义为:

3.根据权利要求2所述的一种鞅差序列下高维半参数测量误差方法,其特征在于,当采用所述局部二次逼近算法在βj的初始值βj0接近0时,我们设置βj=0,也就是说,在给定的非零βj0的邻域中,设:

4.根据权利要求3所述的一种鞅差序列下高维半参数测量误差方法,其特征在于,参数β的估计值的渐近特性依赖于调节参数,因此根据文献,当采用bic型准则来选择调节参数γ,其定义为:

5.根据权利要求1-4所述的一种鞅差序列下高维半参数测量误差方法,其特征在于,包括以下步骤:


技术总结
本发明公开了一种鞅差序列下高维半参数测量误差方法,涉及高维半参数模型研究领域,一种鞅差序列下高维半参数测量误差方法,对于半参数变系数部分线性模型主要包括拟采取局部多项式方法、B样条方法和经验似然方法;本申请深入研究高维数据下变量选择的理论性质,包括模型选择一致性、参数估计效率等;针对高维数据的特点,研究半参数变系数部分线性模型的变量选择问题,并提出关于模型中参数分量以及非参数分量的变量选择方法,改进并推进已有的成果;通过这些研究工作,希望能够解决高维数据分析中的关键问题,如模型复杂度过高、计算负担重、估计不稳定等问题。

技术研发人员:黄飞
受保护的技术使用者:安徽信息工程学院
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1