一种基于AIC的逐步特征变量选择方法与流程

文档序号:12157722阅读:来源:国知局

技术特征:

1.一种基于AIC的逐步特征变量选择方法,其特征在于,包括以下步骤:

步骤1:设全部特征变量集为L,记作L={x1,x2,…,xd},其中d大于等于2;随机选择L中的1个特征变量放入已选特征变量集S,令备选特征变量集U为子集S在L中的绝对补集,记作U={x1,x2,…,xk},全局最小AIC值为AICw=+∞,即初始赋值为无穷大;

步骤2:计算备选特征变量集U中所包含的备选特征变量的个数,记作k;判断k是否为0;若是,则执行步骤11;若否,则执行步骤3;

步骤3:对备选特征变量集U中的每个备选特征变量,作为新变量分别与已选特征变量集S、因变量y建立GWR模型,得到模型GWRu1,GWRu2,…,GWRuk;计算模型GWRu1,GWRu2,…,GWRuk当中每个模型的AIC值,获得{AICGWRu1,AICGWRu2,...,AICGWRuk},其中AICGWRuk表示模型GWRuk的AIC值;

步骤4:求出{AICGWRu1,AICGWRu2,…,AICGWRuk}当中的最小值,记为当前最小AIC值AICc

步骤5:判断步骤4中所述AICc是否比全局最小AIC值AICw小3;若是,执行步骤6;若否,随机从U中选择一个变量,删除该变量,执行步骤7;

步骤6:将计算出步骤4中所述AICc的GWR模型所对应的备选特征变量加入已选特征变量集S,将加入后的已选特征变量集S记作S={x1,x2,…,xm};并从备选特征变量集U中删除该备选特征变量,将所述AICc的值赋值给AICw;然后执行步骤7;

步骤7:对已选特征变量集S中的m个变量,每次去除其中一个变量,利用S中的其它变量与因变量y组合建立GWR模型,得到模型GWRs1,GWRs2,…,GWRsm;其中GWRsm表示将S中的变量xm去除后,利用其它变量与因变量y组合而建立的GWR模型;并计算模型GWRs1,GWRs2,…,GWRsm当中每个模型的AIC值,获得{AICGWRs1,AICGWRs2,…,AICGWRsm},其中AICGWRsm表示模型GWRsm的AIC值;

步骤8:求{AICGWRs1,AICGWRs2,…,AICGWRsm}当中的最小值,记为当前最小AIC值AICc

步骤9:判断步骤8中所述AICc是否比全局最小AIC值AICw小3;若是,执行步骤10;若否,执行步骤2;

步骤10:将计算出步骤8中所述AICc的GWR模型对应的特征变量从已选特征变量集S中删除,将步骤8中所述AICc赋值给AICw,返回执行步骤2;

步骤11:循环结束,此时的已选特征变量集作为最优特征变量组合。

2.根据权利要求1所述的基于AIC的逐步特征变量选择方法,其特征在于,步骤3和步骤7中因变量y表示n个数据观测点的观测值,公式为:

<mrow> <mi>y</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>y</mi> <mn>1</mn> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>y</mi> <mn>2</mn> </msub> </mtd> </mtr> <mtr> <mtd> <mo>...</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>y</mi> <mi>n</mi> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>.</mo> </mrow>

3.根据权利要求2所述的基于AIC的逐步特征变量选择方法,其特征在于,步骤3中的GWRu1模型为:

<mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mn>0</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </msubsup> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mi>u</mi> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>u</mi> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&epsiv;</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

GWRu2模型为:

<mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mn>0</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </msubsup> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mi>u</mi> <mn>2</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>u</mi> <mn>2</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&epsiv;</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

GWRuk模型为:

<mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mn>0</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </msubsup> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>&beta;</mi> <mrow> <mi>i</mi> <mi>u</mi> <mi>k</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>u</mi> <mi>k</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>&epsiv;</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

其中xi1,xi2,……,xim表示数据点(ui,vi)处已选特征变量集S中的m个变量,xiu1,xiu2,……,xiuk表示数据点(ui,vi)处备选特征变量集U中的k个变量;βip(ui,vi),(p=0,1,…,m)是第i个数据点(ui,vi)处变量xip对应的未知参数,βiu1(ui,vi)、βiu2(ui,vi)……βiuk(ui,vi)是第i个数据点(ui,vi)处分别与变量xiu1,xiu2,……,xiuk对应的未知参数,ui表示第i个数据点的横坐标,vi表示第i个数据点的纵坐标;(ε1,ε2,…εn)为独立同分布的误差项,通常假定均值为零,方差为σ2;i的取值范围为1至n,表示所述n个数据观测点。

4.根据权利要求3所述的基于AIC的逐步特征变量选择方法,其特征在于,步骤7中的GWRs1模型为:

yi=βi0(ui,vi)+βi2(ui,vi)xi2i3(ui,vi)xi3+…+βim(ui,vi)ximi (5)

GWRs2模型为:

yi=βi0(ui,vi)+βi1(ui,vi)xi1i3(ui,vi)xi3+…+βim(ui,vi)ximi (6)

GWRsm模型为:

yi=βi0(ui,vi)+βi1(ui,vi)xi1i2(ui,vi)xi2+…+βim-l(ui,vi)xi(m-1)i (7)

其中xil,xi2,……,xi(m-1),xim表示第i个数据点(ui,vi)处已选特征变量集S中的m个变量;

βi1(ui,vi),βi2(ui,vi),…,βim(ui,vi)是第i个数据点(ui,vi)处变量xi1,xi2,…,xim对应的未知参数,ui表示第i个数据点的横坐标,vi表示第i个数据点的纵坐标;(ε1,ε3,…εn)为独立同分布的误差项,通常假定均值为零,方差为σ2;i的取值范围为1至n,表示所述n个数据观测点。

5.根据权利要求4所述的基于AIC的逐步特征变量选择方法,其特征在于,步骤3和步骤7中每个模型的AIC值计算公式如下:

<mrow> <mi>A</mi> <mi>I</mi> <mi>C</mi> <mo>=</mo> <mn>2</mn> <mi>n</mi> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mover> <mi>&sigma;</mi> <mo>^</mo> </mover> <mo>)</mo> </mrow> <mo>+</mo> <mi>n</mi> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mn>2</mn> <mi>&pi;</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>n</mi> <mo>&lsqb;</mo> <mfrac> <mrow> <mi>n</mi> <mo>+</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>n</mi> <mo>-</mo> <mn>2</mn> <mo>-</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&rsqb;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

其中,n为数据观测点个数,tr(S)为地理加权回归帽子矩阵S的迹,是误差项估计的标准离差:

<mrow> <mover> <mi>&sigma;</mi> <mo>^</mo> </mover> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>i</mi> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>y</mi> <mo>^</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>/</mo> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>2</mn> <mi>t</mi> <mi>r</mi> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>S</mi> <mi>T</mi> </msup> <mi>S</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>

为n个数据观测点的估计值:

<mrow> <mover> <mi>y</mi> <mo>^</mo> </mover> <mo>=</mo> <mi>S</mi> <mi>y</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>S</mi> <mn>1</mn> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>S</mi> <mn>2</mn> </msub> </mtd> </mtr> <mtr> <mtd> <mo>...</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>S</mi> <mi>n</mi> </msub> </mtd> </mtr> </mtable> </mfenced> <mi>y</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mrow> <msub> <mi>X</mi> <mn>1</mn> </msub> <msup> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>1</mn> </msub> <mi>X</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>1</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>X</mi> <mn>2</mn> </msub> <msup> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>2</mn> </msub> <mi>X</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>2</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>X</mi> <mi>n</mi> </msub> <msup> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mi>n</mi> </msub> <mi>X</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mi>n</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mi>y</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>

其中帽子矩阵S为:

<mrow> <mi>S</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mrow> <msub> <mi>X</mi> <mn>1</mn> </msub> <msup> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>1</mn> </msub> <mi>X</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>1</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>X</mi> <mn>2</mn> </msub> <msup> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>2</mn> </msub> <mi>X</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mn>2</mn> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>X</mi> <mi>n</mi> </msub> <msup> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mi>n</mi> </msub> <mi>X</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>X</mi> <mo>,</mo> </msup> <msub> <mi>W</mi> <mi>n</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>

X’表示X的转置,X表示GWR模型中所有特征变量的n个数据点的观测值:公式(2)中的X为:

公式(3)中的X为:

公式(4)中的X为:

公式(5)中的X为:

公式(6)中的X为:

公式(7)中的X为:

Wi为权重矩阵:

其中wij为数据观测点i与数据观测点j的权重;本专利采用高斯函数法计算权重:

wij=exp(-(dij/b)2) (19)

dij表示点(ui,vi)与点(ui,vi)之间的距离;本专利采用欧式距离计算:

<mrow> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>u</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>v</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>20</mn> <mo>)</mo> </mrow> </mrow>

b表示最优带宽,本专利采用CV法求最优带宽,

<mrow> <mi>C</mi> <mi>V</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>&lsqb;</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>&NotEqual;</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>b</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>21</mn> <mo>)</mo> </mrow> </mrow>

表示在回归参数估计时不包含该点本身;设置b取值范围为(0,max(dij)),当CV最小时,b对应的值即为最优带宽。

6.根据权利要求5所述的基于AIC的逐步特征变量选择方法,其特征在于,步骤4中的AICc为:

AICc=min(AICGWRu1,AICGWRu2,...,AICGWRuk) (22);

步骤8中的AICc为:

AICc=min(AICGWRs1,AICGWRs2,...,AICGWRsm) (23)。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1