本发明涉及一种频谱熵预测方法及系统。
背景技术:
随着无线通信的蓬勃发展,无线通信及其应用已经深入到人们生活的各个方面。尤其是近几年来,以智能手机为中心,移动互联网、车载网络、可穿戴设备、智能家居和物联网等新兴技术和产业开始爆发,使得不同形式的无线产品和业务大量兴起。每种无线产品或者业务都需要利用一定的频谱资源完成通信,然而这些可通信频段大都集中在非授权频段,造成部分非授权频段趋近饱和,甚至过负载状态,因此对新的频段进行扩展的需求迫在眉睫。
人们对无线频谱的需求日益增加,但是可用的未授权频谱却越来越少,无线频谱资源短缺问题日益凸显,可用频谱资源将被分配完毕已经成为业界的共识。相反,授权频段资源丰富且多数情况下频谱利用率较低。因此,研究人员提出了认知无线电技术,允许非授权用户发现空闲授权频段,并采用动态频谱接入方法利用这些空闲频段通信,减少频谱资源的浪费,从而提高频谱利用率,解决频谱资源稀缺的问题。
在实际通信中,空闲频段是不断变化的,非授权用户需要不断地寻找空闲频段。因此,目前研究人员主要研究如何尽可能准确地预测空闲频段,以用于非授权用户通信。这样虽然帮助非授权用户提前寻找到空闲频谱,但若空闲频段切换过于频繁,将导致非授权用户在通信时传输时延和数据包丢失较为严重,影响通信质量。可见,仅仅预测到空闲频段,并不能保证非授权通信质量良好。在此基础上,仍需预测频谱利用平稳的频段,这样的频段才是相对适合非授权用户通信且可获得良好通信质量的频段。因此,目前亟需一种针对频谱利用的平稳程度——频谱熵进行预测的方法或者系统,来预测频谱利用的平稳程度。
技术实现要素:
有鉴于此,有必要提供一种频谱熵预测方法及系统,其能够预测频谱利用平稳的频段,且具有较高预测准确率。
本发明提供一种频谱熵预测方法,该方法包括如下步骤:a.利用自相关函数分析得到频谱熵数据特征;b.根据上述得到的频谱熵数据特征,从所述频谱熵数据中选择主训练特征集合x';c.对主训练特征集合x'进行特征重要性排序,得到特征集合s;d.对所述特征集合s进行特征降维,得到最优特征集合sbest;e.根据最优特征集合sbest和预测值y构造线性回归函数,得到预测器;f.对待预测特征向量进行筛选,并将筛选后的待预测特征向量输入所述预测器得到预测结果。
具体地,所述频谱熵数据为一个离散向量序列x(n),所述自相关函数用rxx(τ)表示,具体为:
其中,n=0,1,2,...,n-1。
具体地,所述步骤c具体采用最大相关最小冗余方法对主训练特征集合x'进行特征重要性排序。
具体地,所述步骤c具体包括:
当m=0时,特征集合s为空集,采用公式:
从主训练特征集合x'中选择与预测值y最相关的特征向量x'1放入特征集合s,其中,i(·)表示互信息函数,j=1,2,…,24;
当m≥1时,采用公式:
在主训练特征集合x'中剩余的特征向量中寻找第m+1个特征放入sm中,其中,x'-sm表示x'中去除sm中的特征向量后剩余的特征向量,
具体地,所述步骤d具体包括:采用svr方法构造训练模型,选择预测误差msek值最小时对应的特征tk为最优特征集合sbest。
本发明还提供一种频谱熵预测系统,包括分析模块、选择模块、排序模块、降维模块、构造模块及预测模块,其中:所述分析模块用于利用自相关函数分析得到频谱熵数据特征;所述选择模块用于根据上述得到的频谱熵数据特征,从所述频谱熵数据中选择主训练特征集合x';所述排序模块用于对主训练特征集合x'进行特征重要性排序,得到特征集合s;所述降维模块用于对所述特征集合s进行特征降维,得到最优特征集合sbest;所述构造模块用于根据最优特征集合sbest和预测值y构造线性回归函数,得到预测器;所述预测模块用于对待预测特征向量进行筛选,并将筛选后的待预测特征向量输入所述预测器得到预测结果。
具体地,所述频谱熵数据为一个离散向量序列x(n),所述自相关函数用rxx(τ)表示,具体为:
其中,n=0,1,2,...,n-1。
具体地,所述排序模块具体采用最大相关最小冗余方法对主训练特征集合x'进行特征重要性排序。
具体地,所述排序模块具体用于:
当m=0时,特征集合s为空集,采用公式:
从主训练特征集合x'中选择与预测值y最相关的特征向量x1放入特征集合s,其中,i(·)表示互信息函数,j=1,2,…,24;
当m≥1时,采用公式:
在主训练特征集合x'中剩余的特征向量中寻找第m+1个特征放入sm中,其中,x'-sm表示x'中去除sm中的特征向量后剩余的特征向量,
具体地,所述降维模块具体用于:采用svr方法构造训练模型,选择预测误差msek值最小时对应的特征tk为最优特征集合sbest。
本发明利用自相关函数分析得到频谱熵数据特征;根据上述得到的频谱熵数据特征,从所述频谱熵数据中选择主训练特征集合x';对主训练特征集合x'进行特征重要性排序,得到特征集合s;对所述特征集合s进行特征降维,得到最优特征集合sbest;根据最优特征集合sbest和预测值y构造线性回归函数,得到预测器;对待预测特征向量进行筛选,并将筛选后的待预测特征向量输入所述预测器得到预测结果。因此本发明能够预测频谱利用平稳的频段,并具有较高预测准确率。且相对于传统时间序列预测方法,本发明增加了特征选择,提高了预测精度。
附图说明
图1为本发明频谱熵预测方法的流程图;
图2为利用自相关函数分析随机选择一个信道的自相关图
图3为本发明频谱熵预测系统的硬件架构图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细的说明。
参阅图1所示,是本发明频谱熵预测方法较佳实施例的作业流程图。
步骤s1,利用自相关函数分析得到频谱熵数据特征。其中,所述频谱熵数据为一个离散向量序列x(n)。具体而言:
对于上述离散向量序列x(n),其自相关函数rxx(τ)为:
其中,n=0,1,2,...,n-1。
图2是利用自相关函数分析随机选择的950mhz频段一个信道的自相关图。根据频谱熵的自相关图可知,频谱熵具有较强的自相关性,并且发现时间序列每延迟24个时间点,自相关值达到局部最大值。说明频谱熵具有周期相关性,周期为24。
步骤s2,根据上述得到的频谱熵数据特征,从所述频谱熵数据中选择主训练特征集合x'。具体包括:
设输入样本数据集为y和x,其中y为预测值,x为所有的特征向量,x为m维向量x={x1,x2,x3,…,xi,…,xm},其中,每个元素xi表示一个特征向量,xi∈r,i=1,2,3,...,m。
根据上述频谱熵数据特征的分析可知频谱熵数据的周期为24,因此选择频谱熵数据的前24维数据作为主训练特征集合,预测第25维数据。则主训练特征集合为x'={x1,x2,x3,…,x24}。
步骤s3,对主训练特征集合x'进行特征重要性排序,得到特征集合s。
最大相关最小冗余(minimumredundancymaximumrelevance,mrmr)方法可以最大化保留预测特征向量的信息,同时使特征之间的相关性最小化。这样得到的特征可以更好的描述预测特征向量,使得到的预测器具有较好的推广性。因此,本实施例采用mrmr方法对主训练特征集合x'进行特征重要性排序,将排序好的特征放入特征集合s中,并将排序好的特征向量在x'中的位置放入l中。具体排序方法如下所述:
设特征集合s中含有已经排序好的m个特征向量,此时s表示为sm,sm={x'1,x'2,…,x'm}。所述m个特征向量在x'中的位置为lm={l1,l2,…,lm}。
(1)当m=0,表示特征集合s中没有已经排序好的特征向量,此时特征集合s为空集。这时需要从x'中选择与预测值y最相关的特征向
量x1放入特征集合s中,具体计算过程如下述公式所示:
其中,i(·)表示互信息函数,j=1,2,…,24。
具体含义是:x'中特征向量与y的互信息值最大时的特征向量xj为x'1,此时l1=j。
(2)当m≥1时,需要在x'中剩余的特征向量中寻找第m+1个特征放入sm中,具体计算过程如下述公式所示:
其中,x'-sm表示x'中去除sm中的特征向量后剩余的特征向量。
具体含义表示在x'剩余的特征向量中寻找与预测值y最相关的特征向量xj,并且xj与已经排序好的特征向量集合sm的冗余度最小。此时lm+1=j。
步骤s4,对所述特征集合s进行特征降维,得到最优特征集合sbest。具体而言:
所述最优特征集合sbest用于训练预测器。svr(supportvectorregression,支持向量回归)方法就是通过线性拟合得到一个线性回归函数f(x),每个输入样本通过该函数得到该样本的输出值并与输入样本所对应的目标值进行对比,使得两者之间误差在一个较小的范围内。因此,本实施例基于svr方法构造训练模型,选择最优特征集合sbest。
设训练特征集合含k个特征,用tk表示,tk={x'1,x'2,…,x'k}。其中:tk∈s,k=1,2,…,24。
(1)当训练特征集合包含一维特征时,t1=x′1,设样本数据集中y={y1,y2,y3,...,yi...,yn},x′1={x′11,x′12,x′13,...,x′1i...,x′1n},x′1∈rn*1,n为预测值y中包含的预测值个数。
利用svr方法并根据输入样本(t1,y),建立线性回归函数
(2)增加训练特征集合的维度,t2={x′1,x'2},按照步骤(1)对t2进行训练,并得到预测误差mse2。以此类推,每次对训练特征集合增加一维特征,对增加特征后的训练特征集合进行训练,并得到预测误差。例如当前的训练特征集合为tk-1,增加一维特征后为训练特征集合tk,按照步骤(1)的方法对tk进行训练,并得到预测误差msek。当k>24时,结束训练过程。
(3)根据预测误差msek,k=1,2,…,24。,选择msek值最小时对应的特征tk为最优特征集合sbest。
步骤s5,根据最优特征集合sbest和预测值y构造线性回归函数,得到预测器。具体而言:
利用svr方法,根据得到的最优特征集合sbest和预测值y构造线性回归函数
步骤s6,对待预测特征向量进行筛选,并将筛选后的待预测特征向量输入所述预测器得到预测结果。具体而言:
由于训练预测器时,选择的最优特征集合sbest的顺序相对于输入样本数据集x中的特征向量的顺序已经发生了变化。因此需要对待预测特征向量进行筛选,使筛选后的特征向量的顺序与sbest中特征向量的顺序相同,否则可能会严重影响预测结果,产生较大的预测误差。
采用的方法是:根据最优特征集合sbest可知,最优特征向量的个数是k。根据特征重要性排序中的l可知,前k个特征向量在x中的位置。因此待预测特征向量根据l中前k个位置对应的特征向量进行筛选,然后对筛选后的特征向量进行预测。在训练预测器阶段可知预测器模型为
参阅图3所示,是本发明频谱熵预测系统10的硬件架构图。该系统包括分析模块101、选择模块102、排序模块103、降维模块104、构造模块105及预测模块106。
所述分析模块101用于利用自相关函数分析得到频谱熵数据特征。其中,所述频谱熵数据为一个离散向量序列x(n)。具体而言:
对于上述离散向量序列x(n),其自相关函数rxx(τ)为:
其中,n=0,1,2,...,n-1。
图2是分析模块101利用自相关函数,分析随机选择的950mhz频段一个信道的自相关图。根据频谱熵的自相关图可知,频谱熵具有较强的自相关性,并且发现时间序列每延迟24个时间点,自相关值达到局部最大值。说明频谱熵具有周期相关性,周期为24。
所述选择模块102用于根据上述得到的频谱熵数据特征,从所述频谱熵数据中选择主训练特征集合x'。具体包括:
设输入样本数据集为y和x,其中y为预测值,x为所有的特征向量,x为m维向量x={x1,x2,x3,…,xi,…,xm},其中,每个元素xi表示一个特征向量,xi∈r,i=1,2,3,...,m。
根据上述频谱熵数据特征的分析可知频谱熵数据的周期为24,因此选择模块102选择频谱熵数据的前24维数据作为主训练特征集合,预测第25维数据。则主训练特征集合为x'={x1,x2,x3,…,x24}。
所述排序模块103用于对主训练特征集合x'进行特征重要性排序,得到特征集合s。
最大相关最小冗余(minimumredundancymaximumrelevance,mrmr)方法可以最大化保留预测特征向量的信息,同时使特征之间的相关性最小化。这样得到的特征可以更好的描述预测特征向量,使得到的预测器具有较好的推广性。因此,本实施例采用mrmr方法对主训练特征集合x'进行特征重要性排序,将排序好的特征放入特征集合s中,并将排序好的特征向量在x'中的位置放入l中。所述排序模块103的具体排序过程如下所述:
设特征集合s中含有已经排序好的m个特征向量,此时s表示为sm,sm={x'1,x'2,…,x'm}。所述m个特征向量在x'中的位置为lm={l1,l2,…,lm}。
(1)当m=0,表示特征集合s中没有已经排序好的特征向量,此时特征集合s为空集。这时需要从x'中选择与预测值y最相关的特征向
量x1放入特征集合s中,具体计算过程如下述公式所示:
其中,i(·)表示互信息函数,j=1,2,…,24。
具体含义是:x'中特征向量与y的互信息值最大时的特征向量xj为x′1,此时l1=j。
(2)当m≥1时,需要在x'中剩余的特征向量中寻找第m+1个特征放入sm中,具体计算过程如下述公式所示:
其中,x'-sm表示x'中去除sm中的特征向量后剩余的特征向量。
具体含义表示在x'剩余的特征向量中寻找与预测值y最相关的特征向量xj,并且xj与已经排序好的特征向量集合sm的冗余度最小。此时lm+1=j。
所述降维模块104用于对所述特征集合s进行特征降维,得到最优特征集合sbest。具体而言:
所述最优特征集合sbest用于训练预测器。svr(supportvectorregression,支持向量回归)方法就是通过线性拟合得到一个线性回归函数f(x),每个输入样本通过该函数得到该样本的输出值并与输入样本所对应的目标值进行对比,使得两者之间误差在一个较小的范围内。因此,本实施例基于svr方法构造训练模型,选择最优特征集合sbest。
设训练特征集合含k个特征,用tk表示,tk={x'1,x'2,…,x'k}。其中:tk∈s,k=1,2,…,24。
(1)当训练特征集合包含一维特征时,t1=x′1,设样本数据集中y={y1,y2,y3,...,yi...,yn},x′1={x′11,x′12,x′13,...,x′1i...,x′1n},x′1∈rn*1,n为预测值y中包含的预测值个数。
利用svr方法并根据输入样本(t1,y),建立线性回归函数
(2)增加训练特征集合的维度,t2={x′1,x'2},按照步骤(1)对t2进行训练,并得到预测误差mse2。以此类推,每次对训练特征集合增加一维特征,对增加特征后的训练特征集合进行训练,并得到预测误差。例如当前的训练特征集合为tk-1,增加一维特征后为训练特征集合tk,按照步骤(1)的方法对tk进行训练,并得到预测误差msek。当k>24时,结束训练过程。
(3)根据预测误差msek,k=1,2,…,24。,选择msek值最小时对应的特征tk为最优特征集合sbest。
所述构造模块105用于根据最优特征集合sbest和预测值y构造线性回归函数,得到预测器。具体而言:
利用svr方法,根据得到的最优特征集合sbest和预测值y构造线性回归函数
所述预测模块106用于对待预测特征向量进行筛选,并将筛选后的待预测特征向量输入所述预测器得到预测结果。具体而言:
由于训练预测器时,选择的最优特征集合sbest的顺序相对于输入样本数据集x中的特征向量的顺序已经发生了变化。因此需要对待预测特征向量进行筛选,使筛选后的特征向量的顺序与sbest中特征向量的顺序相同,否则可能会严重影响预测结果,产生较大的预测误差。
采用的方法是:根据最优特征集合sbest可知,最优特征向量的个数是k。根据特征重要性排序中的l可知,前k个特征向量在x中的位置。因此待预测特征向量根据l中前k个位置对应的特征向量进行筛选,然后对筛选后的特征向量进行预测。在训练预测器阶段可知预测器模型为
本发明采用频谱熵衡量频谱利用的平稳程度的角度,设计预测频谱熵的方法。本发明主要结合使用了最大相关最小冗余特征选择方法和支持向量回归方法,一方面通过最大相关最小冗余特征选择方法对序列相关性进行分析,并选择对预测贡献最大的时延点作为特征;另一方面使用支持向量回归方法对筛选出来的特征进行训练,选择出最优特征并实现频谱熵预测。
虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。