一种基于自适应图滤波器下的特征聚类方法与流程

文档序号:16037008发布日期:2018-11-24 10:09阅读:503来源:国知局

本发明属于信号处理技术领域,涉及图信号处理理论,特别涉及一种基于自适应图滤波器下的特征聚类方法。

背景技术

图信号处理(graphsignalprocessing,gsp)是当前研究非结构化数据极为有效的方式,在数据分类、压缩感知、线性预测等方面有着广泛的应用。图信号理论已经建立起一套相对完整的图信号理论,包括了图信号定义、图滤波器、图的频率定义等等。在图理论中,最早由sandryhaila等人提出用滤波器的方式将传统机器学习下数据分类问题转化为数字信号处理下(dsp)的滤波器匹配问题。在gf(graphfilter)算法下解决分类问题时,需要建立索引矩阵,构成图的邻接矩阵为全连接阵。然而在该方法下,需要图是无向实域图(undirectedrealgraph),并且需保证边的权重(weightededge)为正值。因此,在构图过程中,有大量计算资源的需求。而且由于滤波器抽头数在一开始被限定,也降低了优化匹配速度。图信号下的分类问题是一个复杂的问题。因为图信号的建立过程不同,因此噪声环境也复杂不一。在gf(graphfilter)算法下,对这一类存在噪声的图信号分类效果不是很出色。



技术实现要素:

本发明的目的,在于提供一种基于自适应图滤波器下的特征聚类方法,其可增强对先验知识的利用,构建新的图信号权重边。

为了达成上述目的,本发明的解决方案是:

一种基于自适应图滤波器下的特征聚类方法,包括如下步骤:

步骤1,特征数据规范化,同一维度的特征要求单位化;

步骤2,特征数据标签记录,提供一定量的先验知识;

步骤3,构建基于数据源的图信号,将数据映射到数据结构图上,获取初始图信号s(known)

步骤4,全变分平滑滤波,获得降噪后的图信号s(true)

步骤5,图滤波器自匹配,获得抽头数组h;

步骤6,全局滤波,获得分类结果s(pred)

上述步骤2的具体过程是:从特征数据中随机抽取一定量的样本,并赋予一定的标签值,正例赋+1,负例赋-1,其余位被选中的特征数据赋0。

上述步骤3的具体过程是:

步骤3.1,假设数据数量为n,每条特征为l×k的信息矩阵;索引图g=(a,v),将数据源中每一个独立数据直接映射为独立的图顶点,其顶点组成顶点集合v;

步骤3.2,ui表示图信号上顶点i的信息矩阵(l×k),dnm表示图信号中顶点n和顶点m数据之间的特征距离,有如下定义:

dnm=‖un-um‖f

其中,un、um分别表示图信号上顶点n、m的信息矩阵;

从v1开始遍历到vn,对每个点运用k近邻搜索算法,得到顶点的近邻集;

步骤3.3,a是n×n的邻接矩阵,an,m≧0,满足如下条件:

a·1n=1n

其中,1n表示全1的列向量,dnm表示的是图信号中顶点n处的数据信息和顶点m处的空间距离,对a有如下定义:

其中,分别表示顶点vn、vm的近邻集,dnk、dml分别表示图信号中顶点n和顶点k、顶点m和顶点l数据之间的特征距离;

步骤3.4,图信号的数字形式如下:

上式中,si的值就是步骤2中赋给顶点的标签,至此,依托于图g的图信号s构建完成。

上述步骤3.2中,采用的是frobenius范数,定义如下:假设m为m×n的矩阵,则其frobenius范数为:

其中,mij表示m第i行第j列元素。

上述步骤4中,图信号理论下的全变分理论,其定义如下;

其中,s代表输入的图信号,a是图信号s的底层图的邻接矩阵,λmax表示邻接矩阵a的最大特征值;

在初始图信号上,利用优化求解:

s(true)=argmintvg(s)。

上述步骤5的具体过程是:

步骤5.1,定义图信号t,其满足如下条件:第一,图信号t和图信号s(true)均可以用同一个索引图g=(a,v)来表征;第二,图信号t中包含的非零标签是从图信号s(true)中非零标签中随机选取的已知子集,切图信号t中的非零子集的长度是图信号s(true)中的80%;

步骤5.2,将图信号t通过基本元滤波器:

hbase=e+hia

其中,hi表示第i节图滤波器的抽头系数,e表示n维单位矩阵;

得到生成标签:

对满足以下条件中的已知标签做出修正:

其中,tn代表第n次滤波输入的图信号结果,相对应的对应第n次通过基本元图滤波输出的结果;

在滤波过程中,通过调整hi的值,使得需调整的标签量最少;

步骤5.3,将的结果赋值给t,重复步骤5.2,直到滤波器抽头hi收敛;

步骤5.4,至此,分类滤波器匹配完成,得到下式:

h(a)=(1n+hpa)(1n+hp-1a)…(1n+h1a)。

上述步骤6中,利用下式获得分类结果s(pred)

s(pred)=s(true)h(a)。

采用上述方案后,本发明利用贪婪算法,逐步最优原则使得抽头h1逐渐收敛;利用图信号处理下的全变分理论在初始图信号上做平滑滤波,降低噪声影响,增强对先验知识的利用,构建新的图信号权重边,该优化问题满足凸优化条件。与现有的图理论下的聚类方法相比,本发明能更好的已知噪声影响,具有更高的识别率和鲁棒性。

附图说明

图1是本发明的流程图;

图2是图信号的样例结构图像;

图3是图滤波器的设计框图;

图4是本发明方法和其他方法在mnist数据集上的性能对比;

图5是brainweb30%先验量下的分割对比;

其中,(a)是truthimage,(b)是本发明方法的分割结果。

具体实施方式

以下将结合附图,对本发明的技术方案及有益效果进行详细说明。

如图1所示,本发明提供一种基于自适应图滤波器下的特征聚类方法,包括如下步骤:

1)特征数据规范化,同一维度的特征要求单位化;

2)特征数据标签记录,提供一定量的先验知识;

具体过程是:从特征数据中随机抽取一定量的样本,并赋予一定的标签值(正例赋+1,负例赋-1),其余位被选中的特征数据赋0;

3)构建基于数据源的图信号,将数据映射到数据结构图上,获取初始图信号s(known)

4)全变分平滑滤波,获得降噪后的图信号s(true)

5)图滤波器自匹配,获得抽头数组h;

6)全局滤波,获得分类结果s(pred)

所述步骤3)的具体过程如下:

3.1)假设数据数量为n,每条特征为l×k的信息矩阵;索引图g=(a,v),将数据源中每一个独立数据直接映射为独立的图顶点,其顶点组成顶点集合v;

3.2)ui表示图信号上顶点i的信息矩阵(l×k),dnm表示图信号中顶点n和顶点m数据之间的特征距离,有如下定义:

dnm=‖un-um‖f

上式中采用的是frobenius范数,定义如下:假设m为m×n的矩阵,则其frobenius范数为:

上式mij表示m第i行第j列元素,是否采用frobenius范数,可以依据信息矩阵的实际情况做相应修改。在具体实例实验中,minist数据采用的frobenius范数,而在brainweb18数据集上采用的l2范数。

从v1开始遍历到vn,对每个点运用k近邻搜索算法,得到顶点的近邻集,如ni表示顶点vi的近邻集合;

3.3)a是n×n的邻接矩阵,an,m≧0,满足如下条件:

a·1n=1n

在本实施例中,1n表示全1的列向量,dnm表示的是图信号中顶点n处的数据信息和顶点m处的空间距离,对a有如下定义:

3.4)图信号的数字形式如下:

上式中,si的值就是步骤2)中赋给顶点的值(标签),至此,依托于图g的图信号s构建完成,如图2。

所述步骤4)中,图信号理论下的全变分理论,其定义如下;

上式s代表输入的图信号,a是图信号s的底层图的邻接矩阵,λmax表示邻接矩阵a的最大特征值。

在初始图信号上,利用优化求解:

s(true)=argmintvg(s)

所述步骤5)的具体过程如下:

5.1)定义图信号t,其满足如下条件:(1)图信号t和图信号s(true)均可以用同一个索引图g=(a,v)来表征;(2)图信号t中包含的非零标签是从图信号s(true)中非零标签中随机选取的已知子集,切图信号t中的非零子集的长度是图信号s(true)中的80%;

5.2)将图信号t通过基本元滤波器,其定义如下:

hbase=e+hia

上式hi表示第i节图滤波器的抽头系数,e表示n维单位矩阵;

可以得到生成标签

对满足以下条件中的已知标签做出修正:

上式tn代表第n次滤波输入的图信号结果,相对应的对应第n次通过基本元图滤波输出的结果,在滤波过程中,通过调整hi的值,使得需调整的标签量最少;

5.3)将的结果赋值给tn+1,重复步骤5.2),直到滤波器抽头hi收敛;

5.4)至此,分类滤波器如图3已经匹配完成,可组合成下式:

h(a)=(1n+hpa)(1n+hp-1a)…(1n+h1a)

应当注意的是,本方法和gf算法不同的是,gf算法是全局优化问题,在匹配之前需要固定滤波器长度,需要人为观察结果是否收敛,而在本算法中,依据贪婪算法,是逐步最有原则。而且在处理噪声时,不需要对原始数据做额外的预处理,只需要通过平滑滤波即可。

所述步骤6)中,依据步骤5.4)中所得的分类图滤波器h(a),获得分类结果s(pred)

s(pred)=s(true)h(a)

采用本发明方法基于自适应滤波的聚类方法,在mnist数据集上,在施加了0.5dbw的高斯白噪声后,本发明和其他同理论下的方法(gf算法)相比,有很明显的优势,性能对比结果如图4。在含噪声的brainweb18上,将本发明和原方法做了对比,在先验量达到30%时,效果有明显上升,如表1,聚类结果对比如图5(a)和5(b)。

表1

综合上述,本发明一种基于自适应图滤波器下的特征聚类方法,利用图信号理论,依据图数据特征与空间距离,构建基于数据源的图信号。通过图滤波器和贪婪算法,完成滤波器抽头数自适应。其中,图信号的降噪过程通过图论下的全变分理论构建的系统完成平滑滤波。在全局求解过程中,将传统机器学习下的数据分类过程转变为数字信号处理下的滤波器匹配问题,将迭代过程转变为凸优化求解问题。相比现有的基于图信号理论下的聚类方法,本发明在保证同级别的时间复杂度和空间复杂度的情况下,使得算法在噪声环境下具有更高的识别率和鲁棒性。

以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1