本发明涉及物理层信道认证,尤其是基于机器学习的物理层信道认证。
背景技术:
在未来无线通信系统中,微型终端设备涌入到无线网络中的数量将会成指数倍增长。微型终端在接入无线网络过程中,需要建立安全接入认证等安全措施。但是,目前,传统接入认证主要是基于密码技术,微型终端设备是多种多样的,有的很单一,比如可穿戴设备、简易的物联网终端等无法提供复杂的计算资源,边缘计算节点具有一定的数据处理和存储能力,非对称资源之间进行接入认证难以大规模使用传统基于密码的认证方案。
物理层信道认证利用无线信道信息的空时唯一性,通过比较连续帧之间的信道信息相似性来判断用户身份信息。物理层信道认证直接利用信道信息,无需复杂的上层加密运算,具有快速、高效的优势,十分适用于资源受限的微型终端。但是,实际无线环境中物理层认证的门限难以获取和确定,从而影响了认证准确率,即使可以人工遍历门限,但是效率低下且认证准确率也低。
例如,二元假设法对物理层进行认证的方案如下:设接收机b已经认证了第k个数据帧的来源于合法信息发送者a,提取的信道信息是
零假设
备择假设
保证连续数据帧之间的最大时间差在相干时间以内是认证进行的前提。
受噪声和ici的影响,以及信道估计算法本身的估计误差,实际得到的信道信息的估计值
其中,nk和nk+1同为独立同分布的复高斯噪声,并且服从n(0,σ2)分布。所以,直接运用信道信息进行假设检验,需要考虑噪声变量影响,增加认证复杂度。由于nk和nk+1具有同样的统计特性,信道信息的“差值”可以消除噪声变量的影响。物理层认证转化成了信道信息“差值”和设定的门限值之间的比较,上式可以表示为:
零假设
备择假设
上式中可以看出,物理层认证实际就是信道信息“差值”和认证门限之间的比较,所以信道信息“差值”和认证门限是物理层认证的关键所在。
检验统计量t可以计算信道信息“差值”,最常见的检验统计量为基于幅度的检验统计量τa,在ofdm系统中,子载波幅度间存在差异,这种差异可以用来对通信者身份进行认证。连续两个数据帧信道信息为
其中
基于幅度的检验统计量τa可以表示为:
其中,σ2为噪声功率,ηa为τa对应的门限值。但是,τa的呈现非随机分布,门限值ηa难以确定,从而影响了认证准确率。
近些年,一些学者研究运用机器学习来解决上述问题。在机器学习领域,自适应增强(adaptiveboosting)算法是1995年由freund和schapire提出的,最具有代表性的提升方法之一,其旨在分类问题中,通过改变训练样本的权重,学习多个分类器,并将这些弱分类器组合形成强分类器,该算法泛化错误率低,易编码,可以用在大部分分类器上,无需参数调整,具有很高的精度,常常被用在二分类和多分类场景中。
技术实现要素:
本发明的目的在于克服现有技术的不足,提供一种基于机器学习的物理层信道认证方法,首先通过对已知合法信息发送者a和模拟非法信息发送者e的信道信息进行采集,并对采集到的信道信息进行预处理,形成二分类的训练集,基于机器学习中分类算法建立的模型对训练集进行训练,得到分类器,接收机b利用分类器对收到的信息包进行是合法者还是非法者的判断,以实现对信息包的认证,得到检测率,在检测率达到规定要求条件下,生成可用分类器,再进行物理层信道认证,具有计算复杂度低、认证准确率高的优势。
本发明的目的是通过以下技术方案来实现的:一种基于机器学习的物理层信道认证方法,包括以下步骤:
s1.接收机b对合法信息发送者a和模拟非法信息发送者e进行信息包的信道信息(csi)采集:
接收机b对合法信息发送者a的信息包的信道信息进行采集,得到包含连续n帧采集结果的数据集
s2.接收机b对数据集
计算数据集
s3.接收机b生成二分类的训练数据集:
将合法信息发送者a和非法者e的训练集
即yi=+1时,表示该数据来自合法信息发送者a;则yi=-1时,表示该数据来自模拟非法者e;
s4.接收机b采用机器学习算法中的分类算法,根据二分类的训练数据集t进行训练,生成分类器;
s5.接收机b利用分类器对测试集
s6.接收机b利用达到要求的分类器对新接收到的信息包进行物理层信道认证。
其中,所述步骤s1包括合法信息发送者a数据集采集步骤和模拟非法信息发送者e数据集采集步骤;
所述合法信息发送者a数据集采集步骤包括:
合法信息发送者a向接收机b发送连续的n个数据帧;接收机b接收到来自合法信息发送者a的第一个数据帧后,提取合法信息发送者a到接收机b的信道信息
所述模拟非法信息发送者e数据集采集步骤:
模拟非法信息发送者e向接收机b发送连续的n个数据帧;接收机b接收到来自模拟非法信息发送者e的第一个数据帧后,提取模拟非法信息发送者e到接收机b的信道信息
进一步地,所述步骤s1中,提取的信道信息都需要在相干时间内,否则认为信道信息不具有相关性。
进一步地,所述步骤s2中,检验统计量是用来衡量信道信息相似度的方法,包括但不限于基于幅度的检验统计量、基于幅度和相位联合的检验统计量,以及基于矫正相位偏移的检验统计量等。
进一步地,所述步骤s3中,划分到训练集
n/2<t<n-1;
并且从tab中划分到训练集
进一步地,所述步骤s4中,所述机器学习算法中的分类算法包括但不限于k-近邻算法、朴素贝叶斯算法、svm算法和决策树算法;
进一步地,所述步骤s4中,步骤s4或步骤s5中所述的分类器包括但不限于adaboost分类器,、bagging分类器和boosting分类器等。
进一步地,所述步骤s5包括:
将测试集
t2(n-1-t)={(x1,y1),…,(xk,yk),…,(x2(n-1-t),y2(n-1-t)},k=1,…,l,…,2(n-1-t)
将t2(n-1-t)中的数据xk依次输入到分类器中,得到分类器输出的yk值,若输出的yk值为-1判断为模拟非法信息发送者e,若输出的yk值为+1判断为合法信息发送者a;
统计数据集t2(n-1-t)中的数据总量2(n-1-t)和分类器判断正确的数据量k1,据此计算分类器的检测率α=k1/2(n-1-t),作为判断分类器性能的依据:
若检测率α达不到规定要求(设定阈值),重新从s1开始,进一步收集合法者和模拟非法者的信道信息数据,重复s2-s5的训练,直到检测率α达到规定要求;
进一步地,所述步骤s6包括:
接收机b接收未知发送者的信息包
本发明的有益效果是:本发明对合法信息发送者a和模拟非法信息发送者e的信道信息进行采集,并对采集到的信道信息进行预处理,形成二分类的数据集,将二分类的数据集分成训练集和测试集,基于机器学习中分类算法建立的模型对训练集进行训练,得到分类器,再利用测试集对该分类器的性能进行测试,最终输出判定结果,一直循环得到达标检测率后,利用达标的分类器对未知接入者信息包进行物理层信道认证。适用于资源受限的认证设备和场景,具有计算复杂度低、认证准确率高的优势。
附图说明
图1为基于机器学习算法的物理层认证方法流程图;
图2为合法信息发送者a与模拟非法信息发送者e的归一化检验统计量τa的散点图;
图3为基于人工遍历门限的检测率曲线图。
图4为基于机器学习和人工遍历的检测率对比图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
本发明在具有多个非法节点和合法节点的实际环境中实施,首先接收机b对合法信息发送者a和模拟非法信息发送者e进行信息包的信道信息(csi)采集,保证连续数据帧之间的最大时间差在相干时间以内,生成的分类器以adaboost分类器为例。
如图1所示,一种基于机器学习的物理层信道认证方法,包括以下步骤:
s1.接收机b对合法信息发送者a和模拟非法信息发送者e进行信息包的信道信息(csi)采集:
接收机b对合法信息发送者a的信息包的信道信息进行采集,得到包含连续n帧采集结果的数据集
s2.接收机b对数据集
计算数据集
s3.接收机b生成二分类的训练数据集:
将合法信息发送者a和非法者e的训练集
即yi=+1时,表示该数据来自合法信息发送者a;则yi=-1时,表示该数据来自模拟非法者e;
s4.接收机b采用机器学习算法中的分类算法,根据二分类的训练数据集t进行训练,生成分类器;
s5.接收机b利用分类器对测试集
s6.接收机b利用达到要求的分类器对新接收到的信息包进行物理层信道认证。
所述步骤s1包括合法信息发送者a数据集采集步骤和模拟非法信息发送者e数据集采集步骤;
所述合法信息发送者a数据集采集步骤包括:
合法信息发送者a向接收机b发送连续的n个数据帧;接收机b接收到来自合法信息发送者a的第一个数据帧后,提取合法信息发送者a到接收机b的信道信息
所述模拟非法信息发送者e数据集采集步骤:
模拟非法信息发送者e向接收机b发送连续的n个数据帧,接收机b接收到来自模拟非法信息发送者e的第一个数据帧后,提取模拟非法信息发送者e到接收机b的信道信息
所述机器学习算法中的分类算法包括但不限于k-近邻算法、朴素贝叶斯算法、svm算法和决策树算法。
在本专利的实施例中,步骤s4生成分类器的过程如下:接收机b采用adaboost算法,结合弱分类器,生成adaboost分类器(即强分类器),具体地:
第一步,输入训练数据集t={(x1,y1),(x2,y2),...,(x2t,y2t)};
第二步,初始化训练数据的权值分布d1=(w11,…,w1i,…,w1,t),
第三步,对m=1,2,…,m
(1)使用具有权值分布dm的训练数据集学习,得到基本分类器,即弱分类器;
gm(x):xi→{-1,+1}
(2)计算gm(x)在训练数据集上的分类误差率:
(3)计算gm(x)的系数:
这里的对数是自然对数;
(4)更新训练数据集的权值分布
dm+1=(wm+1,1,…,wm+1,i,…,wm+1,2t),
这里,zm是规范化因子,它使dm+1成为一个概率分布:
第四步,构建基本分类器的线性组合:
得到最终分类器:
g(x)=sign(f(x))。
在上述步骤中,利用adaboost算法反复学习基本分类器,在每一轮顺序地执行第三步、第四步的系数计算方法,包括但不限于指数、损失函数等,即可得到最终的adaboost分类器g(x)(强分类器)。
在本申请的实施例中,所述步骤s5包括:
将测试集
t2(n-1-t)={(x1,y1),…,(xk,yk),…,(x2(n-1-t),y2(n-1-t))},k=1,…,l,…,2(n-1-t)
将t2(n-1-t)中的数据xk依次输入到分类器g(x)中,得到分类器g(x)输出的yk值,若输出的yk值为-1判断为模拟非法信息发送者e,若输出的yk值为+1判断为合法信息发送者a;
统计数据集t2(n-1-t)中的数据总量2(n-1-t)和分类器g(x)判断正确的数据量k1,据此计算分类器的检测率α=k1/2(n-1-t),作为判断分类器性能的依据:
若检测率α达不到规定要求,重新从s1开始,进一步收集合法者和模拟非法者的信道信息数据,重复s2-s5的训练,直到检测率α达到规定要求;
在本申请的实施例中,所述步骤s6包括:接收机b接收未知发送者的信息包
例如:接收机b接收身份未知对象的接入请求时,可以利用达到规定要求的分类器g(x)判断该对象的合法性:具体地,接收机b接收来自该对象的连续两帧数据(此时m=2),并提取这两帧数据中包含的信道信息,再根据提取的信道信息计算两帧数据的信道信息差值,将该差值输入到分类器g(x),分类器得到输入的y值,若输出为-1判断该身份未知对象为非法者,接收机b拒绝该对象接入,若输出为+1判断身份未知对象为合法者,接收机b允许该对象接入。
利用传统方法进行信道认证时,由于实际信道信息未知,无法确定门限,从而影响认证准确率,如图2所示,为合法信息发送者a和模拟非法信息发送者e的归一化检验统计量τa的散点图,从图中我们看到:模拟非法信息发送者e和合法信息发送者a的归一化τa值存在交错,意味着无法使用一个门限值将它们准确分开;即使通过人工遍历门限,也存在效率低、认证准确率低的问题,如图3所示,将门限在[0,1]之间遍历,得到准确分类的检测率最高也只有79.8%。而本申请采用机器学习算法训练二分类数据集t,可以得到检测率为89.7%,基于机器学习和人工遍历的检测率对比图如图4所示,可见相对于人工遍历门限,采用基于机器学习方法得到的认证模型具有较高的认证准确率;机器学习实际广泛应用于二分类或多分类场景中,当设备接入时,采用基于机器学习的物理层认证模型能快速的判定身份合法,是否允许接入网络,完全能实现低时延,实时接入认证。
综上,本发明对合法信息发送者a和模拟非法信息发送者e的信道信息进行采集,并对采集到的信道信息进行预处理,形成二分类的数据集,将二分类的数据集分成训练集和测试集,基于机器学习中分类算法建立的模型对训练集进行训练,得到分类器,再利用测试集对该分类器的性能进行测试,最终输出判定结果,一直循环得到达标检测率后,利用达标的分类器对未知接入者信息包进行物理层信道认证。适用于资源受限的认证设备和场景,具有计算复杂度低、认证准确率高的优势。
以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。