用于边缘计算的特征数据选择方法及边缘计算终端与流程

文档序号:30157056发布日期:2022-05-26 07:52阅读:67来源:国知局
用于边缘计算的特征数据选择方法及边缘计算终端与流程

1.本发明属于边缘计算技术领域,具体地说,是涉及一种用于边缘计算的数据特征选择方法及边缘计算终端。


背景技术:

2.边缘计算,是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务。其应用程序在边缘侧发起,产生更快的网络服务响应,满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求。边缘计算处于物理实体和工业连接之间,或处于物理实体的顶端。
3.边缘计算可以实时或更快的进行数据处理和分析,让数据处理更靠近源,而不是外部数据中心或者云,可以蒜段延迟时间;在成本预算上可以大大减轻经费预算,企业在本地设备上的数据管理解决方案所花费的成本大大低于云和数据中心网络;减少网络流量;通过降低延迟级别,应用程序可以更高效、更快速地运行,提高应用程序效率;还可以通过边缘计算持续学习,根据个人的需求调整模型,带来个性化互动体验。
4.对物联网而言,边缘计算技术取得突破,意味着许多控制将通过本地设备实现而无需交由云端,处理过程将在本地边缘计算层完成。这无疑将大大提升处理效率,减轻云端的负荷。由于更加靠近用户,还可为用户提供更快的响应,将需求在边缘端解决。
5.根据需求调研分析和基于智能终端的边缘计算技术基础框架,如图1所示,框架主要由边缘节点(ecn)和边缘节点管理器(ecn controller)组成,ecn对从智能终端采集到的数据进行预处理,主要包括目标检测、目标识别、行为分析、数据过滤等;enc controller连接多个ecn,处理任务请求,为ecn动态分配虚拟机资源,通过任务调度模块将预处理后的数据传输到远端的云中心,对数据做进一步的分析处理。从图1可以看出,ecn部分设计的数据分析过程和ecn controller部分包含的任务调度步骤都对数据的边缘处理起到至关重要的作用。
6.但由于目前待处理的数据空间维度较高而对数据的内部特征又不够了解,造成数据分析效率低、精度低;维度灾难会降低任务执行的性能,增加任务处理时间,而维度灾难最主要的原因就是高维数据中冗余特征的存在。特征选择是数据集预处理的重要方法,可以过滤掉数据中的冗余特征,降低数据维度,使数据分析与处理更加高效准确。


技术实现要素:

7.本发明的目的在于提供一种用于边缘计算的数据特征选择方法及边缘计算终端,将k近邻算法和改进的布谷鸟算法结合,利用k近邻算法评估鸟巢的优劣,利用改进的布谷鸟算法在特征空间中搜索最优特征集合来获取优化的特征提取结果,解决现有边缘计算中数据空间维度较高而对数据的内部特征不够了解的技术问题,提高了数据的分析效率和精度。
8.为解决上述技术问题,本发明采用以下技术方案予以实现:
9.提出一种用于边缘计算的特征数据选择方法,包括:
10.步骤1)初始化种群,得到x个鸟巢,每个鸟巢包括n个特征选择位;
11.步骤2)采用k近邻算法计算每个鸟巢的适应度,选择最大适应度值的鸟巢记为最优鸟巢;
12.步骤3)运用莱维飞行更新鸟巢,采用步骤2)更新最优鸟巢;
13.步骤4)将更新鸟巢进行交叉操作得到新的鸟巢,采用步骤2)更新最优鸟巢;
14.步骤5)更新被宿主发现有外来鸟蛋的鸟巢,采用步骤2)更新最优鸟巢;
15.步骤6)利用变异操作更新鸟巢,采用步骤2)更新最优鸟巢;
16.步骤7)在满足设定条件时输出最优鸟巢作为最优特征集合,否则返回步骤3);其中,所述设定条件为设置的迭代次数或特征精度。
17.进一步的,步骤2)中,采用计算每个鸟巢的适应度;其中,γr(d)为特征集合r上训练出的分类器d的分类精度,|r|是选择出来的特征集合包含的特征的数目,|c|是原始特征集合中特征总数;α和β是用来调节分类精度和特征数目两个目标函数的比重的调节参数,α∈(0,1)且β=1-α。
18.进一步的,步骤4)中,将更新鸟巢进行交叉操作得到新的鸟巢具体包括:将更新鸟巢中的鸟巢两两分组,对每组鸟巢执行以下步骤得到新的鸟巢:产生随机数,在随机数小于设定交叉概率时,随机选择一个位置,交换两个鸟巢在随机位置以后的所有基因。
19.进一步的,步骤6)中,使用变异操作继续更新鸟巢,具体包括:针对每个鸟巢产生随机数;在随机数小于设定变异概率时,随机选择一个位置,将鸟巢在随机位置的基因重新设置。
20.提出一种边缘计算终端,包括:初始种群模块,用于初始化种群,得到x个鸟巢,每个鸟巢包括n个特征选择位;k近邻计算模块,用于采用k近邻算法计算每个鸟巢的适应度,选择最大适应度值的鸟巢记为最优鸟巢;改进布谷鸟算法模块,用于运用莱维飞行更新鸟巢,调用所述k近邻计算模块更新最优鸟巢;将更新鸟巢进行交叉操作得到新的鸟巢,调用所述k近邻计算模块更新最优鸟巢;更新被宿主发现有外来鸟蛋的鸟巢,调用所述k近邻计算模块更新最优鸟巢;以及,利用变异操作更新鸟巢,调用所述k近邻计算模块更新最优鸟巢;最优特征选择模块,用于在所述改进布谷鸟算法模块的计算满足设定条件时输出最优鸟巢作为最优特征集合;其中,所述设定条件为设置的迭代次数或特征精度。
21.进一步的,所述k近邻计算模块,采用计算每个鸟巢的适应度;其中,γr(d)为特征集合r上训练出的分类器d的分类精度,|r|是选择出来的特征集合包含的特征的数目,|c|是原始特征集合中特征总数;α和β是用来调节分类精度和特征数目两个目标函数的比重的调节参数,α∈(0,1)且β=1-α。
22.进一步的,所述改进布谷鸟算法模块包括:交叉计算单元,用于将更新鸟巢进行交叉操作,具体包括:将更新鸟巢中的鸟巢两两分组,对每组鸟巢执行以下步骤得到新的鸟巢:产生随机数,在随机数小于设定交叉概率时,随机选择一个位置,交换两个鸟巢在随机位置以后的所有基因。
23.进一步的,所述改进布谷鸟算法模块包括:变异计算单元,用于使用变异操作继续
更新鸟巢,具体包括:针对每个鸟巢产生随机数;在随机数小于设定变异概率时,随机选择一个位置,将鸟巢在随机位置的基因重新设置。
24.与现有技术相比,本发明的优点和积极效果是:本发明提出的用于边缘计算的特征选择方法及边缘计算终端,将经过k近邻计算得到的特征集合作为初始最优鸟巢,把初始最优鸟巢看做搜索空间中的点,在全局搜索阶段中融入遗传算法的交叉算子,在局部搜索阶段融入了遗传算法的变异算子,结合了布谷鸟算法的强鲁棒性和收敛速度快的优点,提高了布谷鸟算法种群的多样性和搜索能力,并将k近邻算法与改进后的布谷鸟算法结合,在莱维飞行、交叉操作和变异操作之后均采用k近邻算法评估鸟巢的优劣,获取到优化的特征提取结果,解决了现有边缘计算中数据空间维度较高而对数据的内部特征不够了解的技术问题,提高了数据的分析效率和精度。
25.结合附图阅读本发明实施方式的详细描述后,本发明的其他特点和优点将变得更加清楚。
附图说明
26.图1为现有基于智能终端的边缘计算技术的基础框架;
27.图2为本发明提出的用于边缘计算的数据特征选择方法的流程图;
28.图3为本发明提出的边缘计算终端的架构图。
具体实施方式
29.下面结合附图对本发明的具体实施方式作进一步详细的说明。
30.本发明针对边缘计算中数据空间维度较高而对数据的内容特征不够了解的情况,提出一种结合k近邻算法和改进布谷鸟算法的数据特征选择方法,过滤掉边缘计算中数据的冗余特征,降低数据维度,使数据分析与处理更高效准确。
31.实施过程中,将搜索空间看做是充满各种特征集合的空间,每个特征集合看做此空间中的一个点或者位置,选取的最优鸟巢,也即最优特征集合是其中包含的被选择特征数据最小、评估标准最优的特征集合。
32.如图2所示,本发明提出的用于边缘计算的特征数据选择方法,包括:
33.步骤s21:初始化种群得到x个鸟巢。
34.每个鸟巢相当于一个特征集合,每个鸟巢包括n个特征选择位,则xi=(x1,x2,x3,...,xn),xi∈{0,1},i=1,2,...,n,xi为第i个鸟巢的位置,即第i个特征集合,xi为第i个特征的选择情况,当xi=1的时候,代表在此特征集合中选择了此特征;当xi=0的时候,代表在此特征集合中没有选择此特征。
35.例如,x4=(0,1,0,1,0,0)代表第4个特征集合中第二个、第四个特征被选择。
36.步骤s22:采用k近邻算法计算每个鸟巢的适应度,选择最大适应度值的鸟巢记为最优鸟巢。
37.根据k近邻算法,按照公式计算每个鸟巢(特征集合)的适应度,选择其中适应度值最大的鸟巢,记为最初的最优鸟巢。
38.其中,γr(d)为在特征集合r上训练出的分类器d的分类精度,|r|是选择出来的特
征集合包含的特征的数目,|c|是原始特征集合中特征总数;α和β是用来调节分类精度和特征数目两个目标函数比重的比重参数,α∈(0,1)且β=1-α。
39.步骤s23:运用莱维飞行更新鸟巢,并采用步骤s22更新最优鸟巢。
40.布谷鸟算法寻找宿主鸟巢的莱维飞行更新公式如下:
[0041][0042]
式中,i取整数,i∈[1,x],x为鸟巢个数;表示第t代的第i个鸟巢;α为步长因子,用来控制步长,α>0;l(u,v)是随机移动步长,计算公式如下:
[0043][0044]
式中,λ∈(1,3],本发明实施例中,取λ=1.5;u和v服从正态分布,如下面公式所示:
[0045][0046]
式中,
[0047]
运用莱维飞行更新鸟巢后,采用步骤s22所述的k近邻算法再次计算每个更新鸟巢的适应度,选取选择最大适应度值的鸟巢更新为最优鸟巢。
[0048]
步骤s24:将更新鸟巢进行交叉操作得到新的鸟巢,采用步骤s22更新最优鸟巢。
[0049]
将更新鸟巢中的鸟巢两两分组,对每组鸟巢执行以下步骤得到新的鸟巢:根据交叉概率pc,产生随机数c,i∈[2,m],c∈[0,1],比较c和pc,如果c<pc,则进行单点交叉操作,随机选取一个位置,交换两个鸟巢这个随机位置以后的所有基因;例如,按顺序每次选择两个鸟巢进行,依次经过两两鸟巢交叉操作,最终得到新的m个鸟巢,然后计算目标函数值,与当前最优鸟巢比较,并记录更新最优鸟巢。
[0050]
将更新鸟巢进行交叉操作得到新的鸟巢后,采用步骤s22所述的k近邻算法再次计算每个更新鸟巢的适应度,选取选择最大适应度值的鸟巢更新为最优鸟巢。
[0051]
步骤s25:更新被宿主发现有外来鸟蛋的鸟巢,采用步骤s22更新最优鸟巢。
[0052]
对被宿主发现有外来鸟蛋的鸟巢,进行更新,公式如下:
[0053][0054]
其中,h为heaviside函数,r表示每个鸟巢的每个变量被发现的概率,r∈(0,1),参数pa为外来鸟蛋被宿主发现的概率,如果r≤pa,记为h(p
a-r)=0,即鸟巢不变;如果r>pa,h(p
a-r)=1,则更新鸟巢;和分别为第t代中第x个和第y个鸟巢。
[0055]
更新被宿主发现有外来鸟蛋的鸟巢后,采用步骤s22所述的k近邻算法再次计算每个更新鸟巢的适应度,选取选择最大适应度值的鸟巢更新为最优鸟巢。
[0056]
步骤s26:利用变异操作更新鸟巢,采用步骤s22更新最优鸟巢。
[0057]
首先给出变异概率pm,针对每个鸟巢产生随机数m,m∈[0,1],比较m和pm,如果m<pm,则进行单点变异操作,随机选取一个位置,将这个鸟巢此位置上的基因进行重新设置,
这样每个鸟巢依次经过单点变异,最终得到新的x个鸟巢。
[0058]
再与当前的最优鸟巢进行比较,采用步骤s22所述的k近邻算法再次计算每个更新鸟巢的适应度,选取选择最大适应度值的鸟巢更新为最优鸟巢。
[0059]
步骤s27:在满足设定条件时输出最优鸟巢作为最优特征集合。
[0060]
设定条件例如设置的迭代次数或特征精度;在步骤s26后,判断是否满足设定条件,若满足则输出最优鸟巢作为最优特征集合,否则返回步骤s23继续迭代优化直至满足设定条件。
[0061]
基于上述提出的用于边缘计算的数据特征选择方法,本发明还提出一种边缘计算终端,如图3所示,包括初始种群模块31、k近邻计算模块32、改进布谷鸟算法模块33和最优特征选择模块34。
[0062]
初始种群模块31用于初始化种群,得到x个鸟巢,其中每个鸟巢中共有n个特征,则xi=(x1,x2,x3,...,xn),xi∈{0,1},i=1,2,...,n,xi为第i个鸟巢的位置,即第i个特征集合,xi为第i个特征的选择情况,当xi=1的时候,代表在此特征集合中选择了此特征;当xi=0的时候,代表在此特征集合中没有选择此特征。
[0063]
k近邻计算模块32用于采用k近邻算法计算每个鸟巢的适应度,选择最大适应度值的鸟巢记为最优鸟。
[0064]
改进布谷鸟算法模块33用于运用莱维飞行更新鸟巢,调用k近邻计算模块32更新最优鸟巢;将更新鸟巢进行交叉操作得到新的鸟巢,调用k近邻计算模块32更新最优鸟巢;更新被宿主发现有外来鸟蛋的鸟巢,调用k近邻计算模块32更新最优鸟巢;以及,利用变异操作更新鸟巢,调用k近邻计算模块32更新最优鸟巢;
[0065]
最优特征选择模块34用于在改进布谷鸟算法模块的计算满足设定条件时输出最优鸟巢作为最优特征集合;其中,设定条件为设置的迭代次数或特征精度。
[0066]
具体的,k近邻计算模块采用计算每个鸟巢的适应度;其中,γr(d)为特征集合r上训练出的分类器d的分类精度,|r|是选择出来的特征集合包含的特征的数目,|c|是原始特征集合中特征总数;α和β是用来调节分类精度和特征数目两个目标函数的比重的调节参数,α∈(0,1)且β=1-α。
[0067]
在本发明实施例中,改进布谷鸟算法模块33包括交叉计算单元331和变异计算单元332;交叉计算单元331用于将更新鸟巢进行交叉操作,具体包括:将更新鸟巢中的鸟巢两两分组,对每组鸟巢执行以下步骤得到新的鸟巢:产生随机数,在随机数小于设定交叉概率时,随机选择一个位置,交换两个鸟巢在随机位置以后的所有基因。变异计算单元332用于使用变异操作继续更新鸟巢,具体包括:针对每个鸟巢产生随机数;在随机数小于设定变异概率时,随机选择一个位置,将鸟巢在随机位置的基因重新设置。
[0068]
该边缘计算终端寻找最优特征集合的方法已经在上述的数据特征选择方法中详述,此处不予赘述。
[0069]
上述本发明提出的用于边缘计算的特征选择方法及边缘计算终端,将经过k近邻计算得到的特征集合作为初始最优鸟巢,把初始最优鸟巢看做搜索空间中的点,在全局搜索阶段中融入遗传算法的交叉算子,在局部搜索阶段融入了遗传算法的变异算子,结合了布谷鸟算法的强鲁棒性和收敛速度快的优点,提高了布谷鸟算法种群的多样性和搜索能
力,并将k近邻算法与改进后的布谷鸟算法结合,在莱维飞行、交叉操作和变异操作之后均采用k近邻算法评估鸟巢的优劣,获取到优化的特征提取结果,解决了现有边缘计算中数据空间维度较高而对数据的内部特征不够了解的技术问题,提高了数据的分析效率和精度。
[0070]
应该指出的是,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1