一种配用电通信接入网业务流感知的方法与流程

文档序号:15594258发布日期:2018-10-02 19:19阅读:289来源:国知局

本发明涉及电力通信技术领域,更具体地,涉及一种配用电通信接入网业务流感知的方法。



背景技术:

配用电通信接入网是智能电网中非常重要的组成部分,承载了配电自动化、电能质量监测、用电信息采集、自助缴费终端等业务,直接影响到供电可靠性和生活用电的质量。由于配用电通信接入网承载的业务种类和数量的提升,网络中各种新业务及加密类业务的不断涌现,极大增加了网络负担,造成网络拥塞及业务qos(qualityofservice,服务质量)劣化。针对这种情况,实现配用电通信接入网业务流的有效感知,可以缓解流量阻塞,降低传输时延,优化传输效果,从而提高qos。

在配用电通信接入网的业务流感知技术中,基于业务流识别的机器学习算法受到了广泛应用,而且机器学习算法的性能直接影响业务感知的精度与效率。近邻传播(affinitypropagation,ap)算法是一种基于近邻信息传播的无监督聚类算法,其目的是找到最优的类代表点集合(类代表点对应为某个样本点),使得所有数据点到最近类代表点的相似度之和最大。ap算法避免了聚类结果受限于初始类代表点的选择,基于相似度信息的传播来优化目标,实现简单。以上优点使得ap算法在业务流感知技术中具有极大的潜力。

随着近邻传播算法在网络应用领域变得越来越复杂,算法应用的实时性与精确度要求也在不断提高。传统的近邻传播算法没有考虑应用的先验信息与背景知识,并且同时对整个业务流集合进行聚类,严重制约了近邻传播算法在业务感知领域的精确度与实时性;在配用电通信接入网中,难以保证业务识别的效率。



技术实现要素:

本发明为了解决原有的近邻传播算法复杂程度较高,导致业务感知的准确性与实时性不高等问题,提出了一种配用电通信接入网业务流感知的方法。

为实现以上发明目的,采用的技术方案是:

一种配用电通信接入网业务流感知的方法,包括以下步骤:

s1.对业务流进行特征提取,得到特征数据集;

s2.对特征数据集进行子集的抽样,得到n个数据子集;

s3.对n个子集分别进行ap聚类,得到n个子簇;

s4.对n个子簇进行业务标签对应,实现业务流分类。

优选地,所述步骤s1提取的特征包括报文五元组与特征值。

优选地,所述步骤s3的具体执行流程如下:

s11.对于每个子集,计算子集内任意两个数据点之间的欧式距离;

s12.将每个子集计算的数据点之间的欧式距离分别存储在矩阵e中;

s13.基于矩阵e为每个子集构造相似度矩阵;

s14.基于相似度矩阵对每个子集进行ap聚类,得到子簇。

优选地,1)在进行子集的抽样时,初始化数据集合里任何数据点被抽取的权重一致,均为wi=1/n,i∈(1,2,...,n)。

2)根据公式,计算各个点的抽样概率并以此,完成抽取子集中的t个子集点。

3)重复2)过程,保证数据集中的数据点均在子集中被抽取两次以上。

4)当某个数据点被选取时,其权重将会不断调整:如某数据点本次聚类结果与上次结果不一致,则将本数据点标记为“敏感”数据点,增加下一次的抽样权重;反之,减小下一次的抽取权重。直至,任何一个数据点在被前后两次抽取进行分类结果不在变化。

5)应用ap算法完成聚类,形成n个子簇。

6)将n个子簇映射到n个业务中,完成业务流的感知。

与现有技术相比,本发明的有益效果是:

本发明提供的方法采用分治与权重调整的方法,一方面降低了系统运算的复杂度,另一方面进一步保证了运算结果的精确度。

附图说明

图1为方法的流程示意图。

图2为步骤s3的执行示意图。

具体实施方式

附图仅用于示例性说明,不能理解为对本专利的限制;

以下结合附图和实施例对本发明做进一步的阐述。

实施例1

如图1所示,本发明提供了一种配用电通信接入网业务流感知的方法,包括以下步骤:

s1.对业务流进行特征提取,得到特征数据集;

s2.对特征数据集进行子集的抽样,得到n个数据子集;

s3.对n个子集分别进行ap聚类,得到n个子簇;

s4.对n个子簇进行业务标签对应,实现业务流分类。

本实施例中,所述步骤s1提取的特征包括报文五元组与特征值。以psize_max最大包长、pinterval_max最大到达间隔、pdur_max最大业务持续时间为业务流的统计特征,从而获得描述该业务流的特征集u(i)=(psize(i),pinterval(i),pdur(i))。

本实施例中,如图2所示,所述步骤s3的具体执行流程如下:

s11.对于每个子集,计算子集内任意两个数据点之间的欧式距离;

s12.将每个子集计算的数据点之间的欧式距离分别存储在矩阵e中;

s13.基于矩阵e为每个子集构造相似度矩阵;

s14.基于相似度矩阵对每个子集进行ap聚类,得到子簇。

本实施例中,1)在进行子集的抽样时,初始化数据集合里任何数据点被抽取的权重一致,均为wi=1/n,i∈(1,2,...,n)。

2)根据公式,计算各个点的抽样概率并以此,完成抽取子集中的t个子集点。

3)重复2)过程,保证数据集中的数据点均在子集中被抽取两次以上。

4)当某个数据点被选取时,其权重将会不断调整:如某数据点本次聚类结果与上次结果不一致,则将本数据点标记为“敏感”数据点,增加下一次的抽样权重;反之,减小下一次的抽取权重。直至,任何一个数据点在被前后两次抽取进行分类结果不在变化。

5)应用ap算法完成聚类,形成n个子簇。

6)将n个子簇映射到n个业务中,完成业务流的感知。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1