一种基于无线网络话务特征的小区聚类方法和系统的制作方法_3

文档序号:8946300阅读:来源:国知局
距离进行聚 类。这样的方法只能发现球状的簇,而在发现任意形状的簇上遇到了困难。随之提出了基 于密度的另一类聚类方法,其主要的思想是:只要临近区域的密度(对象或数据点的数目) 超出了某个阀值,就继续聚类。也就是说,对给定类中的每个数据点,在一个给定范围的区 域中必须至少包含某个数目的点。这样的方法可以用来过滤"噪声"孤立点数据,发现任意 形状的簇。DBSCAN是一个有代表性的基于密度的方法,它根据一个密度阀值来控制簇的增 长。
[0035] (e)基于随机搜索的大型应用聚类(CLARANS) :CLARANS是分割方法中基于随机搜 索的大型应用聚类算法。在分割方法中最早提出的一些算法大多对小数据集合非常有效, 但对大的数据集合没有良好的可伸缩性。如PAM、CLARA能处理比PAM大的数据集合,其有 效性取决于样本的大小,但当某个采样得到的中心点不属于最佳的中心点时CLARA不能得 到最佳聚类结果。CLARANS是在CLARA算法的基础上提出来的,与CLARA不同CLARANS没 有在任一给定的时间局限于任一样本,而是在搜索的每一步都带一定随机性的选取一个样 本。此方法的优点是一方面改进了CLARA的聚类质量,另一方面拓展了数据处理量的伸缩 范围,具有较好的聚类效果。但它的计算效率较低,且对数据输入顺序敏感,只能聚类凸状 或球型边界。 聚类结果的整合
[0036] 将五类聚类算法的结果由向量转化成聚类结果相似矩阵,把五个聚类结果相似矩 阵取均值再根据阈值取值后转回成聚类结果向量,得到此聚类方法的最终结果,这里阈值 为〇. 5,具体内容和步骤包括: (a) 所述结果向量为X = U1, x2,--,Xi,. . .,xn},其中Xi表示第i个小区所属的聚类 类别,n为小区总数。所述相似矩阵为P,P的初始值是一个n*n的全零矩阵,比较两两小 区,若在上述结果向量中Xi=X,即第i个小区和第j个小区属于同一类,则Pu=P^ = 1。重复这一过程直至所有的小区都比对完毕。从而生成该算法下的相似矩阵。对五类聚 类算法的结果向量分别采用a)步骤的转化方法,分别得到smatrixl、smatrix2、smatrix3、 smatrix4、smatrix5这五个聚类结果相似矩阵; (b) 把五个聚类结果相似矩阵取均值 smatrix= (smatrixl+smatrix2+smatrix3+smatrix4+smatrix5) /5 即P= (Pl+P2+P3+P4+P5)/5 (c) 再将矩阵根据阈值取值 smatrix=round,similarity,matrix(smatrix,round,threshold) 如果相似矩阵smatrix中的值Pij大于0? 5 则将Plj取为I 否则将Plj取为0 其中P,= 1说明i小区和j小区为一类,P,= 〇说明i小区和j小区不为一类。
[0037] 阈值取为0. 5的原因:类似投票机制,根据阈值统计是否超过1/2以上的聚类算法 将某两小区分为一类。共5个聚类算法,如果多于3个或超一半以上认为两个小区属于同 一类则确认该两小区为一类,否则不为一类,故临界值设为〇. 5 ; (d)再将相似矩阵转回成 聚类结果向量得到新型聚类方法的最终结果 cvector=to.cluster,vector(smatrix)
[0038] 最后得到的结果向量形如Y=Iy1,y2,--,y;, ?…,yj,其中y;表示第i个小区所 属的聚类类别。
[0039] S5将聚类结果与地理信息系统中的地理信息进行结合,并显示结合后的聚类结 果。该地理信息系统可使用本申请人自主研发的DEEPLAN系统,也可以使用现有的其他系 统。如图2所示,将聚类结果在地图上显示出来,其中颜色一样的小区表示其属于同一类, 在此实施例中我们将1600个小区分为了 3类。
[0040] 本发明提供了一种基于无线网络话务特征的小区聚类系统: 数据库模块,用于导入待处理数据; 特征参数提取模块,用于提取每个待处理数据的"特征参数"; K值选取模块,通过计算BWP指标、Calinski-Harabasz指标和Silhouette指标三大指 标对数据进行聚类,选择聚类效果最好的指标所对应的K值为聚类最优K值; 聚类分析模块,利用选取的最优K值,运用五种聚类算法对待处理数据进行聚类整合; 可视化模块,将聚类结果与地理信息系统中的地理信息进行结合,并显示结合后的聚 类结果。
[0041] 优选地,所述地理信息显示利用地图软件工具包(ArcGIS地图软件工具),对聚类 分析结果进行地理位置信息的整合与输出。
[0042] 优选地,所述系统还包括界面显示模块,用于显示数据库登陆界面、数据导入界 面。
【主权项】
1. 一种基于无线网络话务特征的小区聚类方法,其特征在于包括如下步骤: Sl选择待处理数据; S2提取每个待处理数据的"特征参数"; S3对待处理数据进行聚类最优K值选取; S4利用选取的最优K值运用五种聚类算法对待处理数据进行聚类整合; S5将聚类结果与地理信息系统中的地理信息进行结合,并显示结合后的聚类结果。2. 根据权利要求1所述的一种基于无线网络话务特征的小区聚类方法,其特征在于: 步骤Sl中所述待处理数据为有关小区话务在一段时间范围内建立的RSCP和Ec/Io两个关 键指标的小区级秒粒度话务统计信息表和对该段时间范围采用时间序列拟合算法建立的 小区级秒粒度话务信息时间序列。3. 根据权利要求1所述的一种基于无线网络话务特征的小区聚类方法,其特征在于: 步骤S2中所述的特征参数指关于小区话务的两个关键指标RSCP和Ec/Io的话务特征分别 提取的最大值、95%分位数、5%分位数、均值、中位数、方差、偏度和峰度、序列关联性、非线 性、频率、稳定性和持续性;以及关于小区级秒粒度话务信息时间序列的趋势、季节性、序列 关联性、非线性、偏度和峰度。4. 根据权利要求1所述的一种基于无线网络话务特征的小区聚类方法,其特征在于: 步骤S3中所述的最优K值选取的方法是通过计算BWP指标、Calinski-Harabasz指标和 Silhouette指标,对小区话务数据进行聚类,选择聚类效果最好的指标所对应的K值为聚 类最优K值。5. 根据权利要求1所述的一种基于无线网络话务特征的小区聚类方法,其特征在于: 步骤S4中所述运用五种聚类算法对待处理数据进行聚类整合是指运用五类聚类算法对所 有小区进行聚类,并将结果向量转化成聚类结果相似矩阵,把五个聚类结果相似矩阵取均 值再根据阈值取值后转回成聚类结果向量,得到此聚类方法的最终结果。6. 根据权利要求5所述的一种基于无线网络话务特征的小区聚类方法,其特 征在于,所述将结果向量转化成聚类结果相似矩阵,具体算法如下:结果向量为X = {Xl,x2,. . . .,Xl,. . .,xn},其中X1表示第i个小区所属的聚类类别,n为小区总数;所述相似 矩阵为P,P的初始值是一个n*n的全零矩阵,两两小区比较,若在上述结果向量中X i= X _j, 即第i个小区和第j个小区属于同一类,则P,= P ,= 1 ;重复这一过程直至所有的小区都 比对完毕,从而生成该算法下的相似矩阵。7. 根据权利要求5所述的一种基于无线网络话务特征的小区聚类方法,其特征在于: 阈值为〇. 5。8. -种基于无线网络话务特征的小区聚类系统,其特征在于,该系统包括: 1) 数据库模块,用于导入待处理数据; 2) 特征参数提取模块,用于提取每个待处理数据的"特征参数"; 3. K值选取模块,通过计算计算BWP指标、Calinski-Harabasz指标和Silhouette指标 三大指标对数据进行聚类,选择聚类效果最好的指标所对应的K值为聚类最优K值; 4) 聚类分析模块,利用选取的最优K值,运用五种聚类算法对待处理数据进行聚类整 合; 5) 可视化模块,将聚类结果与地理信息系统中的地理信息进行结合,并显示结合后的 聚类结果。9. 根据权利要求8所述的一种基于无线网络话务特征的小区聚类系统,其特征在于, 所述地理信息显示利用地图软件工具包,对聚类分析结果进行地理位置信息的整合与输 出。10. 根据权利要求8所述的一种基于无线网络话务特征的小区聚类系统,其特征在于, 所述系统还包括界面显示模块,用于显示数据库登陆界面、数据导入界面。
【专利摘要】一种基于无线网络话务特征的小区聚类方法,主要包括五个步骤:S1选择待处理数据;S2提取每个待处理数据的“特征参数”;S3对待处理数据进行聚类最优K值选取;S4利用选取的最优K值运用五种聚类算法对待处理数据进行聚类整合;S5将聚类结果与地理信息系统中的地理信息进行结合,并显示结合后的聚类结果。本发明通过聚类得到话务数据类似的小区,为移动运营商提供了一个评估和规划网络容量的辅助方案。
【IPC分类】H04W24/10, H04W16/18, H04W24/08
【公开号】CN105163326
【申请号】CN201510642088
【发明人】吴冬华, 欧阳晔, 胡岳, 代心灵, 石路路, 闫兴秀
【申请人】南京华苏科技股份有限公司
【公开日】2015年12月16日
【申请日】2015年9月30日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1