一种基于KNN的小区基站经纬度数据校正方法与流程

文档序号:17238507发布日期:2019-03-30 08:28阅读:766来源:国知局
一种基于KNN的小区基站经纬度数据校正方法与流程

本发明涉及信号模拟技术领域,尤其涉及利用运营商手机用户位置信令大数据实现基站经纬度自动核查的一种基于knn的小区基站经纬度数据校正方法及系统。



背景技术:

在基站经纬度采集维护的过程中,由于采集方法及人工管理问题,运营商后台网管平台很多基站经纬度与站点实际位置不符。现有基站经纬度数据核查主要有两种方法:

方法一通过基站真实经纬度实现基站小区公参经纬度数据核查。该方法利用gps获取基站的真实经纬度信息,并以此经纬度为标准,与基站小区工程参数表中的经纬度进行比较分析,通过计算经纬度直线距离进行判定,根据设定的误差门限值生成核查结果。该工具主要包括:基站站点gps信息提取(提取现实站点的gps信息、经纬度格式标准化、现网基站gps锁星核查)、经纬度换算(经纬度格式转换、两基站间距离计算)、基站经纬度核查(对公参表中的基站经纬度数据进行对比检查)。

方法二是通过待校验基站小区与相邻小区的空间关系实现基站小区公参经纬度数据核查。该方法包括:获取待校验基站的经纬度数据以及所属区域的经纬度数据范围,判断所述待校验基站的经纬度数据是否位于所属区域经纬度数据范围内,若是,则继续后续校验流程;否则,输出所述待校验基站经纬度数据有误结果;获取所述待校验基站包括的小区信息以及所有相邻小区信息,判断任两个相邻小区与待校验基站包括小区之间的夹角的差是否满足如下条件:φnφn1<180°,且φmaxφ1>180°;所述φn、φn1为任意两个相邻小区与待校验基站包括小区的夹角;φmax为所有相邻小区中与所述待校验基站包括小区的夹角最大值;φ1为所有相邻小区中与所述待校验基站包括小区的夹角最小值;若是,则流程结束;否则,输出所述待校验基站经纬度数据有误结果。

针对目前基站经纬度存在的误差及人工经纬度核查效率低的现状,现有基站经纬度核查方法实现现实站点经纬度数据自动提取,并对工程参数表中的基站经纬度数据进行批量核查,应用程序化手段代理人工操作,可以极大地提高网优运维人员的工作效率,将有限的人力资源从繁琐的工作中解放出来,同时提高基站经纬度数据的准确性。

然而,现有基站经纬度核查方法存在如下缺陷:

1、第一种方法需要通过操作维护中心omc平台下发指令收集基站的gps信息,该方法局限于可通过平台自动采集gps信息的基站。

2、第二种方法需要首先获取待校验基站小区的所有相邻小区,根据相邻小区之间的空间关系采用简单计算来判断经纬度异常,无法识别待校验基站误差经纬度与周边小区空间关系无明显异常的。

3、现有方法无法适用到bbu模块与rru模块分离安装的场景。由于基站小区公参中记录的是bbu的经纬度,bbu模块通常是集中安装在室内的,维护中心omc平台获取的也是bbu的经纬度,因此,现有方法无法提供rru模块的经纬度,而手机用户位置定位取决于rru模块的经纬度,随着rru远端射频模块的安装越来越灵活,越来越多的rru模块与bbu模块分离安装,影响手机用户位置定位的经度。



技术实现要素:

本发明的目的在于,提出一种基于手机信令切换位置大数据,运用knn近邻算法及gis空间计算技术,实现待校验基站小区经纬度数据自动校核,适合在大规模计算集群上实现分布式部署,高效处理海量手机信令数据。

为了实现上述目的,本发明所采用的技术方案为:

一种基于knn的小区基站经纬度数据校正方法,包括:

基站切换信令清洗转换,对手机信令数据进行清洗、转换、序列化,构建手机用户基站切换序列;

相邻基站切换数据计算,依据手机用户基站切换序列生成待校验基站的相邻基站群及切换特征数据;

相邻基站切换数据预处理,排除待校验基站相邻基站群中特征值小于预定值的相邻基站,以及相邻基站缺失的基站;

相邻基站群修正,采用基于距离的异常点检测算法,计算相邻基站空间邻近度,根据相邻基站空间邻近度剔除相邻基站异常点,确定待校验基站的有效相邻基站群;

待校验基站经纬度测算,根据有效相邻基站群,采用knn空间邻近算法,选择k个邻近相邻基站,依据k个邻近基站公参经纬度,生成待校验基站的测算经纬度;

待校验基站经纬度校正,将待校验基站测算经纬度与邻近基站公参经纬度进行误差计算,识别经纬度异常的基站及异常概率。

其中,所述基站切换信令清洗切换包括获取全网手机信令数据,过滤用户标识缺失信令,按时间顺序排列,剔除连续冗余基站信令,生成手机用户基站切换序列。

其中,所述手机用户基站切换序列包括:用户标识、进入时间、进入基站及离开基站。

其中,获取待校验基站的相邻基站群的方法为:

获取待校验基站的切入信令;

获取待校验基站的切出信令;

统计待校验基站与不同相邻基站的切换次数cnt;

取出待校验基站切换次数最多的前n个相邻基站,作为待校验基站的相邻基站群。

其中,所述排除包括如下步骤,

将所有相邻基站与基站公参信息表匹配,剔除无匹配的相邻基站,获取邻近基站公参经纬度;

剔除待校验基站的相邻基站群中与待校验基站切换次数cnt小于a1的相邻基站样本;

剔除待校验基站的相邻基站个数小于a2,且待校验基站与相邻基站群中所有相邻基站的累计关联切换次数小于一设定值m的基站。

其中,计算相邻基站空间邻近度包括如下步骤:

计算同一群组的相邻基站群内各相邻基站到其他相邻基站的距离和作为相邻基站空间邻近度,剔除距离和大于一定阈值d的相邻基站;

其中,所述待校验基站经纬度测算包括如下步骤:

针对同一个待校验基站的所有相邻基站,按照邻近基站公参经纬度对相邻基站位置合并,统计待校验基站同位置点相邻基站的基站个数;

计算同一个待校验基站同位置点相邻基站与待校验基站切换次数最大的相邻基站对应的切换次数;

计算同一个待校验基站相邻基站群中每个同位置点相邻基站的平滑关联次数;

计算同一个待校验基站所有同位置点相邻基站的平滑关联次数总和,一平滑关联次数/平滑关联次数总和作为每个同位置点相邻基站的权重m;

测算待校验基站的经纬度:

待校验基站测算经度=∑(同位置点相邻基站精度*权重m)

待校验基站测算纬度=∑(同位置点相邻基站纬度*权重m)。

其中,所述待校验基站经纬度校正包括如下步骤:

将所有待校验基站与基站公参信息表匹配,计算待校验基站测算经纬度与邻近基站公参经纬度之间距离误差dis;

将距离误差dis做箱线图,计算距离误差的3/4分位数+1.5倍iqr作为筛选经纬度异常的异常阈值,大于异常阈值的待校验基站为经纬度异常基站,其中iqr为箱线图的箱距,即1/4分位数与3/4分位数的差;

针对判断为经纬度异常基站,使用离差标准化公式标准化距离误差dis:tand_dis=(dis-min(dis))/(max(dis)-min(dis));

异常概率=0.6+stand_dis*0.4。

本发明的有益效果为:

一、通过该方法实现待校验基站小区经纬度自动校核,同时该方法可以输出待校验基站小区经纬度的测算值,方便网优人员针对经纬度异常的基站小区进行人工修正。该方法采用大数据处理技术,通过后台任务定期执行,定期输出经纬度异常的基站小区,提供前端基站小区应用管理功能,方便运维人员进行异常经纬度基站查询及异常经纬度修正。

二、本发明无需通过gps采集实际站点的经纬度数据,适用于所有2g/3g/4g基站,通过手机切换信令识别邻近小区,与待校验基站的经纬度误差无关,采用机器学习算法提高了经纬度异常基站识别的准确性。

三、本发明利用信令切换关系及时空邻近算法,自动识别待校验小区的相邻小区,无需准备基站小区空间关系信息;

四、本发明基于统一的信令数据与具体基站小区设备、网络管理平台无关,适用所有基站小区,通用性强。

五、本发明解决了bbu与rru安装分离小区的经纬度无法获取的问题,可以提供rru设备的近似经纬度值,有效提高了此类基站小区的手机用户定位精度。

六、本发明无需人工干预,所有程序可以在大规模集群上实现分布式部署,实现全流程自动化处理。

附图说明

图1为本发明一种基于knn的小区基站经纬度数据校正方法一实施例的流程图。

具体实施方式

以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。

参阅图1所示,本发明的一实施方式公开一种基于knn的小区基站经纬度数据校正方法,包括:

s100:基站切换信令清洗转换,对手机信令数据进行清洗、转换、序列化,构建手机用户基站切换序列;获取运营商全网2/3/4g手机信令数据,过滤用户标识缺失信令,按用户、时间、顺序排序,剔除同一手机用户连续冗余基站信令,生成手机用户基站切换序列,具体的包括用户标识、进入时间、进入基站、离开基站等信息。

s200:相邻基站切换数据计算,依据手机用户基站切换序列生成待校验基站的相邻基站群及切换特征数据;

在一实施方式中,获取待校验基站的相邻基站群的方法包括如下步骤:

获取待校验基站的切入信令,手机用户基站切换信令中,结束基站为当前基站,开始基站为切入基站;

获取待校验基站的切出信令,手机用户基站切换信令中,开始基站为当前基站,结束基站为切除基站;

统计待校验基站与不同相邻基站的切换次数cnt,所述切换次数包括切入次数+切出次数;

取出待校验基站切换次数最多的前n个相邻基站,作为待校验基站的相邻基站群。所述n优选的为20个。

s300:相邻基站切换数据预处理,排除待校验基站相邻基站群中特征值小于预定值的相邻基站,以及相邻基站缺失的基站;

在一实施方式中,其中,所述排除包括如下步骤,

将所有相邻基站与基站公参信息表匹配,剔除无匹配的相邻基站,获取邻近基站公参经纬度;

剔除待校验基站的相邻基站群中与待校验基站切换次数cnt小于a1的相邻基站样本;所述a1优选的为10。

剔除待校验基站的相邻基站个数小于a2,且待校验基站与相邻基站群中所有相邻基站的累计关联切换次数小于一设定值m的基站。其中设定值m的确定方法为:根据地区统计,计算所有待校验基站与相邻基站的累计切换次数的中位数。所述a2优选的为10。

s400:相邻基站群修正,采用基于距离的异常点检测算法,计算相邻基站空间邻近度,根据相邻基站空间邻近度剔除相邻基站异常点,确定待校验基站的有效相邻基站群;

计算相邻基站空间邻近度,具体包括如下步骤:

计算同一群组的相邻基站群内各相邻基站到其他相邻基站的距离和作为相邻基站空间邻近度,剔除距离和大于一定阈值d的相邻基站,其中阈值d的确定方法为:根据地区统计,计算所有距离和的中位数。

s500:待校验基站经纬度测算,根据有效相邻基站群,采用knn空间邻近算法,选择k个邻近相邻基站,依据k个邻近基站公参经纬度,生成待校验基站的测算经纬度;

其中,所述待校验基站经纬度测算包括如下步骤:

针对同一个待校验基站的所有相邻基站,按照邻近基站公参经纬度对相邻基站位置合并,统计待校验基站同位置点(经纬度一致的点)相邻基站的基站个数count;

计算同一个待校验基站同位置点相邻基站与待校验基站切换次数最大的相邻基站对应的切换次数max(cnt);

计算同一个待校验基站相邻基站群中每个同位置点相邻基站的平滑关联次数cnt_smooth=max(cnt)*(1+count/10-0.1);

计算同一个待校验基站所有同位置点相邻基站的平滑关联次数cnt_smooth总和∑cnt_smooth,以平滑关联次数/平滑关联次数总和(即cnt_smooth/∑cnt_smooth)作为每个同位置点相邻基站的权重m;

测算待校验基站的经纬度:

待校验基站测算经度=∑(同位置点相邻基站精度*权重m)

待校验基站测算纬度=∑(同位置点相邻基站纬度*权重m)。

s600:待校验基站经纬度校正,将待校验基站测算经纬度与邻近基站公参经纬度进行误差计算,识别经纬度异常的基站及异常概率。

在一实施方式中,所述待校验基站经纬度校正包括如下步骤:

将所有待校验基站与基站公参信息表匹配,计算待校验基站测算经纬度与邻近基站公参经纬度之间距离误差dis;

将距离误差dis做箱线图,计算距离误差的3/4分位数+1.5倍iqr作为筛选经纬度异常的异常阈值,大于异常阈值的待校验基站为经纬度异常基站,其中iqr为箱线图的箱距,即1/4分位数与3/4分位数的差;

针对判断为经纬度异常基站,使用离差标准化公式标准化距离误差dis:tand_dis=(dis-min(dis))/(max(dis)-min(dis));

异常概率=0.6+stand_dis*0.4,最终确定经纬度异常基站的经纬度异常概率。

通过该方法实现待校验基站小区经纬度自动校核,同时该方法可以输出待校验基站小区经纬度的测算值,方便网优人员针对经纬度异常的基站小区进行人工修正。该方法采用大数据处理技术,通过后台任务定期执行,定期输出经纬度异常的基站小区,提供前端基站小区应用管理功能,方便运维人员进行异常经纬度基站查询及异常经纬度修正。

本发明无需通过gps采集实际站点的经纬度数据,适用于所有2g/3g/4g基站,通过手机切换信令识别邻近小区,与待校验基站的经纬度误差无关,采用机器学习算法提高了经纬度异常基站识别的准确性。同时,本方法可以输出待校验基站小区的经纬度测算值;利用信令切换关系及时空邻近算法,自动识别待校验小区的相邻小区,无需准备基站小区空间关系信息;基于统一的信令数据与具体基站小区设备、网络管理平台无关,适用所有基站小区,通用性强。解决了bbu与rru安装分离小区的经纬度无法获取的问题,可以提供rru设备的近似经纬度值,有效提高了此类基站小区的手机用户定位精度。无需人工干预,所有程序可以在大规模集群上实现分布式部署,实现全流程自动化处理。

应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1