基于软采信令的经纬度回填方法与流程

文档序号:16548259发布日期:2019-01-08 20:58阅读:242来源:国知局
基于软采信令的经纬度回填方法与流程
本发明涉及移动通信领域,更具体地,涉及一种基于软采信令的经纬度回填方法。
背景技术
:目前,移动通信领域中的移动定位技术主要应用在基于位置的服务方面,根据移动用户的位置,为用户提供与位置相关的各项服务,将成为未来手机业务中的主流趋势。现有的移动终端定位方法存在以下问题:(1)卫星定位,以gps为代表,gps在室外可以获得较高的定位精度,误差在10-50米以内,然而只有智能手机有gps定位功能,普通的手机没有;gps在室内无法进行定位,必须依靠智能手机第三方的软件,即使获得第三方软件的数据,涉及到数据解密等步骤也难以应用;(2)通过信号到达时间(toa)、到达时间差、信号到达角度(aoa)或者以上几种指标综合使用的混合定位方法,该方法的定位误差一般都在200米以上,无法满足高精度的定位需求;(3)小区id+时间提前量(cellid+ta)的定位方法,即利用移动台所占用的服务小区的位置信息以及服务小区的ta进行定位,该方法对通信网络的负担较小,但是定位精度较低;另外也有通过测量信号强度,然后用传播模型计算距离的方法来定位的技术,但由于无线传播环境的不同,这种方法也存在误差比较大的问题。技术实现要素:本发明为克服现有技术定位精度较低,无法满足高精度定位需求的缺点,提出了一种基于软采信令的经纬度回填方法。为解决上述技术问题,本发明采用的技术方案如下:基于软采信令的经纬度回填方法,包括以下步骤:s1:采集待定位移动终端的路测数据;s2:对步骤s1中得到的待定位移动终端的路测数据进行处理,经过处理符合条件的路测数据作为训练样本;s3:构建定位指纹库模型;s4:训练定位指纹库模型,生成在线定位模型;s5:软采信令的经纬度回填;s6:更新定位指纹库;s7:更新在线定位模型。进一步地,步骤s1中所述的路测数据包括路测终端的位置坐标、各个小区的标识信息、场强数据、时延数据、方向角数据和经纬度数据。进一步地,步骤s2具体包括以下步骤:s21:对所述的路测数据进行筛选,标准如下:④小区个数大于等于4;⑤时延数据的数值小于等于测量报告数据标准允许的最大值;⑥小区与采样点的距离小于等于3000米;s22:对筛选后的路测数据进行格式处理,剔除不符合要求的数据;s23:对格式处理后的路测数据进行归一化处理。进一步地,步骤s3具体包括以下步骤:s31:将移动网络覆盖区域划分为边长为l的栅格,并将栅格编号,根据路测终端的位置坐标,将训练样本分配到对应的栅格中;s32:将栅格的编号作为位于该栅格的训练样本的分类标识,分类标识和训练样本共同组成指纹数据记录储存在定位指纹库中。进一步地,步骤s4具体包括以下步骤:s41:采用优化的随机森林回归算法对每个栅格内的训练样本进行建模,得到每个栅格的在线定位模型,用于预测待定位移动终端所处的经度和纬度;s42:存储在线定位模型。进一步地,步骤s41中所述的优化的随机森林回归算法即把随机森林回归算法中的每棵树的最大深度(max_depth)、建立子树的数量(n_estimators)、结点分裂所需最小样本数(min_samples_split)和叶结点最小样本数(min_samplesleaf)设置为一个区间列表,在所有候选的参数区间选择中,通过循环遍历的方式找到效果最优的超参数组合,即得到超参数区间列表中的最优超参数组合与最优模型。进一步地,步骤s42中所述的在线定位模型包括m棵决策树,分别为t1(x)、t2(x)、…、ti(x)、…、tm(x),x={x1,x2,...,xn}是在线定位模型的n维输入向量,每棵决策树产生的预测值分别为:所有决策树预测值的平均值即为在线定位模型的输出;假设指纹数据所在输入空间划分为h个单元u1、u2、…、uh、…、uh,且对应单元的输出值为c1、c2、…、ch、…、ch,训练样本集表示为d={(x1,y1),(x2,y2),...,(xk,yk),...,(xn,yn)},那么,对于任一决策树ti(x),其训练过程如下:p1:从训练样本集d中q个特征字段选d个特征作为本弱回归器的特征集,且满足d=log2q,所述的特征字段包括主小区的场强数据、n个邻小区的场强数据、时延数据、方向角数据,其中,n是预设的邻小区数目。p2:遍历d中的切分变量j和切分点s,求解下式:选择出最优的对(j,s);其中,yi是xi的对应输出。p3:用步骤p2中得到的对(j,s)划分区域,划分成两个子区域,如下:u1(j,s)={x|x(j)≤s}u2(j,s)={x|x(j)>s}p4:决定相应的输出,输出如下:p5:对两个子区域循环执行步骤p2至步骤p4,直至满足预先设定的停止条件为止;p6:生成二叉决策树:其中,i为指示函数,i(true)=1,i(false)=0;并行操作步骤p1至步骤p6,生成m棵二叉决策树,即得到在线定位模型。进一步地,步骤s5具体包括以下步骤:s51:获取在线软采数据,并提取软采数据的特征信息,包括主小区的标识信息和场强数据,至少3个邻近小区的频点、pci信息、时延数据和方向角数据;s52:根据提取的在线软采数据的特征信息,从定位指纹库中筛选出涉及相同小区的指纹库样本数据记录;s53:计算筛选出的指纹样本数据记录中所包含的每个训练样本与在线软采数据的欧氏距离,并从中筛选得到欧式距离最小的训练样本,将该训练样本对应的栅格定为目标栅格;s54:将在线软采数据作为在线定位模型的输入,计算每条数据的预测经纬度。进一步地,步骤s6具体包括以下步骤:s61:根据指纹数据记录的入库时间,筛选出入库的时长超过设定时间段的指纹数据记录;s62:将筛选出的指纹数据记录中量化的影响程度小于设定值的指纹数据记录剔除;s63:定位指纹库内指纹数据记录的数量低于设定数量时,补入新的指纹数据记录进定位指纹库。进一步地,根据指纹数据记录的入库时间,筛选入库的时长超过设定时间段的指纹数据记录,步骤s61中所述的设定时间段为24小时,每日更新一次;步骤s62中将量化的影响程度小于设定值的指纹数据记录标记,并根据在线定位指纹库该记录的id,将定位指纹库中相同id的指纹数据记录标记为删除,最后剔除定位指纹库中的所有标记为删除的指纹数据记录;步骤s63中所述的设定数量为2000条/栅格,定位指纹数据库中某一栅格的指纹数据记录的数量低于2000时,则补入新的指纹数据记录到定位指纹库内。进一步地,步骤s7中所述的更新在线定位模型就是根据步骤s62中剔除的指纹数据记录和/或步骤s63中补入的指纹数据记录更新对应栅格下的样本数据,重新训练在线定位模型,并更新该栅格的在线定位模型。与现有技术相比,本发明技术方案的有益效果是:采用优化的随机森林回归算法,有效地提高了软采数据基于定位指纹库的定位精度,同时使定位指纹库不断的自我迭代更新,剔除影响较小的样本,使指纹库样本的数量达到相对最优,同时补入符合要求的样本,使指纹库样本的质量维持在较高水平,进一步提高了定位精度。附图说明图1为本发明实施例的流程图;图2为本发明实施例更新定位指纹库的流程图;图3为本发明实施例不同栅格的训练时间以及误差统计图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。如图1至图3所示,本实施例,针对中国移动的lte网络,并以计算机程序的方式将方案部署在软采信令分析系统内,本发明的具体实施方案如下:基于软采信令的经纬度回填方法,包括以下步骤:s1:采集待定位移动终端的路测数据:用测试自动路测工具(auxiliarytestunit,atu)进行路测数据的采集,该工具集成有gps模块,因此,所述的路测数据除了包括各个小区的标识信息、场强数据、时延数据和方向角数据外,还包括有路测终端的位置坐标以及各个小区的经纬度。s2:对步骤s1中得到的待定位移动终端的路测数据进行处理,将经过处理符合条件的路测数据作为训练样本,处理过程如下:s21:对所述的路测数据进行筛选,标准如下:①小区个数大于等于4;②时延数据的数值小于等于37;③小区与采样点的距离小于等于3000米;s22:对筛选后的路测数据进行格式处理,剔除不符合要求的数据;s23:对格式处理后的路测数据进行归一化处理。s3:构建定位指纹库模型,具体包括以下步骤:s31:将移动网络覆盖区域划分为边长为l的栅格,并将栅格编号,根据路测终端的位置坐标,将训练样本分配到对应的栅格中;s32:将栅格的编号作为位于该栅格的训练样本的分类标识,分类标识和训练样本共同组成指纹数据记录储存在定位指纹库中。本实施例采用postgresql数据库建立定位指纹库,每条指纹数据记录共有基本字段,分别是:areaid:栅格编号,long型;sampleid:同一栅格下的记录编号,int型;longitude:该条记录采样的经度,double型;latitude:该条记录采样的纬度,double型;servingcellid:服务小区的识别信息,int型;cellid0-7:7个非服务小区(邻近小区)的识别信息,可以为空,int型;servingcellrsrp:服务小区的识别信息,对应的场强数据(电平),double型;rsrp0-7:7个非服务小区(邻近小区)对应的场强数据(电平),非服务小区识别信息空则为空,double型;ta:与服务小区的时延,int型;aoa:与服务小区的方向角,int型。具体地,本实施例在进行处理前,将指纹数据(servingcellrsrp、rsrp0-7、ta、aoa,即本算法所需的10个向量维度)的值根据中国移动所制定的标准进行归一化处理,具体的做法是:将servingcellrsrp、rsrp0-7的值除以140,ta的值除以37,aoa的值除以360,得到本算法的输入数据,这样每个维度对预测的影响程度得到了平衡。s4:训练定位指纹库模型,生成在线定位模型,具体包括以下步骤:s41:采用优化的随机森林回归算法对每个栅格内的训练样本进行建模,得到每个栅格的在线定位模型,用于预测待定位移动终端所处的经度和纬度;s42:存储在线定位模型。具体地,本实施例中,步骤s41中所述的优化的随机森林回归算法即把随机森林回归算法中的每棵树的最大深度(max_depth)、建立子树的数量(nestimators)、分裂所需最小样本数(min_samples_split)和叶节点最小样本数(minsamplesleaf)设置为一个区间列表,在所有候选的参数区间选择中,通过循环遍历的方式找到效果最优的超参数组合,即得到超参数区间列表中的最优超参数组合与最优模型。具体地,本实施例中,步骤s42中所述的在线定位模型包括m棵决策树,分别为t1(x)、t2(x)、…、ti(x)、…、tm(x),x={x1,x2,...,xn}是在线定位模型的n维输入向量,每棵决策树产生的预测值分别为:所有决策树预测值的平均值即为在线定位模型的输出;假设指纹数据所在输入空间划分为h个单元u1、u2、…、uh、…、uh,且对应单元的输出值为c1、c2、…、ch、…、ch,训练样本集表示为d={(x1,y1),(x2,y2),...,(xk,yk),...,(xn,yn)},那么,对于任一决策树ti(x),其训练过程如下:p1:从训练样本集d中q个特征字段选d个特征作为本弱回归器的特征集,且满足d=log2q,所述的特征字段包括主小区的场强数据、n个邻小区的场强数据、时延数据、方向角数据,其中,n是预设的邻小区数目。p2:遍历d中的切分变量j和切分点s,求解下式:选择出最优的对(j,s);其中,yi是xi的对应输出。p3:用步骤p2中得到的对(j,s)划分区域,划分成两个子区域,如下:u1(j,s)={x|x(j)≤s}u2(j,s)={x|x(j)>s}p4:决定相应的输出,输出如下:p5:对两个子区域循环执行步骤p2至步骤p4,直至满足预先设定的停止条件为止,所述的预先设定的停止条件是:达到预先设定的每颗树的最大深度、叶结点的最小样本数、分裂所需的最小样本数;p6:生成二叉决策树:其中,i为指示函数,i(true)=1,i(false)=0;并行操作步骤p1至步骤p6,生成m棵二叉决策树,即得到在线定位模型。s5:软采信令的经纬度回填,具体包括以下步骤:s51:获取在线软采数据,并提取软采数据的特征信息,包括主小区的标识信息和场强数据,至少3个邻近小区的频点、pci信息、时延数据和方向角数据;s52:根据提取的在线软采数据的特征信息,从定位指纹库中筛选出涉及相同小区的指纹库样本数据记录;s53:计算筛选出的指纹样本数据记录中所包含的每个训练样本与在线软采数据的欧氏距离,并从中筛选得到欧式距离最小的训练样本,将该训练样本对应的栅格定为目标栅格;训练样本与在线软采数据的特征信息之间存在以下两种情况:①训练样本与在线软采数据的特征信息之间至少有1个相同的小区的情况:在将待定位移动终端初步定位到栅格的过程中,当训练样本与路测数据至少有1个相同的小区,即初步定位成功,则提取出该移动终端路测数据中与指纹库随机森林回归定位算法中所使用的相同特征字段的数值,同时,对于提取出的数值有缺失的情况,使用指纹库中相同栅格样本数据相同字段的均值进行填补,经过缺失值处理之后,将处理后的数据代入该栅格的在线定位模型,预测出其经度与纬度,即完成定位过程。训练样本与在线软采数据的特征信息之间有5个相同的小区的情况如表1下所示:表1②训练样本与在线软采数据的特征信息没有相同的小区的情况:在将待定位移动终端初步定位到栅格的过程中,当训练样本与路测数据没有相同的小区,则视为初步定位失败,由于在目标精准定位中,若初步定位的误差大,则在栅格中进行随机森林回归定位没有意义,因此,放弃对该移动终端进行定位。s54:将在线软采数据作为在线定位模型的输入,计算每条数据的预测经纬度。s6:更新定位指纹库,具体包括以下步骤:s61:根据指纹数据记录的入库时间,筛选出入库的时长超过设定时间段的指纹数据记录;在本实施例中,每条指纹数据记录还包含三个标记字段:version:版本号,integer型;delete:删除/保留标记,boolean型;updatetime:入库时间,timestampwithouttimezone型。s62:将筛选出的指纹数据记录中量化的影响程度小于设定值的指纹数据记录剔除;s63:定位指纹库内指纹数据记录的数量低于设定数量时,补入新的指纹数据记录进定位指纹库。具体地,本实施例中,根据指纹数据记录的入库时间,筛选入库的时长超过设定时间段的指纹数据记录,步骤s61中所述的设定时间段为24小时,每日更新一次,当超时24小时将delete字段的值为ture;步骤s62中将量化的影响程度小于设定值的指纹数据记录标记,并根据在线定位指纹库该记录的id,将定位指纹库中相同id的指纹数据记录标记为删除,最后剔除定位指纹库中的所有标记为删除的指纹数据记录;步骤s63中所述的设定数量为2000条/栅格,定位指纹数据库中某一栅格的指纹数据记录的数量低于2000时,则补入新的指纹数据记录到定位指纹库内;本实施例更新定位指纹库的流程图如图2所示。s7:更新在线定位模型,即根据步骤s62中剔除的指纹数据记录和/或步骤s63中补充的指纹数据记录更新对应栅格下的样本数据,重新训练在线定位模型,并更新该栅格的在线定位模型。下面通过测量精度说明本实施例的定位效果:在本实施例中,栅格的边长l为100米,每个栅格的样本数设定值为2000,由于采用了更新原则,每个栅格的样本数逐步增加,最终保持在1500到2000以内。在本实施例中,对经度随机森林回归模型与纬度随机森林回归模型使用的超参数设置相同,并使用网格搜索得到模型的最优结果,超参数设定如下:训练集样本量:测试集样本量=3:1;每棵树的最大深度(max_depth)=[6,7];子树的数量(n_estimators)=[30,35,40,45,50,55];结点分裂所需的最小样本数(min_samples_split)=[2,3,4];叶结点最小样本数(minsamplesleaf)=[2,3];本实施例中,所用总样本量为6395个样本,其中含4793个训练样本以及1602个测试样本,训练样本误差统计如表2所示,测试样本误差统计如表3所示,不同栅格的训练时间以及误差统计如表4所示。表2误差范围(米)样本占比率误差范围(米)样本占比率0-1097.538%50-600.042%10-202.149%60-700.021%20-300.188%70-800%30-400.063%80-900%40-500%>900%由表2可知,在4793条预测样本中,10米误差内的样本占比约为97.538%,20米误差内的样本占比约为2.149%,即20米内的误差样本占比99.687%,总体误差在70米以内;表3误差范围(米)样本占比率误差范围(米)样本占比率0-1091.573%50-600.125%10-207.054%60-700%20-300.811%70-800%30-400.250%80-900.062%40-500.125%>900%由表3可知,在4793条预测样本中,10米误差内的样本占比约为91.573%,20米误差内的样本占比约为7.054%,即20米内的误差样本占比98.627%,总体误差在90米以内。表4由表4可知,样本数量控制在(1500,2000]范围内时,平均训练时间仅为943秒,预测平均误差达到了6.47e-05的水平;将样本数量提升至(2000,3000]内时,平均训练时间猛增至3023秒,增加了接近三倍,预测平均误差仅下降至5.12e-05水平,带来的下降十分有限。综上所述,改变每个栅格的样本数量设定值,虽然样本数量增大可以使预测平均误差变小,但却是以平均训练时间为代价;不同栅格的训练时间以及误差统计图如图3所示;因此,本实施例选择将样本数量控制在(1500,2000]范围内。相同或相似的标号对应相同或相似的部件;附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1