一种无线基站与线段型地理地物关联矩阵的建立方法与流程

文档序号:18793175发布日期:2019-09-29 19:09阅读:211来源:国知局
一种无线基站与线段型地理地物关联矩阵的建立方法与流程

本发明属于数据分析技术领域,具体涉及一种无线基站与线段型地理地物关联矩阵的建立方法。



背景技术:

在应用运营商大数据的过程中,经常需要把基站信息映射到具体的地理地物,为进一步分析手机用户的社会化位置属性提供数据基础。

随着近距离无线通信和移动网络技术的不断发展,基于位置的服务(location-basedservice,lbs)越来越受到人们的重视。全球定位系统(globalpositioningsystem,gps)在室外已经可以提供位置信息,但是在室内环境下由于建筑物的遮挡、楼层密度较大等特点而无法正常工作。在这种情况下,出现了利用红外线、wifi、zigbee等载波技术的室内定位方案,但是都没有达到非常好的效果。wifi技术由于其能耗较大,且容易受到信号的干扰,信号覆盖的范围也仅局限于90m以内的空间,所以该技术的优势并不明显;zigbee技术尽管具有低功耗、低成本、通信效率高等优点,但是其定位结果不稳定,系统可靠性不强。

申请号为201811550838.2的《一种区块特征指纹识别的方法》提出了一种区块特征指纹识别的方法。包括以下步骤:s1:获取通信运营商提供的基站工程参数和地图服务商提供的地理实体实际位置坐标点集合;s2:根据基站工程参数计算基站的覆盖面;s3:根据基站的覆盖面和空间区块实际位置坐标点集合计算地理实体与基站的匹配关系,形成地理实体特征指纹。本发明通过基站工程参数结合地理实体实际位置坐标点集合,将每一个地理区块实体与基站的位置关系进行匹配,形成地理实体特征指纹。然而该方法存在以下缺点:1、无线射频的覆盖是复杂的,有折射、散射和衍射等影响因素,采用几何的方法计算覆盖面积重叠,不能准确地计算无线基站和地理地物实体的关系;2、该方法不能对道路等线段型地理地物建立无线基站和地理地物实体的关系。



技术实现要素:

本发明要解决的技术问题在于克服现有技术的不足,提供一种无线基站与线段型地理地物关联矩阵的建立方法,采用的是基于手机用户上报的精准的gps和基站编号,将gps精确关联到地理实体,建立gps-小区-地理地物的关系,通过海量数据可以建立比较准确的无线基站=地理地物的关系概率矩阵。

本发明解决上述技术问题的技术方案如下:一种无线基站与线段型地理地物关联矩阵的建立方法,具体包括以下步骤:

s1、从移动运营商大数据中提取训练数据traindata;

s2、从电子地图中提取地物信息,建立poidata;

s3、利用线性差分法对线段型地物进行分段;

s4、通过地理关系关联traindata和poidata;

s5、建立基于训练数据的关系矩阵rcp_train、rpc_train;

s6、利用传播模型计算每一个无线基站小区到每一个分段点的覆盖强度,推导出覆盖概率;

s7、建立所以小区到所以分段点的覆盖概率矩阵rline_cov;

s8、计算训练矩阵的伴随可信矩阵bline;

s9、综合rpc_train、rline_cov、bline三个矩阵对线段型地物建立小区-地物的关系矩阵rline;

s10、对关系矩阵rline采用周期性滑动窗口法进行更新。

进一步地,所述步骤s2中的地物信息为:高速公路、城市道路、省道、市道、县道等、出入口、停车场等,并将地物信息建立poidata具体为:

poidata={(poiname,poitype,centerx,centery,points)}

其中:poiname表示地物名称;poitype表示地物类型;centerx和centery分别表示线段中心点的坐标;points描述多线段的有序点的集合。

进一步地,所述步骤s3具体为:采用线性差分法对于城市环境按照20~50米进行划分,对于郊区环境按照100~5000米进行划分。

进一步地,所述步骤s4中traindata和poidata的的关联方法具体为:对于线段型poidata,对线段沿法线方向扩展为一个矩形,如果traindata中的经纬度落在该poidata对应的points中,则这个traindata记录可以关联这个线段型poidata。

进一步地,所述步骤s5中关系矩阵rcp_train、rpc_train的具体建立方法为:

对所有traindata进行计算,然后对地理地物进行合并则得到以下的数据

其中,cnt为满足关联条件的训练数据的数量,

把cnttrain按行进行归一化得到小区-地物的关系矩阵rcp_train:

把rcp_train进行转置并按行进行归一化得到地物-小区的关系矩阵rpc_train:

进一步地,所述步骤s6的计算方法具体为:采用以下传播模型计算小区到线段中心点的无线接收功率:

rx=tx-(k1+k2log(d)+k3log(hcell)+k4diff+k5log(d)*log(hcell)+k6(hms)

+k7f(clutter))

其中,k1为与pi年率相关的因子,取值为23.5;k2为与距离相关的因子,取值为44.9,k3为天线高度相关因子,取值为5.83;k4为与衍射相关的因子,取值为0;k5为与发射天线和距离相关的因子,取值为-6.55;k6为与接收机高度相关因子,取值为0,k7为地物相关因子,取值为0;

tx为小区的发射功率,从基站的工程参数中获得;

hcell为小区天线高度,从基站的工程参数中获得;

d为小区到线段中心点的距离;

覆盖概率矩阵rline_cov的建立方法为:

进一步地,所述步骤s8中伴随可信矩阵bline的计算方法为:假设经过这个地物的用户数usercnt超过n1,并且平均每用户产生的样本数avg_samplecnt超过n2,则认为该样本空间具有统计意义;则训练矩阵的可信度最高,获得最大的加权10x;x取1,n1取100,n2取1000;

当样本空间低于上述空间时,可信度的计算方法如下:

对训练矩阵中的每一个元素进行可信度计算,即得到可信度矩阵bline:

bline=bi,j]n*m。

进一步地,所述步骤s9具体为:根据rcp_train、rline_cov、bline三个矩阵联合计算,最终的合并公式为:

r'line=rpc_train.*bline+rline_cov

对r'line按行进行归一化得到最终的rline

进一步地,所述步骤s10中周期性滑动窗口法具体为:

以t为周期,以nt为数据滑动计算窗口的更新方式对关系矩阵rregion进行更新,其中,t=1个月,n=3,表示关系矩阵每个月将重新计算一次,每次计算所采用的数据为过去3个月的数据。

本发明采用的是基于手机用户上报的精准的gps和基站编号,将gps精确关联到地理实体,建立gps-小区-地理地物的关系,通过海量数据可以建立比较准确的基站=地理地物的关系概率矩阵。

本发明还将地理地物进行分类,对不同的地物应用不同的计算方法。

并发明还提出了一种概率加权合并的方法,把训练得到的关系矩阵与根据基站和地理实体计算出来的关系矩阵进行合并,从而得到一个更加准确的关系矩阵。

本发明的有益效果是:本发明提出了一种综合利用移动通信网络中的信令数据、app数据、基站工程参数以及电子地图中的地物数据联合使用方法。对一定历史时长的数据进行提取,采用相对准确的手机上报的gps数据建立基站和地理地物的基本关系。在没有gps数据或gsp数据不足的地方采用无线覆盖仿真模型,建立基站和地理地物的关系。并提出了一个融合方法,把上述两个关系矩阵融合成统一的关系矩阵。本发明为准确判断手机用户的停留地点之后将为手机用户提供社会化地理信息提供基础数据,为公共安全、防灾减灾、智慧城市、市场营销等基于人员位置的应用提供基础模型。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明具体实施例的步骤s10中采用周期性滑动窗口法对关系矩阵rline进行更新的示意图。

具体实施方式

下面利用具体实施例对本发明作进一步阐述。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。

需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

本文使用的术语仅用于描述特定实施例,并且不意在限制本发明的示例实施例。如本文所使用的,单数形式“一”、“一个”以及“该”意在包括复数形式,除非上下文明确指示相反意思。还应当理解术语“包括”、“包括了”、“包含”、和/或“包含了”当在本文中使用时,指定所声明的特征、整数、步骤、操作、单元和/或组件的存在性,并且不排除一个或多个其他特征、数量、步骤、操作、单元、组件和/或他们的组合存在性或增加。

在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。在其他实施例中,可以不以非必要的细节来示出众所周知的过程、结构和技术,以避免使得示例实施例不清楚。

实施例

本发明所提供的一种无线基站与线段型地理地物关联矩阵的建立方法,具体步骤为:

s1、从移动运营商大数据中提取训练数据traindata;

利用移动运营商管道数据,从移动运营商2g/3g/4g网络的a/iu/s1-mme等控制面接口可以采集到信令数据,通过数据转换可以得到位置类数据即每个用户发生通信事件所在的基站的位置、时间、时长。

从移动运营商2g/3g/4g网络的gb/iups/gn/s1-u等用户面接口可以采集到上网数据流,通过数据转换可以得到用户的上网流量数据。随着移动互联网的发展,大量基于lbs的app会上报经纬度,通过解码这些经纬度可以得到用户的gps位置,利用各个百度、高德等地图服务商的坐标转换服务可以把这些经纬度转换为标准的gps。

通过移动采集数据的控制面和用户面关联方法,比如tmsi,m-tmsi,gtp-id,apid等方式,经过数据整理,最终可以得到以下记录集。这个记录集即为关系矩阵的训练数据,如下所示:

traindata={(userid,timestart,timeend,cellid,gpsx,gpsy)}

其中,userid表示用户id;timestart表示用户发生通信事件的所在基站的起始时间;timeend表示用户发生通信事件的所在基站的结束时间;cellid表示手机id;gpsx和gpsy分别表示用户发生通信事件的经纬度。

s2、从电子地图中提取地物信息,并进行分类,建立poidata;

通过gis系统获取地区的地理地物,从地物中提取出高速公路、城市道路、省道、市道、县道等、出入口、停车场等地物信息。把地物信息整理为以下格式的数据:

poidata={(poiname,poitype,centerx,centery,points)}

其中:poiname表示地物名称,比如:xx大厦;poitype表示地物类型,比如楼宇;centerx和centery分别表示线段中心点的坐标;points描述多线段的有序点的集合。

s3、利用现行差分法对线段型地物进行分段:

高速公路、城市道路往往是线段型地物。而且往往距离比较长。长距离的地物地理跨度太大,往往与大量的基站小区有关系。因此简单地建立线段型地物和小区的关系矩阵,必然不准确,不合理。为了提高准确程度,需要把这些线段进行划分,按照n米进行划分,对于城市环境可以按照20~50米进行划分,对于郊区环境可以按照100~5000米进行划分。划分方法可以采用线性差分法。

s4、通过地理关系关联traindata和poidata;

对于线段型poidata,对线段沿法线方向扩展为一个矩形,traindata和poidata的的关联方法为:如果traindata中的经纬度落在该poidata对应的points中,则这个traindata记录可以关联这个区域型poidata。

s5、建立基于训练数据的关系矩阵rcp_train、rpc_train;

对所有traindata进行计算,然后对地理地物进行合并则得到以下的数据

cnt为满足关联条件的训练数据的数量。

把cnttrain按行进行归一化得到小区-地物的关系矩阵rcp_train:

把rcp_train进行转置并按行进行归一化得到地物-小区的关系矩阵rpc_train:

s6、利用传播模型计算每一个无线基站小区到每一个分段点的覆盖强度,推导出覆盖概率:

首先,计算小区到线段中心点的无线路径损耗;

采用以下传播模型计算小区到线段中心点的无线接收功率

rx=tx-(k1+k2log(d)+k3log(hcell)+k4diff+k5log(d)*log(hcell)+k6(hms)+k7f(clutter)。

其中,k1为与pi年率相关的因子,这里取值为23.5,k2为与距离相关的因子,这里取值为44.9,k3为天线高度相关因子,这里取值为5.83,k4为与衍射相关的因子,这里可以取0,k5为与发射天线和距离相关的因子,这里取值为-6.55,k6接收机高度相关因子,这里可以取0,k7为地物相关因子,这里可以取0.

tx为小区的发射功率,从基站的工程参数中获得。

hcell为小区天线高度,从基站的工程参数中获得。

d为小区到线段中心点的距离。

其次,计算小区对线段型地物的覆盖概率:

通过上述公式,可以计算每个小区到线段中心点的无线接收功率。

为了提高计算速度,可以定义当小区到线段中心点的距离超过小区半径的3倍时,不参与路径损耗的计算。

这样,可以得到各个小区到该线段中心点的接收功率向量(rx1,rx2,rx3…rxn),对向量进行归一化,得到归一化的向量,即为小区对该地物的覆盖概率pline_cov(poii,cellj);

s7、建立基于覆盖的小区-线段型地物的覆盖概率矩阵rline_cov;

遍历每一个线段型地物,即可以得到小区-地物的覆盖概率矩阵:

s8、计算训练矩阵的伴随可信矩阵bline;

由于不是每一个地物都有充足的训练数据,甚至有可能出现训练数据为0的情况,这个时候需要采用覆盖模型对训练模型进行补充和修正。一般来说基于真实数据的训练模型的可信度要大于覆盖模型。因此对两个矩阵合并的时候,要进行权重的设置,由于不同数据量将产生不同的可信度不一样,所以针对不同的可信度需要采用不同的权重分配。由于不同的小区有不同的训练数据特征,因此需要对每一个小区对应的每一种地物分别计算融合权重。这个基于不同小区不同地区的融合权重就是伴随可信矩阵。综合考虑以上因素建立针对训练矩阵的伴随可信矩阵b。对于线段型地物,我们把这个矩阵记为bline。

根据数据分析经验,假设经过这个地物的用户数usercnt超过n1,并且平均每用户产生的样本数avg_samplecnt超过n2,则认为该样本空间具有统计意义。则训练矩阵的可信度最高,获得最大的加权10x。x可以取1,n1可以取100,n2可以取1000。

当样本空间低于上述空间时,可信度的计算方法如下:

对训练矩阵中的每一个元素进行可信度计算,即得到可信度矩阵bline:

bline=[bi,j]n*m。

s9、根据rcp_train、rline_cov、bline三个矩阵联合计算,最终的合并公式为:

r'line=rpc_train.*bline+rline_cov

对rl'ine按行进行归一化得到最终的rline

s10、采用周期性滑动窗口法对关系矩阵rline进行更新;

由于小区的工程参数和无线环境是经常变化的,地理地物也随着城市的变迁不断地变化,因此需要对rline矩阵进行不断的更新。本发明综合考虑无线环境的变化频率和城市建设的速度,提出以t为周期,以nt为数据滑动计算窗口的更新方式。如图1所示,比如t=1个月,n=3,则表示关系矩阵每个月将重新计算一次,每次计算所采用的数据为过去3个月的数据。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1