一种基于众包样本加权曲面拟合的室内定位方法与流程

文档序号:16387427发布日期:2018-12-22 10:02阅读:147来源:国知局
一种基于众包样本加权曲面拟合的室内定位方法与流程

本发明属于通信和无线网络技术领域,更具体地,涉及一种基于众包样本加权曲面拟合的室内定位方法。

背景技术

随着移动互联网的不断发展,人们对室内基于位置的信息服务不断增加。室内基于位置的信息服务主要包括车位查找、物流管理、商品促销信息推送服务等。目前已经开发出多种室内定位技术,例如,wifi定位、蓝牙定位、红外定位等。基于wifi技术的室内定位由于无需额外布置定位信标,用户无需额外购置定位硬件设备,受到广泛青睐,并在近年成为了室内定位研究的重要对象。

基于wifi技术的室内定位技术可分为两种:基于测距的定位技术和基于指纹的定位技术。前者基于传播模型测距的多边定位技术,但由于室内环境的复杂多变性,使得普适传播模型不可能精确得到,且在室内家具、物体的遮蔽与多径反射作用下导致该技术定位精度不是很高。后者则基于在室内不同位置上所接收到的信号源信号强度具有唯一性,从而称作信号强度(rss,receivedsignalstrength)指纹定位。

基于指纹的室内定位技术可分为两个阶段,一是离线指纹地图构造阶段,二是待测设备定位阶段。根据离线指纹地图构造的方法的不同,基于指纹的室内定位技术又可分为:传统的基于现场勘测的定位技术,例如cn103379441a;基于众包指纹的定位技术,例如,cn105242239a。

基于众包指纹的室内定位技术,其思想主要是利用一般人群进行有意识或随意的测量作为指纹来源,避免了传统的基于现场勘测的定位技术耗时耗力的技术问题。针对如何减小定位误差,现有的基于众包指纹的室内定位技术,通常是通过多种多样的方式实现对数据的平均,期望能滤除不准确的样本的影响。例如,专利cn106792465a,该专利通过划分栅格方式存放样本,将坐标位置处于同一栅格范围内的不同样本,视作是在该栅格点处所收集到的样本,可以较大程度上减少标注误差;也有通过卡尔曼滤波等方法去消除这些误差的定位方法。但上述方法都没有从源头上入手,单纯认为不同众包样本占有平等的地位,期望通过大量数据的平均构建具有代表性的指纹库,从而导致指纹库不仅准确度差,而且收敛慢。



技术实现要素:

针对现有技术的缺陷,本发明的目的在于提供一种客观合理评价信号强度样本可信度从而构建准确指纹库的方法,由此解决现有定位技术中无法评估样本准确性,基于有误差的众包样本构建得到失真指纹库,导致定位误差较大的技术问题。

为实现上述目的,本发明实施例一种基于众包样本加权曲面拟合的室内定位方法,该方法包括以下步骤:

s1.目标区域中设置n个信号源,并将目标区域划分为p个子区域;

s2.收集目标区域的众包样本数据;

s3.分配样本所在子区域,分别计算信号源对区域定位、区域内位置定位的重要度

s4.子区域中样本在物理空间分簇、信号空间分簇,根据分簇结果计算样本权值;

s5.在每个子区域内根据样本权值进行样本筛选,用曲面拟合函数拟合信号源在该子区域内的信号强度分布;

s6.计算各子区域的区域指纹;

s7.采样待定位置点指纹;

s8.用加权计算待定位置点指纹与各子区域指纹的指纹差异度dj,根据指纹差异度dj确定待定位置点所在区域;

s9.用加权计算待定位置点指纹与待定位置点所在区域内任意位置点指纹的指纹差异度j,待定位置点所在区域内任意位置点指纹由曲面拟合函数获得,根据指纹差异度j确定待定位置点坐标。

具体地,步骤s3包含如下子步骤:

(3-1)汇总子区域aj中样本能够从信号源sk接收到的所有信号强度

其中,j=1,2,..,p,k=1,2,..,nj,mj表示子区域aj中样本个数,表示在子区域aj中从信号源sk接收到的所有信号强度值的总数,将信号强度值按下式归一化:

(3-2)利用熵值函数计算该信号源的信号强度分布情况:

(3-3)计算重要度:

其中,为信号源对区域定位的重要度,为信号源对区域内位置定位的重要度。

具体地,随机挑选k个样本作为k个物理空间簇中心点,依据样本之间的物理空间距离将样本划分到这k个中心点所在的簇中;依据样本之间信号空间距离将样本同样k个中心点所在的簇中,最终得到k个物理空间簇集合与k个信号空间簇集合

对于第i个样本,找出其所在的物理空间簇和信号空间簇依据两簇之间交集的大小计算该样本的可信度与权值,如公式所示:

其中,γi为第i个样本的可信度,ωi为第i个样本的权值,si′为信号空间簇中的第i′个样本。

具体地,所述根据样本权值进行样本筛选包括:

(5-1)设定百分比阈值pth与权值阈值ωth,其中pth∈[0,1],ωth∈[0,1],优选地,pth=50%,ωth=0.25;

(5-2)将子区域内所有样本权值从小到大排列成数组,数组元素所在位置与mj的比值称为百分比,找出百分比为pth处的样本,该样本所在位置记为ith,该样本的权值大小记为ωk;

(5-3)若ωk≥ωth,不需要筛选样本,否则,将数组中前个样本删除;之后样本个数变为m′j,m′j≤mj。

具体地,所述对每个信号源构建信号强度的曲面拟合函数包括:

(5-4)采用二元多项式来建立拟合函数φjk(x,y),如公式所示

其中,φjk(x,y)为区域aj中第k个信号源的信号强度拟合函数,αcd为拟合系数,p、q为多项式拟合参数,优选地,p、q均选定为3;

(5-5)利用最小二乘准则构建目标函数h,使拟合函数总的误差平方和最小,其中目标函数的表达式如公式所示:

其中,(xi,yi)表示在该区域内第i个样本的物理坐标,rik表示第i个样本指纹中从第k个信号源所接收到的信号强度,ωi表示第i个样本的权值;

(5-6)目标函数h对每一个拟合系数αcd求偏导,并令其为0,最终得到拟合系数αcd通过a=u-1v可计算得到;

具体地,p、q均选定为3。

具体地,步骤s8包括:当待定位置点的指纹与某个区域的指纹差异度dj最小时,则断定待定位置点目标位于该区域atarget;

其中,为信号源对区域定位的重要度,fgk为第j个区域指纹中第k个信号源sk的平均信号强度,rtk为待定位置点指纹中第k个信号源的信号强度。

具体地,步骤s9包括:利用带权搜索公式在确定的区域atarget内进行搜索,以寻找到一个空间点,使其指纹与待定点指纹具有最小的指纹差异度,作为最终的定位结果;

其中,是待定位置点最终的坐标,为信号源对区域内位置定位的重要度,φtargetk(x,y)表示在目标区域atarget中第k个信号源所建立的信号强度拟合函数。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:

(1)本发明通过熵值法评估了每个区域中每个信号源所提供的信号强度值包含的信息量,从而决定了每个信号源在定位时的重要度,而不是将所有信号源一视同仁。该步骤不仅提高了在区域粗定位阶段时的精度,也提高了在区域内精确定位的精度。

(2)本发明通过样本权值评估带噪音的众包样本的真实性,选取了较合理且具有代表性的数据赋予较高的权值,使得构建的指纹数据库更加准确,提高了定位精度。

(3)本发明通过曲面拟合函数预测了每个区域中每个信号源的信号强度分布情况,从而构建出了一个连续的指纹库。该指纹库通过少量的曲面拟合系数确定,占用空间比传统数据库要小,但提供了更丰富的指纹信息;在经过样本筛选加权后,指纹库相较传统指纹库准确度更高。

附图说明

图1为本发明提供的基于众包样本加权曲面拟合的室内定位方法流程图。

图2为本发明提供的步骤s5中样本筛选流程图。

图3为本发明实施例提供的目标区域示意图。

图4为栅格曲面定位法、原始曲面定位法、聚类曲面定位法以及本发明选择样本曲面定位方法在a房间内建立的关于信号源3的信号强度拟合曲面示意图。

图5为众包样本数量变化时,近邻栅格定位、栅格曲面定位、原始曲面定位、聚类曲面定位及选择样本曲面定位的定位效果对比示意图。

图6为众包样本数据包含的噪声干扰变化时,近邻栅格定位、栅格曲面定位、原始曲面定位、聚类曲面定位及选择样本曲面定位的定位效果对比示意图。

图7为众包样本数量和包含的噪声干扰固定时,近邻栅格定位栅格曲面定位、原始曲面定位、聚类曲面定位及选择样本曲面定位的定位误差累积分布示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

图1为本发明提供的基于众包样本加权曲面拟合的室内定位方法流程图。如图1所示,该方法包括以下步骤:

s1.目标区域中设置n个信号源,并将目标区域划分为p个子区域;

s2.收集目标区域的众包样本数据;

s3.分配样本所在子区域,分别计算信号源对区域定位、区域内位置定位的重要度

s4.子区域中样本在物理空间分簇、信号空间分簇,根据分簇结果计算样本权值;

s5.在每个子区域内根据样本权值进行样本筛选,用曲面拟合函数拟合信号源在该子区域内的信号强度分布;

s6.计算各子区域的区域指纹;

s7.采样待定位置点指纹;

s8.用加权计算待定位置点指纹与各子区域指纹的指纹差异度dj,根据指纹差异度dj确定待定位置点所在区域;

s9.用加权计算待定位置点指纹与待定位置点所在区域内任意位置点指纹的指纹差异度j,待定位置点所在区域内任意位置点指纹由曲面拟合函数获得,根据指纹差异度j确定待定位置点坐标。

步骤s1.目标区域中设置n个信号源,并将目标区域划分为p个子区域。

在给定目标区域中设置n个信号源{s1,s2,...,sk,...,sn},k表示信号源的编号,k=1,2,..,n,保证位于目标区域中任意位置的终端能够接收到来自至少一个信号源的信号强度。

根据目标区域的建筑布局,例如房间和走廊,将目标区域划分为p个子区域{a1,a2,...,aj,...,ap},j表示子区域的编号,j=1,2,..,p。在本实施方式中,信号源是无线接入点(accesspoint,简称ap)。

步骤s2.收集目标区域的众包样本数据。

所述众包样本数据是指从若干个众包用户的终端上获取的传感器数据。用户在目标区域中手持终端设备随意走动,终端设备进行信号强度采样,最终得到m个样本{s1,s2,...,si,...,sm},i表示样本编号,i=1,2,..,m。第i个样本si的指纹采样第i个样本si时终端所处的二维坐标其中,rik表示第i个样本si所接收到的来自第k个信号源的信号强度,xi和yi分别表示第i个样本si的横坐标和纵坐标。如果第i个样本si没有从某个信号源接收到信号强度,则将对应的信号强度设为一个很小的值,比如-90dbm。

步骤s3.分配样本所在子区域,分别计算信号源对区域定位、区域内位置定位的重要度

根据样本的二维坐标将样本分配到其对应的子区域中。

子区域aj可监测到nj个信号源,子区域aj中有mj个样本,

通过熵值法评估信号源sk定位重要度,包含如下子步骤:

(3-1)汇总子区域aj中样本能够从信号源sk接收到的所有信号强度其中,j=1,2,..,p,k=1,2,..,nj,mj表示子区域aj中样本个数,表示在子区域aj中从信号源sk接收到的所有信号强度值的总数,将信号强度值按下式归一化:

(3-2)利用熵值函数计算该信号源的信号强度分布情况:

(3-3)计算重要度:

其中,为信号源对区域定位的重要度,为信号源对区域内位置定位的重要度。

本步骤的优点在于通过熵值法评估了每个区域中每个信号源所提供的信号强度值包含的信息量,从而决定了每个信号源在定位时的重要度,而不是将所有信号源一视同仁。该步骤不仅提高了在区域粗定位阶段时的精度,也提高了在区域内精确定位的精度。

s4.子区域中样本在物理空间分簇、信号空间分簇,根据分簇结果计算样本权值。

每个子区域包含一份样本集,子区域aj包含mj个样本。随机挑选k个样本作为k个物理空间簇中心点,依据样本之间的物理空间距离将样本划分到这k个中心点所在的簇中;同样的,依据样本之间信号空间距离将样本同样k个中心点所在的簇中。最终得到k个物理空间簇集合与k个信号空间簇集合其中,样本之间的物理空间距离等于两样本二维坐标的距离,样本之间的信号空间距离等于两样本指纹的距离。

对于第i个样本,找出其所在的物理空间簇和信号空间簇依据两簇之间交集的大小计算该样本的可信度与权值,如公式所示:

其中,γi为第i个样本的可信度,ωi为第i个样本的权值,si′为信号空间簇中的第i′个样本。

本步骤的优点在于:通过评估带噪音的众包样本的真实性,选取了较合理且具有代表性的数据赋予较高的权值,使得构建的指纹数据库更加准确,提高了定位精度。

s5.在每个子区域内根据样本权值进行样本筛选,对每个信号源构建信号强度的曲面拟合函数。子区域aj包含mj个样本。图2为本发明提供的步骤s5中样本筛选流程图。如图2所示,包括以下子步骤:

(5-1)设定百分比阈值pth与权值阈值ωth,其中pth∈[0,1],ωth∈[0,1],优选地,pth=50%,ωth=0.25。

(5-2)将子区域内所有样本权值从小到大排列成数组,数组元素所在位置与mj的比值称为百分比,找出百分比为pth处的样本,该样本所在位置记为ith,该样本的权值大小记为ωk;

(5-3)若ωk≥ωth,不需要筛选样本,否则,将数组中前个样本删除;之后样本个数变为m′j,m′j≤mj。

(5-4)采用二元多项式来建立拟合函数φjk(x,y),如公式所示

其中,φjk(x,y)为区域aj中第k个信号源的信号强度拟合函数,αcd为拟合系数,p、q为多项式拟合参数,优选地,p、q均选定为3。

(5-5)利用最小二乘准则构建目标函数h,使拟合函数总的误差平方和最小,其中目标函数的表达式如公式所示:

其中,(xi,yi)表示在该区域内第i个样本的物理坐标,rik表示第i个样本指纹中从第k个信号源所接收到的信号强度,ωi表示第i个样本的权值。

(5-6)目标函数h对每一个拟合系数αcd求偏导,并令其为0,最终得到拟合系数αcd通过a=u-1v可计算得到。

曲面函数预测了每个区域中每个信号源的信号强度分布情况,计算每个信号源对应的曲面函数即可得到区域中所有信号源的信号强度分布情况。将这些曲面函数组合,能得到反映区域中指纹情况的指纹数据库。

本步骤的优点在于通过曲面函数预测了每个区域中每个信号源的信号强度分布情况,从而构建出了一个连续的指纹库。该指纹库通过少量的曲面拟合系数确定,占用空间比传统数据库要小,但提供了更丰富的指纹信息;在经过样本筛选加权后,指纹库相较传统指纹库准确度更高。

s6.计算各子区域的区域指纹。

将每个子区域内所有信号源的曲面拟合函数通过等距栅格采样,建立相应的区域指纹其中,nj是该区域中可监测到的信号源数目。

在区域aj中设置等距采样栅格,得到栅格的集合gj,第g个栅格的中心点坐标为(gx,gy),g=1,2,...,|gj|。

其中,fgk表示区域aj中位置(gx,gy)接收到第k个信号源的信号强度。优选地,等距采样栅格的大小设置为0.25×0.25m2

s7.采样待定位置点指纹。

在待定位置点扫描n个信号源的信号强度,获得待定点的指纹

s8.用加权计算待定位置点指纹与各子区域指纹的指纹差异度dj,根据指纹差异度dj确定待定位置点所在区域。

利用公式计算待定位置点的指纹与p个区域中各区域指纹的指纹差异度dj,以初步判断待定位置点所在区域的位置。具体而言,a表示区域指纹和待定点指纹中共同接收到的信号源集合,当待定位置点的指纹与某个区域的指纹差异度最小时,则断定待定位置点目标位于该区域atarget。

其中,为信号源对区域定位的重要度,fgk为第j个区域指纹中第k个信号源sk的平均信号强度,rtk为待定位置点指纹中第k个信号源的信号强度。

本步骤的优点在于通过将目标预先定位到一个区域,大大缩小目标可能位于的区域,减少指纹对比工作量。此外,区域定位结果对定位要求不高的场景也很实用。

s9.用加权计算待定位置点指纹与待定位置点所在区域内任意位置点指纹的指纹差异度j,待定位置点所在区域内任意位置点指纹由曲面拟合函数获得,根据指纹差异度j确定待定位置点坐标。

根据位置搜索算法并利用带权搜索公式在确定的区域atarget内进行搜索,以寻找到一个空间点,使其指纹与待定点指纹具有最小的指纹差异度,作为最终的定位结果。

其中,是待定位置点最终的坐标,为信号源对区域内位置定位的重要度,φtargetk(x,y)表示在目标区域atarget中第k个信号源所建立的信号强度拟合函数。在本实施方式中,位置搜索算法采用梯度下降位置搜索法。

本步骤的优点在于:可以在连续的物理空间内寻找一点作为定位结果,突破了传统的指纹定位结果只能从有限个参考点中提取的缺点,提高了定位的精度。

图3为本发明实施例提供的目标区域示意图。如图3所示,本发明的场景根据自然格局可以划分为4个房间和1条走廊共5个子区域,其中房间a、c长10.5m,宽7.76m,房间b、d长10.5m,宽9.56m,走廊长32.6m,宽3.62m。在场景内总共可测得n=392个信号源,该场景中任意位置均可接收到至少一个信号源的信号强度。每个子区域内划分的物理空间簇和信号空间簇的数目k分别为234(房间a、c),288(房间b、d),324(走廊)。

使用华为荣耀3c智能手机作为终端进行信号强度的测量。采样数据分为两部分:一部分用于建立指纹数据库,称作训练集。一部分用于测试定位精度,称作测试集。训练集中又分为两部分数据:一部分数据通过在室内环境中均匀采样方式收集,共设置了1367个采样点,每个采样点采样10秒钟,每秒钟采样一次,共采集得13670个样本数据。一部分数据通过在室内环境中随意走动收集,因此只收集了可走动的过道部分数据,共采集得13370个样本数据。

本应用实例中,共设置了五种实验方案进行测试。

(a)近邻栅格定位法。将室内地图均匀划分为0.6m×0.6m的栅格,并将众包样本选择最近的栅格添加进入,每个栅格求取指纹的平均值后得到离散指纹库,用k最近邻算法(knn,k-nearestneighbor)求取目标位置。

(b)栅格曲面定位法。对(a)中平均后的栅格指纹中的每个接入点信号强度拟合信号强度曲面构建指纹库,利用梯度下降法求取目标位置。

(c)原始曲面定位法。保留原始数据的位置,直接对每个数据的指纹中的计入点信号强度拟合信号强度曲面构建指纹库,利用梯度下降法求取目标位置。

(d)聚类曲面定位法。将众包样本的物理空间坐标通过k-means聚类,聚类中的样本指纹求取平均后,拟合信号强度曲面构建指纹库,并利用梯度下降法求取目标位置。

(e)选择样本曲面定位法。保留原始数据的位置,利用本发明提出的样本选择算法方法对样本选择后,再拟合信号强度曲面构建指纹库,利用梯度下降法求取目标位置。

在使用本发明提出的信号源定位重要度后,在测试阶段,每个样本的区域定位命中率均在99.58%以上,几乎所有的测试样本能被划分到正确的定位区域中。

图4为栅格曲面定位法、原始曲面定位法、聚类曲面定位法以及本发明选择样本曲面定位方法在a房间内建立的关于信号源3的信号强度拟合曲面示意图。其中由于方案(e)为每一个样本设定了权值,因此每个样本以不同颜色表示其权值。可以看出,四种定位方案所拟合的信号强度分布曲面图均有些许不同,采用本发明方法构建的信号强度分布曲面更加遵循信号传播模型。

图5为众包样本数量变化时,近邻栅格定位、栅格曲面定位、原始曲面定位、聚类曲面定位及选择样本曲面定位的定位效果对比示意图。通过该对比结果可以看出当众包样本数量较少时,传统的栅格定位方法定位误差极大,而采用了本发明提出的曲面拟合方法的其余四种方案定位误差都相对很小。当众包样本数量增加后,栅格曲面定位法、原始曲面定位法以及聚类曲面定位法由于拟合的曲面精度提高定位误差先减小,而后期由于大量众包样本的噪声引起定位误差持续增大。采用本发明提出的众包样本加权曲面拟合方法由于剔除了不可信的众包样本,因此定位误差并没有增大。

图6为众包样本数据包含的噪声干扰变化时,近邻栅格定位、栅格曲面定位、原始曲面定位、聚类曲面定位及选择样本曲面定位的定位效果对比示意图。通过该对比结果可以看出,五种实验方案都由于样本添加的干扰程度增大,而引起定位误差增大。而本发明提出的众包样本加权曲面拟合方法取得了最小的定位误差。

图7为众包样本数量和包含的噪声干扰固定时,近邻栅格定位栅格曲面定位、原始曲面定位、聚类曲面定位及选择样本曲面定位的定位误差累积分布示意图。通过该对比结果可以看出,本发明提出的定位方法较传统定位算法有了明显的提高。这是由于我们的方法对众包样本进行了合理的筛选,并通过曲面拟合,建立了更为详细的信号强度分布函数,丰富了定位阶段的搜索空间,所以提高了定位精度。

以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1