基于流形学习的指纹库自更新方法和装置制造方法

文档序号：6509555阅读：166来源：国知局

基于流形学习的指纹库自更新方法和装置制造方法
【专利摘要】本发明公开了一种基于流形学习的指纹库自更新方法和装置，涉及定位领域。本发明利用相同或相近位置信号强度在低维位置空间具有的相似性为依据，基于大量无标记数据，利用流形技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点，从低维位置空间的数据点中筛选出可信数据点，基于可信数据点预测出其他位置的数据点，并将低维位置空间中预测出的数据点映射为高维信号向量空间的数据点，最后根据可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点更新指纹库，实现了基于大量无标记数据的指纹库自更新过程，赋予指纹库自适应无线信号环境变化的能力，提供定位算法的鲁邦性，同时降低了样本的采集代价。
【专利说明】基于流形学习的指纹库自更新方法和装置

【技术领域】
[0001] 本发明涉及定位领域，特别涉及一种基于流形学习的指纹库自更新方法和装置。

【背景技术】
[0002] 指纹库保存有位置空间与信号向量空间之间的映射关系，根据接收到的信号向量和指纹库可以确定相应的位置信息，从而实现定位。由此可见，建立精确的位置空间与信号向量空间之间的映射模型，对提高定位精度至关重要。
[0003] 目前指纹库通常采用监督学习的训练算法来建立的位置空间与信号向量空间之间的映射模型，该方法在离线训练阶段需要从实际环境中采集大量的训练数据集，训练数据集全部为标记数据，即经用户确认位置的位置点的信号向量。采集带有标记数据的训练数据集，样本收集代价非常高。
[0004] 并且，无线信号容易受到环境的影响而发生变化，在信号分布变化时位置空间与信号向量空间的映射关系会发生较大改变，此时，如果仍然按照之前建立的指纹库进行定位，定位精度就会急剧下降。按照现有技术，需要重新采集大量带有标记数据的训练数据集来更新指纹库中的信息，样本收集代价非常高。
[0005] 由此可见，现有的指纹库更新方法无法适用无线信号多变的通信环境，每次指纹库更新均需要采集大量带有标记数据的训练数据集，样本收集代价非常高。

【发明内容】

[0006] 本发明实施例所要解决的一个技术问题是：解决指纹库更新过程由于需要大量标记数据的训练数据集所导致的样本收集代价较高的问题。
[0007] 根据本发明实施例的一个方面，提出一种基于流形学习的指纹库自更新方法，包括：基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点，其中，所述高维信号向量空间的数据点包括无标记数据，无标记数据是指未经用户确认位置的位置点的信号向量；从低维位置空间的数据点中筛选出可信数据点；基于可信数据点预测出其他位置的数据点；将低维位置空间中预测出的数据点映射为高维信号向量空间的数据点；根据可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点更新指纹库。
[0008] 所述基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点包括：在高维信号向量空间的数据点中寻找其中任意第一数据点的预设数量的邻居数据点；由邻居数据点构造邻接图，并计算邻接图的邻接矩阵；根据邻接矩阵将高维信号向量空间的第一数据点映射为低维位置空间对应的数据点。
[0009] 所述从低维位置空间的数据点中筛选出可信数据点包括：通过粗大误差滤除方法或者距离阈值过滤方法从低维位置空间的数据点中筛选出可信数据点。
[0010] 所述基于可信数据点预测出其他位置的数据点包括：采用数据插值方法或者高斯过程方法，基于可信数据点预测出其他位置的数据点。 toon] 所述高维信号向量空间的数据点还包括标记数据；其中，标记数据是指经用户确认位置的位置点的信号向量。
[0012] 根据本发明实施例的再一个方面，提出一种基于流形学习的指纹库自更新装置，包括：第一映射单元，用于基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点，其中，所述高维信号向量空间的数据点包括无标记数据，无标记数据是指未经用户确认位置的位置点的信号向量；筛选单元，用于从低维位置空间的数据点中筛选出可信数据点；预测单元，用于基于可信数据点预测出其他位置的数据点；第二映射单元，用于将低维位置空间中预测出的数据点映射为高维信号向量空间的数据点；更新单元，用于根据可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点更新指纹库。
[0013] 所述第一映射单元，具体用于在高维信号向量空间的数据点中寻找其中任意第一数据点的预设数量的邻居数据点；由邻居数据点构造邻接图，并计算邻接图的邻接矩阵；根据邻接矩阵将高维信号向量空间的第一数据点映射为低维位置空间对应的数据点。
[0014] 所述筛选单元，具体用于通过粗大误差滤除方法或者距离阈值过滤方法从低维位置空间的数据点中筛选出可信数据点。
[0015] 所述预测单元，具体用于采用数据插值方法或者高斯过程方法，基于可信数据点预测出其他位置的数据点。
[0016] 所述高维信号向量空间的数据点还包括标记数据；其中，标记数据是指经用户确认位置的位置点的信号向量。
[0017] 本发明利用相同位置或相近位置信号强度在低维位置空间所具有的相似性为依据，基于采集的大量无标记数据，利用流形技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点，然后从低维位置空间的数据点中筛选出可信数据点，基于可信数据点预测出其他位置的数据点，并将低维位置空间中预测出的数据点映射为高维信号向量空间的数据点，最后根据可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点更新指纹库，实现了基于大量无标记数据的指纹库自更新过程，赋予指纹库自适应无线信号环境变化的能力，提供定位算法的鲁邦性，同时降低了样本的采集代价。
[0018] 通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

【专利附图】

【附图说明】
[0019] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0020] 图1为本发明基于流形学习的指纹库自更新方法一个实施例的流程示意图。
[0021] 图2为本发明信号向量空间与位置空间的映射关系不意图。
[0022] 图3为本发明基于流形学习的指纹库自更新方法再一个实施例的流程示意图。
[0023] 图4为本发明基于流形学习的指纹库自更新装置一个实施例的结构示意图。

【具体实施方式】
[0024] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0025] 除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
[0026] 同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0027] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。
[0028] 在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。
[0029] 应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。
[0030] 为了解决指纹库更新过程由于需要大量标记数据的训练数据集所导致的样本收集代价较高的问题，本发明提出一种基于大量无标记数据的指纹库自更新方案（即指纹库自适应更新方案)，大大降低了样本的采集代价。其中，标记数据是指经用户确认位置的位置点的信号向量，无标记数据是指未经用户确认位置的位置点的信号向量。需要说明的是，本发明提出的指纹库自更新方案可以全部采用无标记数据，也可以大量采用无标记数据，少量采用标记数据。由于标记数据的位置信息是经过用户确认的，因此，部分采用标记数据可以使指纹库中的数据更加准确。下面详细说明本发明的方案。
[0031] 图1为本发明基于流形学习的指纹库自更新方法一个实施例的流程示意图。如图 1所示，将在线定位阶段用户提供的大量无标记数据和少量标记数据或者全部无标记数据输入流形学习模型，流形学习模型输出有效数据，有效数据输入已有的指纹库更新指纹库数据，输出更新的指纹库。其中，有效数据例如可以是步骤S305中的可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点。
[0032] 图2描述的是信号向量空间与位置空间的映射关系示意图。将一个工作日分为若干时间段，表示为T=It 1, t2, ...，tj，根据某时段内采集的无标记数据(还可以有少量标记数据)，运用流形学习方法完成指纹库的自适应更新。如图2所示，某一时间段的信号向量空间(例如m维，m > 2)中的数据点SA、SB、S。分别映射为位置空间(例如2维）中的数据点 A、B、C，经过一段时间后，各位置点的信号向量空间可能会发生改变，改变后的信号向量空间中的数据点S/、SB'、S C'分别映射为位置空间中的数据点A、B、C。基于流形学习的指纹库更新方案基于如下假设：i)物理位置相距较近点的信号强度相似，同样的信号强度相似点的物理位置较近。ii)信号强度在相隔较长的时间段内变化较大，相隔较短时间内变化较小。不同时间段的同一位置同一接入点（AP)的信号组成一个信号对，例如{S A，S/ }， {SB，V }。例如，A、B点物理距离较接近，因此某时间段内，信号向量空间中的Sb比Sc更相近Sa，在另一时间段内，信号空间发生了改变，但变化后的信号向量V仍然比Sc'更相近 sA'。
[0033] 图3为本发明基于流形学习的指纹库自更新方法再一个实施例的流程示意图。
[0034] 如图3所示，本实施例的指纹库自更新方法包括以下步骤：
[0035] S301，基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点。
[0036] 其中，高维信号向量空间的数据点包括无标记数据，无标记数据是指未经用户确认位置的位置点的信号向量。高维信号向量空间的数据点还可以包括标记数据，标记数据是指经用户确认位置的位置点的信号向量。部分采用标记数据可以使指纹库中的数据更加准确。标记数据可以由系统提供纠错接口，用户在产生错失定位结果时，可以通过该纠错接口向系统提供正确位置。
[0037] 本步骤实现了高维空间到低维空间的降维过程，其中一种示例性的实现方法为：
[0038] (1)局部近邻选取：在高维信号向量空间的数据点中寻找其中任意第一数据点的预设数量的邻居数据点，例如可以采用k最近邻方法选取邻居节点，即通过计算两两信号向量之间的欧式距离，获取最近的k个邻居节点。
[0039] (2)构建邻接矩阵W :由邻居数据点构造邻接图G，并计算邻接图的邻接矩阵。
[0040] 邻接图G的一种构造方法为：若某两个邻居数据点i，j近邻，则Gij = 1，否则，若两点i，j不近邻，则Gij为0。
[0041] 邻接矩阵也称为权重矩阵，可以使用热核方法确定，即若Gi j = 1，则 Wfexpl；- Il Xi-Xj Il 2/(2 〇 2)]，否则若Gij = 0,则Wij=O,其中，Xi和Xj分别表示信号向量， σ表示常量系数，Ilxi-Xjll表示两向量Xi和Xj之间的距离。或者，可以使用简化表示，即若 Gi j = 1，则 Wij=I,否则若 Gi j = 0,则 Wij=CL
[0042] (3)特征映射（降维）：根据邻接矩阵将高维信号向量空间的第一数据点映射为低维位置空间对应的数据点。
[0043] 在高维空间中距离相近的向量族转换到低维空间后还应保持相似的拓扑结构。则可以通过最小二乘原理构造下面的目标函数：

【权利要求】
1. 一种基于流形学习的指纹库自更新方法，包括：基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点，其中，所述高维信号向量空间的数据点包括无标记数据，无标记数据是指未经用户确认位置的位置点的信号向量；从低维位置空间的数据点中筛选出可信数据点；基于可信数据点预测出其他位置的数据点；将低维位置空间中预测出的数据点映射为高维信号向量空间的数据点；根据可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点更新指纹库。
2. 根据权利要求1所述的方法，其特征在于，所述基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点包括：在高维信号向量空间的数据点中寻找其中任意第一数据点的预设数量的邻居数据占. 由邻居数据点构造邻接图，并计算邻接图的邻接矩阵；根据邻接矩阵将高维信号向量空间的第一数据点映射为低维位置空间对应的数据点。
3. 根据权利要求1所述的方法，其特征在于，所述从低维位置空间的数据点中筛选出可信数据点包括：通过粗大误差滤除方法或者距离阈值过滤方法从低维位置空间的数据点中筛选出可信数据点。
4. 根据权利要求1所述的方法，其特征在于，所述基于可信数据点预测出其他位置的数据点包括：采用数据插值方法或者高斯过程方法，基于可信数据点预测出其他位置的数据点。
5. 根据权利要求1所述的方法，其特征在于，所述高维信号向量空间的数据点还包括标记数据，标记数据是指经用户确认位置的位置点的信号向量。
6. -种基于流形学习的指纹库自更新装置，包括：第一映射单元，用于基于流形学习技术将高维信号向量空间的数据点映射为低维位置空间对应的数据点，其中，所述高维信号向量空间的数据点包括无标记数据，无标记数据是指未经用户确认位置的位置点的信号向量；筛选单元，用于从低维位置空间的数据点中筛选出可信数据点；预测单元，用于基于可信数据点预测出其他位置的数据点；第二映射单元，用于将低维位置空间中预测出的数据点映射为高维信号向量空间的数据点；更新单元，用于根据可信数据点对应的高维信号向量空间的数据点以及映射得到的高维信号向量空间的数据点更新指纹库。
7. 根据权利要求6所述的装置，其特征在于，所述第一映射单元，具体用于在高维信号向量空间的数据点中寻找其中任意第一数据点的预设数量的邻居数据占. 由邻居数据点构造邻接图，并计算邻接图的邻接矩阵；根据邻接矩阵将高维信号向量空间的第一数据点映射为低维位置空间对应的数据点。
8. 根据权利要求6所述的装置，其特征在于，所述筛选单元，具体用于通过粗大误差滤除方法或者距离阈值过滤方法从低维位置空间的数据点中筛选出可信数据点。
9. 根据权利要求6所述的装置，其特征在于，所述预测单元，具体用于采用数据插值方法或者高斯过程方法，基于可信数据点预测出其他位置的数据点。
10. 根据权利要求6所述的装置，其特征在于，所述高维信号向量空间的数据点还包括标记数据，标记数据是指经用户确认位置的位置点的信号向量。
【文档编号】G06F17/30GK104424276SQ201310386266
【公开日】2015年3月18日申请日期:2013年8月30日优先权日:2013年8月30日
【发明者】刘源, 孙智强, 邵齐海, 罗智勇申请人:中国电信集团公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘源;孙智强;邵齐海;罗智勇;
技术所有人：中国电信集团公司;
我是此专利的发明人

上一篇：一种并行协同系统的标准数据交换接口方法
上一篇：一种fpga仿真测试用例自动化回归方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。