室内外用户识别方法、装置及电子设备与流程

文档序号:29435089发布日期:2022-03-30 08:20阅读:110来源:国知局
室内外用户识别方法、装置及电子设备与流程

1.本技术涉及通信技术领域,尤其涉及一种室内外用户识别方法、装置及电子设备。


背景技术:

2.受限于室内建设资源的不足,当前大量室内覆盖依靠于室外宏站,因而室内用户感知保障与业务发展面临着深度覆盖严重不足的问题,而传统网优手段依据小区kpi指标间接地对建筑物室内覆盖情况进行判断定位,不能准确了解楼宇室内网络真实覆盖需求,尤其是无法准确获取用户业务区域的覆盖质量以及用户的真实业务感知。因此,如何准确区分宏站覆盖的室内、外用户,以准确获取室内用户所处位置覆盖质量情况,判断是否存在弱覆盖、信号质量差等问题,是保障室内用户感知的关键步骤。


技术实现要素:

3.本技术实施例提供一种室内外用户识别方法、装置及电子设备,以实现准确区分室内外用户。
4.为了解决上述技术问题,本技术实施例采用下述技术方案:
5.第一方面,本技术实施例提供一种室内外用户识别方法,包括:
6.获取待识别用户的最小化路测mdt数据;
7.基于所述待识别用户的mdt数据,确定所述待识别用户的用户行为特征数据,用户的用户行为特征数据包括所述用户的运动特征、与所述用户相关联的小区的信号覆盖特征;
8.基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类,得到所述待识别用户的类型,其中,所述类型包括室内用户和室外用户,所述分类模型是基于设定的分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到。
9.可选地,所述mdt数据包括位置信息和参考信号接收功率rsrp,所述运动特征包括移动速度,与所述用户相关联的小区的信号覆盖特征包括所述用户的rsrp、所述用户所在小区内不同类型的用户的rsrp和所述用户的邻区内不同类型的用户的rsrp;
10.基于所述待识别用户的mdt数据,确定所述待识别用户的用户行为特征数据,包括:
11.基于所述待识别用户的位置信息及各位置对应的时刻,确定所述待识别用户的移动速度;
12.基于所述待识别用户的位置信息,确定所述待识别用户所在的小区及邻区;
13.基于所述待识别用户所在小区内各用户的类型及mdt数据进行整合,以得到所述所在小区内不同类型的用户的rsrp;以及,
14.基于所述邻区内各用户的类型及mdt数据进行整合,以得到所述邻区内不同类型的用户的rsrp。
15.可选地,在基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类之前,所述方法还包括:
16.获取多个不同类型的样本用户的mdt数据;
17.基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据;
18.将所述样本用户的用户行为特征数据作为样本数据,得到样本数据集;
19.基于所述分类算法和所述样本数据集,对所述多个不同类型的用户进行训练,建立所述分类模型。
20.可选地,所述分类算法为k最近邻knn算法;
21.基于所述分类算法和所述多个不同类型的样本用户的用户行为特征数据,对所述多个不同类型的用户进行训练,建立所述分类模型,包括:
22.将所述样本数据集划分为第一数据集和第二数据集;
23.针对所述第一数据集中每一样本数据,确定该样本数据与所述第二数据集中各样本数据之间的距离;
24.从所述第二数据集中选取与该样本数据距离最近的设定数量的样本数据,确定为参考样本数据;
25.基于选取出的参考样本数据所属的样本用户的类型,识别该样本数据所对应的类型,得到该样本数据的类型识别结果;
26.基于所述第一数据集中各样本数据所对应的类型及类型识别结果,更新所述设定数量。
27.可选地,在基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,所述方法还包括:
28.对于每一所述样本用户,基于所述样本用户的mdt数据中的位置信息,确定所述样本用户的移动速度,并筛除移动速度超过设定速度的样本用户的mdt数据。
29.可选地,在基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,所述方法还包括:
30.对于每一所述样本用户,基于所述样本用户的mdt数据中的位置信息确定所述样本用户与指定基站之间的距离,并筛除与所述指定基站之间的距离超过设定距离的样本用户的mdt数据。
31.可选地,在基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,所述方法还包括:
32.对于每一所述样本用户,将所述样本用户的mdt数据中的经纬度数据与设定的地图图层数据进行匹配,得到所述经纬度数据与所述地图图层数据之间的匹配度;
33.筛除所述匹配度小于设定匹配度的样本用户的mdt数据。
34.第二方面,本技术实施例提供一种室内外用户识别装置,包括:
35.第一获取模块,用于获取待识别用户的最小化路测mdt数据;
36.第一确定模块,用于基于所述待识别用户的mdt数据,确定所述待识别用户的用户行为特征数据,用户的用户行为特征数据包括所述用户的运动特征、与所述用户相关联的小区的信号覆盖特征;
37.分类模块,用于基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类,得到所述待识别用户的类型,其中,所述类型包括室内用户和室外用户,所述分类模型是基于分类算法和多个不同类型的样本用户的mdt数据进行训练得到。
38.可选地,所述mdt数据包括位置信息和参考信号接收功率rsrp,所述运动特征包括移动速度,与所述用户相关联的小区的信号覆盖特征包括所述用户的rsrp、所述用户所在小区内不同类型的用户的rsrp和所述用户的邻区内不同类型的用户的rsrp;
39.所述第一确定模块具体用于:
40.基于所述待识别用户的位置信息及各位置对应的时刻,确定所述待识别用户的移动速度;
41.基于所述待识别用户的位置信息,确定所述待识别用户所在的小区及邻区;
42.基于所述待识别用户所在小区内各用户的类型及mdt数据进行整合,以得到所述所在小区内不同类型的用户的rsrp;以及,
43.基于所述邻区内各用户的类型及mdt数据进行整合,以得到所述邻区内不同类型的用户的rsrp。
44.可选地,所述第一获取模块还用于:在所述分类模块基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类之前,获取多个不同类型的样本用户的mdt数据;
45.所述第一确定模块还用于:
46.基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据;
47.所述装置还包括训练模块,所述训练模块具体用于:
48.将所述样本用户的用户行为特征数据作为样本数据,得到样本数据集;
49.基于所述分类算法和所述样本数据集,对所述多个不同类型的用户进行训练,建立所述分类模型。
50.可选地,所述分类算法为k最近邻knn算法;
51.所述训练模块具体用于:
52.将所述样本数据集划分为第一数据集和第二数据集;
53.针对所述第一数据集中每一样本数据,确定该样本数据与所述第二数据集中各样本数据之间的距离;
54.从所述第二数据集中选取与该样本数据距离最近的设定数量的样本数据,确定为参考样本数据;
55.基于选取出的参考样本数据所属的样本用户的类型,识别该样本数据所对应的类型,得到该样本数据的类型识别结果;
56.基于所述第一数据集中各样本数据所对应的类型及类型识别结果,更新所述设定数量。
57.可选地,所述装置还包括第一筛选模块;
58.所述第一筛选模块,用于在所述第一确定模块基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,对于每一所述样
本用户,基于所述样本用户的mdt数据中的位置信息,确定所述样本用户的移动速度,并筛除移动速度超过设定速度的样本用户的mdt数据。
59.可选地,所述装置还包括第二筛选模块;
60.所述第二筛选模块,用于在所述第一确定模块基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,对于每一所述样本用户,基于所述样本用户的mdt数据中的位置信息确定所述样本用户与指定基站之间的距离,并筛除与所述指定基站之间的距离超过设定距离的样本用户的mdt数据。
61.可选地,所述装置还包括第三筛选模块,所述第三筛选模块用于:
62.在所述第一确定模块基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,对于每一所述样本用户,将所述样本用户的mdt数据中的经纬度数据与设定的地图图层数据进行匹配,得到所述经纬度数据与所述地图图层数据之间的匹配度;
63.筛除所述匹配度小于设定匹配度的样本用户的mdt数据。
64.第三方面,本技术实施例提供一种电子设备,包括:
65.处理器;
66.用于存储所述处理器可执行指令的存储器;
67.其中,所述处理器被配置为执行所述指令,以实现第一方面所述的方法。
68.第四方面,本技术实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行第一方面所述的方法。
69.本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:
70.通过本实施例提供的室内外用户识别方法,由于室内用户和室外用户各自的运动特征及相关联的小区的信号覆盖特征均存在明显的差异性,且同一类型的用户的运动特征及相关联的小区的信号覆盖特征均存在明显的局类型,通过将用户的运动特征和相关联的小区的信号覆盖特征作为用户的用户行为特征数据,设定的分类模型基于分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到,进而基于该分类模型和待识别用户的用户行为特征数据对待识别用户进行识别,可以克服建筑物室内覆盖情况不明确对识别结果的影响,达到准确识别室内外用户的效果。
附图说明
71.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
72.图1为本技术实施例提供的一种室内外用户识别方法的流程图;
73.图2为本技术实施例提供的一种对分类模型的训练方法的流程图;
74.图3为本技术实施例提供的另一种对分类模型的训练方法的流程图;
75.图4为本技术实施例提供的一种电子设备的结构示意图;
76.图5为本技术实施例提供的一种室内外用户识别装置的结构示意图。
具体实施方式
77.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及
相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
78.以下结合附图,详细说明本技术各实施例提供的技术方案。
79.请参见图1,本技术实施例提供一种室内外用户识别方法,如图1所示,该方法包括以下步骤:
80.s12,获取待识别用户的mdt数据。
81.具体地,mdt(minimization of driver-test,最小化路测)是第三代合作伙伴计划(the 3
rd generation partnership project,3gpp)在lte(long term evolution,长期演进)系统中引入的一种通过网络配置对ue(user equipment,用户设备)进行测量数据采集、上报的自动化路测技术。用户设备可向基站自动上报mdt数据,由此,可获取待识别用户的用户设备(ue,user equipment)上报至基站的mdt数据,作为待识别用户的mdt数据。
82.其中,待识别用户的mdt数据可以例如包括但不限于待识别用户的位置信息、rsrp(reference signal receiving power,参考信号接收功率)等。具体来说,待识别用户的位置信息可以包括待识别用户的实时位置及各个位置对应的时刻,待识别用户的位置可以用经纬度数据表示。
83.s14,基于待识别用户的mdt数据,确定待识别用户的用户行为特征数据。
84.其中,用户的用户行为特征数据包括用户的运动特征、与用户相关联的小区的信号覆盖特征。用户的运动特征是指用于表征用户的运动特点的特征,所述运动特征具体可以包括移动速度。与用户关联的小区的信号覆盖特征是指用于表征与用户关联的小区的信号覆盖情况的特征,所述信号覆盖特征具体可以包括不同类型的用户的rsrp等。
85.另外,与用户关联的小区可根据实际需求自定义,例如,与用户关联的小区具体可以包括用户所在的小区、用户的邻区等,本技术实施例对此不作具体限定。
86.通过对已知类型的大量用户的运动特征、用户的rsrp以及用户与基站之间的距离进行统计分析得出,各类型的用户的rsrp、用户与基站之间的距离以及用户的运动特征均在三维空间中呈现出聚类分布的特点。其次,通过对处于同一小区的多个不同类型的用户的rsrp进行统计分析得出,不同类型的用户的rsrp具有明显的差异性,室外用户的rsrp通常要比室内用户的rsrp强。此外,通过对大量用户的邻区内不同类型的用户的rsrp进行统计分析得出,用户所在小区内各用户的rsrp分布情况与用户的邻区内各用户的rsrp分布情况大致相同。基于以上三点可以得出,不同类型的用户的运动特征及与用户相关联的小区的信号覆盖特征都具有明显差异性,因此可将用户的运动特征及与用户相关联的小区的信号覆盖特征作为用户的用户行为特征数据,以便能够准确识别室内外用户。
87.在可选的方案中,可基于待识别用户的mdt数据中的位置信息及各位置对应的时刻,确定待识别用户的移动速度,并基于待识别用户的位置信息,确定待识别用户所在的小区及邻区,进一步基于待识别用户所在小区内各用户的类型及mdt数据进行整合,以得到待识别用户所在小区内不同类型的用户的rsrp,以及基于待识别用户的邻区内各用户的类型及mdt数据进行整合,以得到待识别用户的邻区内不同类型的用户的rsrp。
88.具体地,可将待识别用户的mdt数据中的位置信息按照时间序列进行排序,确定相邻两个时刻之间的时间差和对应位置间的距离,进而计算出待识别用户在这段距离内的平
均移动速度,即v=d/(t
2-t1),其中,v表示移动速度,d表示待识别用户在t1时刻所处的位置与在t2时刻所处的位置之间距离。
89.进一步地,可基于待识别用户的mdt数据中的位置信息,确定各个位置所属的小区,将占比最高的小区作为待识别用户所在的小区,并将与该小区相邻的小区作为待识别用户的邻区。接着,可获取用户所在小区内所有用户的mdt数据,并按照各用户的类型对所有用户的rsrp进行分类和整合,可以得到该小区内不同类型的用户的rsrp。同样地,可获取待识别用户的邻区内所有用户的mdt数据,并按照各用户的类型对所有用户的rsrp进行分类和整合,可以得到该邻区内不同类型的用户的rsrp。,其中,不同类型的用户的rsrp可以是不同类型的用户的平均rsrp、rsrp范围等,本技术实施例对此不作具体限定。
90.s16,基于设定的分类模型和待识别用户的用户行为特征数据,对待识别用户进行分类,得到待识别用户的类型。
91.其中,所述类型包括室内用户和室外用户。所述分类模型是基于设定的分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到。
92.需要说明的是,训练得到上述分类模型的过程将在下文图2所示的实施例中进行详细说明,此处不再展开。
93.通过本实施例提供的室内外用户识别方法,由于室内用户和室外用户各自的运动特征及相关联的小区的信号覆盖特征均存在明显的差异性,且同一类型的用户的运动特征及相关联的小区的信号覆盖特征均存在明显的局类型,通过将用户的运动特征和相关联的小区的信号覆盖特征作为用户的用户行为特征数据,设定的分类模型基于分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到,进而基于该分类模型和待识别用户的用户行为特征数据对待识别用户进行识别,可以克服建筑物室内覆盖情况不明确对识别结果的影响,达到准确识别室内外用户的效果。
94.为了使本领域技术人员更加理解本技术实施例提供的技术方案,下面对本技术实施例提供的室内外用户识别方法进行详细说明。
95.针对上述步骤s16中的分类模型,本技术实施例还包括对该分类模型的训练方法。
96.值得说明的是,对该分类模型的训练是根据从移动网络平台采集到的不同类型的样本用户的mdt数据预先进行的,后续在进行室内外用户识别的过程中,无需每次对该分类模型进行训练,或者,可以周期性地基于从移动网络平台新采集的不同类型的样本用户的mdt数据对该分类模型进行更新,以提升该分类模型的识别准确率。
97.具体地,对上述分类模型的训练方法如图2所示,该训练方法包括:
98.s22,获取多个不同类型的样本用户的mdt数据。
99.其中,样本用户的mdt数据可以例如包括但不限于样本用户的位置信息、rsrp等。具体来说,样本用户的位置信息可以包括样本用户的实时位置及各个位置对应的时刻,待识别用户的位置可以用经纬度数据表示。
100.s24,基于多个不同类型的样本用户的mdt数据,确定多个不同类型的样本用户的用户行为特征数据。
101.具体地,基于样本用户的mdt数据确定样本用户的用户行为特征数据的具体实施方式与上述步骤s14中确定待识别用户的用户行为特征数据的具体实施方式类似,此处不再赘述。
102.s26,将样本用户的用户行为特征数据作为样本数据,得到样本数据集。
103.对于每一样本用户,在确定出该样本用户的用户行为特征数据后,可将确定出的用户行为特征数据作为样本数据,由此,可得到包含多个样本数据的样本数据集。
104.s28,基于设定的分类算法和样本数据集,对多个不同类型的用户进行训练,建立分类模型。
105.具体地,将样本数据所属的样本用户的类型作为标签,通过将样本数据作为输入、将样本数据的标签作为输出,通过分类算法进行训练,可以得到分类模型。
106.本技术实施例中的分类算法可以例如包括以下一种或多种算法的组合:knn(k-nearestneighbor,k最近邻)算法、决策树算法、随机森林算法、朴素贝叶斯算法等,本技术实施例对分类算法不做具体限定。
107.由于不同类型的用户的运动特征及与用户相关联的小区的信号覆盖特征存在明显的差异性,且knn算法相对简单、便于实施,在较为优选的方案中,可选取knn算法对分类模型进行训练。由此,训练得到的分类模型可基于待识别用户的用户行为特征数据与所有已知类型的样本数据,从中选取与待识别用户的用户行为特征数据距离最近的k个已知类型的样本数据,根据少数服从多数的投票法则,将k个最邻近的样本数据中占比最多的类型确定为待识别用户的类型。
108.由于分类模型的k值对识别结果的准确率有较大的影响,较大的k值可以减小分类模型学习的误差,但近似误差会增大,使得分类模型变得简单;而较小的k值使得分类模型的近似误差减小,但估计误差会增大,容易发生过拟合,因此,在更为优选的方案中,可在对分类模型的训练过程中进行不断迭代以寻找最佳k值,由此使得得到的分类模型的近似误差和估计误差适中,进而得到的分类模型的识别准确率高。
109.具体地,如图3所示,上述步骤s28可以包括:
110.s281,将所述样本数据集划分为第一数据集和第二数据集。
111.第一数据集和第二数据集相对独立,二者可以通过样本数据集的数据量来划分,例如将样本数据集对半分成两个相对独立的集合。当然,对样本数据集的划分还可以采用现有的其他划分方式,本技术实施例对样本数据集的划分方式不做具体限定。
112.s282,针对第一数据集中每一样本数据,确定该样本数据与第二数据集中各样本数据之间的距离。
113.可将第一数据集可作为训练数据,第二数据集可作为测试数据。
114.任意两个样本数据之间的距离可采用欧式距离,如下述公式(1)所示。
[0115][0116]
其中,d(x,y)表示第一数据集中的样本数据x与第二数据集中的样本数据y之间的距离;xi表示样本数据x包含的第i个特征;yi表示样本数据y包含的第i个特征;n表示样本数据包含的特征的总数。
[0117]
当然,值得说明的是,任意两个样本数据之间的距离也可以采用曼哈顿距离、闵可夫斯基距离等,本技术实施例对此不做具体限定。
[0118]
s283,从第二数据集中选取与该样本数据距离最近的设定数量的样本数据,确定
为参考样本数据。
[0119]
其中,设定数量即为分类模型的参数,即knn算法中的k值。
[0120]
s284,基于选取出的参考样本数据所属的样本用户的类型,识别该样本数据所对应的类型,得到该样本数据的类型识别结果。
[0121]
具体实施时,可首先设定一初始的k值。对于第一数据集中的每一样本数据,在通过上述步骤s282确定出该样本数据(以下称为待识别的样本数据)与第二数据集中各个样本数据之间的距离后,可从第二数据集中选取出与该待识别的样本数据距离最近的k个样本数据,作为参考样本数据,进一步可将选取出的参考样本数据中占比最高的类型作为该待识别的样本数据的类型,由此得到该待识别的样本数据的类型识别结果。
[0122]
s285,基于第一数据集中各样本数据所对应的类型及类型识别结果,更新设定数量。
[0123]
具体地,可基于第一数据集中各样本数据所对应的类型及类型识别结果,确定第一数据集的识别结果误差,若第一数据集的识别结果误差超过设定值,则调整设定数量k值,按照调整后的k值重复上述步骤s281至s284,直到第一数据集的识别结果误差小于设定值。由此,完成对分类模型的训练,将此时的k值作为分类模型的参数,得到训练好的分类模型。
[0124]
在其他一些可选的方案中,也可以设置多个设定数量k值,针对每一个k值,均执行上述步骤s281至s284,由此可基于每个k值对应的第一数据集的识别结果误差,进一步选取识别误差最小的k值作为分类模型最终的参数,由此完成对分类模型的训练。
[0125]
为了进一步提高分类模型的识别准确率,在更为优选的方案中,在上述步骤s24之前,本技术实施例提供的对分类模型的训练方法还包括:对于每一样本用户,基于该样本用户的mdt数据中的位置信息,确定该样本用户的移动速度,并筛除移动速度超过设定速度的样本用户的mdt数据。
[0126]
其中,样本用户的移动速度可以是样本用户的平均移动速度。设定速度可以根据实际需要自定义设置,例如,设定速度可以设置为120km/h。
[0127]
若样本用户的移动速度超过设定速度,可认为该样本用户的mdt数据存在异常,进而可将该样本用户的mdt数据筛除。
[0128]
可以理解,通过上述方案,从用户的角度对存在异常的样本用户的mdt数据进行筛除,可以避免异常数据对分类模型的训练带来的不良影响,进而使得训练出的分类模型的识别准确率更高。
[0129]
为了进一步提高分类模型的识别准确率,在更为优选的方案中,在上述步骤s24之前,本技术实施例提供的对分类模型的训练方法还包括:对于每一所述样本用户,基于该样本用户的mdt数据中的位置信息确定该样本用户与指定基站之间的距离,并筛除与指定基站之间的距离超过设定距离的样本用户的mdt数据。
[0130]
其中,指定基站可以是覆盖样本用户所在小区的基站,相应地,设定距离可以根据该基站的覆盖范围自定义设置。例如,可以获取该基站与周边其他基站之间的平均距离,将该平均距离的4至5倍作为上述设定距离。
[0131]
可以理解,通过上述方案,从基站的角度对存在异常的样本用户的mdt数据进行筛除,可以避免异常数据对分类模型的训练带来的不良影响,进而使得训练出的分类模型的
识别准确率更高。
[0132]
为了进一步提高分类模型的识别准确率,在更为优选的方案中,在上述步骤s24之前,本技术实施例提供的对分类模型的训练方法还包括:对于每一样本用户,将该样本用户的mdt数据中的经纬度数据与设定的地图图层数据进行匹配,得到该样本用户的经纬度数据与地图图层数据之间的匹配度,进一步筛除所述匹配度小于设定匹配度的样本用户的mdt数据。
[0133]
具体来说,对于每一样本用户而言,若获取到的该样本用户的mdt数据中的经纬度数据与设定的地图图层数据之间的匹配度小于设定匹配,则可判定该样本用户的mdt数据存在异常,进而可以将该样本用户的mdt数据筛除。其中,匹配度可以根据实际应用需要自定义设置,例如,匹配度可以设置为90%。
[0134]
可以理解,通过上述方案,通过将所包含的经纬度数据与地图图层数据不匹配的样本用户的mdt数据筛除,可以避免存在异常的mdt数据对分类模型的训练带来的不良影响,进而使得训练出的分类模型的识别准确率更高。
[0135]
由于用户的运动特征和与用户相关联的小区的信号覆盖特征属于不同维度的物理量,两者之间往往具有不同的量纲和单位,为了保证分类模型的识别结果准确率,在更为优选的方案中,在上述步骤s28之前,本技术实施例提供的对分类模型的训练方法还可以包括:对样本数据集中的样本数据进行归一化处理。
[0136]
具体地,可按照下述公式(2)对样本数据集中的样本数据进行归一化处理。
[0137][0138]
其中,x
norm
表示对样本数据中的特征x进行归一化后的值,x
max
表示样本数据集中该特征的最大值,x
min
表示样本数据集中该特征的最小值。
[0139]
可以理解,通过对样本数据集中的样本数据进行归一化处理,以保证样本数据包含的不同物理量之间处于同一个数量级之下,进而消除不同量纲之间的差异,提升分类模型的识别准确率。
[0140]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0141]
图4是本技术的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
[0142]
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总
线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0143]
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
[0144]
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成室内外用户识别装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
[0145]
获取待识别用户的最小化路测mdt数据;
[0146]
基于所述待识别用户的mdt数据,确定所述待识别用户的用户行为特征数据,用户的用户行为特征数据包括所述用户的运动特征、与所述用户相关联的小区的信号覆盖特征;
[0147]
基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类,得到所述待识别用户的类型,其中,所述类型包括室内用户和室外用户,所述分类模型是基于设定的分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到。
[0148]
上述如本技术图1所示实施例揭示的室内外用户识别装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0149]
该电子设备还可执行图1的方法,并实现室内外用户识别装置在图1、图2所示实施例的功能,本技术实施例在此不再赘述。
[0150]
当然,除了软件实现方式之外,本技术的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
[0151]
本技术实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
[0152]
获取待识别用户的最小化路测mdt数据;
[0153]
基于所述待识别用户的mdt数据,确定所述待识别用户的用户行为特征数据,用户的用户行为特征数据包括所述用户的运动特征、与所述用户相关联的小区的信号覆盖特征;
[0154]
基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类,得到所述待识别用户的类型,其中,所述类型包括室内用户和室外用户,所述分类模型是基于设定的分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到。
[0155]
图5是本技术的一个实施例室内外用户识别装置的结构示意图。请参考图5,在一种软件实施方式中,该装置500可包括:
[0156]
第一获取模块510,用于获取待识别用户的最小化路测mdt数据;
[0157]
第一确定模块520,用于基于所述待识别用户的mdt数据,确定所述待识别用户的用户行为特征数据,用户的用户行为特征数据包括所述用户的运动特征、与所述用户相关联的小区的信号覆盖特征;
[0158]
分类模块530,用于基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类,得到所述待识别用户的类型,其中,所述类型包括室内用户和室外用户,所述分类模型是基于分类算法和多个不同类型的样本用户的mdt数据进行训练得到。
[0159]
可选地,所述mdt数据包括位置信息和参考信号接收功率rsrp,所述运动特征包括移动速度,与所述用户相关联的小区的信号覆盖特征包括所述用户的rsrp、所述用户所在小区内不同类型的用户的rsrp和所述用户的邻区内不同类型的用户的rsrp;
[0160]
所述第一确定模块520具体用于:
[0161]
基于所述待识别用户的位置信息及各位置对应的时刻,确定所述待识别用户的移动速度;
[0162]
基于所述待识别用户的位置信息,确定所述待识别用户所在的小区及邻区;
[0163]
基于所述待识别用户所在小区内各用户的类型及mdt数据进行整合,以得到所述所在小区内不同类型的用户的rsrp;以及,
[0164]
基于所述邻区内各用户的类型及mdt数据进行整合,以得到所述邻区内不同类型的用户的rsrp。
[0165]
可选地,所述第一获取模块510还用于:在所述分类模块530基于设定的分类模型和所述待识别用户的用户行为特征数据,对所述待识别用户进行分类之前,获取多个不同类型的样本用户的mdt数据;
[0166]
所述第一确定模块520还用于:
[0167]
基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据;
[0168]
所述装置500还包括训练模块,所述训练模块具体用于:
[0169]
将所述样本用户的用户行为特征数据作为样本数据,得到样本数据集;
[0170]
基于所述分类算法和所述样本数据集,对所述多个不同类型的用户进行训练,建立所述分类模型。
[0171]
可选地,所述分类算法为k最近邻knn算法;
[0172]
所述训练模块具体用于:
[0173]
将所述样本数据集划分为第一数据集和第二数据集;
[0174]
针对所述第一数据集中每一样本数据,确定该样本数据与所述第二数据集中各样本数据之间的距离;
[0175]
从所述第二数据集中选取与该样本数据距离最近的设定数量的样本数据,确定为参考样本数据;
[0176]
基于选取出的参考样本数据所属的样本用户的类型,识别该样本数据所对应的类型,得到该样本数据的类型识别结果;
[0177]
基于所述第一数据集中各样本数据所对应的类型及类型识别结果,更新所述设定数量。
[0178]
可选地,所述装置还包括第一筛选模块;
[0179]
所述第一筛选模块,用于在所述第一确定模块520基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,对于每一所述样本用户,基于所述样本用户的mdt数据中的位置信息,确定所述样本用户的移动速度,并筛除移动速度超过设定速度的样本用户的mdt数据。
[0180]
可选地,所述装置还包括第二筛选模块;
[0181]
所述第二筛选模块,用于在所述第一确定模块520基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,对于每一所述样本用户,基于所述样本用户的mdt数据中的位置信息确定所述样本用户与指定基站之间的距离,并筛除与所述指定基站之间的距离超过设定距离的样本用户的mdt数据。
[0182]
可选地,所述装置还包括第三筛选模块,所述第三筛选模块用于:
[0183]
在所述第一确定模块520基于所述多个不同类型的样本用户的mdt数据,确定所述多个不同类型的样本用户的用户行为特征数据之前,对于每一所述样本用户,将所述样本用户的mdt数据中的经纬度数据与设定的地图图层数据进行匹配,得到所述经纬度数据与所述地图图层数据之间的匹配度;
[0184]
筛除所述匹配度小于设定匹配度的样本用户的mdt数据。
[0185]
通过本实施例提供的室内外用户识别装置,由于室内用户和室外用户各自的运动特征及相关联的小区的信号覆盖特征均存在明显的差异性,且同一类型的用户的运动特征及相关联的小区的信号覆盖特征均存在明显的局类型,通过将用户的运动特征和相关联的小区的信号覆盖特征作为用户的用户行为特征数据,设定的分类模型基于分类算法和多个不同类型的样本用户的用户行为特征数据进行训练得到,进而基于该分类模型和待识别用户的用户行为特征数据对待识别用户进行识别,可以克服建筑物室内覆盖情况不明确对识别结果的影响,达到准确识别室内外用户的效果。
[0186]
总之,以上所述仅为本技术的较佳实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
[0187]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放
器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0188]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0189]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0190]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1