数据处理方法及装置与流程

文档序号:14943191发布日期:2018-07-13 21:37
本发明涉及通信
技术领域
,尤其涉及用于移动通信的数据处理方法及装置。
背景技术
:随着移动通信技术的不断发展,为了向用户提供更加优质的通信服务,提升用户的使用体验,经常需要确定用户常驻位置的准确信息。根据网络投诉记录统计,长期演进(LTE)网络用户90%以上的投诉原因反映在其常驻位置的网络质量问题,如家里、单位、学校等,表明用户对LTE网络质量的高敏感和网络满意度集中反映在其常驻位置的感知,而用户的常驻位置基本上为室内场景。因此,如何基于现有的移动网络数据精准过滤抽样出用户的常驻室内位置,是量化评估室内网络质量、降低用户投诉、提高用户满意度的关键。在使用LTE技术的移动通信中,已有几种方式可以实现室内用户的位置定位。一种方式可以基于小区群识别室内用户并匹配测量报告(MR)信息:将存在切换关系的小区汇聚为小区群,通过特定时间内(如T=20分钟)用户活动范围在小区群内并且活动半径小于X米,即判定为室内用户,最终通过此类用户MR话单仿真定位出LTE室内用户位置。这种确定用户常驻位置的方式由于难以准确识别并剔除大量的产生在室内场景周边且慢速移动的用户的采样数据,因此所确定的用户的常驻位置并不准确。另一种方式可以基于建立室内用户指纹库并匹配MR信息:通过室内用户特征(主服小区和邻区的覆盖场景、电平、变化率、用户移动速率等,APP经纬度信息等)建立室内用户指纹库,匹配符合指纹库特征的MR类型过滤出近似室内用户的MR,最终通过MR话单仿真定位出LTE室内用户的位置。还有一种方式可以基于海量实测数据建模及软件定位SDK:通过海量楼宇、室内实地测试或扫频建立MR覆盖模型,或通过特定软件的专用服务接口进行高精度定位。这两种定位方法都需要较大的成本投入和后期维护,不太适用于全区域的应用和推广。技术实现要素:本发明实施例提供了一种数据处理方法和装置,能够对在室内场景周边,以及慢速移动的用户的采样数据进行筛选和剔除,从而利用该数据准确地确定用户的常驻位置。本发明的一个实施例提供了一种数据处理方法,该方法包括:根据XDR数据确定用户在目标时间段内的常驻小区;利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息;根据所述常驻小区以及所述经纬度信息,从所述用户在所述目标时间段内的通信数据中筛选出用于确定所述用户在所述目标时间段内常驻位置的数据。可选地,根据XDR数据确定目标时间段内终端的常驻小区的步骤包括:根据XDR数据中的信令特征数据确定目标时间段内终端的在各小区驻留频次;将大于预设阈值的驻留频次所对应的小区确定为所述目标时间段的常驻小区。可选地,根据XDR数据中的信令特征数据确定终端的在各小区驻留频次的步骤包括:根据S1_MME接口接收的XDR数据中的信令特征数据确定终端处于空闲状态下的驻留频次;和/或,根据S1_U接口接收的XDR数据中的信令特征数据确定终端处于业务状态下的驻留频次。可选地,MR指纹数据库通过如下方法建立:通过MR数据和XDR数据共有的三元组,将目标时间段内多天MR数据和XDR数据进行关联合并;根据合并后的数据创建所述MR指纹数据库。可选地,利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息的步骤包括:确定所述MR数据的本小区和邻近小区的信号强度;在所述MR数据归属主服务小区的MR指纹数据库中,查找特征信息与当前MR数据中包含的特征信息最接近的位置;确定所述位置的经纬度,作为所确定的所述用户的经纬度信息。可选地,根据所述常驻小区以及所述经纬度信息,从所述用户在所述目标时间段内的通信数据中筛选出用于确定所述用户在所述目标时间段内常驻位置的数据的步骤包括:将用户在目标时间段内的常驻小区以及所述用户的经纬度信息,按照用户、时段以及小区进行关联合并;通过对所述目标时段内出现在所述常驻小区以外的S1-MME和S1-U话单记录的话单时间点的常驻小区定位经纬度信息进行数据清洗剔除,确定所述用户在所述目标时间段内常驻位置的数据。可选地,所述方法还包括:通过计算筛选所得到的数据的离散度对所述数据进行清洗;通过清洗后的数据结合地图处理程序,确定所述用户在所述目标时间段的常驻建筑物位置。本发明的另一实施例还提供了一种数据处理装置,包括:常驻小区确定单元、经纬度信息确定单元以及数据处理单元,其中:常驻小区确定单元,根据XDR数据确定用户在目标时间段内的常驻小区;经纬度信息确定单元,利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息;数据处理单元,根据所述常驻小区以及所述经纬度信息,从所述用户在所述目标时间段内的通信数据中筛选出用于确定所述用户在所述目标时间段内常驻位置的数据。可选地,所述装置还包括MR指纹数据库建立单元;所述MR指纹数据库建立单元,通过MR数据和XDR数据共有的三元组,将目标时间段内多天MR数据和XDR数据进行关联合并,根据合并后的数据创建所述MR指纹数据库。可选地,所述常驻小区确定单元根据XDR数据中的信令特征数据确定目标时间段内终端的在各小区驻留频次;将大于预设阈值的驻留频次所对应的小区确定为所述目标时间段的常驻小区。采用本发明的实施例所提供的数据处理方法和装置,根据XDR数据确定用户在目标时间段内的常驻小区,并且利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息,从而能够根据该常驻小区以及该经纬度信息,从用户在目标时间段内的通信数据中筛选出用于确定该用户在目标时间段内常驻位置的数据。根据本发明实施例的上述技术方案,能够对在室内场景周边,以及慢速移动的用户的采样数据进行筛选和剔除,从而利用该数据能够准确地确定用户的常驻位置。附图说明此处所说明的附图用来提供对本文技术方案的进一步理解,构成说明书的一部分,用于解释目的而不应认为将本发明的方案局限于所示的具体内容。在附图中:图1为本发明的实施例提供的数据处理方法的具体实现流程示意图;图2为本发明的实施例提供的MR数据和XDR数据关联示意图;图3为本发明的实施例提供的数据清洗示意图;图4为本发明的实施例提供的确定用户常驻建筑物的示意图;图5为本发明的实施例所提供的数据处理装置的具体结构示意图。具体实施方式下面将结合附图描述本发明的示例性实施例。但是显然,所描述的实施例仅是其部分实现方式,而不是全部的可能实现方式。基于本文所公开的实施例,本领域普通技术人员容易获得的其他实现方式,这些都应落在所申请保护的范围内。本发明的一个实施例提供了一种数据处理方法。该方法的流程示意图如图1所示,包括下述步骤。步骤S11:根据XDR数据,确定用户在目标时间段内的常驻小区。XDR数据是基于全量数据进行处理后,生成的供信令监测平台和信令类应用使用的信令及业务的详细记录,其中,全量数据包含了被采集链路的全部内容,包括控制面的全量信令数据及用户面的全量业务数据。在实际通信过程中,XDR数据可以包括信令XDR(也称为信令特征数据)以及业务XDR(也称为XDR通话数据),其中信令XDR是基于所采集的控制面信令而生成的信令过程的详细记录,业务XDR是基于所采集的用户面业务数据而生成的业务传输过程的详细记录。通常时间段的划分方式可以有多种。比如,可以以小时为单位将一天划分为24个时间段,也可以将一天划分为工作时间段(比如,9点~12点、14点~17点)、休闲时间段(17点~24点、12点~14点)以及休息时间段(0点~9点),等等。由于用户的工作和生活方式不同,不同用户的周期性潮汐位置规律存在差异,也造成用户在白天(对应于工作时间段)、晚上(对应于休闲时间段)、夜间(对应于休息时间段)的业务模型和感知存在明显差异。也可以结合用户的职业、年龄等因素,采用其它的划分方式将一天划分为其它的时间段。在一种实施例中,对用户常驻位置场景进行如表1所示的划分聚类。表1根据一种实施例,确定用户在目标时间段内的常驻小区可以采用如下方式:根据XDR数据中的信令特征数据确定目标时间段内用户在各小区的驻留频次,然后将大于预设阈值(例如1小时)的驻留频次所对应的小区确定为所述目标时间段的常驻小区。在LTE通信技术中,为了确定目标时间段内终端在各小区的驻留频次,可以根据S1-U接口和S1-MME接口中接收的XDR数据中的信令特征数据,来确定目标时间段内终端在各小区的驻留频次,该驻留频次能够反映终端(或终端的用户)在对应的小区内的驻留时间。比如,可以根据S1_MME接口的XDR信令特征数据确定终端处于空闲状态下的驻留频次(称为空闲驻留频次),或根据S1_U接口的XDR信令特征数据确定终端处于业务状态下的驻留频次(称为业务驻留频次),也可以结合这两个接口中接收到的XDR信令特征数据来总的驻留频次。基于S1_MME消息,终端在空闲状态下,最长的信令间隔至少为周期性的“跟踪区更新(TAU)”时长(根据LTE规范的T3412定时器,该时长为54分钟),因此用户在持续空闲态1小时内必定会触发TAU_TYPE=3的TAU。可以以小时为粒度统计用户在对应小区下的驻留小时频次。例如,用户单天特定时段内在同一小区3个小时出现S1_MME消息记录,则该用户在当天该时段内驻留的小时频次为3。通常,系统可以筛选频次大于2且最高的N个小区(N例如可以是3、4或者其他值);如果出现驻留频次相同的情况,可以再选择消息记录次数最多的小区。因此,能够根据S1_MME接口的XDR信令特征数据的次数,将该次数确定为终端处于空闲状态下的驻留频次,从而统计该终端的用户在对应小区下的驻留时间。用户在业务态下会产生的相关业务话单记录。和空闲态算法类似,可以将用户在小区的小时时段内产生过该类话单记录记为1次驻留频次,并可以将该信令用于判别用户在业务态下的驻留小区。例如,用户单天特定时段内在同一小区的3个小时时段均产生过S1-U话单记录即认为在该小区的业务态驻留频次为3。系统可以筛选频次大于2且最高的N个小区(N例如可以为3、4或者其他值);如果出现频次相同的情况,可以再选择消息记录次数最多的小区。因此,能够根据S1_U接口的XDR信令特征数据确定终端处于业务状态下的驻留频次。此外,也可以将空闲驻留频次和业务驻留频次之和的总驻留频次,作为所确定目标时间段内用户的在对应小区的驻留频次。大于预设阈值的驻留频次所对应的小区被确定为目标时间段的常驻小区。当驻留频次大于该预设阈值时,说明用户在该小区内进行了较长时间的逗留,可以将该小区确定为目标时间段内的常驻小区。该预设阈值可以根据实际需要进行设定,比如,可以设定为3、4,或设定为其他值。为了进一步增加所确定的常驻小区的准确性,可以确定一个调查周期(例如15天或者其它)。在该调查周期内,确定每一天目标时间段的待选常驻小区,如果该调查周期内,预定比例(例如50%)以上的天数中某个小区均为目标时间段的常驻小区,则可以将该小区确定为目标时间段的常驻小区。例如,在连续的15天内,用户至少有8天在9:00-11:00和14:00-17:00的时段在同一小区下空闲驻留频次加业务驻留频次不小于3,则可以将该小区确定为该用户的一个白天常驻小区;在这15天内至少有8天在17:00-24:00的时段在同一小区下空闲驻留频次加业务驻留频次不小于3,则可以将该小区确定为该用户的一个晚上常驻小区;在这15天内至少有8天在0:00-9:00的时段在同一小区下空闲驻留频次加业务驻留频次不小于3,则可以将该小区确定为一个该用户的夜间常驻小区。这种方式可以有效剔除用户在潮汐(例如上下班路途上)及类似场景产生规律性业务的非常驻小区输出,从而使得所确定的常驻小区更加准确。在进一步的实施例中,还可以从调查周期中剔除节假日,以减小类似的规律性影响。由于无线网络的特点,用户特定时段的常驻位置可能存在多重小区覆盖现象,因此常驻位置CI可能会有多个。在一种实施例中,可以针对常驻位置的数目设定阈值N(例如3、4或其他数值)。在多个常驻位置CI中可以按照出现天数和时段频率进行排序,选择不多于N个小区,作为用户常驻位置小区簇,该小区簇内可以有一个或多个小区。用户的多场景常驻位置可以被建模输出,例如表2所示。表2步骤S12:利用预先建立的MR指纹数据库以及MR数据,确定用户的经纬度信息。MR指纹数据库可以预先创建。在一种实施例中,可以通过步骤S121和S122创建MR指纹数据库。步骤S121:将分析区域下同一时间范围的多天LTEMR数据和XDR数据进行关联合并。在一种实施例中,可以利用图2所示MR数据和XDR数据共有的三元组UE-S1AP-ID、MMEGROUPID和MMEcode参数,并结合时间戳和小区进行MR和XDR关联,以获得相关数据。根据示例性实施例,该数据可以包括表3所示的字段中的一些或全部。用户(IMSI)时间CIAOATARSRP邻区CI邻区RSRPAPP上报经纬度……表3步骤S122:根据步骤S121获得的数据,创建基于用户上报APPGPS和实地测试数据的MR指纹数据库。该数据库的数据能够实现自动累积更新,并能够利用该MR指纹数据库,对符合指纹库规则的用户MR数据的用户记录进行定位。表4示出了步骤S122所创建的MR指纹数据库的一些示例性字段。经度纬度TAAOASCRSRPN1RSRPN2RSRPN3RSRP表4S1-U中HTTP话单的XDR文件中的URI字段可以截取到部分APP上报的经纬度。有效APP经纬度可以按话单的过程开始时间(ProcedureStartTime)、过程结束时间(ProcedureEndTime)和MRO中的数据,采用n秒内时间滑动搜索方式进行关联,剔除n秒外的无效数据,实现对同一个用户的MR、XDR数据的关联,获取用户上报APP经纬度时的RSRP、邻区RSRP、RSRQ、TA、RIP、AOA等信息。这样,用户APP经纬度和无线环境(MR模型)可以关联起来,并实现自动累计和更新的MR指纹库。在创建MR指纹数据库之后,可以利用所创建的MR指纹数据库,根据MR数据的无线传播模型进行仿真定位。根据一种实施例,可以通过最小化欧式距离算法将MR数据的用户定位到仿真位置。例如,对于一条待定位的MR数据记录,可以确定它的本小区和邻小区的信号强度,然后在该MR归属主服务小区的指纹集合中,查找特征信息与当前MR中包含的特征信息最接近的位置,并以此位置做为该MR数据记录的位置。即,以主服务小区为键(key)进行键值搜索,仅提取满足主服务小区匹配的指纹库;假设对于第i条MRO数据,包含K个主邻小区ID,对应的参考信号功率记为RSRPi,k,选取第j条指纹库信息中的K个主邻小区进行比较,对应的参考信号功率记为RSRPj,k,则第i条MRO数据与第j条指纹库信息的归一化欧式距离匹配可以用如下公式(1)表示。那么,对于指纹库序号的全集记为J,则第i条MRO数据匹配到第s条指纹库的最小化归一化欧式距离匹配算法可以用如下公式(2)表示。对应的,可以认为第i条MRO数据匹配到第s条指纹库对应的位置,将数据整理之后加上经纬度信息输出。最终输出的MR数据记录的经纬度的示例如表5所示。用户(IMSI)时间CIAOATARSRP邻区CI邻区RSRP经纬度……表5步骤S13:根据常驻小区以及经纬度信息,从用户在目标时间段内的通信数据中筛选出用于确定所述用户在所述目标时间段内常驻位置的数据。在一种实施例中,步骤S13可以包括步骤S131和S132。S131:将用户在目标时间段内的常驻小区以及所述用户的经纬度信息,按照用户、时段以及小区进行关联合并。S132:通过对所述目标时段内出现在所述常驻小区以外的S1-MME和S1-U话单记录的话单时间点的常驻小区定位经纬度信息进行数据清洗剔除,确定所述用户在所述目标时间段内常驻位置的数据。对通信数据的筛选可以满足用户在指定时长(例如1小时)以上产生的信令话单都在其常驻的小区组范围内的小区,以避免用户短期驻留常驻位置周边的场景。在筛选出数据之后,即得到了用户在各类目标时间段(例如白天、晚上、夜间)常驻位置的仿真经纬度集合,如表6所示,从而能够利用该数据准确的确定用户在目标时间段的准确位置。表6本发明的实施例提供的数据处理方法根据XDR数据确定用户在目标时间段内的常驻小区,并且利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息,从而能够根据该常驻小区以及该经纬度信息,从用户在目标时间段内的通信数据中筛选出用于确定该用户在目标时间段内常驻位置的数据。该方法能够对在室内场景周边以及慢速移动的用户的采样数据进行筛选和剔除,从而利用该数据能够准确地确定用户的常驻位置。根据本发明的实施例,通过对用户多场景常驻位置的建模,精确过滤并定位用户常驻室内位置。与传统的基于移动网络数据的定位算法相比,目标针对性更明确,定位更准确;而与海量测试模拟及软件定位SDK方法相比,能节省较大的成本,并具有减少维护难度等优点。既能较大程度提高现有仅基于移动网络数据静态用户定位的准确性,又能找出网络下关键保障用户群,为用户常驻位置的网络质量评估、降低投诉、提高满意度提供低成本且更有效的支撑。虽然上文对实施例的描述是按照步骤S11~步骤S13的顺序进行的,但是这并不是限制性的。上述方法可以包括更多或更少的步骤,或者,其中的步骤顺序可以调换(例如先执行步骤S12,再执行步骤S11)。例如,在步骤S13对通信数据进行筛选之后,还可以对筛选得到的数据进行清洗,从而进一步的增加利用该数据确定的用户常驻位置的准确性。在一种实施例中,可以通过计算筛选所得到的数据的离散度对所述数据进行清洗。例如,可以按照10米×10米(或者其它值)区域进行离散度计算,过滤剔除掉稀疏的(例如,MR仿真经纬度采样数除以定样面积小于阈值比例,如图3右半部分的两个区域所示)采样点。或者,可以过滤剔除掉距离仿真采样数最集中区域若干距离(例如X米外)的采样。其中,X可以根据实际场景进行确定,例如可以将城区场景的X确定为1000米,非城区的X确定为2000米。多种清洗方式也可以结合使用。在一种实施例中,还可以根据清洗后的数据并结合地图处理程序,根据经纬度采样集中度与地理建筑物匹配,确定用户在所述目标时间段的常驻建筑物位置。图4示出了有关的示例;该图用大体方框形状示出了五个建筑物,用户的常驻建筑物位置可以确定为左半部分的椭圆形所示区域。本发明的实施例还提供了一种数据处理装置,该装置可以与上文所述的方法相对应。如图5所示,该装置50可以包括常驻小区确定单元501、经纬度信息确定单元502以及数据处理单元503。其中,常驻小区确定单元501,根据XDR数据确定用户在目标时间段内的常驻小区;经纬度信息确定单元502,利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息;数据处理单元503,根据所述常驻小区以及所述经纬度信息,从所述用户在所述目标时间段内的通信数据中筛选出用于确定所述用户在所述目标时间段内常驻位置的数据。由于该装置50采用与实施例1相同的发明构思,因此能够解决现有技术中的问题,这里就不再赘述。常驻小区确定单元501可以根据XDR数据确定目标时间段内终端的常驻小区。例如,可以根据XDR数据中的信令特征数据确定目标时间段内终端的在各小区驻留频次,并将大于预设阈值的驻留频次所对应的小区确定为所述目标时间段的常驻小区。在实际应用中,可以是根据S1_MME接口接收的XDR数据中的信令特征数据确定终端处于空闲状态下的驻留频次,也可以是根据S1_U接口接收的XDR数据中的信令特征数据确定终端处于业务状态下的驻留频次,也可以是空闲驻留频次以及业务驻留频次的和。该装置50还可以包括MR指纹数据库建立单元,该MR指纹数据库建立单元可以通过如下方式建立MR指纹数据库:通过MR数据和XDR数据共有的三元组,将目标时间段内多天MR数据和XDR数据进行关联合并,根据合并后的数据创建所述MR指纹数据库。经纬度信息确定单元502可以利用预先建立的MR指纹数据库以及MR数据确定所述用户的经纬度信息,例如确定所述MR数据的本小区和邻近小区的信号强度;在所述MR数据归属主服务小区的MR指纹数据库中,查找特征信息与当前MR数据中包含的特征信息最接近的位置;确定所述位置的经纬度,作为所确定的所述用户的经纬度信息。数据处理单元503可以根据所述常驻小区以及所述经纬度信息,从所述用户在所述目标时间段内的通信数据中筛选出用于确定所述用户在所述目标时间段内常驻位置的数据。例如,可以将用户在目标时间段内的常驻小区以及所述用户的经纬度信息,按照用户、时段以及小区进行关联合并;通过对所述目标时段内出现在所述常驻小区以外的S1-MME和S1-U话单记录的话单时间点的常驻小区定位经纬度信息进行数据清洗剔除,确定所述用户在所述目标时间段内常驻位置的数据。该装置还可以还包括数据清洗单元以及常驻位置确定单元。其中,数据清洗单元可以通过计算筛选所得到的数据的离散度对所述数据进行清洗。常驻位置确定单元可以通过清洗后的数据结合地图处理程序,确定所述用户在所述目标时间段的常驻建筑物位置。本领域的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。数据处理装置50可采用完全硬件、完全软件、或结合软件和硬件的实施形式。还可采用在一个或多个含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光存储器等)上实施的计算机程序产品的形式。在本文描述的技术方案中,通过提取用户在空闲态及业务态下控制面及业务面信令中移动管理性数据及信息,进行用户周期性潮汐类别聚类,建立用户常驻位置(小区簇)建模;将S1信令和MR数据关联,通过创建APP经纬度及实际测试数据矫正指纹库对MR无线传播仿真定位数据进行校正,得出全量用户级定位数据;从而能够通过算法关联得到用户多类场景常驻位置的室内定位、业务、MR等相关信息。本文是参照根据实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。以上所描述的仅为本发明的实施例,并不用于限制目的。对于本领域技术人员来说,可以有各种更改和变化形式。在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。当前第1页1 2 3 
再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1