旅游用户筛选的方法和旅游用户筛选的系统与流程

文档序号:12906711阅读:478来源:国知局
旅游用户筛选的方法和旅游用户筛选的系统与流程

本发明属于大数据处理/旅游技术领域,具体涉及一种旅游用户筛选的方法和旅游用户筛选的系统。



背景技术:

随着经济的快速发展,旅游越来越成为人们满足精神享受的方式。景区、酒店、旅行社、ota应用等均希望发掘旅游爱好者,向用户定向推送旅游相关信息。

目前,景区、酒店、旅行社等实体旅游行业主体,并无智能定位旅游爱好者以及发掘潜在客户群的有效方法及手段或渠道,均通过公共广告投放或向老顾客投放广告等实现信息宣传。ota应用(onlinetravelagent,即在线旅行代理,例如携程、途牛、蚂蜂窝、去哪儿等),大多在app应用商店推广应用,扩张注册用户数,再通过分析注册用户在其应用上的浏览、搜索、订购行为,向用户推荐相关度高的旅游信息及产品。

另外,ota应用分散自立,仅能掌握本应用注册用户的行为特征和爱好,无法分析哪些非注册用户是旅游潜在用户,且对新注册用户也无信息推荐的依据。可见,目前客户群和实体旅游行业主体供需信息极度不对称,不利于旅游资源及产品的针对性营销和推广。

提供一种有效的旅游用户定位以及发掘新旅游用户方法,成为目前对旅游爱好者进行精准旅游资讯推荐亟待解决的技术问题。



技术实现要素:

本发明所要解决的技术问题是针对现有技术中存在的上述不足,提供一种旅游用户筛选的方法和旅游用户筛选的系统,有效的解决了旅游用户定位以及发掘新旅游用户的问题。

解决本发明技术问题所采用的技术方案是该旅游用户筛选的方法,其中,基于移动运营商大数据进行分析和定位旅游爱好者,该方法包括步骤:

获取数据:从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;

对数据进行分析处理:根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。

优选的是,在对数据进行分析处理时,构造函数为:

根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];

为向量,f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用的频次、t2为用户使用ota应用的时长以及b为用户使用ota应用的流量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;

θ为调整参数,θ为向量。

优选的是,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;

根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;

以及,根据用户上网记录数据中与访问ota应用、浏览旅游网页相关的流量统计和比较,结合用户访问ota应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。

优选的是,还包括根据用户以往历史行为数据,估计调整参数θ的步骤,包括:

根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;

选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;

将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);

计算并比较真实样本值与ym(θn)的误差和:

找出最小值δy对应的样本,其对应的向量θ即为调整参数。

优选的是,对数据进行分析处理还包括根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;

该方法还进一步包括:结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。

一种旅游用户筛选的系统,其基于移动运营商大数据进行分析和定位旅游爱好者,该系统包括数据获取模块1和数据分析处理模块,其中:

所述数据获取模块1:用于从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;

所述数据分析处理模块:用于根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。

优选的是,在所述数据分析处理模块中包括数据分类单元和计算单元,其中:

在所述数据分类单元中,对获取的数据进行如下分类:f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用ota应用的频次、t2为用户使用ota应用的时长以及b为用户使用ota应用的流量;

在所述计算单元中,构造函数为:

根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];

为向量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;

θ为调整参数,θ为向量。

优选的是,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;

在所述数据分类单元中,根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;以及,根据用户上网记录数据中与访问ota应用、浏览旅游网页相关的流量统计和比较,结合用户访问ota应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。

优选的是,所述数据分析处理模块还包括调整参数单元,用于根据用户以往历史行为数据,估计调整参数θ,包括:

根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;

选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;

将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);

计算并比较真实样本值与ym(θn)的误差和:

找出最小值δy对应的样本,其对应的向量θ即为调整参数。

优选的是,所述数据分析处理模块还用于根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;

该系统还进一步包括还包括资讯推荐模块,用于结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。

本发明的有益效果是:本发明的旅游用户筛选的方法和旅游用户筛选的系统,基于移动运营商大数据,从海量的数据中提炼或筛选出有用的当前位置和与旅游相关的数据,可以获知用户异地出行、异地停留的轨迹,感知用户“去过哪”;利用移动用户上网记录,可以获知用户有无了解旅游资讯的兴趣或出行的意愿,通过“做和想”的结合,可以科学、精准地判定“谁”是旅游爱好者,进而,结合用户以往行为数据,向这群人推荐“什么”,从而实现为用户推荐适合的旅游信息的目的,大大提高了数据资料的准确性和用户定位的有效性。

附图说明

图1为本发明实施例中旅游用户筛选的方法的流程图;

图2为本发明实施例中用户异地出行数据图;

图3为本发明实施例中用户异地停留数据图;

图4为本发明实施例中用户上网记录数据图;

图5为本发明实施例中用户手机消费数据图;

图6为本发明实施例中构造函数的曲线图;

图7为本发明实施例中旅游用户筛选的系统的结构框图;

附图标记中:

1-数据获取模块;

2-数据分析处理模块;21-数据分类单元;22-计算单元;23-调整参数单元;

3-资讯推荐模块。

具体实施方式

为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。

本发明实施例提供一种基于运营商大数据的旅游用户挖掘及定位旅游用户并相应进行信息推荐的方法及相应的系统。该基于运营商大数据的旅游用户挖掘及信息推荐的方法及相应的系统,通过对用户异地出行、异地停留、上网行为等特征分析,挖掘热爱旅游的用户群,并根据用户以往旅游消费档次,结合手机消费情况,为用户推荐合适的旅游资讯。

该旅游用户筛选的方法,基于移动运营商大数据进行分析和定位旅游爱好者,包括步骤:

获取数据:从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;

对数据进行分析处理:根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。

其中,在对数据进行分析处理时,构造函数为:

根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];

为向量,f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用的频次、t2为用户使用ota应用的时长以及b为用户使用ota应用的流量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;

θ为调整参数,θ为向量。

其中,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地(移动运营商通过历史大数据挖掘分析得出)进行比较,得出异地出行时间、地点、异地停留时间和次数。

移动运营商大数据记录的信息包括手机号码、位置区编码、基站编码、终端设备标识(imei)、流量类型、开始时间、结束时间、上行流量、下行流量、访问的网络类型等等。运营商网络业务和信令大数据(语音/短信/上网接入基站/小区、附着、位置更新、切换、mr数据等)记录着每个用户移动终端的当前位置(位于哪个移动网络基站/小区内),通过信号转接可实时感知用户位于移动网络中的哪个小区。根据小区的行政区划分布表,可以获知用户位于哪个城市。经过长期的分析,可知用户的常驻地在哪里(城市级别);当当前位置与用户常驻地不一致时,说明其在异地出行。并可进一步通过所在基站/小区的归属城市,可知其在哪个异地城市。通过基站/小区的归属地、经纬度及位置场景类型、用户在各个基站/小区的停留时间等,从而获知用户的异地停留数据

运营商网络业务大数据记录着每个用户使用移动终端上网的各种信息,访问的应用/网站名称、产生的流量、使用的时长、访问的应用/网站类型等。根据用户上网记录数据中与访问ota应用、浏览旅游网页相关的流量统计和比较,结合用户访问ota应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。

该方法还包括根据用户以往历史行为数据,估计调整参数θ的步骤,其中的调整参数为,根据运营商原始话单数据或统计分析结果数据进行计算得到。具体步骤包括:

根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;

选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;

将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);

计算并比较真实样本值与ym(θn)的误差和:

找出最小值δy对应的样本,其对应的向量θ即为调整参数。

即通过m个样本取值,分别代入构造函数,估计n个调整参数,判断哪个误差和最小,最小者最趋近于真实值的估计值,最小者对应的估计值即为调整参数。这里应该理解的是,对调整参数的估算可以采用多种估计方法,例如最大似然估计等,这里仅以最小误差和估计法作为示例。

该方法还可以进一步包括旅游资讯推荐的步骤:对数据进行分析处理还包括根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;

该方法还进一步包括:结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。

根据如图1所示的旅游用户筛选的方法的流程,详细说明该旅游用户筛选的方法如下:

步骤s1):获取数据。

基于运营商大数据获得如下几类数据:

(1)用户异地出行数据

用户使用的移动终端时刻与移动网络保持着信息交互,移动网络可实时感知用户位于网络中的哪个小区。根据小区的行政区划分布表,可以获知用户位于哪个城市。如图2所示,用户的当前位置在移动网络中可对应至基站/小区(位置区编码/小区号),根据基站/小区基础信息表可对应为经纬度,进而对应出城市;然后,可判断用户当前位置与常驻地是否一致,不一致则说明其在异地出行。

(2)用户异地停留数据

根据运营商网管系统对小区的基础信息记录,可获知用户位于哪类场所。如图3所示,用户异地出行的当前位置,也对应至移动网络中的基站/小区,根据基站/小区基础信息表可获知该小区的场景类型,是否在饭店、酒店、景区附近,可根据此判断用户是否具有旅游特征。

(3)用户上网记录数据

根据运营商网络侧采集的移动用户上网记录,可以获知用户访问的应用列表。如图4所示,可计算每个用户使用ota应用的时长和流量。

(4)用户手机消费数据

根据运营商计费管理系统内的业务使用数据,可以获知用户的消费情况。如图5所示,可计算每个用户的月消费额度,为其消费水平提供参考。

步骤s2):对数据进行分析处理。

基于以上采集到的数据,评估用户对旅游的喜爱程度,即找到“谁”是旅游爱好者。

步骤s21):设置关键参数。

(1)找出周末或节假日前后出现在异地的用户,设用户出现在异地的频次为f1;

(2)设用户出现在异地的时长为t1;

(3)白天(如:8:00-20:00)附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例r1;

(4)晚上(如:20:00-次日8:00)附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例r2;

(5)使用ota应用的频次为f2;

(6)使用ota应用的时长为t2;

(7)使用ota应用的流量为b;

步骤s22):构造预测模型。

上述特征均为正向特征,各项取值越大,用户是旅游爱好者的概率越高,设概率为y,则构造函数:

其中:θ为向量,θ为调整参数。构造函数的曲线如图6所示,y∈[0,1]。图6中,用户是否旅游用户的概率在[0,1]区间,x越大,概率越趋近于1。

步骤s23):根据用户以往历史行为数据,估计调整参数θ。

(1)根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ。

(2)选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计。

(3)将n个向量θ1,θ2,θ3...θn,分别带入公式(1)的构造函数其中为上述m个已知旅游爱好者的样本取值,得到ym(θn)。

(4)比较真实样本值与ym(θn)的误差和,找出最小值δy,用户对应的向量θ即为调整参数:

(5)根据公式(1)的构造函数计算每个用户的旅游爱好概率,大于预设阈值(如0.5)者,即认为用户是旅游爱好者。

通过以上步骤,解决了“谁”是旅游爱好者的判定问题,接下来,需要解决向这群人推荐“什么”的问题。

步骤s3):推荐相应档次的旅游资讯。

在步骤s2)找到“谁”是旅游爱好者的基础上,实现给“谁”推荐旅游资讯能实现较大的推荐成果。

根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析,结合用户手机套餐使用情况,为用户划分旅游消费档次,比如划分为高、中、低档,为用户推荐相应的旅游资讯。

本发明还提供一种旅游用户筛选的系统,基于移动运营商大数据进行分析和定位旅游爱好者,如图7所示,该系统包括数据获取模块1和数据分析处理模块2,其中:

数据获取模块1:用于从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;

数据分析处理模块2:用于根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。

优选的是,在数据分析处理模块2中包括数据分类单元21和计算单元22,其中:

在数据分类单元21中,对获取的数据进行如下分类:f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用ota应用的频次、t2为用户使用ota应用的时长以及b为用户使用ota应用的流量;

在计算单元22中,构造函数为:

根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];

为向量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;

θ为调整参数,θ为向量。

其中,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;

在数据分类单元21中,根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;

以及,根据用户上网记录数据中与访问ota应用、浏览旅游网页相关的流量统计和比较,结合用户访问ota应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。

其中,数据分析处理模块2还包括调整参数单元23,用于根据用户以往历史行为数据,估计调整参数θ,包括:

根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;

选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;

将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);

计算并比较真实样本值与ym(θn)的误差和:

找出最小值δy对应的样本,其对应的向量θ即为调整参数。

另外,作为进一步的应用,数据分析处理模块2还用于根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;该系统还进一步包括还包括资讯推荐模块3,用于结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。

本发明的旅游用户筛选的方法和旅游用户筛选的系统,基于一种并不向大众公开的大数据平台,利用移动运营商大数据,通过对庞大的信息量整合和对比分析,从海量的数据中提炼或筛选出有用的当前位置和与旅游相关的数据,可以获知用户异地出行、异地停留的轨迹,感知用户“去过哪”;利用移动用户上网记录,可以获知用户有无了解旅游资讯的兴趣或出行的意愿,通过“做和想”的结合,可以科学、精准地判定“谁”是旅游爱好者,进而,结合用户以往行为数据,向这群人推荐“什么”,从而实现为用户推荐适合的旅游信息的目的,大大提高了数据资料的准确性和用户定位的有效性。

可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1