一种基于漫游信息的跨省旅行热门线路推荐方法与流程

文档序号:36113186发布日期:2023-11-22 14:36阅读:34来源:国知局
一种基于漫游信息的跨省旅行热门线路推荐方法与流程

本发明涉及移动互联网,尤其涉及一种基于漫游信息的跨省旅行热门线路推荐方法。


背景技术:

1、随着人们生活水平的提高,越来越多的人选择旅行来放松身心、增长见识,旅游业也逐渐在我国国民经济中占据十分重要的位置,在旅游业中,设计一条好的旅游线路不仅能给旅行社或其他旅游经营商带来更多的游客,同时也为其带来更好的经济收益。旅游线路是旅游产品的重要组成部分,是连接旅游者、旅游企业及相关部门、旅游目的地的重要纽带。

2、目前,市场上已经有很多旅行社、ota等机构提供旅游线路推荐服务,但是,这些传统的旅行线路推荐方式是基于用户的地理位置、旅行时间、预算等信息进行推荐,具有主观性,不够客观,同时无法充分考虑用户的个性化需求和偏好。

3、近年来,移动互联网技术的普及和发展,给用户的旅行方式带来了极大地改变,用户可以通过移动设备随时随地获取信息,分享旅行经验,也可以在旅行中记录自己的漫游轨迹,基于这些漫游数据,可以更好的理解用户的旅行需求和偏好,为用户推荐更加个性化的旅游路线。


技术实现思路

1、本发明解决现有技术存在的技术问题,本发明提供了一种基于漫游信息的跨省旅行热门线路推荐方法,该方法根据用户的出行偏好和历史漫游轨迹,自动推荐符合用户需求的旅行线路。

2、为实现上述目的,本发明采用的技术方案如下:

3、一种基于漫游信息的跨省旅行热门线路推荐方法,包括以下步骤:

4、s1、获取用户的漫游轨迹信息,并将该漫游轨迹信息存储在数据库内,所述漫游轨迹信息包括用户的号码信息、位置信息、时间信息、轨迹信息;

5、s2、构建线路推荐算法工程,具体包括以下步骤:

6、s201、提取数据中用户漫游轨迹信息中的停留点和轨迹,并使用地理信息系统工具分析、处理停留点和轨迹信息,得到用户在不同景点的停留时间和频率信息;

7、s202、通过数据分析用户的停留点和轨迹信息,识别各个省份内的热门旅游景点和区域,并根据停留时间和频率确定热门程度;

8、s203、结合热门景点和用户的漫游轨迹信息,使用图算法计算最佳路线,去除最佳路线上的冷门景点以及增加最佳路径设定距离内的热门景点,连接生成热门线路;

9、s204、将用户的旅行目的地和热门线路包含的景点进行匹配,提供符合用户需求的旅行线路;

10、s3、收集用户反馈信息,反馈信息包括用户的满意度、评分,再将收集到的用户反馈信息用于优化和改进线路推荐算法。

11、进一步地,s202步骤中,采用k-means算法对景点热门程度进行聚类分析,根据停留时间和频率将游客划分为不同的簇,具体包括以下步骤:

12、s2021、从簇中取出游客的停留时间和频率数据,对该数据进行标准化;

13、s2022、使用elbow方法分析指标确定聚类数目k;

14、s2023、进行k-means聚类分析,k-means算法表达式如下:

15、j=∑(d(xi,ci))2

16、上式中,xi表示样本点,ci表示该样本所属的簇的中心点,d为距离度量函数;

17、s2024、根据聚类结果,计算簇的大小和簇间的距离,再结合停留时间和频率来确定景点热门程度。

18、更进一步地,簇的大小通过下式计算:

19、ji=∑(d(xi,ci))2

20、上式中,xi表示样本点,ci表示该样本所属的簇的中心点,d表示距离度量函数;

21、景点热门程度通过下式计算:

22、

23、上式中,popularity为景点热门程度,具体为:

24、当popularity≥0.25时,为热门景点;

25、当0.1≤popularity<0.25时,为一般热门景点;

26、当popularity<0.1时,为冷门景点。

27、更进一步地,s2023具体包括以下步骤:

28、第一步、随机初始化k个簇的中心点,计算每个样本与各个中心点之间的距离,将样本分配给最近的中心点所在的簇;

29、每个样本与其中心点之间的距离通过下式计算得出:

30、d(x,y)=sqrt((x1-x2)2+(y2-y2)2)

31、上式中,sqrt表示求平方根符号,x1、y1分别表示样本的经度和纬度,x2、y2分别表示中心点的经度和纬度;

32、第二步、更新每个簇的中心点,将其设为簇内所有样本的平均值;簇中心的更新通过下式进行:

33、

34、上式中,xi表示第i个簇的样本点,ni表示第i个簇的样本数量;

35、第三步、重复以上两个步骤,直到达到停止条件,停止条件为簇内的样本不再发生变化。

36、更进一步地,s203步骤中的最佳路线通过下述步骤得出:

37、s2031、计算所涉及区域内所有相邻景点之间的距离,同时获取所述景点的热门程度数据;

38、s2032、构建图模型,将每个景点作为图中的一个节点,节点之间的距离作为边的权重;

39、s2033、确定起点和终点,以及需要经过的景点数量;

40、s2034、使用dijkstra算法计算最佳路径。

41、更进一步地,dijkstra算法计算最佳路径的方法为:从起点开始,分别计算到每一节节点的值,两个节点之间没有路线则作为+∞计算,每次固定此图中的最小值,逐步往前推进,直到确定了最终的值,产生最小值的路径即为最佳路径,终点处的数值为最佳路径的距离。

42、进一步地,s204具体包括以下步骤:

43、s2041、从数据库中提取漫游轨迹数据,包括用户过去的旅行目的地(景点)、停留时间、行驶轨迹;

44、s2042、根据用户的历史漫游数据和s203步骤生成的旅游热门线路,通过用户的旅行目的地和线路包含的景点进行匹配,算出和用户匹配的热门旅游线路;

45、s2043、生成用户感兴趣的旅游线路,通过结合用户的偏好和推荐算法,为用户推荐适合的旅游路线。

46、更进一步地,s2043具体通过下述步骤进行:

47、1)计算用户之间的相似度,相似度使用余弦相似度来计算,设定两个用户,分别用i、k表示,他们之间的相似度为s(i,k);

48、2)计算每个用户的旅游线路评分,对于每个用户,计算他们对每个旅游线路的评分,设定用户i对旅游线路j的评分为r(i,j);

49、3)预测与i用户相似的用户k的旅游线路评分,通过下式表示:

50、

51、上式中,p(k,j)表示用户k对旅游线路j的预测评分,s(i,k)表示用户i和用户k之间的相似度,r(i,j)表示用户i对旅游线路j的评分;

52、4)推荐旅游线路,根据用户的预测评分,推荐评分最高的旅游线路,设定用户k的推荐旅游线路为j*,则:

53、j*=max(p(k,j))

54、上式中,max(p(k,j))表示用户k对线路j的最高预测评分。

55、进一步地,地理信息系统工具分析、处理停留点和轨迹的方法为:将漫游轨迹数据中的轨迹数据输入到gis中,生成shapefile矢量数据文件,再通过python代码将shapefile文件转换为geojson格式数据,然后从geojson数据中提取相关信息,通过经纬度找到对应的景点,并提取停留时间和频率信息。

56、进一步地,s3具体包括以下步骤:

57、s301、在旅游平台的网站发布公告,告知用户可以通过特定的邮箱、电话或者在线表单提供反馈信息;

58、s202、制定一份包含有关旅游推荐线路问题的问卷,包括满意度、推荐程度、价格合理度、景点丰富度、导游讲解水平;

59、s203、对收集到的用户反馈数据进行整理和分析,找出用户对旅游推荐线路的喜好和需求,以及存在的问题和改进的地方;

60、s204、将分析结果以报告的形式通过旅游平台的网站发布,让用户了解旅游推荐线路的优劣和改进方向。

61、与现有技术相比,本发明的有益效果为:

62、(1)本发明通过漫游轨迹信息,得到游客的停留点和频率,再结合聚类算法得到热门景点,再根据图算法得到最佳线路,通过选取最佳线路中的排名靠前的若干个景点,并将这些景点进行连线形成热门线路,再根据用户的目的地和热门线路包含的景点进行匹配,提供符合用户的旅游线路,从而实现根据用户的出行偏好和历史漫游轨迹,自动推荐符合用户需求的旅行线路的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1