一种基于谱聚类算法的景点路线推荐方法

文档序号:9688055阅读:814来源:国知局
一种基于谱聚类算法的景点路线推荐方法
【技术领域】
[0001] 本发明设及旅游信息服务领域,特别是一种基于谱聚类算法的景点路线推荐方 法。
【背景技术】
[0002] 旅游路线最优化问题一直是人们所关注的一个社会焦点,特别是近几年来随着城 市的发展,人们生活物质水平的提高,节日期间外出旅游,己经成为节假日必不可少的部 分。因此,如何对旅游路线进行合理的优化越来越被人所重视。
[0003] 旅游路线规划是典型的旅行商问题(TSP),旅行商问题是指旅行商按一定的顺序 访问每个城市,使得每个城市都能被访问且仅能被访问一次,最后回到起点,且花费的代价 最小。旅行商问题是组合优化问题中典型的多项式复杂程度的非确定性问题(NP完全问 题),是许多领域内复杂工程优化问题的抽象形式。关于旅行商问题(TSP)问题的完全有效 的算法目前尚未找到,运促使人们长期W来不断地探索并积累了大量的算法。归纳起来,目 前主要算法可分成传统优化算法和现代优化算法。在传统优化算法中又可分为最优解算法 和近似方法。传统优化算法包括分支定界法、改良回路法、贪婪算法、插入法等。最优解算法 虽然可W得到精确解,但计算时间无法忍受,因此就产生了各种近似方法,运些近似算法虽 然可W较快地求得接近最优解的可行解,但其接近最优解的程度不能令人满意。
[0004] 现代优化算法中分为确定性方法和随机方法。确定性的方法优化速度快,但容易 陷入局部极小值,即无法保证全局最优,而且增加了算法复杂度,致使求解时间过长,不利 于实际应用;相反,随机方法能够最大程度的避免确定性方法的不足,虽然不能保证在确定 的步骤内得到最优解,但通过引入新的接受准则,引出了一种在全局范围内寻找最优解的 方法一-模拟退火算法。该算法善于捜索困难度和复杂性高的"死角",从中找出期望值高 的区域,但也存在着不足之处。如果问题的复杂程度不断增大那么其结果的求解时间也会 逐渐成指数级变大,一旦问题的规模过于庞大则求解时间也会大大延长,从而达不到预期 结果。而且可行性已经不再是人们追求的唯一目标,仅仅对运种基本需求的满足是远远不 够的,对问题求解效率和质量的要求更是人们追求的方向。
[0005] 上述方法均不能很好地满足实际情况中的游客需求,即在较短时间内向游客推荐 一条最短的旅游路线。

【发明内容】

[0006] 发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于谱 聚类算法的景点路线推荐方法。
[0007] 为了解决上述技术问题,本发明公开了一种基于谱聚类算法的景点路线推荐方 法,包括W下步骤:
[000引步骤1,游客确定要游览的景点,通过计算机、智能终端、或者其他具有数据处理功 能的交互设备捜集运些景点的数据信息并抽象成一个无向图;
[0009] 步骤2,使用弗洛伊德Floyd-Warshall算法化ttps : //en .Wikipedia .org/wiki/ Floyd-Warshall_algo;rithm)计算无向图中任意两个景点的最短距离,得到景点路径图,删 除景点路径图中的无用路径;
[0010] 步骤3,应用谱聚类算法将步骤2得到的景点路径图上的大景区切割成两个W上小 景区;
[0011] 步骤4,采用模拟退火算法计算出小景区间的路线规划方案;
[0012] 步骤5,选择离游客最近的一个小景区的景点作为游客的出发点,求出该小景区内 的景点访问路线,再根据小景区之间的路线规划方案访问下一个小景区,分别求出每个小 景区内部的景点访问路线,最终得到所有景点的总体游览路线。
[0013] 本发明中,捜集的游客游览景点抽象为一个无向图G=(V,E,C)。景点的集合为V = {vi,V2,···,V1,···,Vn},其中V康示第i个景点,1 y如,η表示景点的个数。道路(边)的集合 为6={(1',3):1',3£'\〇,其中1',3为景点。景点之间的距离为〔={山:1',3£¥}。
[0014] 步骤2中,采用基于弗洛伊德的算法删除景点之间的无用边,分为两步,
[0015] 步骤2-1,通过弗洛伊德算法计算出任意两个景点i和j之间的最短距离dist[i] [j];
[0016] 步骤2-2,如果两个景点i和j之间直接相连的路径长度c[i][j]大于运两个景点之 间的最短距离,即c[i][j]〉dist[i][j],那么判定该路径不在运两个景点的最短路径上,删 除该路径,其中c[i][ j]表示景点i和景点j直接相连的路径长度,dist[i][ j]表示景点i和 景点j的最短距离。最后得到删除无用路径的景点路径图。
[0017] 步骤3包括W下步骤:
[0018] 步骤3-1,采用高斯核函数构造所有景点的相似矩阵W和度矩阵D:
[0021] 其中,讯^表示景点i和景点j之间的相似度,1 < 1,j <n,n表示景区内所有景点的总 数,所有的WU构成相似矩阵W,cu表示景点i和景点j之间直接相连的路径的长度,如果不存 在直接相连的路径,则CU设为W,将所有的CU进行从小到大排序,最大值记为最大距离 dmax,最小值记为最短距离dmin,〇表示最大距离dmax与最短距离dmin之差的10%,〇 = (dmax-dmin)*10%,d康示景点i的度,所有的di构成度矩阵D;
[0022] 步骤3-2,通过相似矩阵W和度矩阵D构造对称拉普拉斯矩阵Lsym,公式如下:
[0023] Lsym =扩 1/2L扩 1/2 = I-扩 1/2町)-1/2,
[0024] 其中,L表示拉普拉斯矩阵,L = D-W,I表示单位矩阵,单位矩阵参见化ttps:// zh.wikipedia.org/zh-cn/)。
[0025] 步骤3-3,计算出矩阵Lsym的前ω个特征值及其对应的特征向量Va,l如< ω,Va表 示第a个最小特征值对应的特征向量,所有特征向量组成矩阵V;
[00%]步骤3-4,将特征向量矩阵V进行归一化,得到矩阵T,公式如下:
[0027]
[0028] 其中,Tbf表示归一化矩阵第b行第f列的值,Vbf表示特征向量矩阵第b行第f列的 值,1非如,1 y含ω ;vbg表示特征向量矩阵第b行第g列的值,1含g含ω
表示特 征向量矩阵第b行的所有列的值之和;
[0029] 步骤3-5,设矩阵T的第b行向量为yb,l非如,对运η个向量采用k-均值化-means) 方法进行聚类,产生k个聚类,向量yb所属的类别即为景点b所属的类别,每个聚类内的景点 组成一个小景区,则共有k个小景区。
[0030] 步骤4包括如下步骤:
[0031] 步骤4-1,设定小景区之间的距离,如果两个小景区中有直接相连的景点,则两个 小景区之间的距离为直接相连的景点距离的平均值;如果小景区间没有直接的景点,那么 两个小景区间的距离设为无穷大;
[0032] 步骤4-2,通过弗洛伊德(Floyd-Warshall)算法计算出任意两个小景区之间的最 短距离;
[0033] 步骤4-3,对于上述k个小景区(口1,口2,-',口1〇,采用模拟退火算法计算出小景区间 的路线规划方案,该路线规划方案的解空间是小景区访问顺序的排列组合,确定起点1和终 点k后,则解空间S表示为{2,···,k-l}的所有排列的集合,解空间S中每一种排列Se表示一种 游览运k个小景区的路线规划,然后采用模拟退化算法求出最优路线规划方案。
[0034] 本发明采用的模拟退火法(Simulated Annealing)是模拟热力学中经典粒子系统 的降溫过程,用来求解规划问题的极值。当孤立粒子系统的溫度W足够慢的速度下降时,系 统近似处于热力学平衡状态,最后系统将达到本身的最低能量状态,即基态,运相当于能量 函数的全局极小点。步骤4-3所述采用模拟退化算法求出最优路线规划方案包括如下步骤:
[0035] 步骤4-3-1,设定解空间S的初始解是随机生成的{2,3,…,k-1}的随机排列So,且 设走初始溫度to为100度;
[0036] 步骤4-3-2,按照排列(ρι,ρ2,···,ρ?的顺序访问小景区,总路线长度公式如下:
[0037]
[00測其中,Cost(pi,p2,…,Pk)表示访问所有小景区的总路线长度,d(px,px+i)表示小景 区Ρχ与小景区化+1之间的最短距离;
[0039] 步骤4-3-3,任意选择序号为pui,pu2的小景区,2卽ia<pu2非,交换Pul和Pu2的访问 顺序,形成新的路线方案,若交换前的排列为36=徊,口2,一瓜1^''瓜2^'',口1〇,则交换后的 新路
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1