一种基于迁移学习和聚类算法的研学旅行智能规划方法与流程

文档序号:25172389发布日期:2021-05-25 14:42阅读:193来源:国知局
一种基于迁移学习和聚类算法的研学旅行智能规划方法与流程

本发明涉及大数据及人工智能相关应用技术,具体是一种基于迁移学习和聚类算法的研学旅行智能规划方法。



背景技术:

随着大数据和人工智能的发展,现实生活中处处离不开人工智能,研学旅行是学校根据区域特点、学生性格特征、科学教育的等综合的需要,组织学生通过集体旅行、集体食宿的方式走出校园,在与平常不同的生活中拓展视野、丰富知识,加深与自然和文化的亲近感,增加对集体生活方式和社会公共道德的体验。研学旅行继承了我国传统游学的“读万卷书,行万里路”的教育思想,成为了科学教育的新的发展理念。

目前,研学旅行需要花费大量的时间和精力去思考去哪里,去做什么的问题,大大增加了学生的思考负担,为了解决这个问题,我们提出了研学旅行的智能规划。其中深度学习中的这种迁移被称作归纳迁移,在解决分类问题方面表现出了优异的性能,在地点规划的研究中得到了越来越多的关注。



技术实现要素:

本发明的目的在于提供一种基于迁移学习和聚类算法的研学旅行智能规划方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于迁移学习和聚类算法的研学旅行智能规划方法,包括如下步骤:

步骤s1:收集所有学生相关信息,提取学生的较为重要的信息进行处理,然后利用谱聚类对学生进行分类;

步骤s2:根据学生分类的结果对不同的研学地点进行划分,利用学生聚类后的结果,对这些不用的类别进行处理,得到一个研学地点的聚类结果;

步骤s3:在聚类结果的基础上,得到与学生特征相对应的研学地点,根据研学场景对应的类别关系表,制定相应的研学旅行方案。

作为本发明进一步的方案:步骤s1中对信息进行处理的方法包括利用均值填充的方法对缺失值进行填充和对数据进行预处理,将数据描述为图论中的无向图:g=(v,e),其中表示节点的集合,e为边的集合。

作为本发明进一步的方案:步骤s1中利用谱聚类对学生进行分类的方法为:对所有数据点组成的图进行切图,使切图后不同的子图间边权重和最低,子图内的边权重和最高,得到学生的不同类别。

作为本发明进一步的方案:步骤s1中,所述学生相关信息至少包括学生年龄、性别、性格特征、兴趣爱好、课程关联性、家庭地址,较为重要的信息至少包含学生的各科学习成绩、学生各方面的发展程度和学生的家庭情况。

作为本发明进一步的方案:步骤s2中,根据学生的综合信息,利用谱聚类算法,将全部学生进行分类,再根据学生分组情况对研学地点进行分类,划分出不同的信息点,针对不同的分类结果利用迁移学习对这些不同的研学地点进行建模,获取不同类别内不同学生的需求。

作为本发明进一步的方案:步骤s3中,通过深度学习对覆盖范围最广泛的信息点进行预训练,再通过迁移学习对其他不同的信息点的模型进行微调,得到的不同研学地点内不同学生的需求。

作为本发明进一步的方案:还包括步骤s4:对每次研学旅行方案实施后再次进行评估,将评估结果加入信息点的模型后进行微调。

与现有技术相比,本发明的有益效果是:本发明通过对学生的分类,考虑到学生的各方面特征不同,特别是兴趣爱好和课程关联性,引入了迁移学习用于学习不同区域的模式相似性,然后提出了一种基于迁移学习和聚类算法的研学旅行智能规划方法,通过不断更新特征参数,避免从零开始学习从而加快速度。仿真结果表明,在相同的旅行场景,学生的个人特征具有相似性。此外,还分析了聚类算法中的收敛阈值问题,研究了学习速率和存储容量对性能的影响。

附图说明

图1为本发明谱聚类算法流程图。

图2为本发明谱聚类权重设置示意图。

图3为本发明不同簇数目下数据点的分类情况示意图。

图4为本发明迁移学习的单元结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例中,一种基于迁移学习和聚类算法的研学旅行智能规划方法,包括以下步骤:

步骤s1:首先收集所有学生的相关信息,包括学生年龄、性别、性格特征、兴趣爱好、课程关联性、家庭地址,家庭收入情况,提取学生的较为重要的信息并对其进行处理,然后利用谱聚类对学生进行分类;图1所示为谱聚类算法流程图,首先是输入学生信息的数据和聚类数,然后计算出相似度矩阵、计算拉普拉斯矩阵、计算矩阵的特征值和特征向量,最后输出聚类结果:

1)在本实例中,为了进行科学的分组,最大限度的利用现有的数据,学生的特征采用向量空间表示法,用ui表示学生i,ui={(ki1,wi1),(ki2,wi2),...,(kih,wih)},kih表示学生特征的类别,wih表示学生特征kih的感兴趣程度,用余弦夹角公式计算相似程度,并给兴趣爱好设置一定的权重值。其中余弦夹角公式为:

2)用dbi来评估度量分类场景,dbi称为分类适确性指标。假设我们有m个时间序列,这些时间序列聚类为n个簇,m个时间序列设为输入矩阵x,n个簇类设为n作为参数传入算法。使用下列公式进行计算:这个公式的含义是度量每个簇类最大相似度的均值。dbi就是计算类内距离之和与类间距离之比,来优化k值的选择,避免聚类算法中由于只计算目标函数wn而导致局部最优的情况。

3)然后进行学生的分类,将学生看成节点,不同节点之间的距离是不同,因此所对应的边有不同的权重,将所有节点组成带有权重的无向图,为了划分出k个最优的子图,这样就使得不同子图之间边权重尽可能的低,相同子图边权重尽可能的高些,从而达到聚类的目的;图2所示为谱聚类分类权重设置示意图,该模型是一个基于图论的谱聚类方法,它能够识别任意形状的样本空间,并且能够收敛于全局的最优解,基本原理是通过分解后得到的特征向量进行聚类。谱聚类分类权重设置结果中,距离越远权重越小,距离越小权重越大。

步骤s2:根据学生分类的结果对不同的研学地点进行划分,划分为学校、公园、博物馆、体育馆、娱乐区等,利用学生聚类后的结果,对这些不用的类别进行处理,从而得到一个研学地点的分类结果;

对于poi的分布信息,可以使用谷歌api进行收集,具体来说,收集了学校、公园、博物馆、体育馆、娱乐区等多个poi,通过poi数据集生成的矩阵表示为

为了实现对研学地点的划分,我们使用了一些人工标记区域并结合兴趣点(poi)分布来实现准确的标签。一个区域的poi分布反应了它的功能,因此可以帮助我们准确地识别出模式的标签,图3所示为不同簇数目下数据点的分类情况示意图,数据对象分成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。在数据空间中,数据集由许多数据对象或数据点组成,聚类的最终目的就是把数据集划分为多个子集。

步骤s3:在聚类结果的基础上,设计了一种迁移学习的策略,用于学习不同区域的模式相似度,从一个聚类中获得的模式可以转移到其他聚类中,从而制定不同的研学旅行方案。

针对不同的研学地点,首先,覆盖范围大的地点可看做源域并建立预训练的神经网络模型,其次在目标域内对预训练的模型进行修正。迁移学习可以定义为:给定一个标记的源域ds和一个未标记的目标域dt,这两个域的数据分布为不同,迁移学习的目的是在ds的帮助下学习目标域dt的知识。

2)根据迁移学习训练的模型,可以得到与学生特征相对应的研学地点,根据研学场景对应的类别关系表,制定相应的研学旅行方案。图4所示为迁移学习的单元结构图,迁移学习框架由多个单元连接而成,由输入、深度神经网络、微调、源输出、目标输出组成,数据输入经过dnn1和dnn2训练,再经由dnn3训练分成源输出和目标输出,源输出经过微调得到目标输出。

上述分析说明,本发明所提出的一种基于迁移学习的研学旅行智能规划方法,能获得比现有方法更好的研学旅行规划能力,可以很好地改善学生的学习问题,具有一定的参考价值和实际经济效益。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1