一种基于旅游的数据中心管理方法、系统及可存储介质

文档序号:31308599发布日期:2022-08-30 22:28阅读:78来源:国知局
一种基于旅游的数据中心管理方法、系统及可存储介质

1.本发明涉及旅游管理技术领域,更具体的说是涉及一种基于旅游的数据中心管理方法、系统及可存储介质。


背景技术:

2.传统的旅游经济发展属于粗放型的静态开发,即在景区旅游资源的基础上进行简单的改造和设施配套,对旅游资源的深入开发不够。除少数同时兼具高等级和唯一性的景区外,大部分旅游景区若一直延续原有的开发模式和经营模式,那么门票经济导致的盈利模式单一、单一营销而不得不将门票收入与旅游社共享导致的盈利率低、单一市场指向导致的盈利范围小等问题将是不可避免的,因此,大部分旅游景区都需要寻求突破。
3.在互联网大数据的时代特征下,充分利用网络等资源发展旅游市场,改变了原来的单一旅游方式,推动了旅游文化、景点、大城市建设,创新旅游运营模式,并促使国人的旅游消费习惯慢慢向智能化方式转变。随着旅游业前所未有的蓬勃发展,人们的旅游消费观念也日益成熟,游客越来越追求个性化、体验化、情感化、休闲化的旅游经历。
4.然而在互联网飞速发展的时代,与旅游相关的数据的数据量异常庞大,目前旅游行业在大数据的应用上还存在较大的障碍,对于旅游企业来讲,需要逐步通过对大量数据的分析和挖掘,指导和管理工作,如酒店更加精准地根据顾客特征和偏好推荐有吸引力的旅游产品和服务、旅游景区更好地进行客流疏导和调控、旅行社更方便地整合信息资源而开发出更有针对性和个性化的旅游产品等。
5.因此,如何对数据进行收集、挖掘和利用才是解决问题的根本,如何合理管理各类数据,提高用户访问数据的速度和精准性,提高管理数据的效率是本领域技术人员亟需解决的技术问题。


技术实现要素:

6.有鉴于此,本发明提供了一种基于旅游的数据中心管理方法、系统及可存储介质,可以实现各类数据的合理管理,提高用户访问数据的速度和精准性,提高管理数据的效率,进而提升用户体验。
7.为了实现上述目的,本发明提供了一种基于旅游的数据中心管理方法,包括以下步骤:
8.基于浏览器和第三方客户端,获取旅游相关数据信息;
9.对所述旅游相关数据信息进行预处理,获取准确的数据信息;
10.采用决策树分类方法对所述准确的数据信息进行数据挖掘,获得数据挖掘结果并存储在数据库中;
11.根据用户的旅游需求意向在数据库中查找与所述旅游需求意向相匹配的数据信息;
12.基于查找到的数据信息,生成旅游推荐方案并反馈给用户。
13.可选的,所述旅游相关数据信息包括游客客流数据、旅行社数据、旅游景区数据、餐饮购物数据、旅游时长及旅游时间、游客的出游满意度。
14.可选的,对所述旅游相关数据信息进行预处理,具体包括以下步骤:
15.判断所述旅游相关数据信息是否存在缺失;若是,选择同类别的相应数据进行替换;若否,则对所述旅游相关数据信息进行去噪声处理、填补缺失域;
16.基于实际情况确定划分标准,对连续数值进行数据范化,获取离散属性的数据信息;
17.判断不同类别的数据间的相关度,删除不必要的数据,当剩余的不同类别的数据之间的相关度处于预先设定的范围时,认为不同类别的数据相关,获取准确的数据信息。
18.可选的,所述判断不同类别的数据间的相关度的方法为x2统计分布表示的方法,具体为:
19.对于两个变量a和b(a=a1,

,aa;b=b1,

,bb),若检验变量a和变量b是否相互独立,则有:
[0020][0021]
其中,n表示总样本数,表示满足“a=a
i”的样本数,表示满足“b=b
j”的样本数,表示“a=ai且b=b
j”的样本数;
[0022]
当x2>x2(
0.05,df
),即p≤0.05时,认为变量a和变量b相关。
[0023]
可选的,采用决策树分类方法对所述准确的数据信息进行数据挖掘,具体包括以下步骤:
[0024]
将获取的准确的数据信息作为训练数据集,并计算所述训练数据集中每个属性的信息增益,选取最佳的分裂决策属性作为节点,构建分类决策树;
[0025]
根据所述分类决策树,对获取的数据信息进行分类。
[0026]
可选的,所述信息增益的表达式为:
[0027][0028]
其中:m表示变量x的m种不同的离散取值,pi表示变量x取值为i的概率。
[0029]
本发明还公开了一种基于旅游的数据中心管理系统,包括:
[0030]
数据获取模块,基于浏览器和第三方客户端,获取旅游相关数据信息;
[0031]
数据处理模块,用于对所述旅游相关数据信息进行预处理,获取准确的数据信息;
[0032]
数据挖掘模块,通过决策树分类方法对所述准确的数据信息进行数据挖掘,获得数据挖掘结果并存储在数据库中;
[0033]
匹配模块,用于根据用户的旅游需求意向在数据库中查找与所述旅游需求意向相匹配的数据信息;
[0034]
方案生成模块,通过查找到的数据信息,生成旅游推荐方案并反馈给用户。
[0035]
可选的,所述数据处理模块包括数据缺失判断模块、数据范化模块、数据相关度判断模块;
[0036]
所述数据缺失判断模块,用于判断所述旅游相关数据信息是否存在缺失;
[0037]
所述数据范化模块,基于实际情况确定划分标准,对连续数值进行数据范化,获取离散属性的数据信息;
[0038]
数据相关度判断模块,用于判断不同类别的数据间的相关度,删除不必要的数据,当剩余的不同类别的数据之间的相关度处于预先设定的范围时,认为不同类别的数据相关,获取准确的数据信息。
[0039]
本发明还公开了一种计算机可存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上所述数据中心管理方法的步骤。
[0040]
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于旅游的数据中心管理方法、系统及可存储介质,实现了对数据的收集、挖掘和利用,可以合理管理各类数据,提高用户访问数据的速度和精准性,提高管理数据的效率,进而提升用户体验,可以为用户提供更适合更满意的服务。
附图说明
[0041]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0042]
图1为基于旅游的数据中心管理方法的流程图;
[0043]
图2为基于旅游的数据中心管理系统的结构示意图。
具体实施方式
[0044]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0045]
实施例1
[0046]
本发明实施例公开了一种基于旅游的数据中心管理方法,如图1所示,包括以下步骤:
[0047]
基于浏览器和第三方客户端,获取旅游相关数据信息;
[0048]
对旅游相关数据信息进行预处理,获取准确的数据信息;
[0049]
采用决策树分类方法对准确的数据信息进行数据挖掘,获得数据挖掘结果并存储在数据库中;
[0050]
根据用户的旅游需求意向在数据库中查找与旅游需求意向相匹配的数据信息;
[0051]
基于查找到的数据信息,生成旅游推荐方案并反馈给用户。
[0052]
进一步地,旅游相关数据信息包括游客客流数据、旅行社数据、旅游景区数据、餐饮购物数据、旅游时长及旅游时间、游客的出游满意度。
[0053]
进一步地,对旅游相关数据信息进行预处理,具体包括以下步骤:
[0054]
判断旅游相关数据信息是否存在缺失;若是,选择同类别的相应数据进行替换;若
否,则对旅游相关数据信息进行去噪声处理、填补缺失域;处理数据缺失可以有效减少学习过程中可能出现的矛盾,在决策树的训练阶段,如果在节点n需要检查属性a且a值缺失,也可以令a值等于在节点n分类的所有样本中属性a最常取的值。
[0055]
基于实际情况确定划分标准,对连续数值进行数据范化,获取离散属性的数据信息;范化就是把连续数值的属性转换为离散属性,可以使数据更加简洁,也可以方便人们在更容易理解的层次上对数据进行分析,可以根据实际情况确定分类标准,比如对游客的花费进行数据范化,把花费分为低(小于1000元)、中(1000元至2000元)、高(大于2000元)3类。
[0056]
判断不同类别的数据间的相关度,删除不必要的数据,当剩余的不同类别的数据之间的相关度处于预先设定的范围时,认为不同类别的数据相关,获取准确的数据信息。例如,游客对旅游地的饮食评价可能会影响其对旅游地的综合评价,即表示这二者之间的冗余度较高,不适合同时作为输入;而另一方面,与输出变量无关的输入可能会误导数据挖掘的过程,因此需对数据间的相关度进行判别,删除不必要的数据,获取更有用的信息。
[0057]
进一步地,判断不同类别的数据间的相关度的方法为x2统计分布表示的方法,具体为:
[0058]
对于两个变量a和b(a=a1,

,a
|a|
;b=b1,

,b
|b|
),若检验变量a和变量b是否相互独立,则有:
[0059][0060]
其中,n表示总样本数,表示满足“a=a
i”的样本数,表示满足“b=b
j”的样本数,表示“a=ai且b=b
j”的样本数;
[0061]
当x2>x2(
0.05,df
),即p≤0.05时,认为变量a和变量b相关。
[0062]
决策树也称为判定树,是运用于分类的一种树结构,其每个内部节点代表对某个属性的一次测试,每条边代表一个测试结果,叶节点代表某个类或者类的分布,最上面的节点是根节点。构造决策树采用自上而下的递归构造方法,若训练数据集中的数据有几种不同的属性,则按照属性的各种取值把该训练数据集再划分为对应的几个子集(即分支),再依次递归处理各个子集。
[0063]
具体地,采用决策树分类方法对准确的数据信息进行数据挖掘,包括以下步骤:
[0064]
将获取的准确的数据信息作为训练数据集,并计算训练数据集中每个属性的信息增益,选取最佳的分裂决策属性作为节点,构建分类决策树;
[0065]
根据分类决策树,对获取的数据信息进行分类。
[0066]
具体地,信息增益的表达式为:
[0067][0068]
其中:m表示变量x的m种不同的离散取值,pi表示变量x取值为i的概率。
[0069]
本发明还公开了一种计算机可存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上所述数据中心管理方法的步骤。
[0070]
实施例2
[0071]
本发明实施例公开了一种基于旅游的数据中心管理系统,如图2所示,包括:
[0072]
数据获取模块,基于浏览器和第三方客户端,获取旅游相关数据信息;
[0073]
数据处理模块,用于对旅游相关数据信息进行预处理,获取准确的数据信息;
[0074]
数据挖掘模块,通过决策树分类方法对准确的数据信息进行数据挖掘,获得数据挖掘结果并存储在数据库中;
[0075]
匹配模块,用于根据用户的旅游需求意向在数据库中查找与旅游需求意向相匹配的数据信息;
[0076]
方案生成模块,通过查找到的数据信息,生成旅游推荐方案并反馈给用户。
[0077]
进一步地,数据处理模块包括数据缺失判断模块、数据范化模块、数据相关度判断模块;
[0078]
数据缺失判断模块,用于判断旅游相关数据信息是否存在缺失;
[0079]
数据范化模块,基于实际情况确定划分标准,对连续数值进行数据范化,获取离散属性的数据信息;
[0080]
数据相关度判断模块,用于判断不同类别的数据间的相关度,删除不必要的数据,当剩余的不同类别的数据之间的相关度处于预先设定的范围时,认为不同类别的数据相关,获取准确的数据信息。
[0081]
随着互联网的飞速发展,产生了大量的旅游相关数据信息,然而这些数据没有被充分的利用,而通过本发明中的技术方案,可以实现对大量数据的收集、挖掘和利用,可以合理管理各类数据,提高用户访问数据的速度和精准性,提高管理数据的效率,进而提升用户体验,可以为用户提供更适合的旅游推荐方案。
[0082]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0083]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1