酒店产量预测方法、系统、设备及存储介质与流程

文档序号:24128525发布日期:2021-03-02 16:22阅读:149来源:国知局
酒店产量预测方法、系统、设备及存储介质与流程

[0001]
本发明涉及人工智能技术领域,具体地说,涉及一种酒店产量预测方法、系统、设备及存储介质。


背景技术:

[0002]
现有技术中,对酒店的产量(即酒店客房等资源的销量)进行预测一般采用传统的时间序列模型或者神经网络模型lstm(long short-term memory,长短期记忆人工神经网络)。但是传统时序模型很难综合考虑多个外生变量对最终产量的影响,并且其表达能力有限。而在酒店产量预测过程中,除时序特征外,还涉及到诸如预定进度特征、酒店所在竞争圈特征、酒店属性特征、日期特征等外生变量。所以此时传统时序模型的预测准确性就会明显较差。而神经网络模型lstm在对多酒店进行预测的场景下其表达能力有限,无法实现同时对多酒店进行预测的场景使用。


技术实现要素:

[0003]
针对现有技术中的问题,本发明的目的在于提供一种酒店产量预测方法、系统、设备及存储介质,既能实现对多酒店的产量同时预测,又能提高酒店产量预测的准确性。
[0004]
为实现上述目的,本发明提供了一种酒店产量预测方法,所述方法包括以下步骤:
[0005]
获取多个酒店的产量数据;
[0006]
基于分位数回归模型构建分位数损失函数;
[0007]
构建初始深度学习网络模型;
[0008]
基于所述分位数损失函数和所述多个酒店的产量数据,训练所述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型;
[0009]
基于所述目标网络模型对多个酒店的未来一预设时段内的产量分别进行预测,输出各个酒店在所述预设时段内的产量值。
[0010]
可选地,所述基于所述分位数损失函数和所述多个酒店的产量数据,训练所述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型的步骤包括:
[0011]
对每一酒店的所述产量数据进行向量化操作,得到归属于一酒店的多个特征向量;
[0012]
对所述特征向量分别进行特征低阶交叉和特征高阶交叉,分别得到第一预测值和第二预测值;
[0013]
对所述第一预测值和第二预测值进行加权求和,得到初始预测结果,并对所述初始预测结果利用预设激活函数进行归一化操作,得到预测概率值;
[0014]
将所述预测概率值和预设的真实结果值作为所述分位数损失函数的输入,得到目标网络模型。
[0015]
可选地,所述初始深度学习网络模型中包含有dnn模型,所述对所述特征向量分别进行特征低阶交叉和特征高阶交叉,分别得到第一预测值和第二预测值的步骤包括:
[0016]
从所有的所述特征向量中任选两个特征向量进行组合,形成多个特征向量集合,每一所述特征向量集合中包含有两个特征向量;
[0017]
对所有的所述特征向量集合分别进行内积运算,得到第一预测值;
[0018]
将所有的所述特征向量作为所述dnn模型的输入,得到第二预测值。
[0019]
可选地,所述目标网络模型中包含分位数,不同酒店对应的目标网络模型中的分位数不同。
[0020]
可选地,所述基于所述分位数损失函数和所述多个酒店的产量数据,训练所述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型的步骤包括:
[0021]
对于每一酒店,将多个预设分位数分别作为所述分位数损失函数的输入,训练生成归属于同一酒店的多个不同的第二网络模型,每一所述第二网络模型对应一所述预设分位数;
[0022]
基于过去n天的所述产量数据作为测试集,对所述多个不同的第二网络模型分别进行测试,将得到的预测值与真实产量值差值最小的所述第二网络模型,作为所述酒店对应的目标网络模型;所述过去n天的所述产量数据包含所述真实产量值。
[0023]
可选地,所述基于所述分位数损失函数和所述多个酒店的产量数据,训练所述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型的步骤包括:
[0024]
依据每一酒店的所述产量数据中包含的特征,生成每一特征对应的特征id;
[0025]
依据所述特征和所述特征id,生成特征字典文件;
[0026]
将所述特征字典文件存储至所述目标网络模型中。
[0027]
可选地,每一条所述产量数据包括特征和与所述特征对应的特征值;所述初始深度学习网络模型具有多个参数;每一所述特征匹配一个所述参数;且每一所述特征匹配一所述特征向量;
[0028]
所述对所有的所述特征向量集合分别进行内积运算,得到第一预测值的步骤包括:依据低阶交叉函数对每一特征向量集合分别进行内积运算;
[0029]
所述低阶交叉函数为:
[0030][0031]
其中,
[0032]
y1表示所述第一预测值,w0表示所述初始深度学习网络模型的第一个参数,w
i
表示所述初始深度学习网络模型的第i个参数,m表示每一条所述产量数据的特征总数,x
i
表示每一条所述产量数据中第i个特征对应的特征值,<v
i
,v
j
>表示特征向量v
i
和v
j
的内积,v
i
表示每一条所述产量数据中第i个特征对应的特征向量,v
j
表示每一条所述产量数据中第j个特征对应的特征向量,x
j
表示每一条所述产量数据中第j个特征对应的特征值,v
i,f
表示特征向量v
i
中的第f个元素,v
j,f
表示特征向量v
j
中的第f个元素,k表示特征向量v
i
中的元素总数。
[0033]
可选地,所述分位数损失函数为:
[0034][0035]
其中,n表示所述产量数据的总数量,q表示预设分位数,y

p
表示第p条所述产量数据的预测值,y
p
表示第p条所述产量数据的真实产量值,l表示总损失值。
[0036]
可选地,所述方法还包括步骤:
[0037]
基于当前时段的酒店产量数据对所述多个酒店的产量数据进行更新;
[0038]
基于更新后的产量数据,再次训练所述初始深度学习网络模型,得到更新后的目标网络模型以及更新后的所述分位数。
[0039]
可选地,所述产量数据包括历史产量数据、酒店属性特征数据以及当前预订进度数据;所述酒店属性特征数据包括酒店星级、房型等级和酒店所在城市数据,所述产量数据还包括历史预订进度数据、当前取消进度、酒店所在竞争圈特征和日期特征。
[0040]
本发明还提供了一种酒店产量预测系统,用于实现上述酒店产量预测方法,所述系统包括:
[0041]
产量数据获取模块,用于获取多个酒店的产量数据,所述产量数据包括历史产量数据、酒店属性特征数据以及当前预订进度数据;
[0042]
损失函数构建模块,基于分位数回归模型构建分位数损失函数;
[0043]
模型构建模块,用于构建初始深度学习网络模型;
[0044]
模型训练模块,基于所述分位数损失函数和所述多个酒店的产量数据,训练所述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型;
[0045]
产量预测模块,基于所述目标网络模型对多个酒店的未来一预设时段内的产量分别进行预测,输出各个酒店在所述预设时段内的产量值。
[0046]
本发明还提供了一种酒店产量预测设备,包括:
[0047]
处理器;
[0048]
存储器,其中存储有所述处理器的可执行指令;
[0049]
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项酒店产量预测方法的步骤。
[0050]
本发明还提供了一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现上述任意一项酒店产量预测方法的步骤。
[0051]
本发明与现有技术相比,具有以下优点及突出性效果:
[0052]
本发明提供的酒店产量预测方法、系统、设备及存储介质能够综合考虑多个外生变量对最终产量的影响,提高了酒店产量预测准确性;并且具有对多酒店的并行预测能力,能够根据不同的酒店采用不同的分位数生成模型,在实现多酒店同时预测的前提下,保证了并行预测时对每个酒店的产量预测准确性。
附图说明
[0053]
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
[0054]
图1为本发明一实施例公开的一种酒店产量预测方法的示意图;
[0055]
图2为本发明一实施例中步骤s40的流程示意图;
[0056]
图3为本发明一实施例中步骤s402的流程示意图;
[0057]
图4为本发明一实施例中步骤s404的流程示意图;
[0058]
图5为本发明另一实施例中步骤s40的流程示意图;
[0059]
图6为本发明另一实施例公开的一种酒店产量预测方法的示意图;
[0060]
图7为本发明实施例公开的一种酒店产量预测系统的结构示意图;
[0061]
图8为本发明实施例公开的一种酒店产量预测设备的结构示意图;
[0062]
图9为本发明实施例公开的一种计算机可读存储介质的结构示意图。
具体实施方式
[0063]
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
[0064]
如图1所示,本发明实施例公开了一种酒店产量预测方法,该方法包括以下步骤:
[0065]
s10,获取多个酒店的产量数据,上述产量数据可以包括历史产量数据、酒店属性特征数据以及当前预订进度数据。上述酒店属性特征数据可以包括酒店星级、房型等级和酒店所在城市数据,上述产量数据还包括历史预订进度数据、当前取消进度、酒店所在竞争圈特征和日期特征。本申请对上述产量数据和酒店属性特征数据不作限制,比如上述产量数据还可以包括酒店点评特征。
[0066]
s20,基于分位数回归模型构建分位数损失函数。其中,每一个分位数损失函数包含有对应的预设分位数,每一个酒店对应一个预设分位数,并且不同酒店的分位数损失函数中的预设分位数可以不同,也可以相同。本领域技术人员可以根据需要进行设置。
[0067]
本实施例中,上述分位数损失函数为:
[0068][0069]
其中,n表示上述产量数据的总数量,也即产量数据的总条数。q表示预设分位数,比如可以为0.45、0.5或者0.6。y

p
表示第p条产量数据的预测值,y
p
表示第p条产量数据的真实产量值。产量数据中包含有该条数据对应的真实产量值。l表示总损失。
[0070]

p:y

p≥yp
(y

p-y
p
)表示对于第p条产量数据,若预测值大于等于真实产量值,也即y

p
≥y
p
,则执行作为第p条产量数据的损失值计算总损失值。如果预测值小于真实产量值,也即y

p
<y
p
,则执行作为第p条产量数据的损失值计算总损失值。
[0071]
s30,构建初始深度学习网络模型。本实施例中,该初始深度学习网络模型中包含有dnn(deep neural networks,深度神经网络)模型。其中,初始深度学习网络模型可以为deepfm深度学习模型。本申请对此不作限制。上述deepfm模型包含fm(factor machine,因子分解机)和dnn模型两部分。
[0072]
s40,基于上述分位数损失函数和上述多个酒店的产量数据,训练上述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型。具体来说,如图2所示,步骤s40包括:
[0073]
s401,对每一酒店的上述产量数据进行向量化操作,得到归属于一酒店的多个特征向量。本实施例中,每一条上述产量数据包括特征和与上述特征对应的特征值。比如,若产量数据中包含酒店星级数据,则每一条酒店星级数据包含星级特征和该特征对应的特征值。
[0074]
上述初始深度学习网络模型具有多个参数。每一特征匹配一个上述参数。且每一特征匹配一上述特征向量。对产量数据进行向量化操作也即是对产量数据中的特征进行上述向量化操作,得到特征对应的特征向量。其中,可以利用embedding技术实现上述向量化操作。
[0075]
s402,对所有特征向量分别进行特征低阶交叉和特征高阶交叉,分别得到第一预测值和第二预测值。具体来说,如图3所示,步骤s402包括:
[0076]
s4021,从所有的上述特征向量中任选两个特征向量进行组合,形成多个特征向量集合,每一上述特征向量集合中包含有两个特征向量。
[0077]
s4022,对每一特征向量集合中的特征向量分别进行内积运算,得到第一预测值。具体来说,该步骤中依据低阶交叉函数对每一特征向量集合中的特征向量分别进行内积运算。
[0078]
上述低阶交叉函数为:
[0079][0080]
其中,
[0081]
y1表示上述第一预测值。w0表示上述初始深度学习网络模型的第一个参数。w
i
表示上述初始深度学习网络模型的第i个参数。m表示每一条上述产量数据的特征总数。x
i
表示每一条上述产量数据中第i个特征对应的特征值。<v
i
,v
j
>表示特征向量v
i
和v
j
的内积。v
i
和v
j
表示一个特征向量集合中的两个特征向量。
[0082]
v
i
表示每一条上述产量数据中第i个特征对应的特征向量。v
j
表示每一条上述产量数据中第j个特征对应的特征向量。x
j
表示每一条上述产量数据中第j个特征对应的特征值,v
i,f
表示特征向量v
i
中的第f个元素,v
j,f
表示特征向量v
j
中的第f个元素,k表示特征向量v
i
中的元素总数。
[0083]
以及s4023,将所有的上述特征向量作为上述dnn模型的输入,得到第二预测值。对于dnn模型的计算过程,利用现有技术即可,不再赘述。
[0084]
s403,对上述第一预测值和第二预测值进行加权求和,得到初始预测结果,并对上述初始预测结果利用预设激活函数进行归一化操作,得到预测概率值。其中,上述加权求和时权重可以根据需要设置,本申请不作限制。上述预设激活函数可以采用softmax激活函数。
[0085]
以及s404,将上述预测概率值和预设的真实结果值作为上述分位数损失函数的输入,得到目标网络模型。具体来说,也即可以利用上述分位数损失函数计算损失,使损失达
到最小;此时可以得到初始深度学习网络模型中各个参数对应的值,将特征参数设置为该值,即得到目标网络模型。
[0086]
本实施例中,上述目标网络模型中包含分位数,该分位数是上述预设分位数中的一个。不同酒店对应的目标网络模型中的分位数不同。这样可以根据不同酒店的属性特征等数据,设置合理的分位数,提高其预测准确率,从而实现提高对各个酒店的预测准确率。
[0087]
以及s50,基于上述目标网络模型对多个酒店的未来一预设时段内的产量分别进行预测,输出各个酒店在上述预设时段内的产量值。比如,上述预设时段可以为6天,也即对各个酒店未来6天的产量值分别进行预测。这样实现了对多酒店的并行预测能力,可以节省需要对多个酒店预测产量的时间,提升预测系统对多酒店场景下产量预测的效率。
[0088]
在本申请的另一实施例中,在上述实施例的基础上,如图4所示,步骤s404包括:
[0089]
s4041,对于每一酒店,将多个预设分位数分别作为上述分位数损失函数的输入,训练生成归属于同一酒店的多个不同的第二网络模型。每一上述第二网络模型对应一上述预设分位数。
[0090]
s4042,基于过去n天的上述产量数据作为测试集,对上述多个不同的第二网络模型分别进行测试,将得到的预测值与真实产量值差值最小的上述第二网络模型,作为上述酒店对应的目标网络模型。上述过去n天的上述产量数据包含上述真实产量值。
[0091]
这样对于每一个酒店,可以利用多个预设分位数得到多个备用的第二网络模型,防止仅选择一个预设分位数生成模型而导致模型收敛偏片面,可以避免异常数据值对模型产生明显的影响,提高模型的容错率,使得生成的模型更加准确。并且,利用最接近当前的产量数据进行测试,可以保证得到的模型参数的准确性,这些都能使得最终的预测结果更加准确。
[0092]
在本申请的另一实施例中,在上述实施例的基础上,如图5所示,在步骤s40中,步骤s402还包括:依据每一酒店的上述产量数据中包含的特征,生成每一特征对应的特征id。
[0093]
步骤s403还包括:依据上述特征和上述特征id,生成特征字典文件。
[0094]
步骤s404还包括:将上述特征字典文件存储至上述目标网络模型中。
[0095]
这样可以避免现有技术必须在开发中先根据所有特征,预设生成一字典文件,在后续若产生新增特征等情况无法及时更新字典文件,导致开发成本增加的问题,本申请无须单独开发特征映射关系,降低了工程开发成本。
[0096]
在本申请的另一实施例中,在上述实施例的基础上,如图6所示,上述酒店产量预测方法还可以包括步骤:
[0097]
s60,基于当前时段的酒店产量数据对上述多个酒店的产量数据进行更新。
[0098]
s70,基于更新后的产量数据,再次训练上述初始深度学习网络模型,得到更新后的目标网络模型以及更新后的上述分位数。
[0099]
这样可以根据最近的预测效果,重新找到最合适的分位数并更新,并且丰富产量数据库,更好地刻画了数据的分布,有利于保证历史产量数据的时效性,有利于提高下次进行产量预测时的准确性。
[0100]
需要说明的是,本申请的上述所有实施例可以自由组合,组合后得到的技术方案也在本申请的保护范围之中。
[0101]
如图7所示,本发明实施例还公开了一种酒店产量预测系统7,该系统包括:
[0102]
产量数据获取模块71,用于获取多个酒店的产量数据,上述产量数据包括历史产量数据、酒店属性特征数据以及当前预订进度数据;
[0103]
损失函数构建模块72,基于分位数回归模型构建分位数损失函数;
[0104]
模型构建模块73,用于构建初始深度学习网络模型;
[0105]
模型训练模块74,基于上述分位数损失函数和上述多个酒店的产量数据,训练上述初始深度学习网络模型,分别得到各个酒店对应的目标网络模型;
[0106]
产量预测模块75,基于上述目标网络模型对多个酒店的未来一预设时段内的产量分别进行预测,输出各个酒店在上述预设时段内的产量值。
[0107]
可以理解的是,本发明的酒店产量预测系统还包括其他支持酒店产量预测系统运行的现有功能模块。图7显示的酒店产量预测系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0108]
本实施例中的酒店产量预测系统用于实现上述的酒店产量预测的方法,因此对于酒店产量预测系统的具体实施步骤可以参照上述对酒店产量预测的方法的描述,此处不再赘述。
[0109]
本发明实施例还公开了一种酒店产量预测设备,包括处理器和存储器,其中存储器存储有所述处理器的可执行指令;处理器配置为经由执行可执行指令来执行上述酒店产量预测方法中的步骤。图8是本发明公开的酒店产量预测设备的结构示意图。下面参照图8来描述根据本发明的这种实施方式的电子设备600。图8显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0110]
如图8所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
[0111]
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述酒店产量预测方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
[0112]
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。
[0113]
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0114]
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0115]
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当
明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储平台等。
[0116]
本发明还公开了一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述酒店产量预测方法中的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述酒店产量预测方法中描述的根据本发明各种示例性实施方式的步骤。
[0117]
如上所示,该实施例的计算机可读存储介质的程序在执行时,能够综合考虑多个外生变量对最终产量的影响,提高了酒店产量预测准确性;并且具有对多酒店的并行预测能力,能够根据不同的酒店采用不同的分位数生成模型,在实现多酒店同时预测的前提下,保证了并行预测时对每个酒店的产量预测准确性。
[0118]
图9是本发明的计算机可读存储介质的结构示意图。参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0119]
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0120]
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0121]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0122]
本发明实施例提供的酒店产量预测方法、系统、设备及存储介质能够综合考虑多个外生变量对最终产量的影响,提高了酒店产量预测准确性;不再过度依赖历史数据进行
预测,能够更好地应对冷启动场景;
[0123]
另一方面,本申请具有对多酒店的并行预测能力,能够根据不同的酒店采用不同的分位数生成模型,在实现多酒店同时预测的前提下,保证了并行预测时对每个酒店的产量预测准确性。
[0124]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1