资源配置方法和装置与流程

文档序号:28101820发布日期:2021-12-22 11:43阅读:109来源:国知局
资源配置方法和装置与流程

1.本发明涉及计算机技术领域,尤其涉及一种资源配置方法和装置。


背景技术:

2.互联网医院可以为用户提供实时的在线医疗服务。用户可通过终端(pc端或手机端)访问互联网医院,能够随时随地享受问诊服务。当用户发起问诊咨询时,会相应地生成一个问诊单。为了合理配置服务器资源以及医生资源,可以提前预测问诊单量,并根据问诊单量的预测值进行资源配置。但是现有预测方式预测问诊单量准确率低,会导致服务器资源以及医生资源分配不合理的问题。


技术实现要素:

3.有鉴于此,本发明实施例提供一种资源配置方法和装置,能够解决现有预测方式预测问诊单量准确率低所导致的资源分配不合理的问题。
4.为实现上述目的,根据本发明实施例的一个方面,提供了一种资源配置方法。
5.本发明实施例的资源配置方法包括:
6.获取第一数据表单,所述第一数据表单包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差;
7.根据所述第一数据表单以及训练得到的问诊单量预测模型,确定第二数据表单,所述第二数据表单至少包括:下一时间段的问诊单量的预测值;
8.根据所述第二数据表单中下一时间段的问诊单量的预测值进行资源配置;
9.其中,所述问诊单量预测模型的训练过程包括:
10.获取训练样本,所述训练样本包括:指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差;
11.将所述训练样本输入模型中,计算每个所述指定时间段的下一时间段的问诊单量的预测值;
12.确定每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差;
13.根据所确定的偏差,调整所述模型的模型参数以更新所述模型;
14.重复执行以上步骤,将所确定的偏差在预设范围内的模型选取为所述问诊单量预测模型。
15.可选地,所述模型输入参数还包括以下一个或多个维度的数据:当前时间段的历史问诊单量分布、下一时间段的历史问诊单量分布、当前时间段所对应的日期的历史问诊单量分布以及当前日期的属性特征。
16.可选地,所述训练样本是通过以下方式生成的:
17.获取预设日期范围内不同时间段的问诊单量的历史数据;
18.按照时间段的维度,根据预设的特征明细对所述历史数据进行聚合处理;
19.对聚合处理后的历史数据进行归一化处理并拼接得到每个时间段的特征数据;
20.对每个时间段,以所述时间段的下一时间段的问诊单量为标签,对所述时间段的特征数据进行打标,以生成所述训练样本。
21.可选地,重复执行以上步骤,将所确定的偏差在预设范围内的模型选取为所述问诊单量预测模型包括:
22.获取预设的重复执行次数;
23.当重复执行次数满足设定的截取条件时,将对应的模型保存到候选模型集合中;
24.使用测试样本分别对所述候选模型集合中的每个候选模型进行测试,以选取最优模型作为所述问诊单量预测模型,其中,所述最优模型为所述所确定的偏差为最小的模型。
25.可选地,在确定下一时间段的问诊单量的预测值之后,所述方法还包括:
26.当确定的下一时间段的问诊单量的预测值大于预设报警阈值时,触发预警。
27.可选地,在确定下一时间段的问诊单量的预测值之后,所述方法还包括:
28.根据最近日期范围内不同时间段的问诊单量的预测值,生成问诊单量的分布图;
29.将所述分布图发送至终端,通过所述终端显示所述分布图。
30.可选地,所要调整的模型参数至少包括:隐藏层的层数以及每层的神经元数量。
31.为实现上述目的,根据本发明实施例的另一个方面,提供了一种资源配置装置。
32.本发明实施例的资源配置装置包括:
33.第一获取模块,用于获取第一数据表单,所述第一数据表单包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差;
34.确定模块,用于根据所述第一数据表单以及训练得到的问诊单量预测模型,确定第二数据表单,所述第二数据表单至少包括:下一时间段的问诊单量的预测值;
35.配置模块,用于根据所述第二数据表单中下一时间段的问诊单量的预测值进行资源配置;其中,所述问诊单量预测模型的训练过程包括:
36.获取训练样本,所述训练样本包括:指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差;
37.将所述训练样本输入模型中,计算每个所述指定时间段的下一时间段的问诊单量的预测值;
38.确定每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差;
39.根据所确定的偏差,调整所述模型的模型参数以更新所述模型;
40.重复执行以上步骤,将所确定的偏差在预设范围内的模型选取为所述问诊单量预测模型。
41.为实现上述目的,根据本发明实施例的另一个方面,提供了一种电子设备。
42.本发明实施例的电子设备包括:
43.一个或多个处理器;
44.存储装置,用于存储一个或多个程序,
45.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的方法。
46.为实现上述目的,根据本发明实施例的另一个方面,提供了一种计算机可读介质。
47.本发明实施例的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法。
48.上述发明中的一个实施例具有如下优点或有益效果:
49.在本发明实施例中,根据问诊单量确定请求将模型输入参数输入至问诊单量预测模型,以确定下一时间段的问诊单量的预测值,所述模型输入参数包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。该实施方式可以准确确定下一时间段的预测问诊单量,可以很好地拟合不同时间段问诊单量的变化趋势,能够很好地解决突发情况,例如:促销活动或疫情爆发。同时,该实施方式可以实时地根据前一时间段的问诊单量纠正当前时间段的问诊单量预测结果,有很好的纠偏效果,鲁棒性强。即该实施方式的问诊单量的预测准确率更高,进而可以根据问诊单量的预测值更合理地进行资源配置。
50.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
51.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
52.图1是本发明第一实施例的资源配置方法的流程示意图;
53.图2是本发明实施例的问诊单量预测模型的训练过程的流程示意图;
54.图3是本发明第二实施例的资源配置方法的流程示意图;
55.图4是本发明实施例的dnn模型训练的流程示意图;
56.图5是本发明实施例的问诊单量预测模型的示意图;
57.图6是本发明实施例的预设日期范围内不同时间段的问诊单量的分布示意图;
58.图7是本发明实施例的预设日期范围内不同时间段的问诊单量及其预测值的分布示意图;
59.图8是根据本发明实施例的资源配置装置的模块示意图;
60.图9是本发明实施例可以应用于其中的示例性系统架构图;
61.图10是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
62.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
63.一般地,可以基于专家经验迁移策略或历史数据统计分析策略对问诊单量进行预测。当基于专家经验迁移策略对问诊单量进行预测时,虽然解决无历史数据情况下问诊单量的预测,但是由于不同领域的数据分布会有很大差异,因此其他领域的专家经验迁移学习到该领域,会存在偏差较大的可能性。当基于历史数据统计分析策略对问诊单量进行预测时,会使用历史均值对问诊单量进行预测,该预测方式仅能代表通用规律,不能很好刻画不同日期之间所存在的特殊分布。且该预测方式也不能很好地解决促销活动或者疫情期间的问诊单量预测,预测偏差容易受到异常值的影响,最终导致该预测方式的预测准确率低。
64.由于现有预测方式预测问诊单量准确率低,在根据问诊单量的预测值进行资源配置时,会导致服务器资源以及医生资源分配不均衡的问题。例如:在各种促销活动时会导致问诊单量的激增,进而会产生以下问题:
65.1)服务器资源预估不足,导致系统崩溃:由于问诊单量激增,服务器资源提前预估少,cpu达到峰值,进而导致整个问诊流程崩溃。除此之外,在问诊单量较少时,会造成服务器资源的浪费。例如:问诊单量在不同时间段分布是不同的,在0点至凌晨8点内的问诊单量较少,理论上不需要太多的服务器资源,但是实际分配太多,会造成资源浪费。
66.2)医生资源分配不均衡:由于问诊单量在不同时段分配不同,存在问诊单量多医生在线数少或者问诊单量少医生在线数多两种情况。问诊单量多医生在线数少,导致接诊慢,用户体验差;问诊单量少医生在线数多,导致医生接不到单,收益少。
67.因此,准确且实时地预测问诊单量,有助于合理协调医生资源和服务器资源,可以达到降成本和增收益的效果,同时能够保障大型活动促销期间整个系统的正常运行。
68.为了更加合理地进行资源配置,本发明实施例提供了一种资源配置方法,图1是本发明第一实施例的资源配置方法的流程示意图,如图1所示,所述资源配置方法可以包括如下的步骤s101至s103。
69.步骤s101:获取第一数据表单,所述第一数据表单包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。
70.在步骤s101之前,可以将每天按照预设的时间间隔划分为多个时间段,当前时间段可以理解为一天中的任意时间段或任意时刻。当前时间段的问诊单量是在该时间段内统计所得的问诊单量的实际值。所述当前时间段的问诊单量的预测值是通过问诊单量预测模型计算所得的预测值。
71.参见表1,所述第一数据表单用于存储模型输入参数,所述模型输入参数除了包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。所述模型输入参数还包括以下一个或多个维度的数据:当前时间段的历史问诊单量分布、下一时间段的历史问诊单量分布、当前时间段所对应的日期的历史问诊单量分布以及当前日期的属性特征。
72.具体地,当前时间段的历史问诊单量分布的特征明细至少包括:当前时间段历史问诊单量的最大值、最小值、平均值、方差、85分位数、65分位数、45分位数和/或25分位数等。下一时间段历史问诊单量分布的特征明细至少包括:当前时间段的下一时间段历史问诊单量的最大值、最小值、平均值、方差、85分位数、65分位数、45分位数和/或25分位数等。当前时间段所对应的日期的历史问诊单量分布可以理解为历史上该日期问诊单量分布,当前时间段所对应的日期的历史问诊单量分布的特征明细至少包括:当前时间段所对应日期的历史问诊单量的最大值、最小值、平均值、方差、85分位数、65分位数、45分位数和/或25分位数等。当前日期的属性特征是指当前日期与促销活动或者突发性疫情等有关的属性特征,当前日期的属性特征的特征明细至少包括:是否有促销活动(是或否)、活动类型规模大小(高、中、低)。
73.表1模型输入参数
[0074][0075][0076]
步骤s102:根据所述第一数据表单以及训练得到的问诊单量预测模型,确定第二数据表单,所述第二数据表单至少包括:下一时间段的问诊单量的预测值。
[0077]
在步骤s102中,所述第二数据表单用于存储下一时间段的问诊单量的预测值。所述问诊单量预测模型可以为dnn(deep neural networks,深度神经网络)模型,当然并不仅限于此。所述dnn模型至少包括:输入层、至少一个隐藏层以及输出层。例如:所述隐藏层的数量为2个,每个隐藏层分别包括100和20个神经元,两个隐藏层均使用relu激活函数。
[0078]
需要说明的是,下一时间段可以理解为当前时间段的下一个时间段,例如:若将一天分为四个时间段:00:00~6:00、6:00~12:00、12:00~18:00以及18:00~24:00,若当前时间段为6:00~12:00,下一时间段为12:00~18:00,即可以根据6:00~12:00的问诊单量的分布确定12:00~18:00的问诊单量的分布。
[0079]
在确定下一时间段的问诊单量的预测值之后,可以根据下一时间段的问诊单量的预测值进行资源配置,例如:可以根据下一时间段的问诊单量的预测值对服务器资源进行配置,以防止问诊单量急剧增加导致的宕机等问题。同时,在问诊单量急剧增加时,为了提醒运营人员,当确定的下一时间段的问诊单量的预测值大于预设报警阈值时可以触发预警。又如:可以根据下一时间段的问诊单量的预测值对医生资源进行配置,以解决医生分配不合理等一系列问题。
[0080]
除此之外,还可以根据下一时间段的问诊单量的预测值生成问诊单量的分布图,以便于用户根据问诊单量的分布图调整问诊时间。具体过程可以为:首先根据最近日期范围内不同时间段的问诊单量的预测值,生成问诊单量的分布图。然后再将所述分布图发送至终端,通过所述终端显示所述分布图。
[0081]
参见图2,在步骤s102之前,需要对问诊单量预测模型进行训练,所述问诊单量预测模型的训练过程包括如下的步骤s201至步骤s205。
[0082]
步骤s201:获取训练样本,所述训练样本包括:指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差。
[0083]
在步骤s201获取训练样本中,不同训练样本是根据预设日期范围内不同时间段的问诊单量提取得到的特征数据。所述训练样本包括以下一个或多个维度的数据:指定时间段的问诊单量、所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差、指定时间段的历史问诊单量分布、下一时间段的历史问诊单量分布、指定时间段所对应的日期的历史问诊单量分布以及当前日期的属性特征。
[0084]
在步骤s201获取训练样本之前,可以根据预设日期范围内不同时间段的问诊单量的历史数据确定训练样本,确定训练样本的过程大致为:首先获取预设日期范围内不同时间段的问诊单量的历史数据。然后再按照时间段的维度,根据预设的特征明细(如表1所示)对所述历史数据进行聚合处理。然后对聚合处理后的历史数据进行归一化处理并拼接得到每个时间段的特征数据。最终对每个时间段,以所述时间段的下一时间段的问诊单量为标签,对所述时间段的特征数据进行打标,以生成所述训练样本。
[0085]
需要说明的是,为了提高预测的准确率,在根据预设的特征明细对所述历史数据进行聚合处理之前,可以对所述历史数据进行数据清理处理,可以理解的是,通过数据清洗处理可以清洗掉所述历史数据中的异常值,例如:可以清洗掉所述历史数据中取值为空的数据。
[0086]
步骤s202:将所述训练样本输入模型中,计算每个所述指定时间段的下一时间段的问诊单量的预测值。
[0087]
步骤s203:确定每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差。
[0088]
在步骤s203中,在确定偏差时,可以将每个所述指定时间段的下一时间段的问诊单量与其预测值的均方误差,确定为每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差。
[0089]
步骤s204:根据所确定的偏差,调整所述模型的模型参数以更新所述模型。
[0090]
在步骤s204调整所述模型的模型参数中,当所述问诊单量预测模型为dnn模型时,所要调整的模型参数至少包括:隐藏层的层数以及每层的神经元数量。
[0091]
步骤s205:重复执行以上步骤s202至步骤s204,将所确定的偏差在预设范围内的模型选取为所述问诊单量预测模型。
[0092]
在步骤s205选取为所述问诊单量预测模型中,为了选取问诊单量预测模型,可以获取预设的重复执行以上步骤s202至步骤s204的次数。当重复执行次数满足设定的截取条件时,将对应的模型保存到候选模型集合中。然后使用测试样本分别对所述候选模型集合中的每个候选模型进行测试,以选取最优模型作为所述问诊单量预测模型,其中,所述最优模型为所述所确定的偏差为最小的模型,优化函数可以采用亚当优化器(adamoptimizer)。
[0093]
步骤s103:根据所述第二数据表单中下一时间段的问诊单量的预测值进行资源配置。
[0094]
在步骤s103中,可以根据所述第二数据表单中下一时间段的问诊单量的预测值对医生资源或计算机资源进行配置。需要说明的是,本发明实施例并不具体限定所述资源的种类。
[0095]
在本发明实施例中,根据问诊单量确定请求将模型输入参数输入至问诊单量预测模型,以确定下一时间段的问诊单量的预测值,所述模型输入参数包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。该实施方式可以准确确定下一时间段的预测问诊单量,可以很好地拟合不同时间段问诊单量的变化趋势,能够很好地解决突发情况,例如:促销活动或疫情爆发。同时,该实施方式可以实时地根据前一时间段的问诊单量纠正当前时间段的问诊单量预测结果,有很好的纠偏效果,鲁棒性强。即该实施方式的问诊单量的预测准确率更高,进而可以根据问诊单量的预测值更合理地进行资源配置。
[0096]
图3是本发明第二实施例的资源配置方法的流程示意图,如图3所示,所述资源配置方法可以包括如下的步骤s301至步骤s316。
[0097]
步骤s301:获取预设日期范围内不同时间段的问诊单量的历史数据。
[0098]
在步骤s301中,可以根据实际需求确定预设日期范围的具体取值,可以将预设日期范围按照一定的时间间隔划分为不同的时间段,来统计不同时间段内的问诊单量的历史数据。
[0099]
步骤s302:按照时间段的维度,根据预设的特征明细对所述历史数据进行聚合处理。
[0100]
需要说明的是,为了提高预测的准确率,在对所述历史数据进行聚合处理之前,可以对所述历史数据进行数据清理处理。可以理解的是,通过数据清洗处理可以清洗掉所述历史数据中的异常值,例如:可以清洗掉所述历史数据中取值为空的数据。
[0101]
在步骤s302的聚合处理过程中,可以根据如表1所示的特征明细对所述历史数据进行聚合处理。
[0102]
步骤s303:对聚合处理后的历史数据进行归一化处理并拼接得到每个时间段的特征数据。
[0103]
步骤s304:对每个时间段,以所述时间段的下一时间段的问诊单量为标签,对所述时间段的特征数据进行打标,以生成所述训练样本。
[0104]
步骤s305:获取训练样本,所述训练样本包括:指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差。
[0105]
在步骤s305获取训练样本中,不同训练样本是根据预设日期范围内不同时间段的问诊单量提取得到的特征数据。所述训练样本包括以下一个或多个维度的数据:指定时间段的问诊单量、所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差、指定时间段的历史问诊单量分布、下一时间段的历史问诊单量分布、指定时间段所对应的日期的历史问诊单量分布以及当前日期的属性特征。
[0106]
步骤s306:将所述训练样本输入模型中,计算每个所述指定时间段的下一时间段的问诊单量的预测值。
[0107]
步骤s307:确定每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差。
[0108]
步骤s308:根据所确定的偏差,调整所述模型的模型参数以更新所述模型。
[0109]
需要说明的是,所述模型可以为dnn模型,所述dnn模型至少包括:输入层、至少一个隐藏层以及输出层。例如:所述隐藏层的数量为2个,每个隐藏层分别包括100和20个神经
元,两个隐藏层均使用relu激活函数。在步骤s308调整所述模型的模型参数中,所要调整的模型参数至少包括:隐藏层的层数以及每层的神经元数量。
[0110]
步骤s309:重复执行以上步骤s306至步骤s308,获取预设的重复执行步骤s306至步骤s308的次数。
[0111]
步骤s310:当重复执行次数满足设定的截取条件时,将对应的模型保存到候选模型集合中,其中,设定的截取条件例如是:每重复执行100次,就将对应的模型添加到候选模型集合中。
[0112]
在步骤s310中,可以将所确定的偏差在预设范围内的模型保存到候选模型集合中。
[0113]
步骤s311:使用测试样本分别对所述候选模型集合中的每个候选模型进行测试,以选取最优模型作为所述问诊单量预测模型,其中,所述最优模型为所述所确定的偏差为最小的模型。
[0114]
步骤s312:获取第一数据表单,所述第一数据表单包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差;
[0115]
在步骤s312中,可以根据问诊单量确定请求获取模型输入参数,所述模型输入参数包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。
[0116]
步骤s313:根据所述第一数据表单以及训练得到的问诊单量预测模型,确定第二数据表单,所述第二数据表单至少包括:下一时间段的问诊单量的预测值;
[0117]
在步骤s313中,将所述模型输入参数输入至问诊单量预测模型,以确定下一时间段的问诊单量的预测值,然后执行步骤s314或步骤s315。
[0118]
步骤s314:根据所述第二数据表单中下一时间段的问诊单量的预测值进行资源配置,当确定的下一时间段的问诊单量的预测值大于预设报警阈值时,触发预警。
[0119]
在步骤s314中,所述预设报警阈值可以根据实际需求确定,本发明实施例并不具体限定所述预设报警阈值的具体取值。
[0120]
步骤s315:根据最近日期范围内不同时间段的问诊单量的预测值,生成问诊单量的分布图,然后执行步骤s316。
[0121]
在步骤s315中,所述最近日期范围可以理解为距离当前日期之后的预设日期范围。
[0122]
步骤s316:将所述分布图发送至终端,通过所述终端显示所述分布图。
[0123]
在本发明实施例中,根据问诊单量确定请求将模型输入参数输入至问诊单量预测模型,以确定下一时间段的问诊单量的预测值,所述模型输入参数包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。该实施方式可以准确确定下一时间段的预测问诊单量,可以很好地拟合不同时间段问诊单量的变化趋势,能够很好地解决突发情况,例如:促销活动或疫情爆发。同时,该实施方式可以实时地根据前一时间段的问诊单量纠正当前时间段的问诊单量预测结果,有很好的纠偏效果,鲁棒性强。即该实施方式的问诊单量的预测准确率更高,进而可以根据问诊单量的预测值更合理地进行资源配置。
[0124]
参见图4和图5,所述问诊单量预测模型可以采用dnn模型,dnn模型相对传统的机
器学习具有较好的学习能力,可以更好地拟合问诊单量。相对rnn或者lstm来说,dnn模型具有模型结构简单、对服务性能损耗偏低等优点。参见图5,所述dnn模型包括:输入层、至少一个隐藏层和一个输出层。例如:所述隐藏层的数量为2个,每个隐藏层分别包括100和20个神经元,两个隐藏层均使用relu激活函数。在确定偏差时,损失函数可以采用均方误差,即可以将每个所述指定时间段的下一时间段的问诊单量与其预测值的均方误差,确定为每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差。所述dnn模型的学习率可以设置为0.001,优化函数可以采用亚当优化器(adamoptimizer),神经元的尺寸可以为128,迭代次数可以设置为10000。需要说明的是,以上有关各个运行参数具体取值的描述只是示例并非限定,本发明实施例中并不具体限定各个运行参数的具体取值。
[0125]
参见图6,图6所示的为按小时统计的问诊单量分布图,为了制备训练样本,可以将一天划分24小时,将每个小时作为采集的时间段分别采集问诊单量。对图6分析可知,问诊单量在不同的时间段分布呈现出一定的规律,每个时间段的问诊单量分布特征对于模型预测的重要性非常高。
[0126]
虽然不同时间段的问诊单量变化会呈现出一定的规律,但是每天同时刻的问诊单量存在一定的差异。因此可以根据当前时间段的问诊单量及时调整模型预测值,来降低模型预测的偏差。即可以在样本中增加指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差的特征数据。另外,不同时间段所述问诊单量的分布与属性特征有关,所述属性特征可以理解为与历史活动或者突发性疫情等相关属性特征。例如:不同时间段的问诊单量与促销活动或大规模突发性疫情等因素有一定的关系。因此在制备样本时,需要考虑当前日期的属性特征。
[0127]
在样本制备完成后,将样本分为训练集、测试集以及验证集,将训练集中的训练样本输入至模型中来对模型进行训练,将符合截取条件的模型存入候选模型集合中。在训练完成后,可以通过验证集中的样本验证训练所得模型的模型效果,同时可以通过测试集中的样本从候选模型集合中选取最优模型,并根据最优模型计算每个所述指定时间段的下一时间段的问诊单量的预测值。
[0128]
参见图4,dnn模型的训练流程如下:
[0129]
1)统计分析:主要分析历史问诊单分布情况,以及影响问诊单量的因素。
[0130]
2)特征和样本制备:将历史数据按照表1的明细特征进行聚合统计,然后进行最大最小归一化,拼接成每个时间段的特征数据,并将下一时刻的问诊单量作为标签。
[0131]
3)模型训练及调优:可以根据历史经验设置要调整的模型参数,可以仅对少部分模型参数进行调整,例如隐藏层的层数以及每层的神经元数量。
[0132]
4)模迭代10000次,损失函数基本收敛。
[0133]
5)模型效果验证:可以选取7天数据进行效果评测。
[0134]
参见图7,图7所示的为日期范围在2019-05-28至2019-06-03内不同时间段的问诊单量与当前时间段问诊单量的预测值的曲线分布图,由图7可以看出,通过该问诊单量预测模型能够较好地拟合问诊单量分布,并且相对基于历史数据统计分析,问诊单量实际值与预测值的平均误差降低一倍。
[0135]
图8是根据本发明实施例的资源配置装置的模块示意图,参见图8,该资源配置装置800可以包括:
[0136]
第一获取模块801,用于获取第一数据表单,所述第一数据表单包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差;
[0137]
确定模块802,用于根据所述第一数据表单以及训练得到的问诊单量预测模型,确定第二数据表单,所述第二数据表单至少包括:下一时间段的问诊单量的预测值;
[0138]
配置模块803,用于根据所述第二数据表单中下一时间段的问诊单量的预测值进行资源配置;
[0139]
其中,所述问诊单量预测模型的训练过程包括:
[0140]
获取训练样本,所述训练样本包括:指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差;
[0141]
将所述训练样本输入模型中,计算每个所述指定时间段的下一时间段的问诊单量的预测值;
[0142]
确定每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差;
[0143]
根据所确定的偏差,调整所述模型的模型参数以更新所述模型;
[0144]
重复执行以上步骤,将所确定的偏差在预设范围内的模型选取为所述问诊单量预测模型。
[0145]
可选地,所述模型输入参数还包括以下一个或多个维度的数据:当前时间段的历史问诊单量分布、下一时间段的历史问诊单量分布、当前时间段所对应的日期的历史问诊单量分布以及当前日期的属性特征。
[0146]
可选地,该资源配置装置800还可以包括:
[0147]
第二获取模块,用于获取预设日期范围内不同时间段的问诊单量的历史数据;
[0148]
聚合模块,用于按照时间段的维度,根据预设的特征明细对所述历史数据进行聚合处理;
[0149]
归一模块,用于对聚合处理后的历史数据进行归一化处理并拼接得到每个时间段的特征数据;
[0150]
打标模块,用于对每个时间段,以所述时间段的下一时间段的问诊单量为标签,对所述时间段的特征数据进行打标,以生成所述训练样本。
[0151]
可选地,该资源配置装置800还可以包括:
[0152]
第三获取模块,用于获取预设的重复执行次数;
[0153]
保存模块,用于当重复执行次数满足设定的截取条件时,将对应的模型保存到候选模型集合中;
[0154]
测试模块,用于使用测试样本分别对所述候选模型集合中的每个候选模型进行测试,以选取最优模型作为所述问诊单量预测模型,其中,所述最优模型为所述所确定的偏差为最小的模型。
[0155]
可选地,该资源配置装置800还可以包括:
[0156]
预警模块,用于当确定的下一时间段的问诊单量的预测值大于预设报警阈值时,触发预警。
[0157]
可选地,该资源配置装置800还可以包括:
[0158]
生成模块,用于根据最近日期范围内不同时间段的问诊单量的预测值,生成问诊
单量的分布图;
[0159]
显示模块,用于将所述分布图发送至终端,通过所述终端显示所述分布图。
[0160]
可选地,所要调整的模型参数至少包括:隐藏层的层数以及每层的神经元数量。
[0161]
在本发明实施例中,根据问诊单量确定请求将模型输入参数输入至问诊单量预测模型,以确定下一时间段的问诊单量的预测值,所述模型输入参数包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。该实施方式可以准确确定下一时间段的预测问诊单量,可以很好地拟合不同时间段问诊单量的变化趋势,能够很好地解决突发情况,例如:促销活动或疫情爆发。同时,该实施方式可以实时地根据前一时间段的问诊单量纠正当前时间段的问诊单量预测结果,有很好的纠偏效果,鲁棒性强。即该实施方式的问诊单量的预测准确率更高,进而可以根据问诊单量的预测值更合理地进行资源配置。
[0162]
图9示出了可以应用本发明实施例的资源配置方法或资源配置装置的示例性系统架构900。
[0163]
如图9所示,系统架构900可以包括终端设备901、902、903,网络904和服务器905。网络904用以在终端设备901、902、903和服务器905之间提供通信链路的介质。网络904可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0164]
用户可以使用终端设备901、902、903通过网络904与服务器905交互,以接收或发送消息等。终端设备901、902、903上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0165]
终端设备901、902、903可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0166]
服务器905可以是提供各种服务的服务器,例如对用户利用终端设备901、902、903所浏览的购物类网站提供支持的后台管理服务器。
[0167]
需要说明的是,本发明实施例所提供的资源配置方法一般由服务器905执行,相应地,资源配置装置一般设置于服务器905中。
[0168]
应该理解,图9中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0169]
下面参考图10,其示出了适于用来实现本发明实施例的终端设备的计算机系统1000的结构示意图。图10示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0170]
如图10所示,计算机系统1000包括中央处理单元(cpu)1001,其可以根据存储在只读存储器(rom)1002中的程序或者从存储部分1008加载到随机访问存储器(ram)1003中的程序而执行各种适当的动作和处理。在ram 1003中,还存储有系统1000操作所需的各种程序和数据。cpu 1001、rom 1002以及ram 1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。
[0171]
以下部件连接至i/o接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至i/o接口1005。可拆卸介
质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
[0172]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(cpu)1001执行时,执行本发明的系统中限定的上述功能。
[0173]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0174]
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0175]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
[0176]
获取第一数据表单,所述第一数据表单包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差;根据所述第一数据表单以及训练得到的问诊单量预测模型,确定第二数据表单,所述第二数据表单至少包括:下一
时间段的问诊单量的预测值;根据所述第二数据表单中下一时间段的问诊单量的预测值进行资源配置;
[0177]
其中,所述问诊单量预测模型的训练过程包括:
[0178]
获取训练样本,所述训练样本包括:指定时间段的问诊单量、及所述指定时间段的问诊单量与所述指定时间段的问诊单量的预测值的偏差;
[0179]
将所述训练样本输入模型中,计算每个所述指定时间段的下一时间段的问诊单量的预测值;
[0180]
确定每个所述指定时间段的下一时间段的问诊单量与其预测值的偏差;
[0181]
根据所确定的偏差,调整所述模型的模型参数以更新所述模型;
[0182]
重复执行以上步骤,将所确定的偏差在预设范围内的模型选取为所述问诊单量预测模型。
[0183]
在本发明实施例中,根据问诊单量确定请求将模型输入参数输入至问诊单量预测模型,以确定下一时间段的问诊单量的预测值,所述模型输入参数包括:当前时间段的问诊单量、及所述当前时间段的问诊单量与所述当前时间段的问诊单量的预测值的偏差。该实施方式可以准确确定下一时间段的预测问诊单量,可以很好地拟合不同时间段问诊单量的变化趋势,能够很好地解决突发情况,例如:促销活动或疫情爆发。同时,该实施方式可以实时地根据前一时间段的问诊单量纠正当前时间段的问诊单量预测结果,有很好的纠偏效果,鲁棒性强。即该实施方式的问诊单量的预测准确率更高,进而可以根据问诊单量的预测值更合理地进行资源配置。
[0184]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1