仓储调度决策方法、装置、终端设备以及存储介质

文档序号：32389966发布日期：2022-11-30 07:50阅读：来源：国知局

技术特征：
1.一种仓储调度决策方法，其特征在于，所述仓储调度决策方法包括：当检测到货物出库请求时，获取密集型仓储系统当前的属性特征数据；将所述属性特征数据输入至预先训练好的深度信念网络模型中进行调度决策，生成调度决策方案，其中，所述深度信念网络模型由提升机选择学习模型、穿梭车选择学习模型和货位优先级学习模型中的一种或多种组成。2.根据权利要求1所述的仓储调度决策方法，其特征在于，所述当检测到货物出库请求时，获取密集型仓储系统当前的属性特征数据的步骤之前，还包括：训练得到所述深度信念网络模型，具体包括：对所述深度信念网络模型进行离线训练，得到离线训练后的深度信念网络模型；对所述离线训练后的深度信念网络模型进行在线训练，得到训练好的深度信念网络模型。3.根据权利要求2所述的仓储调度决策方法，其特征在于，所述对所述深度信念网络模型进行离线训练，得到离线训练后的深度信念网络模型的步骤包括：建立集成优化数学模型，运用优化算法对所述集成优化数学模型进行求解，得到模拟的决策方案；将所述模拟的决策方案导入至预先构建的仓储系统仿真模型进行划分，得到模拟的标签数据；将预先建立的出库订单计划和所述模拟的决策方案导入至所述仓储系统仿真模型中进行模拟作业，得到模拟的运行属性状态数据；根据所述运行属性状态数据生成模拟的属性特征数据；获取所述密集型仓储系统的历史交互数据，生成历史的属性特征数据和历史的标签数据；结合所述模拟的属性特征数据、所述历史的属性特征数据、所述模拟的标签数据和所述历史的标签数据，对所述深度信念网络模型进行离线训练，得到所述离线训练后的深度信念网络模型。4.根据权利要求3所述的仓储调度决策方法，其特征在于，所述对所述离线训练后的深度信念网络模型进行在线训练，得到训练好的深度信念网络模型的步骤包括：获取仓储管理系统和所述密集型仓储系统实际作业现场的在线交互数据；根据所述在线交互数据对所述离线训练后的深度信念网络模型进行在线训练，得到所述训练好的深度信念网络模型。5.根据权利要求4所述的仓储调度决策方法，其特征在于，所述深度信念网络模型由所述提升机选择学习模型、所述穿梭车选择学习模型和所述货位优先级学习模型组成，所述结合所述模拟的属性特征数据、所述历史的属性特征数据、所述模拟的标签数据和所述历史的标签数据，对所述深度信念网络模型进行离线训练，得到所述离线训练后的深度信念网络模型的步骤包括：根据所述模拟的属性特征数据和所述历史的属性特征数据，生成用于离线训练所述提升机选择学习模型的第一训练用的属性特征数据；根据所述模拟的标签数据和所述历史的标签数据，生成用于离线训练所述提升机选择学习模型的第一训练用的标签数据；
结合所述第一训练用的属性特征数据和所述第一训练用的标签数据对所述提升机选择学习模型进行离线训练，生成被选提升机决策方案，并得到离线训练后的提升机选择学习模型；结合所述被选提升机决策方案，以及所述模拟的属性特征数据和所述历史的属性特征数据，生成用于离线训练所述穿梭车选择学习模型的第二训练用的属性特征数据；结合所述被选提升机决策方案，以及所述模拟的标签数据和所述历史的标签数据，生成用于离线训练所述穿梭车选择学习模型的第二训练用的标签数据；结合所述第二训练用的属性特征数据和所述第二训练用的标签数据对所述穿梭车选择学习模型进行离线训练，生成被选提升机-穿梭车决策方案，并得到离线训练后的穿梭车选择学习模型；结合所述被选提升机-穿梭车决策方案，以及所述模拟的属性特征数据和所述历史的属性特征数据，生成用于离线训练所述货位优先级学习模型的第三训练用的属性特征数据；结合所述被选提升机-穿梭车决策方案，以及所述模拟的标签数据和所述历史的标签数据，生成用于离线训练所述货位优先级学习模型的第三训练用的标签数据；结合所述第三训练用的属性特征数据和所述第三训练用的标签数据对所述货位优先级学习模型进行离线训练，生成被选提升机-穿梭车-货位决策方案，得到离线训练后的穿梭车选择学习模型，并得到所述离线训练后的深度信念网络模型。6.根据权利要求5所述的仓储调度决策方法，其特征在于，所述第三训练用的属性特征数据包括：被选巷道的属性特征、被选提升机的属性特征、被选穿梭车的属性特征、待出库货物的货位属性特征以及通过货位两两对比方式生成的货位优先级的属性特征。7.根据权利要求6所述的仓储调度决策方法，其特征在于，所述将所述属性特征输入至预先训练好的深度信念网络模型中进行调度决策，生成调度决策方案的步骤之后，还包括：根据所述调度决策方案执行仓储调度任务，具体包括：当被选穿梭车执行跨层取货任务时，检测目标货物所在目标层的穿梭车工作状态信息；当检测到所述目标层的穿梭车正在执行工作任务时，执行任务转移策略，具体包括：取消所述被选穿梭车当前的跨层取货任务；当检测到所述目标层的穿梭车结束执行任务时，执行所述跨层取货任务。8.一种仓储调度决策装置，其特征在于，所述仓储调度决策装置包括：数据获取模块，用于当检测到货物出库请求时，获取密集型仓储系统当前的属性特征数据；调度决策模块，用于将所述属性特征数据输入至预先训练好的深度信念网络模型中进行调度决策，生成调度决策方案，其中，所述深度信念网络模型由提升机选择学习模型、穿梭车选择学习模型和货位优先级学习模型中的一种或多种组成。9.一种终端设备，其特征在于，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的仓储调度决策程序，所述仓储调度决策程序被所述处理器执行时实现如权利要求1-7中任一项所述的仓储调度决策方法的步骤。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有仓储调
度决策程序，所述仓储调度决策程序被处理器执行时实现如权利要求1-7中任一项所述的仓储调度决策方法的步骤。

技术总结
本申请公开了一种仓储调度决策方法、装置、终端设备以及存储介质，其仓储调度决策方法包括：当检测到货物出库请求时，获取密集型仓储系统当前的属性特征数据；将所述属性特征数据输入至预先训练好的深度信念网络模型中进行调度决策，生成调度决策方案，其中，所述深度信念网络模型由提升机选择学习模型、穿梭车选择学习模型和货位优先级学习模型中的一种或多种组成。本申请解决了仓储调度作业效率较低，设备利用率较低，致使系统总作业时间耗费长的问题，达到仓储系统的调度决策及时、高效的目的。的目的。的目的。

技术研发人员：徐立云徐准施力张剑刘雪梅马淑梅
受保护的技术使用者：同济大学
技术研发日：2022.08.31
技术公布日：2022/11/29

完整全部详细技术资料下载

当前第2页1 2