一种模型结构的优化方法及装置与流程

文档序号:34877218发布日期:2023-07-25 08:46阅读:65来源:国知局
一种模型结构的优化方法及装置与流程

本申请涉及人工智能,尤其涉及一种模型结构的优化方法及装置。


背景技术:

1、大量现实生活中的优化问题本质上都是离散或者连续的组合优化问题,比如机场调度、大学课程排课、护士排班、工厂排产、材料工艺控制、数据分配和电力系统的调度等业务。其中以多工厂排产业务问题为例,这类问题的特征是待求解的变量很多,业务约束多,对求解速度、求解质量以及鲁棒性要求较高。为解决上述问题,许多方法被提出来了,比如启发式方法、元启发算法(进化算法、邻域搜索等)以及数学规划算法。不同的方法有各自的局限性,比如启发式方法产生的结果不够好,需要大量的人工调整;元启发算法求得的结果好于启发式方法,但是其求解速度太慢。


技术实现思路

1、本申请的实施例提供一种模型结构的优化方法及装置,通过对模型的结构优化,提高了求解器对该优化后的模型的求解性能。

2、第一方面,本申请提供了一种模型结构的优化方法,包括获取待优化的业务模型的结构信息,业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,结构信息包括业务模型对应的矩阵信息,矩阵信息包括多个列变量和多个行变量,列变量表征了所述业务模型的变量,变量基于业务数据中的决策特征确定,行变量表征了业务模型的约束,约束基于约束条件确定;将矩阵信息输入图神经网络,得到多个列变量和/或多个行变量对应的多个嵌入表示;将多个嵌入表示输入指针神经网络,得到多个嵌入表示的排序;基于多个嵌入表示的排序,对业务模型的结构进行优化,优化后的业务模型用于输入求解器,得到目标业务在实现最优业务目标时对应的决策。

3、在该实现中,通过对模型的结构优化,提高了求解器对优化后的模型的求解性能。

4、在一个可能的实现中,将矩阵信息输入图神经网络,得到多个列变量和/或多个行变量对应的多个嵌入表示,包括:确定矩阵信息的二部图,二部图包括多个列变量节点和多个行变量节点;提取二部图中各个列变量节点和/或行变量节点的特征,得到各个列变量节点和/或行变量节点对应的嵌入表示;基于各个列变量节点和/或行变量节点对应的嵌入表示,确定多个列变量和/或多个行变量对应的多个嵌入表示。

5、在一个可能的实现中,将所述多个嵌入表示输入指针神经网络,得到多个所述嵌入表示的排序,包括:将多个嵌入表示划分为多组嵌入表示;对多组嵌入表示中各组嵌入表示进行池化操作,得到多个池化特征;将多个池化特征输入指针神经网络,得到多个池化特征的排序;基于多个池化特征的排序,确定多个嵌入表示的排序。

6、在另一个可能的实现中,基于多个嵌入表示的排序,对业务模型的结构进行优化,包括:基于多个嵌入表示的排序,对矩阵信息中多个列变量和/或多个行变量进行排序,得到优化后的矩阵信息;基于优化后的矩阵信息,确定优化后的业务模型的结构信息。

7、在另一个可能的实现中,图神经网络为图卷积神经网络。

8、在另一个可能的实现中,图神经网络和指针神经网络基于强化学习或监督学习训练得到。

9、第二方面,本申请提供了一种模型结构的优化装置,包括:

10、获取模块,用于获取待优化的业务模型的结构信息,所述业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,所述结构信息包括所述业务模型对应的矩阵信息,所述矩阵信息包括多个列变量和多个行变量,所述列变量表征了所述业务模型的变量,所述变量基于所述业务数据中的决策特征确定,所述行变量表征了所述业务模型的约束,所述约束基于所述约束条件确定;

11、嵌入表示提取模块,用于将所述矩阵信息输入图神经网络,得到所述多个列变量和/或多个行变量对应的多个嵌入表示;

12、排序模块,用于将所述多个嵌入表示输入指针神经网络,得到所述多个嵌入表示的排序;

13、优化模块,基于所述多个嵌入表示的排序,对所述业务模型的结构进行优化,优化后的所述业务模型用于输入求解器,得到所述目标业务在实现最优所述业务目标时对应的决策。

14、在一个可能的实现中,所述嵌入表示提取模块具体用于,确定所述矩阵信息的二部图,所述二部图包括多个列变量节点和多个行变量节点;

15、提取所述二部图中各个列变量节点和/或行变量节点的特征,得到所述各个列变量节点和/或行变量节点对应的嵌入表示;

16、基于所述各个列变量节点和/或行变量节点对应的嵌入表示,确定所述多个列变量和/或多个行变量对应的多个嵌入表示。

17、在另一个可能的实现中,所述排序模块具体用于,将所述多个嵌入表示划分为多组嵌入表示;

18、对所述多组嵌入表示中各组嵌入表示进行池化操作,得到多个池化特征;

19、将所述多个池化特征输入所述指针神经网络,得到所述多个池化特征的排序;

20、基于所述多个池化特征的排序,确定所述多个嵌入表示的排序。

21、在另一个可能的实现中,所述优化模块具体用于,基于所述多个嵌入表示的排序,对所述矩阵信息中多个列变量和/或多个行变量进行排序,得到优化后的矩阵信息;

22、基于所述优化后的矩阵信息,确定优化后的业务模型的结构信息。

23、在另一个可能的实现中,所述图神经网络为图卷积神经网络。

24、在另一个可能的实现中,所述图神经网络和所述指针神经网络基于强化学习或监督学习训练得到。

25、第三方面,本申请提供了一种计算设备,包括存储器和处理器,所述存储器中存储有指令,当所述指令被处理器执行时,使得第一方面所述的方法被实现。

26、第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在被处理器执行时,使得第一方面所述的方法被实现。



技术特征:

1.一种模型结构的优化方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述矩阵信息输入图神经网络,得到所述多个列变量和/或多个行变量对应的多个嵌入表示,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述将所述多个嵌入表示输入指针神经网络,得到多个所述嵌入表示的排序,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述多个嵌入表示的排序,对所述业务模型的结构进行优化,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,所述图神经网络为图卷积神经网络。

6.根据权利要求1-5任一项所述的方法,其特征在于,所述图神经网络和所述指针神经网络基于强化学习或监督学习训练得到。

7.一种模型结构的优化装置,其特征在于,包括:

8.根据权利要求7所述的装置,其特征在于,所述嵌入表示提取模块具体用于,确定所述矩阵信息的二部图,所述二部图包括多个列变量节点和多个行变量节点;

9.根据权利要求7或8所述的装置,其特征在于,所述排序模块具体用于,将所述多个嵌入表示划分为多组嵌入表示;

10.根据权利要求7-9任一项所述的装置,其特征在于,所述优化模块具体用于,基于所述多个嵌入表示的排序,对所述矩阵信息中多个列变量和/或多个行变量进行排序,得到优化后的矩阵信息;

11.根据权利要求7-10任一项所述的装置,其特征在于,所述图神经网络为图卷积神经网络。

12.根据权利要求9-11任一项所述的装置,其特征在于,所述图神经网络和所述指针神经网络基于强化学习或监督学习训练得到。

13.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有指令,当所述指令被处理器执行时,使得如权利要求1-6任一项所述的方法被实现。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在被处理器执行时,使得如权利要求1-6任一项所述的方法被实现。


技术总结
本申请提供一种模型结构的优化方法,包括:获取待优化的业务模型的结构信息,业务模型基于目标业务的业务数据中的决策特征、约束条件和业务目标确定,结构信息包括业务模型对应的矩阵信息,矩阵信息包括多个列变量和多个行变量,列变量表征了业务模型的变量,变量基于业务数据中的决策特征确定,行变量表征了业务模型的约束,约束基于约束条件确定;将矩阵信息输入图神经网络,得到多个列变量和/或多个行变量对应的多个嵌入表示;将多个嵌入表示输入指针神经网络,得到多个嵌入表示的排序;基于多个嵌入表示的排序,对业务模型的结构进行优化。本申请通过对模型的结构优化,提高了求解器对优化后的模型的求解性能。

技术研发人员:李希君,朱方舟,甄慧玲,付小津,陆梦,曾嘉,袁明轩
受保护的技术使用者:华为技术有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1