一种多Agent系统非对称分布式约束优化方法

文档序号：6548615阅读：491来源：国知局

一种多Agent系统非对称分布式约束优化方法
【专利摘要】本发明提出了一种多Agent系统非对称分布式约束优化方法，包括如下步骤：控制器接收Agent信息并获得非对称关系，构建Agent连接图；根据Agent连接图中的节点间的连接关系，建立基于排序的链式结构；将Agent连接图按照深度优先的方式构造深度优先树；通过分枝定界策略，计算不同深度优先树的根节点的权重值，最终获取更优的树形结构；依赖得到更优的树形结构，调整多Agent系统中的Agent行为参数。本发明针对多Agent系统的非对称特征，引入预测机制，弥补不完全信息决策的不足，使Agent能预估自己行为的影响，获取更有效的策略，在一定程度上改变收益非单调特性，达到个体利益和全局利益的平衡。
【专利说明】一种多Agent系统非对称分布式约束优化方法
【技术领域】
[0001]本发明涉及一种非对称分布式约束优化方法，特别涉及一种多Agent系统非对称分布式约束优化方法。
【背景技术】
[0002]多Agent系统是研究在一群自治的Agent之间如何协调它们的知识、目标、技能和相互规划采取行动或解决问题。该系统目前已逐步应用在了任务调度、资源分配、传感器网络、交通管理、微网配置等实际应用中。但是，当前在这些应用领域中，对于多Agent系统仍然使用的是“对称性”特性，即认为各Agent对与其有约束关系的其他Agent的特征、取值(策略)空间及代价(收益)函数有准确的信息，每个Agent没有个人的偏好信息和隐私性，进而简化了其求解的过程。
[0003]但是，在实际问题中，大多数的多Agent系统都具有非对称特征，即每个个体具有自己的偏好且不希望与其他个体共享。例如，在微网控制中，每个分布式电源(DG)由于各自的特性不同(如风能或水电站电源等等)，彼此之间的影响是不同的，在相同网络配置下相邻DG的收益也不相同，而每个DG并不清楚其他DG的收益情况。因此，现实情况使得在此类多Agent系统中，需要充分考虑其非对称性特征。

【发明内容】

[0004]为了克服上述现有技术中存在的缺陷，本发明的目的是提供一种多Agent系统非对称分布式约束优化方法，解决Agent非对称不完全信息的响应、双向代价求解和个体收益的私密性的组合问题以及如何设计Agent组织结构和策略并且使它们能达到较好的匹配问题。
[0005]为了实现本发明的上述目的，本发明提供了一种多Agent系统非对称分布式约束优化方法，其包括如下步骤:
[0006]SI,控制器接收Agent信息,根据所述Agent信息获得非对称关系,判断各个Agent之间是否存在约束关系，如果存在，则在有约束关系的两个Agent间搭建一条边，从而构建Agent连接图,其中，各个Agent之间的约束关系决定了 Agent节点之间的连接关系，并判定所述连接图为稀疏图还是稠密图；
[0007]S2，根据Agent连接图中的节点间的连接关系，采用单枝的构造策略，建立基于排序的链式结构，每个Agent节点作为链式结构中的一环，由于Agent间约束关系的稀疏紧密程度不同，Agent在链中的不同位置及其邻居关系会导致整个链式结构的不同分布；
[0008]S3，将步骤SI中所述Agent连接图按照深度优先的方式构造深度优先树，首先对根进行选择时，采用了约束关系最多的节点作为根，然后根据约束边的数量和有无回边确定子节点，构造深度优先树；
[0009]S4，通过分枝定界策略，计算不同深度优先树的根节点的权重值，在计算根节点权重时，采用分枝定界遍历的方式，通过设置阈值，并计算每个Agent节点的上下界来进行剪枝，以最终获取更优的树形结构；
[0010]S5，依赖步骤S4中得到的所述更优的树形结构，调整多Agent系统中的Agent的行为参数。
[0011]本发明的多Agent系统非对称分布式约束优化方法针对多Agent系统的非对称特征，引入预测机制，弥补不完全信息决策的不足，使Agent能预估自己行为的影响，获取更有效的策略，在一定程度上改变收益非单调特性，达到个体利益和全局利益的平衡。
[0012]在本发明的一种优选实施方式中，在步骤S2中，在形成链的过程中，统计每个Agent的约束关系数量，约束关系最多的Agent排列在最前，随着约束关系的降低依次排列，约束关系最少的Agent排列在最后,建立基于排序的链式结构。
[0013]在本发明的另一种优选实施方式中，在步骤S2中，在形成链的过程中，统计每个Agent的约束关系数量,约束关系最多的Agent排列在最前,选择与排列好的Agent链中的最后一个Agent向后相邻的邻居中约束关系最多的Agent排列在后,建立基于排序的链式结构。
[0014]通过建立链式结构,每个Agent节点作为链式结构中的一环,其在链中的不同位置会造成整个链式结构的不同权重分布。
[0015]另外，在形成链的过程中，本发明会尝试通过“按约束关系多优先排序”或“按约束关系多优先排序+邻居关系”的方式来构建链式结构，快速准确。
[0016]在本发明的一种优选实施方式中，由于该链式结构有存在回路的很大可能性，在排序构造链式结构的过程中，增加了反向检测搜索和阶段搜索，用以解决某个Agent节点或某些Agent节点进入链之后可能出现的回路情况，以获取更优的链式结构。
[0017]在本发明的一种优选实施方式中，在步骤S3中将所述Agent连接图按照深度优先的方式构造深度优先树的方法为:
[0018]S31，将约束关系最多的Agent选择为根节点，令根节点为参考节点；
[0019]S32，将与参考节点有连接关系的所有节点建立节点集；
[0020]S33，选择所述节点集中与参考节点连接的约束边最多的节点作为子节点，在选择时需判断该节点的加入会否造成出现交叉回边或伪树；
[0021]S34，当S33中构造的深度优先树出现交叉回边或伪树时，则放弃选择最后纳入树的该节点，而重新选择其他Agent节点作为子节点来继续构造深度优先树,新的节点选择规则仍然是判断是否有与参考节点连接的约束边次多的节点，如果有，则选择与参考节点连接的约束边次多的节点作为子节点，令子节点为参考节点，返回步骤S32，如果没有，则执行步骤S35 ；
[0022]S35，将其他没有在树中出现的Agent根据约束边的连接关系与树中的节点相连。
[0023]从而构造出树型结构。
[0024]在本发明的一种优选实施方式中，根据当前节点在步骤S2中得到的链式结构中该节点的前后节点次序，选择与该节点紧邻的向下一个节点作为子节点，如果当有交叉回边和伪树时，则选择与该节点紧邻的向下第二个节点作为子节点。
[0025]在本发明的一种优选实施方式中，在步骤S4中分枝定界策略，计算不同深度优先树的根节点的权重值的方法为:
[0026]对每个Agenti定义了上下界:
【权利要求】
1.一种多Agent系统非对称分布式约束优化方法，其特征在于，包括如下步骤: SI,控制器接收Agent信息,根据所述Agent信息获得非对称关系,判断各个Agent之间是否存在约束关系，如果存在，则在有约束关系的两个Agent间搭建一条边，从而构建Agent连接图,其中，各个Agent之间的约束关系决定了 Agent节点之间的连接关系，并判定所述连接图为稀疏图还是稠密图； S2，根据Agent连接图中的节点间的连接关系，采用单枝的构造策略，建立基于排序的链式结构，每个Agent节点作为链式结构中的一环，由于Agent间约束关系的稀疏紧密程度不同，Agent在链中的不同位置及其邻居关系会导致整个链式结构的不同分布； S3，将步骤SI中所述Agent连接图按照深度优先的方式构造深度优先树，首先对根进行选择时，采用了约束关系最多的节点作为根，然后根据约束边的数量和有无回边确定子节点，构造深度优先树； S4，通过分枝定界策略，计算不同深度优先树的根节点的权重值，在计算根节点权重时，采用分枝定界遍历的方式，通过设置阈值，并计算每个Agent节点的上下界来进行剪枝，以最终获取更优的树形结构； S5，依赖步骤S4中得到的所述更优的树形结构，调整多Agent系统中的Agent行为参数。
2.如权利要求1所述的多Agent系统非对称分布式约束优化方法，其特征在于:在步骤S2中，在形成链的过程中，统计每个Agent的约束关系数量，约束关系最多的Agent排列在最前，随着约束关系的降低依次排列，约束关系最少的Agent排列在最后,建立基于排序的链式结构。
3.如权利要求1所述的多Agent系统非对称分布式约束优化方法，其特征在于:在步骤S2中，在形成链的过程中，统计每个Agent的约束关系数量，约束关系最多的Agent排列在最前，选择与排列好的Agent链中的最后一个Agent向后相邻的邻居中约束关系最多的Agent排列在后，建立基于排序的链式结构。
4.如权利要求1所述的多Agent系统非对称分布式约束优化方法，其特征在于:在排序构造链式结构的过程中，增加了反向检测搜索和阶段搜索，用以解决某个Agent节点或某些Agent节点进入链之后可能出现的回路情况，以获取更优的链式结构。
5.如权利要求1所述的多Agent系统非对称分布式约束优化方法，其特征在于:在步骤S3中将所述Agent连接图按照深度优先的方式构造深度优先树的方法为: S31，将约束关系最多的Agent选择为根节点，令根节点为参考节点； S32，将与参考节点有连接关系的所有节点建立节点集； S33，选择所述节点集中与参考节点连接的约束边最多的节点作为子节点，在选择时需判断该节点的加入会否造成出现交叉回边或伪树； S34，当S33中构造的深度优先树出现交叉回边或伪树时，则放弃选择最后纳入树的该节点，而重新选择其他Agent节点作为子节点来继续构造深度优先树,新的节点选择规则仍然是判断是否有与参考节点连接的约束边次多的节点，如果有，则选择与参考节点连接的约束边次多的节点作为子节点，令子节点为参考节点，返回步骤S32，如果没有，则执行步骤 S35 ； S35，将其他没有在树中出现的Agent根据约束边的连接关系与树中的节点相连。
6.如权利要求5所述的多Agent系统非对称分布式约束优化方法，其特征在于:根据当前节点在步骤S2中得到的链式结构中该节点的前后节点次序，选择与该节点紧邻的向下一个节点作为子节点，如果当有交叉回边和伪树时，则选择与该节点紧邻的向下第二个节点作为子节点。
7.如权利要求1所述的多Agent系统非对称分布式约束优化方法，其特征在于:在步骤S4中分枝定界策略，计算不同深度优先树的根节点的权重值的方法为: 对每个Agenti定义了上下界:
【文档编号】G06F9/50GK103995750SQ201410244687
【公开日】2014年8月20日申请日期:2014年6月4日优先权日:2014年6月4日
【发明者】张程, 陈自郁申请人:重庆大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张程;陈自郁
技术所有人：重庆大学
我是此专利的发明人

上一篇：基于自动帧重复的1553b总线硬件定时通信测试装置及方法
上一篇：一种信息聚合方法及装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。