基于多智能体的角色分配方法、装置、计算机设备及存储介质与流程

文档序号：16691882发布日期：2019-01-22 18:57阅读：229来源：国知局

本发明属于计算机技术领域，尤其涉及一种基于多智能体的角色分配方法、装置、计算机设备及存储介质。

背景技术：

众所周知，足球比赛是一个团队项目，仅靠个人技能不可能取得胜利，必须考虑全队的协作配合。而robocup(机器人世界杯足球锦标赛)3d仿真比赛的一项任务也是体现多智能体在复杂多变的环境下如何实现高效的协作。

现有针对解决角色分配的问题，有采用子任务集优化方法完成目标框架的设计，使用动态角色分配算法协调整体队伍的占位配合；或基于时空模型匹配方法，以建立相关的运动模型和其内部状态，同时采用遗传算法优化不同行为动作参数配置；还有采用回溯法解决角色分配问题，然而，上述方法计算量大，更新速度慢，尤其运用回溯法求解此问题，时间复杂度高，耗费时间太长，无法应用到类似足球比赛这种需实时做出决策的问题中。

技术实现要素：

本发明实施例提供一种基于多智能体的角色分配方法，旨在解决现有针对角色分配的方法计算量大、更新速度慢、时间复杂度高、耗费时间长以及无法实时做出决策的问题。

本发明实施例是这样实现的，一种基于多智能体的角色分配方法，所述方法包括：

根据球场的当前情况确定阵型；

根据球的当前位置及各智能体的投票情况确定最佳持球智能体；

分别获取第一智能体到第一目标位置、第二目标位置的路径权值，所述路径权值基于智能体到目标位置的距离，结合智能体自身状况确定；

根据所述路径权值，确定第一智能体、第一目标位置、第二目标位置的初始化标志杆值；

计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置；

分别获取第二智能体到第一目标位置、第二目标位置的路径权值，并确定第二智能体的初始化标志杆值；

计算所述第二智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第二智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置；

当第一智能体与第二智能体分别与第一目标位置、第二目标位置相匹配时，则完成角色分配。

本发明实施例还提供一种基于多智能体的角色分配装置，所述装置包括：

第一确定单元，用于根据球场的当前情况确定阵型；

第二确定单元，用于根据球的当前位置及各智能体的投票情况确定最佳持球智能体；

第一获取单元，用于分别获取第一智能体到第一目标位置、第二目标位置的路径权值，所述路径权值基于智能体到目标位置的距离，结合智能体自身状况确定；

第三确定单元，用于根据所述路径权值，确定第一智能体、第一目标位置、第二目标位置的初始化标志杆值；

第一计算单元，用于计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置；

第二获取单元，用于分别获取第二智能体到第一目标位置、第二目标位置的路径权值，并确定第二智能体的初始化标志杆值；

第二计算单元，用于计算所述第二智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第二智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置；

确认单元，用于当第一智能体与第二智能体分别与第一目标位置、第二目标位置相匹配时，则完成角色分配。

本发明实施例还提供一种计算机设备，所述计算机设备包括：处理器，用于执行存储器中存储的计算机程序时实现如上述所述的基于多智能体的角色分配方法的步骤。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序/指令，其特征在于，所述计算机程序/指令被所述处理器执行时实现如上述所述基于多智能体的角色分配方法的步骤。

本发明实施例中，根据球的当前位置及各智能体的投票情况确定最佳持球智能体后，分别获取第一智能体到第一目标位置、第二目标位置的路径权值，并确定第一智能体、第一目标位置、第二目标位置的初始化标志杆值；计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置；同样以第一智能体的角色位置确定方式，确定第二智能体的角色位置，当第一智能体与第二智能体分别与第一目标位置、第二目标位置相匹配时，完成角色分配。一方面，路径权值的确定考虑智能体的自身情况，使角色分配更加合理，能在最短时间完成球队阵型的收敛；另一方面，时间复杂度大为降低，可明显降低计算量，节省了角色切换的时间。

附图说明

图1是本发明实施例一提供的一种基于多智能体的角色分配方法的实现流程图；

图2是本发明实施例一提供的另一种基于多智能体的角色分配方法的实现流程图；

图3是本发明实施例一提供的再一种基于多智能体的角色分配方法的实现流程图；

图4是本发明实施例一提供的智能体角色匹配的带权二分图；

图5是本发明实施例二提供的一种基于多智能体的角色分配方法的实现流程图；

图6是本发明实施例二提供的一种智能体角色匹配的带权二分图；

图7是本发明实施例二提供的一种更新后的智能体角色匹配的带权二分图；

图8是本发明实施例三提供的一种智能体角色匹配的带权二分图；

图9是本发明实施例三提供的一种更新后的智能体角色匹配的带权二分图；

图10是本发明实施例三提供的又一种更新后的智能体角色匹配的带权二分图；

图11是本发明实施例三提供的再一种更新后的智能体角色匹配的带权二分图；

图12是本发明实施例四提供的一种基于多智能体的智能体角色分配装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种信息，但除非特别说明，这些信息不受这些术语限制。这些术语仅用来将同一类型的信息彼此区分开。举例来说，在不脱离本申请的范围的情况下，可以将第一智能体称为第二智能体，且类似地，可将第二智能体称为第一智能体。

本发明实施例提供的基于多智能体的角色分配方法，通过第一智能体及第二智能体到第一目标位置、第二目标位置的路径权值，并对第一智能体、第二智能体、第一目标位置、第二目标位置进行初始化标志杆值，以标志杆值之和与对应路径权值相匹配的目标位置，确定第一智能体、第二智能体的角色位置；一方面，路径权值的确定考虑智能体的自身情况，使角色分配更加合理，能在最短时间完成球队阵型的收敛；另一方面，时间复杂度大为降低，可明显降低计算量，节省了角色切换的时间。

为了进一步阐述本发明为实现预定发明目的所采取的技术手段及功效，根据如下实施例，以robocup3d仿真足球比赛场景为例，对本发明实施例提供的基于多智能体的角色分配方法进行详细说明，值得注意的是，robocup3d仿真足球比赛由两支队伍组成，本发明实施例仅仅为应用于单方队伍在阵型中对应的角色位置分配。

实施例一

图1示出了本发明实施例一提供的一种基于多智能体的角色分配方法的实现流程图，详述如下：

在步骤s101中，根据球场的当前情况确定阵型。

在本发明实施例中，阵型是指为了适应区域防守，节奏控制，无球跑动的需要，全队队员在场上的位置排列和职责分工。阵型可以有不同的种类，用于描述比赛队员在场上的位置排列或一般性的战术组织形式，例如可以包括开球、球门球、角球、边线球、进攻、防守等模式与人类足球赛一样，robocup3d仿真比赛也设置相应的比赛模式来模拟真实的球场情况，如开球、球门球、角球、边线球、进攻、防守等模式。

在实际应用中，可以预先根据现实中球场比赛过程中可能出现的各种情况(如进攻、防守等)及应对阵型，设计一些球场情况和阵型的对应关系集合，所述根据球场的当前情况确定阵型，具体可以为：如当球场上比赛进程处于防守状态时，则阵型确认为防守模式；当比赛进程变为进攻状态时，则阵型转化为进攻模式等。

在步骤s102中，根据球的当前位置及各智能体的投票情况确定最佳持球智能体。

在本发明实施例中，最佳持球智能体是指足球比赛过程中最开始带球的角色；最佳持球角色位置的确定是整场比赛的关键所在，其是该传球还是自己带球前进，对整体团队而言，至关重要。

在本发明实施例中，根据球的当前位置及各智能体的投票情况确定最佳持球智能体，包括：根据该球员是否摔倒、球员自身朝向情况、能否看到球、球在他的前方还是后方，其距离球的距离远近等确定最佳持球智能体；即获取每个智能体所处状况及根据上述最佳智能体确定依据的投票情况，确定最佳持球角色位置获得者；最终结果通过通信系统对该球员编号进行广播，使得所有球员获知最佳持球者所处位置。

在步骤s103中，分别获取第一智能体到第一目标位置、第二目标位置的路径权值，所述路径权值基于智能体到目标位置的距离，结合智能体自身状况确定。

在本发明实施例中，第一智能体代表除了最佳持球智能体外的其他球员；第一目标位置、第二目标位置代表比赛所选阵型中的角色位置，如队伍中有n名球员，所确定的阵型中就有n个角色位置，即n个目标位置；其中，角色位置可以是中锋、边锋、影锋、前腰、后腰、边前卫、中前卫、中后卫、边后卫等，具体由球员人数及阵型而定。

如图2所示，在本发明实施例中，所述步骤s103，还包括以下步骤：

在步骤s201中，根据智能体到目标位置的距离，确定基础权重。

在本发明实施例中，基础权重可以理解为第一智能体分别到第一目标位置，第二目标位置的直线距离。

在步骤s202中，根据所述智能体的朝向与目标位置的角度，确定所述基础权重的增加值。

在本发明实施例中，根据所述智能体的朝向与目标位置的角度，确定多数基础权重的增加值，包括：根据第一智能体自身状况如摔倒与否，以及其到达目标位置是否需要转身、或者中间是否包含障碍物等情况，并结合实际情况增加上述的基础权重。

在步骤s203中，根据所述基础权重的增加值，确定所述智能体到目标位置的最终权重，取所述最终权重的相反数，确定为路径权值。

在本发明实施例中，路径权值为定义的路径上面的值，可以理解为结点间的距离，即以球员到某一角色位置的距离为基础，再考虑该球员是否需要转身或者撞到、摔跤等情况相应增加一定权值，取相反数而得，如智能体a到某一角色位置的路径权值为-10，然而该智能体背朝该角色位置，需要转身前往，则该智能体a到该角色位置在基础权值的基础上，增加一定权值，具体所增加的权值以该智能体自身情况及赛场情况而定，即基于该智能体自身情况及赛场情况下，计算该智能体到到特定角色位置需额外增加的权值。

在步骤s104中，根据所述路径权值，确定第一智能体、第一目标位置、第二目标位置的初始化标志杆值。

如图3所示，在本发明实施例中，所述步骤s104，还包括以下步骤：

在步骤s301中，根据第一智能体到第一目标位置、第二目标位置的路径权值，取最大路径权值作为第一智能体的初始化标志杆值。

在本发明实施例中，初始化标志杆值是确定智能体匹配角色位置的关键依据，即智能体标志杆值与目标位置的标志杆值之和与相对应的路径权值想等，才能得以匹配；其可以根据上述所获取的第一智能体到第一目标位置、第二目标位置的路径权值，将路径权值最大者作为第一智能体的初始化标志杆值。

在步骤s302中，第一目标位置、第二目标位置的初始化标志杆值为0。

在本发明实施例中，智能体与目标位置的初始化标志杆值可以根据公式获得：lx[i]＝max{e.w|e.x＝i}(即每个智能体方的点的初始标志杆为与这个智能体方的点相关联的权值最大的边的权值)，ly[j]＝0(即每个目标位置方的点的初始标志杆为0)；如图4所示的角色匹配示意图，智能体方包括第一智能体a1、第二智能体a2；目标位置方包括第一目标位置p1、第二目标位置p2；第一智能体a1到第一目标位置p1的路径权值w为-15，第一智能体a1到第二目标位置p2的路径权值w为-16，第一智能体a1的初始化标志杆值为-15，第一目标位置、第二目标位置的初始化标志杆值为0。

在本发明实施例中，第一智能体、第一目标位置、第二目标位置均有一个标志杆值，该标志杆必须为可行标志杆，如记lx[i]为智能体方第i智能体的标志杆值，ly[j]为目标位置方的第j目标位置的标志杆值，对任意一边都有lx[i]+ly[j]≥w(w为该边路径权值)，则这一组标志杆值是可行的。特别地，对于lx[i]+ly[j]＝w的边(i，j，w)，为可行边。

在步骤s105中，计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置。

在本发明实施例中，以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置，具体为；判断第一智能体与第一目标位置的标志杆值之和，是否与第一智能体到第一目标位置的路径权值一致，若一致，则初步确定为第一智能体匹配第一目标位置；如图4所示的角色匹配示意图，第一智能体a1与第一目标位置p1的标志杆值之和为-15，正好与第一智能体a1到第一目标位置p1的路径权值相等，则第一智能体a1匹配到第一目标位置p1。

在步骤s106中，分别获取第二智能体到第一目标位置、第二目标位置的路径权值，并确定第二智能体的初始化标志杆值。

在本发明实施例中，根据上述第一智能体到第一目标位置、第二目标位置的路径权值确定步骤，以及第一智能体的初始化标志杆值的确定步骤，确定第二智能体到第一目标位置、第二目标位置的路径权值，以及第二智能体的初始化标志杆值；如图4所示的角色匹配示意图，第二智能体a2到第一目标位置p1的路径权值w为-18，第二智能体a2到第二目标位置p2的路径权值为-14，第二智能体a1的初始化标志杆值为-14。

在步骤s107中，计算所述第二智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第二智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置。

在本发明实施例中，以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置，具体为：判断第二智能体与第一目标位置的标志杆值之和，是否与第二智能体到第一目标位置的路径权值一致，若一致，则初步确定为第二智能体匹配第一目标位置，若不一致，则判断第二智能体与第二目标位置的标志杆值之和，是否与第二智能体到第二目标位置的路径权值一致，若一致，则初步确定为第二智能体匹配第二目标位置；如图4所示的角色匹配示意图，第二智能体a2与第一目标位置p1的标志杆值之和为-18，第二智能体a2与第二目标位置p2的标志杆值之和为-14，正好与第二智能体a2到第二目标位置p2的路径权值相等，则第二智能体a2匹配到第二目标位置p2。

在步骤s108中，当第一智能体与第二智能体分别与第一目标位置、第二目标位置相匹配时，则完成角色分配。

在本发明实施例中，当第一智能体与第二智能体分别与第一目标位置、第二目标位置相匹配，即如图4所示的角色匹配示意图，第一智能体a1与第一目标位置p1相匹配；第二智能体a2与第二目标位置p2相匹配；则角色分配完成。

本发明实施例中，通过第一智能体及第二智能体到第一目标位置、第二目标位置的路径权值，并对第一智能体、第二智能体、第一目标位置、第二目标位置进行初始化标志杆值，以标志杆值之和与对应路径权值相匹配的目标位置，确定第一智能体、第二智能体的角色位置；一方面，路径权值的确定考虑智能体的自身情况，使角色分配更加合理，能在最短时间完成球队阵型的收敛；另一方面，时间复杂度大为降低，可明显降低计算量，节省了角色切换的时间。

实施例二

图5示出了本发明实施例二提供的一种基于多智能体的角色分配方法流程图，其与实施例一相似，不同之处在于，还包括：

在步骤s501中，当第一智能体与第二智能体均同时匹配到第一目标位置或者第二目标位置时，则对第一智能体、第二智能体的标志杆值，以及对应的第一目标位置或者第二目标位置的标志杆值进行修改及更新。

如图6所示的角色匹配示意图，第一智能体a1与第二智能体a2的可行化标志杆值分别为-15、-14，第一智能体a1到第一目标位置p1的路径权值为-15，第一智能体a1到第二目标位置p2的路径权值为-17，第二智能体a2到第一目标位置的路径权值为-14，第二智能体a2到第二目标位置p2的路径权值为-15，根据智能体方的角色位置分配原则：以智能体方与目标值方的标志杆值之和与对应路径权值相匹配的目标位置，即初步确定为该智能体的角色位置；则第一智能体a1与第二智能体a2均匹配到第一目标位置p1，需要对第一智能体、第二智能体的标志杆值，以及对应的第一目标位置或者第二目标位置的标志杆值进行修改及更新。

在本发明实施例中，对第一智能体、第二智能体的标志杆值，以及对应的第一目标位置或者第二目标位置的标志杆值进行修改及更新，具体包括：对第一智能体、第二智能体的标志杆值减少数量级，对应的第一目标位置或者第二目标位置相应增加所述第一智能体、第二智能体的标志杆值减少的数量级；所述数量级基于各路径权值的最小差值而确定；如图6所示的角色匹配示意图，根据路径权值-15、-17、-14，确定路径权值两两差值最小的数量级为1，即第一智能体a1、第二智能体a2的标志杆值均需要减少1个数量级，分别变为-16、-15；第一目标位置p1的标志杆值需要相应增加一个数量级，变为1。

在步骤s502中，返回计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置的步骤。

在本发明实施例中，当标志杆值更新后，重新依次对第一智能体、第二智能体进行角色匹配，如图7所示的标志杆值修改及更新后的角色匹配示意图，按照智能体方的角色位置分配原则：以智能体方与目标值方的标志杆值之和与对应路径权值相匹配的目标位置，即初步确定为该智能体的角色位置；此时，第一智能体a1将匹配到第一目标位置p1，第二智能体a2将匹配到第二目标位置p2。

在步骤s503中，当第一智能体、第二智能体分别匹配到不同的目标位置时，则完成角色分配。

在本发明实施例中，当第一智能体与第二智能体分别匹配到不同的位置时，即如图7所示的角色匹配示意图，第一智能体a1与第一目标位置p1相匹配；第二智能体a2与第二目标位置p2相匹配；则角色分配完成。

本发明实施例中，通过修改及更新相应标志杆值，确保第一智能体以及第二智能体分别匹配到不同的目标位置，并且能在降低计算量的同时，在最短时间完成球队阵型的收敛，大大节省了角色切换的时间。

实施例三

图8示出了本发明实施例三的角色匹配示意图，其与实施例一相似，不同之处在于，本发明实施例三是以三名球员(智能体)分配三个角色位置为例，智能体方包括第一智能体a1、第二智能体a2、第三智能体a3；目标位置方包括第一目标位置p1、第二目标位置p2、第三目标位置p3；具体角色匹配过程，详述如下：

(1)首先初始化标志杆值。如图3所示，第一智能体a1到第一目标位置p1、第二目标位置p2、第三目标位置p3的路径权值w分别为-5、-8、-4；第二智能体a2到第一目标位置p1、第二目标位置p2、第三目标位置p3的路径权值w分别为-4、-5、-3；第三智能体a3到第一目标位置p1、第二目标位置p2、第三目标位置p3的路径权值w分别为-10、-8、-5；第一智能体a1、第二智能体a2、第三智能体a3的初始化标志杆值分别为-4、-3、-5；第一目标位置p1、第二目标位置p2、第三目标位置p3的初始化标志杆值均为0。

(2)为第一智能体a1分配位置，角色位置分配的原则(a1，a2，a3分配角色位置均遵循此原则)是：两边的标志杆相加等于路径上的权值，若是找不到边匹配，对参与此次分配的所有左边标志杆-1，右边标志杆+1，再进行匹配，若还是匹配不到，重复+1和-1操作(注意：每一轮匹配中，每个位置只会被尝试匹配一次)。根据此原则a1和p3可以匹配。a1分配完毕。

(3)为a2分配位置，根据角色位置分配原则，a2只能与p3匹配，但p3已与a1匹配。a1尝试更换，但a1除p3无法找到相匹配的位置。此轮参与匹配的有a1，a2，p3，根据原则，a1与a2标志杆值减少一个数量级(-1)，p3标志杆值增加一个数量级(+1)，角色分配示意图变为如图9所示。

(4)继续为a2分配位置，a2可与p1相匹配，a2分配完毕。此时a1匹配p3，a2匹配p1。

(5)a3没有可与之相匹配的位置，因此a3标志杆值减少一个数量级(-1)，此时角色分配示意图变为如图10所示。

(6)此时a3可与p3匹配，但p3已与a1匹配，因此a1尝试更换。a1可与p1匹配，但p1已与a2匹配，因此a2尝试更换，根据原则没有可更换的位置。此轮参与匹配的有a1，a2，a3，p1，p3，因此，a1，a2，a3标志杆分别-1，p1，p3标志杆+1。此时角色分配示意图变为如图11所示。

(7)此时a3可与p3匹配，但p3已与a1匹配，因此a1尝试更换。a1可与p1匹配，但p1已与a2匹配，因此a2尝试更换。a2可与p2匹配。因此a2改为匹配p2，a1改为匹配p1，a3与p3匹配。至此，所有球员(智能体)全部分配成功，分别为第一智能体a1匹配第一目标位置p1、第二智能体a2匹配第二目标位置p2、第三智能体a3匹配第三目标位置p3，权值和最大为-15。

本发明实施例中，通过第一智能体、第二智能体以及第三智能体分别到第一目标位置、第二目标位置以及第三目标位置的路径权值，并对各智能体、目标位置进行初始化标志杆值，以标志杆值之和与对应路径权值相匹配的目标位置，通过修改及更新相应标志杆值，确保第一智能体、第二智能体以及第三智能体分别匹配到不同的目标位置，能在最短时间完成球队阵型的收敛，时间复杂度大为降低，可明显降低计算量，节省了角色切换的时间。

实施例四

图12示出了本发明实施例四提供的一种基于多智能体的角色分配装置1200的结构，为了便于说明，仅示出了与本发明实施例相关的部分。

基于多智能体的角色分配装置1200，包括：第一确定单元1201、第二确定单元1202、第一获取单元1203、第三确定单元1204、第一计算单元1205、第二获取单元1206、第二计算单元1207以及确认单元1208。

第一确定单元1201，用于根据球场的当前情况确定阵型。

在本发明的实施例中，第一确定单元1201用于根据球场的当前情况确定阵型，与人类足球赛一样，robocup3d仿真比赛也设置相应的比赛模式来模拟真实的球场情况，如开球、球门球、角球、边线球、进攻、防守等模式。根据现实中球场比赛过程中可能出现的各种情况(如进攻、防守等)，设计各种进攻、防守、边线球等各种阵型，形成阵型库；当球场上比赛进程处于防守状态时，则阵型确认为防守模式；当比赛进程变为进攻状态时，则阵型转化为进攻模式等。

第二确定单元1202，用于根据球的当前位置及各智能体的投票情况确定最佳持球智能体。

在本发明的实施例中，第二确定单元1202用于根据球的当前位置及各智能体的投票情况确定最佳持球智能体。最佳持球智能体是指足球比赛过程中最开始带球的前锋角色；最佳持球角色位置的确定是整场比赛的关键所在，其是该传球还是自己带球前进，对整体团队而言，至关重要。根据该球员是否摔倒、球员自身朝向情况、能否看到球、球在他的前方还是后方，其距离球的距离远近等确定最佳持球智能体；即获取每个智能体所处状况及根据上述最佳智能体确定依据的投票情况，确定最佳持球角色位置获得者。。

第一获取单元1203，用于分别获取第一智能体到第一目标位置、第二目标位置的路径权值，所述路径权值基于智能体到目标位置的距离，结合智能体自身状况确定。

在本发明的实施例中，第一获取单元1203用于分别获取第一智能体到第一目标位置、第二目标位置的路径权值，所述路径权值基于智能体到目标位置的距离，结合智能体自身状况确定。第一智能体代表除了最佳持球智能体外的其他球员；第一目标位置、第二目标位置代表比赛所选阵型中的角色位置，如队伍中有n名球员，所确定的阵型中就有n个角色位置，即n个目标位置，；其中，角色位置可以是中锋、边锋、影锋、前腰、后腰、边前卫、中前卫、中后卫、边后卫等，具体由球员人数及阵型而定。

在本发明实施例中，路径权值的确定过程具体包括：根据智能体到目标位置的距离，确定基础权重；根据所述智能体的朝向与目标位置的角度，确定所述基础权重的增加值；根据所述基础权重的增加值，确定所述智能体到目标位置的最终权重，取所述最终权重的相反数，确定为路径权值。

第三确定单元1204，用于根据所述路径权值，确定第一智能体、第一目标位置、第二目标位置的初始化标志杆值。

在本发明的实施例中，第三确定单元1204用于根据所述路径权值，确定第一智能体、第一目标位置、第二目标位置的初始化标志杆值。初始化标志杆值是确定智能体匹配角色位置的关键依据，即智能体标志杆值与目标位置的标志杆值之和与相对应的路径权值想等，才能得以匹配；其可以根据上述所获取的第一智能体到第一目标位置、第二目标位置的路径权值，将路径权值最大者作为第一智能体的初始化标志杆值。每个智能体与目标位置的初始化标志杆值，根据公式获得：lx[i]＝max{e.w|e.x＝i}(即每个智能体方的点的初始标志杆为与这个智能体方的点相关联的权值最大的边的权值)，ly[j]＝0(即每个目标位置方的点的初始标志杆为0)。

第一计算单元1205，用于计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置。

在本发明的实施例中，第一计算单元1205用于计算所述第一智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第一智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置。以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第一智能体的角色位置，具体为：判断第一智能体与第一目标位置的标志杆值之和，是否与第一智能体到第一目标位置的路径权值一致，若一致，则初步确定为第一智能体匹配第一目标位置。

第二获取单元1206，用于分别获取第二智能体到第一目标位置、第二目标位置的路径权值，并确定第二智能体的初始化标志杆值。

在本发明的实施例中，第二获取单元1206用于分别获取第二智能体到第一目标位置、第二目标位置的路径权值，并确定第二智能体的初始化标志杆值。即根据第二智能体到第一目标位置、第二目标位置的路径权值，取最大路径权值作为第二智能体的初始化标志杆值；第二智能体的目标位置分配，在第一智能体的目标位置匹配完毕后启动；与第一智能体匹配方式一致。

第二计算单元1207，用于计算所述第二智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第二智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置。

在本发明的实施例中，第二计算单元1207用于计算所述第二智能体的标志杆值与所述第一目标位置的标志杆值之和，以及所述第二智能体的标志杆值与第二目标位置的标志杆值之和；以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置。以标志杆值之和与对应路径权值相匹配的目标位置，确定为所述第二智能体的角色位置，具体为：判断第二智能体与第一目标位置的标志杆值之和，是否与第二智能体到第一目标位置的路径权值一致，若一致，则初步确定为第二智能体匹配第一目标位置，若不一致，则判断第二智能体与第二目标位置的标志杆值之和，是否与第二智能体到第二目标位置的路径权值一致，若一致，则初步确定为第二智能体匹配第二目标位置。

确认单元1208，用于当第一智能体与第二智能体分别与第一目标位置、第二目标位置相匹配时，确认完成角色分配。

本发明实施例提供的基于多智能体的角色分配装置，通过第一智能体及第二智能体到第一目标位置、第二目标位置的路径权值，并对第一智能体、第二智能体、第一目标位置、第二目标位置进行初始化标志杆值，以标志杆值之和与对应路径权值相匹配的目标位置，确定第一智能体、第二智能体的角色位置；一方面，路径权值的确定考虑智能体的自身情况，使角色分配更加合理，能在最短时间完成球队阵型的收敛；另一方面，时间复杂度大为降低，可明显降低计算量，节省了角色切换的时间。

本发明实施例还提供了一种计算机设备，该计算机设备包括处理器，处理器用于执行存储器中存储的计算机程序时实现上述各个方法实施例提供的基于多智能体的角色分配方法的步骤。

本发明的实施例还提供了一种计算机可读存储介质，其上存储有计算机程序/指令，该计算机程序/指令被上述处理器执行时实现上述各个方法实施例提供的基于多智能体的角色分配方法的步骤。

示例性的，计算机程序可以被分割成一个或多个模块，一个或者多个模块被存储在存储器中，并由处理器执行，以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序在计算机设备中的执行过程。例如，所述计算机程序可以被分割成上述各个方法实施例提供的基于多智能体的角色分配方法的步骤。

本领域技术人员可以理解，上述计算机设备的描述仅仅是示例，并不构成对计算机设备的限定，可以包括比上述描述更多或更少的部件，或者组合某些部件，或者不同的部件，例如可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(centralprocessingunit，cpu)，还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现成可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述计算机设备的控制中心，利用各种接口和线路连接整个用户终端的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述计算机设备的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(smartmediacard，smc)，安全数字(securedigital，sd)卡，闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘飞;杨洪勇;赵玫;韩辅君;张淑宁;唐莉;刘慧霞;刘一凡;杨怡泽;李玉玲;刘远山
技术所有人：鲁东大学
我是此专利的发明人

上一篇：一种工业锅炉废气除尘装置的制作方法
上一篇：无机纳米材料油墨及其制备方法和应用、QLED器件与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。