一种机器人行走参数优化方法、计算机设备以及可读存储介质与流程

文档序号:16854472发布日期:2019-02-12 23:05阅读:157来源:国知局
一种机器人行走参数优化方法、计算机设备以及可读存储介质与流程

本发明涉及机器人领域,特别是涉及一种机器人行走参数优化方法、计算机设备以及可读存储介质。



背景技术:

当前,有足机器人的发展越来越迅速,相比于常规的轮式机器人,有足机器人拥有着独特的拟人化的行进结构,从而具有更高的灵活度以及更强的跨越障碍的能力,能够适用于更加广泛的领域。然而,也正是因为这种拟人化的行进结构,对行进结构上的各个“关节点”的研究也成了当前学者主要的研究方向。而如何保证机器人快速且稳定的行进,如何保证机器人在不同的行进环境下能够自适应调整,从而避免发生倾斜也成了有足机器人发展途中的拦路虎之一。

现有技术中,对有足机器人的改进主要集中在两个方向:对“腿部”行进结构的改进和对“大脑”控制系统的改进。但是当前一些对“腿部”行进结构的研究,仅仅考虑了如何让机器人能够适应各类行走环境,而没有把提升机器人的行走速度当做重点。事实上,很多特定的情况下,更需要机器人能够尽可能快的行走。而当前一些对“大脑”控制系统的研究,更多的是考虑如何控制机器人在某种环境下稳定的行进,比如有些学者采用了进化算法、策略梯度下降等学习算法实现了有足机器人的自我调整以适应不同的行走模式,此外,也有学者对上述技术做出了改进,提出了一种基于韵律模式的机器人在未知环境下行走学习信息处理方法,使得机器人脱离了对“视觉”的依赖,提高了机器人在未知环境下的自我调节能力。

然而,无论是对“腿部”行进结构的改进,还是对“大脑”控制系统的改进,这些研究往往都只涉及到有足机器人均速直行的表现,而并没有涉及到在多种行走模式下的机器人行走参数并行优化问题,比如在很多时候,我们还需要机器人在持续转弯,紧急急停的时候仍然能够保持较高的稳定性。因此,急需一种能够针对多种行走模式下并行优化的机器人行走参数优化方法。



技术实现要素:

本发明实施例提供一种机器人行走参数优化方法,旨在解决多种行走模式下的机器人行走参数优化问题。

本发明实施例提供一种机器人行走参数优化方法,所述方法包括以下步骤:

根据机器人的多个行走参数对应的数值范围生成行走参数数组集合,所述行走参数数组集合包括多个行走参数数组,所述行走参数数组包括各行走参数从所述行走参数对应的数值范围内随机确定的数值;

计算各行走参数数组在不同行走模式下的适应度以及各行走参数数组在不同行走模式下的平均适应度;

根据所述各行走参数数组在不同行走模式下的适应度,在行走参数数组集合中进行选择,并生成优选行走参数数组集合;

在所述优选行走参数数组集合中进行交叉,并生成交叉行走参数数组集合;

在所述交叉行走参数数组集合进行变异,并生成新一代行走参数数组集合;

计算新一代行走参数数组集合中各行走参数数组在不同行走模式下的适应度以及新一代行走参数数组集合中各行走参数数组在不同行走模式下的平均适应度;

当判断新一代各行走参数数组与上一代各行走参数数组在各行走模式下的平均适应度的差的平方和大于等于预设值时,则进入所述根据所述各行走参数数组在不同行走模式下的适应度,通过锦标赛选择,生成优选行走参数数组集合的步骤;

当判断新一代各行走参数数组与上一代各行走参数数组在各行走模式下的平均适应度的差的平方和小于预设值时,则根据该新一代行走参数数组集合中各行走参数数组在不同行走模式下的适应度,确定最优行走参数数组。

本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述机器人行走参数优化方法的步骤。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述机器人行走参数优化方法的步骤。

本发明实施例提供的机器人行走参数优化方法,能够根据多个行走参数对应的数值范围,生成机器人行走参数数组集合,并计算出行走参数数组集合中各行走参数数组在多种行走模式下的适应度以及平均适应度,通过在集合内进行选择,能够保留在多种行走模式下性能均表现良好的行走参数数组,并不断淘汰在某种行走模式下性能处于劣势的行走参数数组,而通过在集合内进行交叉,不断形成新的行走参数数组,可以有效地提高行走参数数组的多样性,便于获得并寻找在多种行走模式下均有优异性能的最优行走参数数组,而通过在集合内进行变异,能够有效地解决现有技术在优化过程中可能会出现“陷入局部最优”的技术问题,每当行走参数数组集合进行一次选择、交叉、变异循环得到新一代行走参数数组集合时,新一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度相较于上一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度都可以得到有效的提高,而当判断新一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度相较于上一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度没有明显改变时,说明此时行走参数数组集合已经基本优化完成,此时该新一代行走参数数组集合中在多种行走模式下适应度最优的行走参数数组即为机器人最优行走参数数组,该行走参数数组在多种行走模式下均具有优良的性能。本发明实施例提供的机器人行走参数优化方法,能够针对多种行走模式下并行优化机器人行走参数,提供一组在多种行走模式下仍能保证机器人优良性能的机器人行走参数,相比于现有技术只能够在单一行走模式下优化机器人行走参数,具有更强的实用价值。

附图说明

图1为本发明实施例提供的一种机器人行走参数优化方法的整体流程图;

图2为本发明实施例提供的一种机器人行走参数优化方法中的锦标赛选择流程图;

图3为本发明实施例提供的一种机器人行走参数优化方法中的模拟二进制交叉流程图;

图4为本发明实施例提供的一种机器人行走参数优化方法中的模拟二进制变异流程图;

图5为本发明实施例提供的一种机器人行走参数优化装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

在本发明实施例中,机器人行走参数优化方法可以应用于终端中;计算机设备,计算机设备可以是独立的物理服务器或终端,也可以是多个物理服务器构成的服务器集群,可以是提供云服务器、云数据库、云存储和cdn等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。

图1示出了本发明实施例提供的一种机器人行走参数优化方法的整体流程图,详述如下。

步骤s101,根据机器人的多个行走参数对应的数值范围生成行走参数数组集合,所述行走参数数组集合包括多个行走参数数组,所述行走参数数组包括各行走参数从所述行走参数对应的数值范围内随机确定的数值。

本发明实施例中,所述行走参数数组集合含有多个行走参数数组中,行走参数集合中含有的行走参数数组的数量n可以人为设定,优选的,设定n值在80~100。

在本发明的一个实施例中,机器人行走参数包括但不限于步频δ*、前进时最大步长maxstep*、脚离地面最大高度移动脚所花费的时间fm等.

可以理解,所述行走参数数组则是上述机器人行走参数相应的数值构成的一个数组,以步频δ*=1、前进时最大步长maxstep*=2、脚离地面最大高度移动脚所花费的时间fm=4为例,则该机器人行走参数对应的行走参数数组为(1,2,3,4),而所述行走参数数组集合为含有多个行走参数数组的集合体,例如某个行走参数数组集合为{(1,2,3,4),(4,3,2,1),(1,4,3,2)}。

步骤s102,计算各行走参数数组在不同行走模式下的适应度以及各行走参数数组在不同行走模式下的平均适应度。

在本发明实施例中,其中,所述各行走参数数组在不同行走模式下的平均适应度是由各行走参数数组在不同行走模式下的适应度求平均值得到。

在本发明实施例中,所述各行走参数数组在不同行走模式下的适应度是通过robocup仿真3d环境进行测试得到的,具体包括:

根据各行走参数数组在robocup仿真3d环境中建立机器人仿真模型;

对所述机器人仿真模型进行不同行走模式下的模拟行走测试;

根据行走测试数据,计算出所述行走参数数组在不同行走模式下的适应度。

作为本发明的一个实施例,所述行走参数数组在不同行走模式下的适应度包括但不限于各行走参数数组直线行走测试的适应度fa、各行走参数数组变换方向稳定性测试的适应度fb以及各行走参数数组行走急停测试的适应度fc。

其中,所述计算各行走参数数组直线行走测试的适应度fa的步骤具体包括:

使机器人仿真模型朝固定方向行走一定时长;

统计机器人朝目标方向移动的距离,重复多次取平均值;

统计摔倒的次数,进行惩罚,

适应度fa计算如下:

fa=100+d-tfallen

fa为直线行走的适应度,d为行走的平均距离,tfallen为摔倒的次数。

所述计算各行走参数数组变换方向稳定性测试的适应度fb的步骤具体包括:

使机器人仿真模型以一定的起点和朝向向变化的目标点移动;

每次更换新的目标点时,统计机器人距离上一目标点的距离,累加和并取相反数;

统计摔倒的次数,进行惩罚,

适应度fb计算如下:

fb=100-dtarget-5*tfallen

fb为变换方向稳定性测试的适应度,dtarget为每次变换目标点时机器人距离上一目标点的累计和,tfallen为摔倒的次数。

所述计算各行走参数数组行走急停测试的适应度fc的步骤具体包括:

使机器人仿真模型走到目标点然后停止;

计算机器人被要求停止后移动的距离,重复多次取平均值并取相反数;

统计摔倒的次数,进行惩罚,

适应度fc计算如下:

fc=100-dmoved-5*tfallen

fc为行走急停测试的适应度,dmoved为机器人被要求停止后移动的距离的平均值,tfallen为摔倒的次数。

步骤s103,根据所述各行走参数数组在不同行走模式下的适应度,在行走参数数组集合中进行选择,并生成优选行走参数数组集合。

在本发明的一个实施例中,所述在行走参数数组集合中进行选择的一种可能选择方案是在行走参数数组集合中进行锦标赛选择,其中所述锦标赛选择可以是二元锦标赛选择、也可以是任意多元锦标赛选择,其中,优选方案为二元锦标赛选择。

步骤s104,在所述优选行走参数数组集合中进行交叉,并生成交叉行走参数数组集合。

在本发明的一个实施例中,所述在所述优选行走参数数组集合中进行交叉的一种可能交叉方案是在所述优选行走参数数组集合中模拟二进制交叉。

所述模拟二进制交叉过程中需要用到模拟二进制交叉因子β,β∈(0,1),可以理解,所述交叉因子β的数值可以预先人为设定,也可以在模拟二进制交叉的过程中随机在(0,1)的范围内取值并对交叉因子β赋值。

步骤s105,在所述交叉行走参数数组集合进行变异,并生成新一代行走参数数组集合。

在本发明的一个实施例中,所述在所述交叉行走参数数组集合中进行变异的一种可能变异方案是在所述交叉行走参数数组集合中模拟二进制变异。

所述模拟二进制变异过程中需要用到变异概率μ,μ∈(0,1),一般来说,μ值为预先人为设定。

可以理解,每一代行走参数数组都需要经过选择生成优选行走参数数组,再经过交叉生成交叉行走参数数组,最后经过变异从而生成新一代行走参数数组。其中,

选择、交叉、变异均属于常规的多目标遗传算法步骤,其方案包括但不限于上述的锦标赛选择、模拟二进制交叉、模拟二进制变异,任何基于多目标遗传算法中选择、交叉、变异步骤从而具体得到的机器人行走参数优化方法,均属于本发明要求保护的范围之内,例如还可以选用随机遍历抽样选择、轮盘赌选择、实值重组交叉、实值变异等其他常见的选择、交叉、变异步骤。

步骤s106,计算新一代行走参数数组集合中各行走参数数组在不同行走模式下的适应度以及新一代行走参数数组集合中各行走参数数组在不同行走模式下的平均适应度。

其中,可以理解,所述适应度以及平均适应度的计算方法与前述步骤s102中适应度以及平均适应度的计算方法均相同。

步骤s107,判断新一代各行走参数数组与上一代各行走参数数组在各行走模式下的平均适应度的差的平方和是否大于或者等于预设数值m。

以新一代行走参数数组集合中各行走参数数组在不同行走模式下的平均适应度为以及上一代行走参数数组集合中各行走参数数组在不同行走模式下的平均适应度为为例,判断fn的数值是否大于或者等于预设数值m,其中,所述

在步骤s107中,判断新一代各行走参数数组与上一代各行走参数数组在各行走模式下的平均适应度的差的平方和是否大于或者等于预设数值m,当判断结果为是,则返回步骤s103,当判断结果为否,则进入步骤s108。

在本发明实施例中,可以理解,每执行一次步骤s103选择、步骤s104交叉、步骤s105变异都是对行走参数数组集合的优化,当判断行走参数数组集合的优化度不够时,返回步骤s103可以对行走参数数组集合继续优化。

步骤s108,根据该新一代行走参数数组集合中各行走参数数组在不同行走模式下的适应度,确定最优行走参数数组。

其中所述确定最优行走参数数组的步骤如前述步骤s103,根据所述各行走参数数组在不同行走模式下的适应度,进行一次全员锦标赛选择,即得最优行走参数数组。

本发明实施例提供的机器人行走参数优化方法,能够接收输入的多个行走参数对应的数值范围,生成机器人行走参数数组集合,并计算出行走参数数组集合中各行走参数数组在多种行走模式下的适应度以及平均适应度,通过在集合内进行选择,能够保留在多种行走模式下性能均表现良好的行走参数数组,并不断淘汰在某种行走模式下性能处于劣势的行走参数数组,而通过在集合内进行交叉,不断形成新的行走参数数组,可以有效地提高行走参数数组的多样性,便于获得并寻找在多种行走模式下均有优异性能的最优行走参数数组,而通过在集合内进行变异,能够有效地解决现有技术在优化过程中可能会出现“陷入局部最优”的技术问题,每当行走参数数组集合进行一次选择、交叉、变异循环得到新一代行走参数数组集合时,新一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度相较于上一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度都可以得到有效的提高,而当判断新一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度相较于上一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度没有明显改变时,说明此时行走参数数组集合已经基本优化完成,此时该新一代行走参数数组集合中在多种行走模式下适应度最优的行走参数数组即为机器人最优行走参数数组,该行走参数数组在多种行走模式下均具有优良的性能。本发明实施例提供的机器人行走参数优化方法,能够针对多种行走模式下并行优化机器人行走参数,提供一组在多种行走模式下仍能保证机器人优良性能的机器人行走参数,相比于现有技术只能够在单一行走模式下优化机器人行走参数,具有更强的实用价值。

图2示出了本发明实施例提供的一种机器人行走参数优化方法中的锦标赛选择流程图,详述如下。

步骤s201,根据各行走参数数组在不同行走模式下的适应度计算出各行走参数数组的非支配序nrank和拥挤度nd。

在本发明实施例中,可以理解,非支配序nrank和拥挤度nd均为多目标遗传算法里面的常用的定义。

以两个行走参数数组在不同行走模式下的适应度(fa1,fb1,fc1)以及(fa2,fb2,fc2)为例,当且仅当fa1≥fa2、fb1≥fb2、fc1≥fc2同时成立时,称(fa1,fb1,fc1)支配(fa2,fb2,fc2),或称(fa2,fb2,fc2)被(fa1,fb1,fc1)支配,即(fa1,fb1,fc1)优于(fa2,fb2,fc2)。非支配序nrank则是对各行走参数数组进行支配排序,其中,所有没有被任何其他行走参数数组所支配的行走参数数组放在第一层,其非支配序nrank=1,剩余的行走参数数组中,所有没有被任何剩余的其他行走参数数组所支配的行走参数数组放在第二层,其非支配序nrank=2,以此类推,其非支配序nrank越小,说明该行走参数数组越优。

作为本发明的一个实施例,在不同的行走模式中任选一种行走模式,针对同一非支配序nrank下的各行走参数数组在该行走模式下的适应度fa1,fa2,fa3,fa4,…的数值大小进行排序,其中数值最小的以及数值最小的其拥堵度nd为无穷,其余各行走参数数组在某个行走模式下拥挤度,则根据得到的排序结果,计算该行走参数数组后一个行走参数与前一个行走参数的数值差并除以最大值与最小值的数值差,即nd=(fnext-flast)/(fmax-fmin)。

以6个行走参数数组a,b,c,d,e,f在某一个行走模式下的适应度fa1,fa2,fa3,fa4,fa5,fa6,以及适应度的排序结果fa3<fa5<fa1<fa6<fa4<fa2为例,其中行走参数数组c在某一个行走模式下的适应度fa3数值最小,则行走参数数组c的拥挤度nd判断为无穷,而对于行走参数数组a的拥挤度,其拥挤度nd=(fa6-fa5)/(fa2-fa3)。

步骤s202,随机在行走参数数组集合中选择至少两个行走参数数组,且每次所选择的行走参数数组的数量相同。

本发明实施例中,可以理解,每次选择均在原行走参数数组集合中进行选择,即两次选择的行走参数数组可能相同。

作为本发明的一个优选方案,每次随机在行走参数数组集合中选择两个行走参数数组,即优选二元锦标赛选择。

步骤s203,根据所选择的行走参数数组的非支配序nrank和拥挤度nd,选择其中最优的行走参数数组,并将所述最优的行走参数数组计入到优选行走参数数组集合中。

作为根据所选择的各行走参数数组的非支配序nrank和拥挤度nd,选择其中最优的行走参数数组的一个具体实施例,所述步骤具体包括:

判断所选择的各行走参数数组的非支配序nrank数值的大小;

当判断出非支配序nrank数值最小的行走参数数组数量为1时,选择所述非支配序nrank数值最大的行走参数数组记为最优的行走参数数组;

当判断出非支配序nrank数值最小的行走参数数组数量不为1时,判断所述非支配序nrank数值最小的各行走参数数组的拥挤度nd的大小;

当判断所述各行走参数数组的拥挤度nd数值最大的行走参数数组数量为1时,选择所述拥挤度nd数值最大的行走参数数组记为最优的行走参数数组;

当判断所述各行走参数数组的拥挤度nd数值最大的行走参数数组数量不为1时,随机在所述拥挤度nd数值最大的行走参数数组中选择一个行走参数数组记为最优的行走参数数组。

步骤s204,判断优选行走参数数组集合中含有的行走参数数组的数量是否满足预设条件。

本发明实施例中,为控制最后生成的新一代行走参数数组集合中含有的行走参数数组数量相较于上一代没有较大区别,优选的,预设条件为:优选行走参数数组集合中含有的行走参数数组的数量不小于前述步骤s101中所述的优选行走参数数组集合中含有的行走参数数组的数量n的1/2。

在步骤s204中,判断优选行走参数数组集合中含有的行走参数数组的数量是否满足预设条件,当判断结果为否,则返回步骤s202,当判断结果为是,则进入步骤s205。

步骤s205,将当前的优选行走参数数组集合记为生成的优选行走参数数组集合。

本发明实施例提供的一种机器人行走参数优化方法中的锦标赛选择方法,相比于其他选择方法,使得在多种行走模式下适应度相对较高的行走参数数组具有更高的概率选入到优选行走参数数组集合中,有效地保留了行走参数数组集合中性能更加优异的行走参数数组。

图3示出了本发明实施例提供的一种机器人行走参数优化方法中的模拟二进制交叉流程图,详述如下。

步骤s301,随机在所述优选行走参数数组集合中选择两个行走参数数组,并随机生成模拟二进制交叉因子β,β∈(0,1);

作为本发明的另一个实施例,所述模拟二进制交叉因子β的数值还可以预先设定。

步骤s302,根据所选择的两个行走参数数组以及交叉因子β生成两个新的行走参数数组,并加入到交叉行走参数数组集合中。

在本发明实施例中,根据两个行走参数数组以及交叉因子可以唯二确定生成两个新的行走参数数组。其中,

所述两个新的行走参数数组中各行走参数的数值c1和c2与所述所选择的两个行走参数数组中相应的行走参数的数值p1和p2以及模拟二进制交叉因子β之间存在着如下确定的关系式:c1=((1+β)*p1+(1-β)*p2)/2,和c2=((1-β)*p1+(1+β)*p2)/2。

以两个行走参数数组(1,2,3,4)和(5,6,7,8)及随机生成的模拟二进制交叉因子β=0.8为例,则生成的两个行走参数数组为(1.4,2.4,3.4,4.4)和(4.6,5.6,6.6,7.6)。

可以理解,模拟二进制交叉因子β影响着生成的行走参数数组与原行走参数数组在各行走参数上的数值差异,模拟二进制交叉因子β越大,生成的行走参数数组与原行走参数数组在各行走参数上的数值差异越小,一般来说,优选β∈(0.95,0.98)

步骤s303,判断交叉行走参数数组集合中含有的行走参数数组的数量是否满足预设条件。

本发明实施例中,同样的,如前述步骤s204,为控制最后生成的新一代行走参数数组集合中含有的行走参数数组数量相较于上一代没有较大区别,优选的,预设条件为:交叉行走参数数组集合中含有的行走参数数组的数量不小于前述步骤s101中所述的优选行走参数数组集合中含有的行走参数数组的数量n。

在步骤s303中,判断交叉行走参数数组集合中含有的行走参数数组的数量是否满足预设条件,当判断结果为否,则返回步骤s301,当判断结果为是,则进入步骤s304。

步骤s304,将当前的交叉行走参数数组集合记为生成的交叉行走参数数组集合。

本发明实施例提供的一种机器人行走参数优化方法中的模拟二进制交叉方法,相比于其他交叉方法,生成的行走参数数组与原行走参数数组具有更强的相关性,能够更多的遗传并保留原行走参数数组的优良性能。

图4示出了本发明实施例提供的一种机器人行走参数优化方法中的模拟二进制变异操作流程图,详述如下。

步骤s401,随机从所述交叉行走参数数组集合中选择一个尚未进行变异判定的行走参数数组。

本发明实施例中,可以理解,所述交叉行走参数数组集合中的各行走参数数组都只进行一次变异判定。

步骤s402,以预设的变异概率μ,μ∈(0,1),对所选择的尚未进行变异判定的行走参数数组进行变异判定,判断所选择的尚未进行变异判定的行走参数数组是否会发生变异;

可以理解,变异有利于保持行走参数数组集合内个行走参数数组的多样性,但是不利于保持行走参数数组集合内个行走参数数组的优选性,一般来说,优选μ∈(0.05,0.1)。

本发明实施例中,所述变异概率μ是指行走参数数组发生改变的概率,即,所选择的尚未进行变异判定的行走参数数组有μ的概率发生改变,有(1-μ)的概率不发生改变。

在步骤s402中,对所选择的尚未进行变异判定的行走参数数组进行变异判定,若判定结果为否,则进入步骤s403,若判定结果为发生是,则进入步骤s404。

步骤s403,将该行走参数数组加入到新一代行走参数数组集合中。

步骤s404,随机改变该行走参数数组中各行走参数的数值大小,生成新的行走参数数组,并加入到新一代行走参数数组集合中。

本发明实施例中,可以理解,需要在各行走参数初始的数值范围内随机改变该行走参数数组中相应的行走参数的数值大小。

步骤s405,判断所述交叉行走参数数组集合中是否存在着尚未进行变异判定的行走参数数组。

本发明实施例中,可以理解,需要对交叉行走参数数组集合的每一个行走参数数组进行一次变异判定。

步骤s405中,判断所述交叉行走参数数组集合中是否存在着尚未进行变异判定的行走参数数组,当判断结果为是,则返回步骤s401,当判断结果为否,则进入步骤s406。

步骤s406,将当前的新一代行走参数数组集合记为生成的新一代行走参数数组集合。

本发明实施例提供的一种机器人行走参数优化方法中的模拟二进制变异方法,相较于其他变异方法,变异效果更佳彻底,更有利于解决优化过程中可能会出现“陷入局部最优”的技术问题。

图5为本发明实施例提供的一种机器人行走参数优化装置的结构示意图,为了便于说明,仅示出了于本发明实施例相关的部分。

所述机器人行走参数优化装置包括:

数据接收模块501,用于接收输入的机器人的多个行走参数对应的数值范围,并根据所述机器人的多个行走参数对应的数值范围生成行走参数数组集合。

第一适应度计算模块502,用于计算各行走参数数组在不同行走模式下的适应度以及各行走参数数组在不同行走模式下的平均适应度。

选择模块503,用于根据所述各行走参数数组在不同行走模式下的适应度,在行走参数数组集合中进行选择,并生成优选行走参数数组集合。

交叉模块504,用于在所述优选行走参数数组集合中进行交叉,并生成交叉行走参数数组集合。

变异模块505,用于在所述交叉行走参数数组集合中进行变异,并生成新一代行走参数数组集合。

第二适应度计算模块506,所述第二适应度计算模块506用于计算新一代行走参数数组集合中各行走参数数组在不同行走模式下的适应度以及新一代行走参数数组集合中各行走参数数组在不同行走模式下的平均适应度。

适应度判断模块507,用于判断新一代各行走参数数组与上一代各行走参数数组在各行走模式下的平均适应度的差的平方和是否大于或者等于预设数值m。

最优行走参数数组选择模块508,用于根据该新一代行走参数数组集合中各行走参数数组在不同行走模式下的适应度,确定最优行走参数数组。

本发明实施例提供的一种机器人行走参数优化装置,能够根据输入的多个行走参数对应的数值范围,生成机器人行走参数数组集合,并计算出行走参数数组集合中各行走参数数组在多种行走模式下的适应度以及平均适应度,通过在集合内进行选择,能够保留在多种行走模式下性能均表现良好的行走参数数组,并不断淘汰在某种行走模式下性能处于劣势的行走参数数组,而通过在集合内进行交叉,不断形成新的行走参数数组,可以有效地提高行走参数数组的多样性,便于获得并寻找在多种行走模式下均有优异性能的最优行走参数数组,而通过在集合内进行变异,能够有效地解决现有技术在优化过程中可能会出现“陷入局部最优”的技术问题,每当行走参数数组集合进行一次选择、交叉、变异循环得到新一代行走参数数组集合时,新一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度相较于上一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度都可以得到有效的提高,而当判断新一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度相较于上一代行走参数数组集合各行走参数数组在多种行走模式下的平均适应度没有明显改变时,说明此时行走参数数组集合已经基本优化完成,此时该新一代行走参数数组集合中在多种行走模式下适应度最优的行走参数数组即为机器人最优行走参数数组,该行走参数数组在多种行走模式下均具有优良的性能。本发明实施例提供的机器人行走参数优化方法,能够针对多种行走模式下并行优化机器人行走参数,提供一组在多种行走模式下仍能保证机器人优良性能的机器人行走参数,相比于现有技术只能够在单一行走模式下优化机器人行走参数,具有更强的实用价值。

本发明实施例提供一种计算机装置,该计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述图1至图4所示出的实施例所提供的机器人行走参数优化方法的步骤。

示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。例如,计算机程序可以被分割成上述各个方法实施例提供的机器人行走参数优化方法的步骤。

本领域技术人员可以理解,上述计算机装置的描述仅仅是示例,并不构成对计算机装置的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信号以及软件分发介质等。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1