对由机器人选择和抓取物体的自动化过程的优化的制作方法

文档序号:17193982发布日期:2019-03-22 23:09阅读:239来源:国知局
对由机器人选择和抓取物体的自动化过程的优化的制作方法

本发明涉及一种用于使用机器学习算法优化通过机器人选择和抓取物体的自动化过程的方法。



背景技术:

制造设施或包装设施在各种各样的工业自动化领域中经常具有传送带,物体或者产品或者产品的部件未分类地或者不规律地处于其上。例如,特别是在初次及二次包装领域中、例如在食品和零食工业中、经常能找到中央传送带,其上有待包装的产品。在此,每传送面积上的产品数量和放置方式是变化的。对于包装流程,于是经常依次地使用一个或者多个工业机器人、即所谓的三角型拾取机器人(deltapicker)或者弯臂机器人,以执行所谓的拾起和放置动作。这要理解为有目的地抓取物品并且将其放置在另一个位置上、例如包装箱中。为了测定产品在传送带上的所谓的拾取位置,使用传感器,例如摄影机系统。

基于传送带上的产品的变化的数量,经常会导致个别机器人的出现待机时间或者不生产的阶段。机器人按照先进先出原则行动,其中,只能借助在一维上检测的在传送带上的位置实现对待拾起的产品的优先级确定。即,在传送带的运转方向上关于物体在传送带上的位置对物体进行分析。产品在传送方向上在传送带上越远,优先级越高。处于机器人的工作范围内的、具有最高优先级的产品被拾起或被抓取。



技术实现要素:

在这个背景下,本发明任务是,为机器人的运行和控制提供一种方法以及一种所属的计算机程序产品和一种生产机器,用于在考虑可预设的优化标准的情况下优化通过由多个机器人构成的布置中的机器人选择和抓取物体的自动化过程的方法。

本发明涉及一种用于根据可预设的优化标准优化通过由多个机器人构成的布置中的机器人选择和抓取物体的自动化过程的方法,其中,潜在待抓取的物体关于其在空间中的位置及其到达的时间点不规律地出现,所述方法具有以下步骤:

-测定潜在待通过机器人抓取的物体;

-在考虑到优化标准的情况下借助一种机器学习算法为潜在待抓取的物体分别测定优先级标识以及与机器人中的一个的对应关系;并且

-依据对应关系和优先级标识进行选择和抓取。

机器人在本发明中要理解为一种机器,其能够受控地或者受调节地自动化地执行运动流程。可替选的概念有操纵臂或者具有多个轴的自动移动设施。

由多个机器人构成的布置要理解为一种系统,其中多个机器人相互之间处于一种特定的关系中。例如,在空间上的接近的,或者设置有在设施内对不同机器人的整体控制,或者在这些机器人之间存在通信关系,使得这些机器人相互之间能够在分散的情况下协调一致。

待抓取的物体关于其在空间中的方位或位置或布置及其的时间点不规律地出现。这意味着,不预测并且尤其是无法预测这些物体在哪个时间点出现在机器人工作范围内的哪个位置上。

对通过机器人潜在可抓取的物体的测定例如以如下方式进行,即,在确定的时间点并且尤其是重复地在确定的时间点上,测定可由该设施的多个机器人抓取的物体。在一种变体方案中,为每个机器人单独地测定潜在可抓取的物体。

借助机器学习算法为每个潜在待抓取的物体分别测定优先级标识以及与给机器人中的一个的对应关系。该机器学习算法在此如下地设计,即,其在测定优先级标识和对应关系时考虑优化标准。在此,这种布置中的不同机器人的能力也在考虑之中。优先级标识在此规定共同对应于机器人的物体的优先级。对应关系另外不是借助物体关于不同机器人的工作范围的位置单独测定的,而是机器学习算法的结果,这种机器学习算法除了物体本身的位置以外还考虑其他的物体的以及其他机器人工作范围内的其他物体的位置和其他机器人可能的抓取过程以及优化标准。只有通过机器学习算法并且通过能够为这个算法预设优化标准的可能性才创造了以下可能,即,对不同的机器人的选择和抓取相互之间优化地进行协调。

根据一种设计方案,传送带上的物体以传送带速度运动。例如,传送带在此引起了位于其上的物体的直线运动。例如,该传送带设置用于,将物体从处理站运输到包装站。在速度恒定的传送带情况中,能够以简单的方式考虑物体在时间上在传送带上的前进运动,因为尤其是物体相互之间的间距是不变的。可以考虑更复杂的传送系统的物体的运动,通过将传送系统的控制机构、例如实现对各个传送部段的独立驱控的直线电机、与机器人的控制机构进行通信连接。

根据一种设计方案,使用受监控的学习算法或者增强的学习算法、尤其是基于人工的神经元网络的学习算法、作为机器学习算法。例如,在训练阶段学习一个受监控的学习算法作为拾取和放置过程的视为最佳的输出数据。例如,基于人工的神经元网络的算法提供以下可能性,通过网络内不同节点上的权重使输出内容匹配于期望的结果。

根据一种设计方案,使用基于实例的学习算法作为机器学习算法。基于实例的学习算法也被称为基于记忆的学习算法,并且借助数据库工作,其中,将遇到的场景与数据库中的记录进行比较,并且借助同样存储在数据库中的被视为最佳的结果安排相应的对应关系和优先级标识。

根据一种设计方案,通过优化标准最小化能量消耗。在此,可以通过算法如下地选出选择和抓取,即,使得机器人或者机器人的抓取臂要移动的运动轨道尽可能地短,或者能够以尽可能慢的轨道速度驶过这些运动流程。如果例如包装过程允许包装流程取决于能量消耗优化而减速,例如当反正是要等待来自前一个制造步骤的物体时,那么就能够以有利的方式减少能量消耗进而减少成本。

根据一种设计方案,机器学习算法进行训练,使得最小化机器人的轨道速度,并且同时通过机器人抓取到最多的潜在可抓取的物体。相应地,用于选择和抓取物体的自动化过程就以如下方式进行,即,为每个机器人也仅给出正好足够的轨道速度。为此,机器人的轨道速度设计成能够进行相应地调整的。以有利的方式,电驱动件的力矩消耗及电流消耗在轨道速度下降时减少。这也保护了机械构造并且减少了因为大的逆转间隙恰如在三角型拾取机器人中很高的传送负荷需求。

优化的过程因此根据物体在传送带上的排列方式也会造成,潜在还可通过第一机器人抓取的物体没有被它拾取而是被放行,并且它们然后例如被接下来的机器人拾起,因为这样就能够降低第一机器人的轨道速度。

如果在训练阶段中产品在其从机器人的布置的工作范围中出去之前可能不被拾取,那么这种尝试就是失败的,并且这种学习算法、例如一种人工的神经元网络就必须调整,使得单个或者所有的机器人的速度在输入数据相同的情况下提升。

根据一种设计方案,通过优化标准最大化通过量。如果待优化的量是通过量、即每个时间单位施行拾取的次数,那么就可以提升拾取和放置设施的效率,至少在以下前提下,即,物体能够相应地快速进入机器人布置的工作范围内,例如通过传送带在包装设施中的前一个步骤中有更高的拾取率或者通过更高的传送带速度。

根据一种设计方案,机器学习算法进行训练,使得最小化机器人的待机时间并且同时最多地由机器人抓取潜在待抓取的物体。优化过程因此根据物体在传送带上的排列也会造成,潜在还可通过第一机器人抓取的物体没有被其拾取而是被放行,并且例如它们之后被接下来的机器人拾取,因为这样所有的机器人总体上就能够抓取更多的物体并且提升整体通行量。

例如就最大可实现的通行量而言,为给定的物体构成的输入组合对在人工的神经元网络中的权重进行调整。如果一个物体不能被机器人拾取,那么这种尝试就失败了并且必须提高单个或者全部的机器人的速度,或者降低传送带速度。

根据一种设计方案,机器学习算法进行训练,使得最大化可变化地调节的传送带速度。如果传送带的速度是可调节的,那么也就可以通过例如人工的神经元网络的输出来优化传送带的速度,从而进一步提升通行量,并且在还抓起所有的物体。

根据一种设计方案,借助传感器、尤其是借助一个或者多个摄影机完成对潜在待抓取的物体的测定。例如在可确定的触发时间点借助传感器检测传送带上的物体及其在空间上的分布。尤其地,检测是在几百毫秒的周期时间内实现的。

根据一种设计方案,在训练阶段并且借助真实的物体施行对机器学习算法的训练。例如训练人工神经元网络,其中,对错误尝试进行标记,并且通过权重来改变网络,使得防止出现错误的结果。

根据一种设计方案,在训练阶段借助对物体的模拟来训练机器学习算法。例如该算法获得作为输入的模拟的摄像图。

因此,用于例如人工神经元网络的输入是待抓起的物体具有x和y坐标的列表,例如传送带上的产品的列表。这个列表从一个真实的或者一个模拟的摄影机系统中产生。机器学习算法或者例如人工神经元网络生成优先级和物体与各个机器人的对应关系作为输出内容。各个机器人选择其工作范围内的具有与相应的机器人的对应的物体,并且抓取该物体,其中,具有最高优先级的所对应的物体作为第一个被拾取,并且以优先级逐渐下降的顺序选择其他物体。

在本发明中,最高优先级要理解为,物体应该被作为第一个抓取。如下的实现方法同样也包含在本发明的保护范围内,其中,例如当应该提前抓起物体时,优先级标识值是较低的。

本发明此外还涉及一种具有计算机程序的计算机程序产品,其具有当该计算机程序在受程序控制的装置上、尤其是在运动控制单元上运行时,用于执行上述方法的工件。

计算机程序产品,像是例如计算机程序工件、例如可以准备或提供为存储器介质,诸如存储卡、u盘、cd-rom、dvd、或者也可从网络中的服务器下载的文件的形式。这例如可以在无线的通信网络中通过传输相应的具有计算机程序产品或计算机程序工件的文件实现。尤其地,处理器或者微处理器、例如在存储器可编程的控制器上的处理器或者微处理器适用于作为受程序控制的装置。

本发明此外还涉及一种生产机器、尤其是包装机,其具有用于控制机器人运动的运动控制器,其中,该运动控制器执行上述方法。

在制造或包装设施的现有硬件中,可以通过借助机器学习算法来优化拾取策略以提升设施通行量。通过最小化在最大轨道速度下的机器人待机时间,能够使设施以最大可能的输出来运行。同时,当单个机器人的轨道速度在通行量相同的情况下被最小化时,尤其在前一个生产步骤中限制物体供应的情况下可以在进行中的运行期间节约能量。

在特定包装设施上训练或者学习的机器学习算法也可以用在其他的设施上。例如只需要进行调适或者进一步的优化,并且这已经可以使用来自特定设施上的训练阶段的结果。

附图说明

下面通过实施例借助附图更详尽地阐述本发明。图中示出:

图1是根据现有技术的在传送带上拾取和放置过程的示意图;

图2是根据本发明的第一实施例的方法的示意图;

图3是在具有根据本发明的另一实施例的传送带的包装设施中的拾取和放置过程的示意图。

具体实施方式

在附图中,只要没有另外的说明,功能相同的元件配有相同的附图标记。

在图1中示意性示出,物体101、203、202、201是如何布置在传送带c上的。例如是在包装设施中利用塑料膜包装的单个产品,准备好要将这些堆放到纸箱中。例如每六个单个产品被包装到一个纸箱中,并且因此作为产品交付。为此,物体101、203、202、201由机器人抓取臂r1、r2、r3从传送带c上拾取,并且被举到另一传送带c'上的纸箱中。为了清楚起见,仅仅示出了少数物体。

在真实的包装设施中,产品不规律地并且未经调整地出现在传送带c上。例如,它们从前一个处于该制造设施中的传送带上掉落下来。例如在处理的最后一个步骤中,将塑料膜围绕产品卷绕,并且完成的产品应该在传送带c上被包装到纸箱中。在现有技术中,只考虑通过摄影机获取的物体的x位置。x轴是通过传送带速度方向预设的轴。因此,一个物体在传送带的运转方向上越远,物体的x位置的值就越大。

每个机器人r1、r2、r3都有一个工作范围,并且从在其工作范围中的产品中按照其优先级的顺序选出物体,这些产品在考虑到轨道速度和可到达的拾取时间点的情况下由相应的机器人考虑。在此,在x方向上最远的物体具有最高优先级并且作为第一个被抓取,接下来的物体按照它们各自的优先级逐渐降低的顺序被抓起。于是,机器人的轴分别按照先进先出的原则受到驱控,按照这个原则,首先在工作区域内被发现的物体也首先被包装到纸箱中。因此,每个机器人仅仅在其工作区域内行动,并且这些机器人相互之间不进行协调。

图2可视化了机器学习算法ai的输入数据d1和输出数据d2,正如其在根据本发明的第一实施例的方法中所使用的那样。使用领域在此应该和在图1中所描述的一样,也就是将物体包装到纸箱中并且通过机器人抓取臂将物体从传送带上拾取。通常使用通用的概念人工智能(或artificialintelligence)ai,来表示利用机器学习算法工作的方法。例如,输入数据根据本发明的第一实施例通过列举所有由传感器或者摄影机检测的物体和其在空间内所属的位置构成。

例如对于传送带仅需要的是空间位置二维示图,因为所有的物体以在z方向上到各个机器人抓取臂恒定的间距位于水平平面内。例如检测x和y位置,由此理解为传送带的运转方向(x)以及与之垂直的水平方向(y)上的方向。在第一步骤s1中,从这种列表中测定,哪些物体是潜在待由机器人抓取的。在此,尤其地理解为所有的机器人抓取臂和可以由它们抓取的物体的全部。

现在,机器学习算法ai在考虑优化标准的情况下在第二步骤s2中为所有潜在待抓取的物体分别确定优先级标识以及与机器人中的一个的对应关系。作为输出d2或结果,其提供一个物体的列表,这个列表具有根据优化标准的与机器人的对应关系以及优先级。例如以基于实例的学习算法作为基础。为了使基于实例的学习算法能够实施优化标准,其能够访问数据库。该算法对借助传感器检测的关于传送带上的当前情况的信息进行分类,并且尝试找到尽可能匹配的数据库记录。在数据库中存储有物体在传送带上的场景,以及用于抓取物体的所提出的、理想情况下优化的解决方案。当前遇到的情况与已经存储在数据库中的情形越相似,就能够更好地应用所提出的解决方案,并且更好地满足优化标准。例如,算法可以在任何时候变换优化的要求,并且根据所选择的优化标准访问不同的数据库,在考虑到相应的优化标准的情况下提供解决方案。

可选地,输出数据d2包含原始数据或者输入数据d1,将它们提供给学习算法。输出数据d2实现了为不同的需要驱控的轴传输要输出给运动控制器的指令。这借助对应关系和优先级标识在第三步骤s3中通过每个机器人对各个轴的驱控实现选择和抓取。

图3示出根据本发明的方法在第二实施例中对于拾取和放置的应用,正如已经在图1和2的阐述中所描述的那样。为此,扩增了用于检测传送带(未示出)上的物体的传感器系统,从而能够检测到第二维度。在这个实施例中测定出物体的x和y位置。除了传送带c以外还布置有另一个传送带c',在该传送带上有待填充物体的纸箱。

根据借助图3所描述的实施例使用人工神经元网络作为机器学习算法,该人工神经元网络关于能量消耗方面对整个包装设施进行优化。关于该优化标准,人工神经元网络在训练阶段事先进行训练,从而在进行中的运行期间,由摄像图的包括具有x和y位置的物体的输入数据生成输出数据,这些输出数据为每个物体给出了与机器人抓取臂r1、r2、r3中的一个的对应关系以及待由所对应的机器人遵循的优先级。

例如在图3中示出了机器人抓取臂r2的工作范围2,其中有三个物体。尽管物体30x在x轴上在传送带运动方向上前进得最远,并且位于机器人抓取臂r2的工作范围内,从而抓取臂潜在地可能抓取该物体,而其被人工神经网络对应于机器人抓取臂r3。因为物体30x在y方向上离传送带c'最远,所以更加有利的是,由机器人抓取臂r3执行对物体的抓取。如果例如该机器人抓取臂r2想要包装所有三个达到工作范围2内的物体,那么该机器人抓取臂r2就必须以极高的速度抓取这三个物体201和202、30x,这带来了较高的电消耗。人工神经元网络可以在将物体与机器人对应时考虑,例如机器人r3具有足够的能力将物体30x例如作为下一个物体进行抓取。所有物体就可以如此地被包装并且同时减少了能量消耗。

借助该人工神经元网络有可能的是,从所训练的排列方式中推导预测,这些预测实现了,从多个机器人的工作范围内抓起所有的物体,并且同时能够最小化能量消耗。在当前情况下,物体30x一开始就被对应于机器人抓取臂r3,从而让机器人抓取臂r2能够较早地开始抓取物体201和物体202,进而能够设定更低的轨道速度。

有利地,以有规律的间隔进行对对应关系和优先级的调整,其中,随时间也能够得到变化的对应关系或优先级。于是,该机器学习算法就可以借助传感器有规律地考虑到物体在传送带上的当前布置和尤其是因为事故或者补充另外的物体而产生的变化。

为了简单起见,在介绍的实施例中仅仅可视化了少量的物体,并且仅仅描述了对于少量物体的优化的可能性。在此不言而喻的是,机器学习算法和特别是人工神经元网络的优点和可能性只有在存在许多物体、许多机器人抓取臂并且如有可能额外地在配合高速度的情况下体现出来。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1