1.一种机械学习装置,学习通过机械手部从包含散装状态的杂乱放置的多个工件中取出所述工件的机器人的动作,
该机械学习装置的特征在于,具备:
状态量观测部,其观测包含三维测量器的输出数据的所述机器人的状态量,该三维测量器取得每个所述工件的三维图;
动作结果取得部,其取得通过所述机械手部取出所述工件的所述机器人的取出动作的结果;以及
学习部,其接受来自所述状态量观测部的输出和来自所述动作结果取得部的输出,与所述机器人的所述状态量和所述取出动作的结果相关联地学习操作量,该操作量包含向所述机器人指示所述工件的所述取出动作的指令数据。
2.根据权利要求1所述的机械学习装置,其特征在于,
所述机械学习装置还具备意图决定部,其参照所述学习部学习到的所述操作量,来决定向所述机器人指示的所述指令数据。
3.一种机械学习装置,学习通过机械手部从包含散装状态的杂乱放置的多个工件中取出所述工件的机器人的动作,
该机械学习装置的特征在于,具备:
状态量观测部,其观测包含三维测量器的输出数据的所述机器人的状态量,该三维测量器测量每个所述工件的三维图;
动作结果取得部,其取得通过所述机械手部取出所述工件的所述机器人的取出动作的结果;以及
学习部,其接受来自所述状态量观测部的输出和来自所述动作结果取得部的输出,与所述机器人的所述状态量和所述取出动作的结果相关联地学习包含所述三维测量器的测量参数的操作量。
4.根据权利要求3所述的机械学习装置,其特征在于,
所述机械学习装置还具备意图决定部,其参照所述学习部学习到的所述操作量来决定所述三维测量器的所述测量参数。
5.根据权利要求1至4中任一项所述的机械学习装置,其特征在于,
所述状态量观测部还根据所述三维测量器的输出来观测包含坐标计算部的输出数据的所述机器人的状态量,该坐标计算部用于计算每个所述工件的三维位置。
6.根据权利要求5所述的机械学习装置,其特征在于,
所述坐标计算部还计算每个所述工件的姿态,并输出计算出的每个所述工件的三维位置和姿态的数据。
7.根据权利要求1至6中任一项所述的机械学习装置,其特征在于,
所述动作结果取得部利用所述三维测量器的输出数据。
8.根据权利要求1至7中任一项所述的机械学习装置,其特征在于,
所述机械学习装置还具备预处理部,其在向所述状态量观测部输入之前,对所述三维测量器的输出数据进行处理,
所述状态量观测部接受预处理部的输出数据作为所述机器人的状态量。
9.根据权利要求8所述的机械学习装置,其特征在于,
所述预处理部使所述三维测量器的输出数据中的每个所述工件的方向和高度均为一定。
10.根据权利要求1至9中任一项所述的机械学习装置,其特征在于,
所述动作结果取得部取得所述工件的取出成功与否、所述工件的损坏状态、以及将取出的所述工件传送到后工序时的完成度中的至少一种。
11.根据权利要求1至10中任一项所述的机械学习装置,其特征在于,
所述学习部具备:
回报计算部,其根据所述动作结果取得部的输出来计算回报;以及
价值函数更新部,其具有用于确定所述工件的所述取出动作的价值的价值函数,与所述回报对应地来更新所述价值函数。
12.根据权利要求1至10中任一项所述的机械学习装置,其特征在于,
所述学习部具有学习所述工件的所述取出动作的学习模型,
所述学习部具备:
误差计算部,其根据所述动作结果取得部的输出和所述学习模型的输出来计算误差;以及
学习模型更新部,其与所述误差对应地来更新所述学习模型。
13.根据权利要求1至12中任一项所述的机械学习装置,其特征在于,
所述机械学习装置具有神经网络。
14.一种机器人系统,具备权利要求1至13中的任一项所述的机械学习装置,该机器人系统的特征在于,具备:
所述机器人;
所述三维测量器;以及
分别控制所述机器人和所述三维测量器的控制装置。
15.根据权利要求14所述的机器人系统,其特征在于,
所述机器人系统具备多个所述机器人,
分别针对每个所述机器人而设置所述机械学习装置,
针对多个所述机器人而设置的多个所述机械学习装置通过通信介质相互共享数据或交换数据。
16.根据权利要求15所述的机器人系统,其特征在于,
所述机械学习装置存在于云服务器上。
17.一种机械学习方法,学习通过机械手部从包含散装状态的杂乱放置的多个工件中取出所述工件的机器人的动作,该机械学习方法的特征在于,
观测包含三维测量器的输出数据的所述机器人的状态量,该三维测量器测量每个所述工件的三维位置;
取得通过所述机械手部取出所述工件的所述机器人的取出动作的结果;以及
接受所观测到的所述机器人的状态量和所取得的所述机器人的取出动作的结果,与所述机器人的所述状态量和所述取出动作的结果相关联地学习包含向所述机器人指示所述工件的所述取出动作的指令数据的操作量。
18.一种机械学习方法,学习通过机械手部从包含散装状态的杂乱放置的多个工件中取出所述工件的机器人的动作,该机械学习方法的特征在于,
观测包含三维测量器的输出数据的所述机器人的状态量,该三维测量器测量每个所述工件的三维图;
取得通过所述机械手部取出所述工件的所述机器人的取出动作的结果;以及
接受所观测到的所述机器人的状态量和所取得的所述机器人的取出动作的结果,与所述机器人的所述状态量和所述取出动作的结果相关联地学习包含所述三维测量器的测量参数的操作量。