机器人学习方法及相关装置与流程

文档序号:24827786发布日期:2021-04-27 16:12阅读:110来源:国知局
机器人学习方法及相关装置与流程

1.本申请涉及人工智能技术领域,具体涉及一种机器人学习方法及相关装置。


背景技术:

2.智能机器人能够理解人类的语言,用人类语言同操作者对话,在它自身的“意识”中单独形成了一种使它得以“生存”的外界环境--实际情况的详尽模式。它能分析出现的情况,能调整自己的动作以达到操作者所提出的全部要求,能拟定所希望的动作,并在信息不充分的情况下和环境迅速变化的条件下完成这些动作。目前的机器人系统中,机器人通常是采用已经训练好的系统进行运行,不能根据实际情况进行系统学习等,导致了其智能性较低。


技术实现要素:

3.本申请实施例提供一种机器人学习方法及相关装置,能够提升机器人系统的智能性。
4.本申请实施例的第一方面提供了一种机器人学习方法,应用于机器人系统,所述方法包括:
5.接收目标用户输入的学习指令;
6.根据所述学习指令,确定待学习信息;
7.根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。
8.结合第一方面,在一个可能的实现方式中,所述根据所述学习指令,确定待学习信息,包括:
9.根据所述学习指令,确定所述目标技能;
10.根据所述目标技能,确定目标学习类别;
11.根据所述目标学习类别,获取所述待学习信息。
12.结合第一方面,在一个可能的实现方式中,所述根据所述目标学习类别,获取待学习信息,包括:
13.根据所述目标学习类别,确定学习目标;
14.获取所述学习目标的动作信息;
15.根据所述动作信息,确定所述待学习信息。
16.结合第一方面,在一个可能的实现方式中,所述根据所述目标学习类别,确定学习目标,包括:
17.根据所述目标学习类别,确定n个参考学习目标;
18.获取所述n个参考学习目标中的每个参考学习目标的特征信息,以得到n个参考特征信息;
19.获取所述n个参考学习目标中的每个参考学习目标的位置信息,以得到n个参考置信息;
20.根据所述n个参考特征信息,确定第一待学习目标集合;
21.根据所述n个参考位置信息,确定第二待学习目标集合;
22.根据所述第一待学习目标集合和所述第二待学习目标集合,确定所述学习目标。
23.结合第一方面,在一个可能的实现方式中,所述方法还包括:
24.获取所述学习后的目标技能的属性信息变化量;
25.根据所述属性信息变化量,确定属性调整值;
26.根据所述属性调整值,对与所述目标技能相对应的目标属性进行调整,得到调整后的目标属性。
27.本申请实施例的第二方面提供了一种机器人的学习装置,应用于机器人系统,所述装置包括:
28.接收单元,用于接收目标用户输入的学习指令;
29.确定单元,用于根据所述学习指令,确定待学习信息;
30.学习单元,用于根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。
31.结合第二方面,在一个可能的实现方式中,所述确定单元用于:
32.根据所述学习指令,确定所述目标技能;
33.根据所述目标技能,确定目标学习类别;
34.根据所述目标学习类别,获取所述待学习信息。
35.结合第二方面,在一个可能的实现方式中,在所述根据所述目标学习类别,获取待学习信息方面,所述确定单元用于:
36.根据所述目标学习类别,确定学习目标;
37.获取所述学习目标的动作信息;
38.根据所述动作信息,确定所述待学习信息。
39.结合第二方面,在一个可能的实现方式中,在所述根据所述目标学习类别,确定学习目标方面,所述确定单元用于:
40.根据所述目标学习类别,确定n个参考学习目标;
41.获取所述n个参考学习目标中的每个参考学习目标的特征信息,以得到n个参考特征信息;
42.获取所述n个参考学习目标中的每个参考学习目标的位置信息,以得到n个参考置信息;
43.根据所述n个参考特征信息,确定第一待学习目标集合;
44.根据所述n个参考位置信息,确定第二待学习目标集合;
45.根据所述第一待学习目标集合和所述第二待学习目标集合,确定所述学习目标。
46.结合第二方面,在一个可能的实现方式中,所述装置还用于:
47.获取所述学习后的目标技能的属性信息变化量;
48.根据所述属性信息变化量,确定属性调整值;
49.根据所述属性调整值,对与所述目标技能相对应的目标属性进行调整,得到调整后的目标属性。
50.本申请实施例的第三方面提供一种终端,包括处理器、输入设备、输出设备和存储
器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本申请实施例第一方面中的步骤指令。
51.本申请实施例的第四方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
52.本申请实施例的第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
53.实施本申请实施例,至少具有如下有益效果:
54.通过接收目标用户输入的学习指令,根据所述学习指令,确定待学习信息,根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能,因此,相对于现有方案中机器人采用已经训练好的系统进行运行,能够接收目标用户输入的学习指令,根据学习指令对目标技能进行学习,得到学习后的目标技能,提升了机器人系统的智能性。
附图说明
55.为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
56.图1为本申请实施例提供了一种机器人学习方法的流程示意图;
57.图2为本申请实施例提供了另一种机器人学习方法的流程示意图;
58.图3为本申请实施例提供的一种终端的结构示意图;
59.图4为本申请实施例提供了一种机器人学习装置的结构示意图。
具体实施方式
60.下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
61.本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
62.在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地
和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
63.请参阅图1,图1为本申请实施例提供了一种机器人学习方法的流程示意图。如图1所示,该方法应用于机器人系统,该方法包括:
64.101、接收目标用户输入的学习指令。
65.机器人系统可以包括有输入设备、输出设备、执行设备等,执行设备可以理解为执行各种类别的动作的设备等。
66.接收目标用户的学习指令的方法可以是:目标用户向机器人系统发送学习指令,该指令通过无线网络向机器人系统进行发送。当然也可以是目标用户通过有线接入的方式进行指令输入。当然还可以是其他方式进行指令输入,此处不做具体限定。
67.102、根据所述学习指令,确定待学习信息。
68.可以根据学习指令确定出对应的技能,根据该技能来确定待学习信息。技能可以包括有语音交互技能、送餐技能、送水技能等。当然还可以是其他智能交互技能,例如,智能搜索、智能提醒等技能。不同的技能可以对应有至少一个学习指令,即技能可以对应有多个学习指令,也可以对应有一个学习指令。当对应有多个学习指令时,则多个学习指令可以对应有技能中的子技能,其与子技能的对应关系是一一对应的。
69.103、根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。
70.对目标技能进行学习的方法可以是,将目标技能进行升级处理,得到升级后的技能。目标技能具有多个等级,不同的待学习信息进行学习时,可以增加技能等级的熟练度,当熟练度值达到预设值后,对目标仅能进行升级处理。
71.本示例中,通过接收目标用户输入的学习指令,根据所述学习指令,确定待学习信息,根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。因此,相对于现有方案中机器人采用已经训练好的系统进行运行,能够接收目标用户输入的学习指令,根据学习指令对目标技能进行学习,得到学习后的目标技能,提升了机器人系统的智能性。
72.在一个可能的实现方式中,一种可能的根据所述学习指令,确定待学习信息,包括:
73.a1、根据所述学习指令,确定所述目标技能;
74.a2、根据所述目标技能,确定目标学习类别;
75.a3、根据所述目标学习类别,获取所述待学习信息。
76.不同的技能可以对应有至少一个学习指令,即技能可以对应有多个学习指令,也可以对应有一个学习指令,当对应有多个学习指令时,则多个学习指令可以对应有技能中的子技能,其与子技能的对应关系是一一对应的。则可以根据具体的学习指令和目标技能之间的对应关系,确定出与该学习指令对应的目标技能。
77.不同的目标技能,具有不同的学习类别,例如,目标技能是语音交互技能,则学习类别可以是学习交互类别等。
78.可以根据目标学习类别对应的学习目标,来确定待学习信息。学习目标例如可以是用户、其它机器人系统、应用程序等。
79.本示例中,根据目标技能确定出目标学习类别,根据学习类别确定出待学习信息,则可以提升待学习信息确定时的准确性。
80.在一个可能的实现方式中,一种可能的所述根据所述目标学习类别,获取待学习
信息的方法包括:
81.b1、根据所述目标学习类别,确定学习目标;
82.b2、获取所述学习目标的动作信息;
83.b3、根据所述动作信息,确定所述待学习信息。
84.学习类别可以对应有多个学习目标,并从多个学习目标中确定出该机器人系统对应的学习目标。例如,学习类别为学习交互类别,则学习目标可以是用户,也可以是其他具有交互功能的机器人系统。
85.学习目标的动作信息获取时,可以是通过摄像头获取,具体可以是,通过摄像头获取学习目标的第一图像,对第一图像进行动作提取,得到动作信息。若学习目标是用户,则动作信息可以是用户的动作信息,若学习目标是其他具有交互功能的机器人系统,则动作信息可以是该机器人交互系统进行交互时的动作,具体可以是肢体交互动作,肢体交互动作可以是机器人系统的壳体等的交互动作。
86.根据动作信息,确定待学习信息的方法可以是:将动作信息确定为待学习信息;也可以是对动作信息进行关键动作提取,将关键动作的动作信息确定为待学习信息。
87.进行关键动作提取的方法可以是,获取动作的动作等级,将动作等级高于预设等级的动作确定为关键动作,将关键动作的动作信息确定为待学习信息。预设等级通过经验值或历史数据设定。其中不同的动作对应有不同的动作等级,动作等级例如可以划分为n个动作等级,n为正整数。预设等级例如可以是n个动作等级中的第k个动作等级,k为小于n的正整数。
88.当然还可以根据学习目标的语音信息,来确定出待学习信息。语音信息可以是学习目标进行语音交互时的语音等。可以根据对语音信息进行语音识别,得到对应的文本信息,将该文本信息,确定为待学习信息。
89.本示例中,根据动作信息确定待学习信息,则可以充分的体现出动作信息与学习信息之间的关联性,提升了待学习信息确定时的准确性。
90.在一个可能的实现方式中,一种可能的根据所述目标学习类别,确定学习目标的方法包括:
91.c1、根据所述目标学习类别,确定n个参考学习目标;
92.c2、获取所述n个参考学习目标中的每个参考学习目标的特征信息,以得到n个参考特征信息;
93.c3、获取所述n个参考学习目标中的每个参考学习目标的位置信息,以得到n个参考置信息;
94.c4、根据所述n个参考特征信息,确定第一待学习目标集合;
95.c5、根据所述n个参考位置信息,确定第二待学习目标集合;
96.c6、根据所述第一待学习目标集合和所述第二待学习目标集合,确定所述学习目标。
97.可以从数据库中进行检索,从而提取到与目标学习类别对应的参考学习目标。可以从数据库中获取到每个参考学习目标的特征信息,以得到参考特征信息。
98.可以通过定位装置,确定出每个参考学习目标的位置信息,也可以是通过测距装置,确定出参考位置信息。当然还可以是通过其它方法确定参考位置信息。参考学习目标的
特征信息可以理解为,参考学习目标的属性信息,例如,参考学习目标为用户,则特征信息可以是目标用户的兴趣信息、用户画像等。
99.根据n参考特征信息进行特征合并处理,得到合并处理后的参考特征信息。对n个参考特征信息进行合并处理的方法可以是:获取n个参考特征信息的交集,将该交集确定为合并处理后的参考特征信息。然后根据合并处理后的参考特征信息,确定第一待学习目标集合。不同的合并后的参考特征信息对应有不同的待学习目标集合。第一待学习目标集合中包括有至少一个待学习目标,待学习目标可以理解为可能成为学习目标的候选目标。
100.根据参考位置信息可以确定出与该目标机器人系统处于预设距离范围内的待学习目标,预设距离范围通过经验值或历史数据设定。参考学习目标的位置信息可以理解为参考学习目标与目标机器人系统的相对位置信息,当然也可以是其他的位置信息,例如,在预先建立的坐标系中的位置信息等,该预先建立的坐标系的原点可以是该目标机器人所在的位置。如此,则可以将距离目标机器人系统预设范围内的目标,确定为待学习目标,则可以相对于确定较远距离的目标为待学习目标,可以准确的获取到待学习目标的动作信息等,提升学习的准确性。
101.可以将第一待学习目标集合和第二待学习目标集合的交集,确定为学习目标。此处第一待学习目标集合与第二待学习目标集合的交集可以理解为,第一待学习目标集合与第二待学习目标集合中均存在的待学习目标所构成的集合。
102.本示例中,通过从多个参考待学习目标中确定出学习目标,可以提升学习目标确定时的准确性。
103.在一个可能的实现方式中,本申请实施例还提供一种属性调整方法,所述方法包括:
104.d1、获取所述学习后的目标技能的属性信息变化量;
105.d2、根据所述属性信息变化量,确定属性调整值;
106.d3、根据所述属性调整值,对与所述目标技能相对应的目标属性进行调整,得到调整后的目标属性。
107.可以根据对目标技能进行学习时的类别和学习量确定变化量,学习类别越多,则变化量越高,学习类别越少,变化量越小;学习量越大,则变化量越高,学习量越小,则变化量越小。
108.本示例中,根据属性信息的变化量,对目标属性进行调整,得到调整后的目标属性,则在机器人系统进行技能学习后,对技能属性进行调整,使得机器人系统更加智能程度。
109.在一个可能的实现方式中,机器人系统还可以包括有投影装置,通过投影装置可以进行投影,以展示机器人可以完成的工作等。投影装置可以是投影仪等,投影仪中包括有旋转装置,通过控制旋转装置可以对投影仪进行对焦操作,从而调整投影的清晰度。一种可能的投影方式可以是:
110.e1、获取旋转装置从所述初始位置调整至第一位置时的第一投影清晰度,以及获取所述旋转装置从所述初始位置调整至第二位置时的第二投影清晰度,从所述初始位置旋转至所述第二位置的第二旋转步长大于从所述初始位置旋转至所述第一位置的第一旋转步长;
111.e2、获取所述第一投影清晰度与所述第二投影清晰度之间的清晰度偏离值;
112.e3、根据所述清晰度偏离值和所述初始位置,确定所述第一目标位置;
113.e4、将所述旋转装置调整至所述第一目标位置;
114.e5、获取所述第一目标位置的第三投影清晰度;
115.e6、若所述第三投影清晰度低于预设清晰度阈值,则获取所述旋转装置从所述初始位置调整至第一位置时所述投影装置与投影幕布之间的第一距离值和第一角度值,以及获取所述旋转装置从所述初始位置调整至第二位置时所述投影装置与投影幕布之间的第二距离值和第二角度值;
116.e7、根据所述第一距离值和所述第二距离值确定第一距离偏离值,以及根据所述第一角度值和所述第二角度值确定第一角度偏离值;
117.e8、根据所述第一距离偏离值确定第一参考修正参数,以及根据所述第一角度偏离值确定第二参考修正参数;
118.e9、根据所述第一参考修正参数和所述第二参考修正参数,确定第一位置偏移量;
119.e10、获取目标用户的表情信息;
120.e11、根据所述表情信息,确定位置满意度;
121.e12、根据所述位置满意度和所述第一位置偏移量,确定第二位置偏移量;
122.e13、根据所述第二位置偏移量和所述第一目标位置,确定第二目标位置;
123.e14、将所述旋转装置调整至所述第二目标位置。
124.获取旋转装置调整至第一位置时的第一投影清晰度的方法可以是,从服务器获取到或者从用户输入的指令中获取到第一投影清晰度等,获取第二投影清晰度的方法与获取第一投影清晰度的方法相同。
125.第一旋转步长小于第二旋转步长,第二旋转步长与第一旋转步长之间的差值小于预设阈值,例如第二旋转步长与第一旋转步长之间的差值小于10步长等。由于第二旋转步长与第一旋转步长之间的差值小于预设阈值,则可以更为准确的对第一目标位置进行确定,提升第一目标位置的准确性。
126.从服务器获取第一投影清晰度的方法可以是:用户用过手机等具有摄像头的电子设备拍摄旋转装置旋转至第一位置时的投影图像;电子设备将该投影图像上传至服务器,服务器对该投影图像进行处理,得到第一投影清晰度。当然服务器还可以是通过其它途径获取到投影图像,比如,通过投影设备预设范围内的监控摄像头等获取的投影图像,此处不作具体限定。,预设范围通过经验值或历史数据设定。
127.可以根据第一投影清晰度、第二投影清晰度之间的偏离值和初始位置来确定第一目标位置。
128.可以将旋转装置从初始位置调整至第一目标位置,也可以是从第二位置调整至第一目标位置,当然还可以是从第一位置调整至第一目标位置,还可以是通过其它的位置调整至第一目标位置,此处不作具体限定。
129.第一目标位置可以是投影装置进行自动对焦后进行投影时旋转装置的位置。投影装置中包括有旋转装置。
130.获取第一目标位置的第三投影清晰度的方法可以参照前述实施例中获取第一投影清晰度的方法,此处不再赘述。预设清晰度阈值可以通过经验值或历史数据设定。
131.第一距离值可以是投影装置的投影镜头的中心与投影幕布所在平面的距离,第一角度可以是投影镜头的镜面所在平面与投影幕布所在平面之间的夹角。
132.第一距离值可以通过测距装置获取得到,第一夹角可以对平面进行延伸处理,从而获取到第一角度。
133.第一距离偏离值可以理解为第二距离值相对于第一距离值之间的波动值,该偏离值可以是正值也可以是负值。
134.根据第一距离偏离值确定第一参考修正参数的方法可以为:不同的距离偏离值对应不同的参考修参数,则可以根据第一距离偏离值确定出第一参考修正参数。不同的角度偏离值对应有不同的参考修正参数,则可以根据第一角度偏离值确定出的第二考修正参数。参考修正参数可以用于确定位置偏移量。
135.可以获取第一修参考正参数和第二参考修正参数的均值,根据该均值确定第一位置偏移量。不同的参考修正值对应有不同的位置偏移量,参考修正值越大,第一位置偏移量越大,参考修正值越小,第一位置偏移量越小。通过第一参考第一修参考正参数和第二参考修正参数的均值确定第一位置偏移量,可以提升第一位置偏移量的准确性。
136.获取目标用户的表情信息的方法可以是,通过用户的电子设备获取目标用户的人脸图像,根据人脸图像确定出用户的表情信息。目标用户可以是对投影装置进行调试的用户,也可以是使用投影装置观看投影画面的用户,当然还可以是其它相关的用户,此处仅为举例说明。
137.不同的表情信息具有不同的满意度,表情信息指示的表情可以是笑脸、哭脸、正常表情的脸型等,正常表情的脸型可以理解为没有表情波动的脸型。笑脸的满意度高于正常表情的脸型的满意度,正常表情的脸型的满意度高于哭脸对应的满意度。
138.可以根据满意度确定第一位置偏移量的修正值,满意度越高,修正值越小,满意度越低,则修正值越大。第一位置偏移量与修正值的乘积,确定为第二位置偏移量,当然还可以是通过其它的方式采用修正值对第一位置偏移量进行修正,得到第二位置偏移量,例如,第一位置偏移量与修正值之和等。
139.可以将第一目标位置按照第二位置偏移量进行偏移后,得到第二目标位置,进行偏移的方法可以是,若第二位置偏移量为正,则可以在第一目标位置加上该偏移量,得到第二目标位置,若第二位置偏移量为负,则可以在第一目标位置上减去该偏移量,得到第二目标位置。第一目标位置加减偏移量可以理解为可以在第一目标位置与初始位置之间的位置偏移量上进行加减该第二位置偏移量。
140.本示例中,在第一目标位置处的投影清晰度为达到预设标准时,则对投影装置再次进行调整,从而可以提升对投影装置进行调整时的准确性。
141.在一个可能的实现方式中,一种可能的根据所述n个参考特征信息,确定第一待学习目标集合的方法可以为:
142.f1、确定n个参考特征信息的中的每个参考特征信息对应的关键词,得到n个关键字;
143.f2、确定所述多个关键字中的每一关键字的关键度,得到多个关键度;
144.f3、根据多个关键度确定第一待学习目标集合。
145.可以对参考特征信息进行关键字提取,得到多个关键字。
146.可以根据多个关键度的均值,来确定第一待学习目标集合,关键度的均值与待学习集合具有对应关系,该对应关系通过经验值设定。
147.一种可能的确定所述多个关键字中的每一关键字的关键度,得到多个关键度,可以包括如下步骤:
148.g1、确定关键字a在所述文本信息中的目标位置以及所述关键字a的参考关键等级,所述关键字a为所述多个关键字中的任一关键字;
149.g2、按照预设的关键等级与关键度之间的映射关系,确定所述参考关键等级对应的参考关键度;
150.g3、按照预设的位置与第一优化因子之间的映射关系,确定所述目标位置对应的目标第一优化因子;
151.g4、获取所述关键字a的音量参数;
152.g5、按照预设的音量参数与第二优化因子之间的映射关系,确定所述关键字a的音量参数对应的目标第二优化因子;
153.g6、依据所述目标第一优化因子、所述目标第二优化因子对所述参考关键度进行优化处理,得到所述关键字a的关键度。
154.其中,预设阈值可以由用户自行设置或者系统默认,预设阈值可以为经验值。智能机器人中可以预先存储预设的关键等级与关键度之间的映射关系、预设的位置与第一优化因子之间的映射关系以及预设的音量参数与第二优化因子之间的映射关系。
155.具体实现中,以关键字a为例,关键字a为多个关键字中的任一关键字,智能机器人可以确定关键字a在文本信息中的目标位置以及关键字a的参考关键等级,按照预设的关键等级与关键度之间的映射关系,确定参考关键等级对应的参考关键度,按照预设的位置与第一优化因子之间的映射关系,确定目标位置对应的目标第一优化因子,第一优化因子的取值范围可以为-1~1,例如,第一优化因子可以为-0.08~0.08。
156.进一步地,由于关键字的音量参数不一样,则说明用户重视程度不一样,音量参数可以为音量或者音调,按照预设的音量参数与第二优化因子之间的映射关系,确定关键字a的音量参数对应的目标第二优化因子,第二优化因子的取值范围可以为-1~1,例如,第二优化因子可以为-0.032~0.032,并且依据目标第一优化因子、目标第二优化因子对参考关键度进行调节,得到关键字a的关键度,具体计算公式如下:
157.关键字a的关键度=关键字a的参考关键度*(1+目标第一优化因子)*(1+目标第二优化因子)
158.进而,可以依据关键字的位置以及音量参数精准确定关键字的关键程度,有助于提升命令识别精度。
159.请参阅图2,图2为本申请实施例提供了另一种机器人学习方法的流程示意图。如图2所示,该方法应用于机器人系统,所述方法包括:
160.201、接收目标用户输入的学习指令;
161.202、根据所述学习指令,确定所述目标技能;
162.203、根据所述目标技能,确定目标学习类别;
163.204、根据所述目标学习类别,确定学习目标;
164.205、获取所述学习目标的动作信息;
165.206、根据所述动作信息,确定所述待学习信息;
166.207、根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。
167.本示例中,根据动作信息确定待学习信息,则可以充分的体现出动作信息与学习信息之间的关联性,提升了待学习信息确定时的准确性。
168.与上述实施例一致的,请参阅图3,图3为本申请实施例提供的一种终端的结构示意图,如图所示,包括处理器、输入设备、输出设备和存储器,处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,上述程序包括用于执行以下步骤的指令;
169.接收目标用户输入的学习指令;
170.根据所述学习指令,确定待学习信息;
171.根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。
172.上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,终端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
173.本申请实施例可以根据上述方法示例对终端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
174.与上述一致的,请参阅图4,图4为本申请实施例提供了一种机器人的学习装置的结构示意图。如图4所示,该装置应用于机器人系统,所述装置包括:
175.接收单元401,用于接收目标用户输入的学习指令;
176.确定单元402,用于根据所述学习指令,确定待学习信息;
177.学习单元403,用于根据所述待学习信息,对目标技能进行学习,得到学习后的目标技能。
178.在一个可能的实现方式中,所述确定单元402用于:
179.根据所述学习指令,确定所述目标技能;
180.根据所述目标技能,确定目标学习类别;
181.根据所述目标学习类别,获取所述待学习信息。
182.在一个可能的实现方式中,在所述根据所述目标学习类别,获取待学习信息方面,所述确定单元402用于:
183.根据所述目标学习类别,确定学习目标;
184.获取所述学习目标的动作信息;
185.根据所述动作信息,确定所述待学习信息。
186.在一个可能的实现方式中,在所述根据所述目标学习类别,确定学习目标方面,所
述确定单元402用于:
187.根据所述目标学习类别,确定n个参考学习目标;
188.获取所述n个参考学习目标中的每个参考学习目标的特征信息,以得到n个参考特征信息;
189.获取所述n个参考学习目标中的每个参考学习目标的位置信息,以得到n个参考置信息;
190.根据所述n个参考特征信息,确定第一待学习目标集合;
191.根据所述n个参考位置信息,确定第二待学习目标集合;
192.根据所述第一待学习目标集合和所述第二待学习目标集合,确定所述学习目标。
193.在一个可能的实现方式中,所述装置还用于:
194.获取所述学习后的目标技能的属性信息变化量;
195.根据所述属性信息变化量,确定属性调整值;
196.根据所述属性调整值,对与所述目标技能相对应的目标属性进行调整,得到调整后的目标属性。
197.本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种机器人学习方法的部分或全部步骤。
198.本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种机器人学习方法的部分或全部步骤。
199.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
200.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
201.在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
202.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
203.另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
204.所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-only memory,rom)、随机存取存储器(random accessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
205.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。
206.以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1