交互学习式机器人和机器人群集以及机器人交互学习方法与流程

文档序号:12026307阅读:207来源:国知局
交互学习式机器人和机器人群集以及机器人交互学习方法与流程

本发明总体涉及机器人领域,尤其涉及交互学习式机器人和机器人群集以及机器人交互的方法。



背景技术:

群体性机器人可在机器人个体之间不断进行交流和沟通,以实现个体之间彼此联系、合作、竞争,从而完成加复杂的协同任务。因此,群体性机器人相比个体机器人具有更强的学习、交互能力,在智能探索、智能家居、家庭娱乐、看护陪伴等领域有着广泛的应用。

群体性机器人通常通过在初期(例如,出厂前)进行机器人训练,以使每一个机器人个体形成个体的动作模式。然而,这种训练往往使群体性机器人的个体都具有相同的动作模式。也就是说,这些机器人出厂后在彼此间的交流与协作仅基于出厂时的设置。这些机器人不具有自主的学习、交互能力,进而不具有个体认知。

因此,需要一种能够彼此学习、交互的群体性机器人。



技术实现要素:

因此,为了提供能够彼此学习、交互的群体性机器人,提供本发明。

实施例提供一种交互学习式机器人,所述交互学习式机器人包括存储装置、可见光通信收发器、编解码器和认证生成装置。其中,存储装置存储机器人的认知模型;可见光通信收发器接收经另一机器人编码和发送的可见光信号;编解码器与编解码器连接,对经解码的信号进行分类,并且根据机器人的认知模型对经分类的信号进行学习,以便形成机器人针对可见光信号的新认知结果;其中,可见光通信收发器还发送新认知结果。

在进一步的实施例中,认知生成装置包括分类器,分类器将经解码的 信号分类为感测数据和认知数据。在更进一步的实施例中,感测数据包括图片数据、声音数据、触觉数据中的一者或多者,认知数据包括个体意识数据、任务指令数据、策略数据、推理数据中的一者或多者。在更进一步的实施例中,分类器还用于将经解码的信号分类为图片数据、声音数据、触觉数据、个体意识数据、任务指令数据、策略数据或推理数据。在更进一步的实施例中,认知生成装置还包括特征提取器和学习装置,其中,特征提取器提取经分类的数据中的特征;学习装置根据认知模型对所提取的特征进行推理和判断以形成新认知结果,其中,新认知结果用于更新认知模型。在更进一步的实施例中,所提取的特征是认知模型中的概念或事件。在更进一步的实施例中,认知模型通过概念与事件之间的联系来确定机器人的新认知结果。在更进一步的实施例中,交互学习式机器人还包括控制器,所述控制器用于根据认知结果来控制机器人的动作。

在进一步的实施例中,可将光通信收发器是led可见光通信收发器、荧光可见光通信收发器中的一者或多者。在更进一步的实施例中,可见光通信收发器被安装于机器人的眼部。

在进一步的实施例中,可见光通信收发器还与云端通信,并且存储装置连接到可见光通信收发器以从云端下载认知模型和/或向云端上传经更新的认知模型。

另一实施例提供一种交互学习式机器人群集,包括至少两个如上述任一项所述的交互学习式机器人,所述至少两个机器人以可见光通信方式通信连接。

又一实施例提供一种机器人交互学习方法,所述方法包括:接收步骤:由机器人接收来自另一机器人的可见光通信信号;解码步骤:对可见光通信信号进行解码;分类步骤:对经解码的信号进行分类;学习步骤:根据机器人的认知模型来学习经分类的信号,以形成对可见光通信信号的新认知结果;更新步骤:存储新认知结果以更新机器人的认知模型;以及发送步骤:发送新认知结果。

在进一步的实施例中,分类步骤还包括:将经解码的信号分类为感测数据和认知数据。在更进一步的实施例中,分类步骤还包括:进一步将感 测数据分类为图片数据、声音数据或触觉数据;并且/或者进一步将认知数据分类为个体意识数据、任务指令数据、策略数据或推理数据。在更进一步的实施例中,学习步骤还包括:提取经分类的信号中的特征;以及根据认知模型,对所提取的特征进行推理和判断以形成新认知结果。在更进一步的实施例中,所提取的特征是认知模型中的概念或事件。在更进一步的实施例中,认知模型通过概念与事件之间的联系来确定机器人的新认知结果。

在进一步的实施例中,接收步骤还包括:从云端下载认知模型和/或向云端上传经更新的认知模型。

本公开具有以下益处:

(1)认知生成装置的使用使机器人个体具有自主的学习、推断能力,从而具有自主的认知;

(2)机器人利用快速、安全、可靠可见光通信来接收信号,提高了学习的效率和可靠性。

附图说明

在结合以下附图阅读对本公开的多个实施例的详细描述之后,能够更好地理解本公开的上述特征和优点。在附图中,以相同或类似的附图标记来指定各附图所共有的相同或类似的元件。为了便于说明,在以下描述中将“交互式学习机器人”简称为“机器人”,并将“交互式学习机器人群集”简称为“机器人群集”。

图1示出根据本公开的一些实施例的机器人100的组成模块示意图。

图2示出根据本公开的一些实施例的机器人群集200的组成模块示意图。

图3示出根据本公开的一些实施例的机器人交互学习方法300的流程图。

具体实施方式

以下结合附图和具体实施例对本公开作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本公开的保护范围 进行任何限制。

图1示出根据本公开的一些实施例的机器人100的组成模块示意图。在图1中,机器人100可包括存储装置110、收发器120、编解码器130和认知生成装置140。

存储装置110存储机器人100的认知模型111。收发器120接收经另一机器人编码和发送的信号。编解码器130与收发器120连接,并且对来自收发器120的信号进行解码。认知生成装置140与编解码器130连接,对经解码的信号进行分类,并且根据机器人100的认知模型111对经分类的信号进行学习,从而形成机器人100对收发器120接收到的信号的新认知结果。

在一些实施例中,收发器120可以是可见光通信收发器。相应地,机器人100通过可见光通信从另一机器人接收信号。

在至少一些实施例中,收发器120可以是led可见光通信收发器,机器人100接收来自经另一机器人编码的特定频率的可见光信号。在替代实施例中,收发器120可以是荧光可见光通信收发器。

在一些实施例中,收发器120可安装在机器人100的眼部。在至少一些实施例中,当需要接收信号时,机器人100与另一机器人眼部对准以实现彼此间的通信。

在一些实施例中,认知生成装置140可包括分类器141。分类器141用于对经解码的信号进行分类。

在一些实施例中,分类器141将经解码的信号分类成感测数据和认知数据。

在一些实施例中,感测数据可包括图片数据、声音数据、触觉数据中的一者或多者。

在一个实施例中,图片数据可以是静止图片的帧或反映图片的像素点的集合。在一个实施例中,声音数据可以是采用各种音频协议编码的音频数据。在一个实施例中,触觉数据可以是接触表面的压力值。

在一些实施例中,认知数据可包括个体意识数据、任务指令数据、策略数据、推理数据中的一者或多者。

在一个实施例中,个体意识可表示机器人100对环境作出的反应。例如,在一个实施例中,机器人100响应于感测到附近的热源而发出响声,从而反映机器人100对危险物的个体意识。在另一个实施例中,机器人100响应于感测到另一机器人(同伴)在附近而发出红色指示光,从而反映机器人100在有同伴陪伴时喜悦的个体意识。

在另一实施例中,任务指令数据可对应于机器人100的协同任务能力。例如,在一个实施例中,另一机器人正在执行某项任务(例如,推动物体),机器人100响应于感测到该另一机器人自身无法单独完成该任务(例如,感测到物体未移动)而接收与该另一机器人相同的任务指令(例如,推动物体),从而与该另一机器人协同执行该任务(例如,推动箱子)。凭借该协同任务能力,每一个机器人个体可在有限的通信范围内实现群集间的协作。

在又一实施例中,策略数据可反映机器人100响应于外部条件而执行的策略。例如,在一个实施例中,机器人100可响应于检测到周围的障碍物而执行避障策略。

在其他实施例中,推理数据反映机器人100对彼此间存在关联的事物作出合理推断的能力。例如,在一个实施例中,另一机器人发出“我饿了”的声音,并且拿起苹果,机器人100根据另一机器人的这两个动作,推断出该另一个机器人“想吃东西”。

认知生成装置140还可包括特征提取器142,用于对经分类的信号进行特征提取。提取特征的目的在于,使经分类的信号通过各自的特征能够被联系起来,有助于机器人100进行学习。

在一些实施例中,提取特征可包括关联从不同信号中提取的特征以形成概念集。例如,在一个实施例中,经分类的第一信号表示一张图片,该图片中有一个苹果;经分类的第二信号表示一段声音:“具有苹果”。在该实施例中,特征提取器142从第一信号中提取出表示该苹果的像素集,并且从第二信号中从提取出唯一的名词“苹果”,从而将概念“苹果”与表示苹果的像素集关联起来以获取对图形的概括能力

在另一些实施例中,提取特征可包括从经分类的信号中提取出事件以 形成事件集。例如,在一个实施例中,经分类的信号表示连续拍摄的两张图片,在拍摄这两张图片的过程中,另一机器人拿起一只苹果。在该实施例中,特征提取器142通过分析另一机器人的手部和苹果在第一图片与第二图片中的位置变化推断出事件“拿起苹果”。从该实施例中可见,特征提取器142使机器人100可建立相同的信号在不同时刻和/或空间处的联系。

认知生成装置140还可包括学习装置143,该学习装置143用于对特征提取器142提取的特征进行推理、判断,以形成机器人100的新认知结果。

在一些实施例中,学习装置143用于对特征提取器142提取的概念集合/或事件集进行推理、判断。例如,在一个实施例中,特征提取器142提取的概念集包括概念“饿”,且事件集中包括事件“拿起苹果”,则学习装置143通过概念“饿”与事件“拿起苹果”之间的联系,推断出结论“想吃东西”。当然,在其他实施例中,学习装置143还可联系更多概念和/或事件之间的来进行推理、判断。

在一些实施例中,学习装置143生成的新认知结果可存储到存储装置110中以更新机器人100的认知模型111。

上文中对分类器141、特征提取器142和学习装置143分别进行操作的实施例,以下提供多个实施例来说明这三者一起操作以实现机器人100的学习的实施例。

在一个实施例中,机器人100通过学习获取了新的个体意识。在该实施例中,机器人100从另一机器人接收到一张图片和一段声音,这张图片上显示有热源,这一段声音包括另一机器人发出的警告“前方危险”。机器人100的分类器141首先将从另一机器人接收到的信号分类为图片数据、声音数据以及另一机器人对危险作出反应的个体意识数据。随后,特征提取器142从图片数据中提取出概念特征“热源”,从声音数据中提取出概念数据“危险”,并且从个体意识数据中提取出事件“就危险发出警告”。最后,学习装置143将概念“热源”与概念“危险”联系起来,并且将概念“危险”与事件“就危险发出警告”关联起来,以此形成机器人100对外界危险作出反应的个体意识。

在另一实施例中,机器人100通过学习获取了新的任务指令。在该实施例中,机器人100从另一机器人接收到一段声音“一起跳舞”,并接收到一张反映跳舞的图片。机器人100的分类器首先将接收到的信号分类为声音数据、图片数据以及另一机器人发出跳舞指令的任务指令数据。随后,特征提取器142从声音数据中提取出概念“一起”、“跳舞”,从图片数据中提取出概念“跳舞”,并且从任务指令数据中提取出事件“发出指令”。最后,学习装置143通过概念“跳舞”将声音数据与图片数据联系起来,将概念“一起”与事件“发出指令”联系起来,使得机器人100推断出应当与另一机器人协同完成任务,而该任务如图片中的概念“跳舞”所示。作为响应,机器人100将与另一机器人一起跳舞。

在又一实施例中,机器人100通过学习获取了新的策略。在该实施例中,机器人100从另一机器人接收到一段声音“前方障碍”,并接收到该另一机器人避开障碍过程中的一系列图片数据,在这一系列图片中,该另一机器人相对于障碍物的位置发生变化,这体现了一种避障策略。对此,机器人100的分类器首先将接收到的信号分类为声音数据和图片数据。随后,特征提取器142从声音数据中提取出概念“障碍”,从图片数据中提取出事件“避障”,并且从一系列图片中提取出概念“避障策略”。最后,学习装置143将概念“障碍”与事件“避障”联系起来,将该联系再与概念“避障策略”相关联,使得机器人100获取了避开障碍的策略。

在其他实施例中,机器人100通过学习获取了新的推理能力。在该实施例中,机器人100从另一机器人接收到一段声音“我饿了”以及一系列图片,这一系列图片反映该另一机器人拿起一只苹果的过程。对此,机器人100的分类器首先将接收到的信号分类为声音数据、图片数据以及体现该另一机器人拿起苹果的动机的个体意识数据。随后,特征提取器142从声音数据中提取出概念“饿”,从一系列图片中苹果和另一机器人的手部的相对运动提取出事件“拿起苹果”,并且从个体意识数据中提取概念“想吃东西”。最后,学习装置143将概念“饿”与事件“拿起苹果”联系起来,并且将该联系与概念“想吃东西”关联起来。这样,机器人100获取了从概念“饿”与事件“拿起苹果”之间的联系推导出概念“想吃东西” 的推理能力。

以上描述了认知生成单元140的分类器141、特征提取器142和学习装置143协作以从接收到的信号中进行学习以获得机器人100的新认知结果的多个实施例。应当理解,以上实施例仅是示例性的。在其他实施例中,可任选地合并多个实施例;或者,可仅执行单个实施例的部分。

在一些实施例中,认知生成单元140可连接至存储装置110,以便将生成的新认知结果存储到存储装置110中来更新认知模型111。

机器人100还可包括控制器150。控制器150基于存储装置110中的认知模型111来控制机器人100的动作。

存储装置110用于存储机器人100的认知模型111。认知模型111反映机器人100执行各种动作的规则。

在一些实施例中,认知模型111可通过概念与事件之间的联系来确定机器人的认知结果。

在一些实施例中,还可以通过训练来使机器人100获得初始的认知模型111。在一个实施例中,训练在机器人100出厂前进行,在训练过程中,机器人100从另一机器人接收信号。与机器人100后的学习过程不同,在训练过程中,机器人100接收到的信号带有标识,该标识指示信号的类别。作为示例,这些类别可以是图片、声音、触觉、个体意识、任务指令、策略或推理中的一者或多者。

在一些实施例中,存储装置110还可连接至收发器120,以便通过收发器120从云端下载认知模型或将认知模型上传到云端。由此,可利用云端来更新机器人100的认知模型111,并且通过机器人100将认知模型111上传到云端,机器人100可潜在地影响其他机器人的认知,从而实现机器人之间的学习、交互。

图2示出根据本公开的一些实施例的机器人群集200的组成模块示意图。在一些实施例中,机器人群集200包括机器人210、220,并且机器人210、220经由链路230通信连接。应当理解,虽然在图中示出机器人群集200由两个机器人组成,但是,在其他实施例中,机器人群集200也可由三个或更多个机器人组成。

在一些实施例中机器人210、220中的任一者都可以是以上讨论的机器人100的多个实施例。

在一些实施例中,链路230可以是可见光通信链路(即,空气介质)。在这些实施例中,机器人210、220各自具有可见光通信收发器,并且经由链路230进行可见光通信。

图3示出根据本公开的一些实施例的机器人交互学习方法300的流程图。在以下描述中,为了使描述简洁,针对一个机器人从另一机器人接收信号以进行交互学习的情况来描述方法。当然,本公开的范围不限于此。例如,可由一个机器人与多个机器人通信以进行交互学习,或者可由一些机器人与另一些机器人通信以进行交互学习。

如图3中所示,方法300可包括:接收步骤301、解码步骤302、分类步骤303、学习步骤304、更新步骤305以及发送步骤306。

在接收步骤301中,由机器人接收来自另一机器人的信号。在优选实施例中,机器人通过可见光通信与另一机器人通信,相应地,此机器人接收来自另一机器人的可见光信号。在此,可见光信号可以指由另一机器人编码的特定频率的可见光信号。作为非限制性示例,此可见光信号可由led可见光通信模块或荧光可见光通信模块来发送和接收。

在解码步骤302中,对接收到的信号进行解码。

在分类步骤303中,对经解码的信号进行分类。在一个实施例中,可以将经解码的信号分类成感测数据和认知数据。在另一实施例中,可以进一步将感测数据分类为图片数据、声音数据或触觉数据。在又一实施例中,可以进一步将认知数据分类为个体意识数据、任务指令数据、策略数据或推理数据。在此所述的各种类型的数据都可以是上文中参照机器人100所述的相应的数据。

在学习步骤304中,可根据机器人的认知模型来学习经分类的信号,以形成对接收到的信号的新认知结果。在此,认知模型可以是上文中参照机器人100所述的认知模型111。在一个实施例中,认知模型可通过上文中针对机器人100所描述的训练方式来获得。在替代实施例中,也可从云端下载此认知模型。在进一步的实施例中,还可以提取经分类的信号中的特 征,并且基于认知模型来对此提取的特征进行推理和判断,从而形成机器人的新认知结果。在进一步的实施例中,所提取的特征可以是认知模型中的概念或事件。在进一步的实施例中,认知模型可通过概念与事件之间的联系来确定机器人的新认知结果。作为特定示例,此学习步骤304可以是上文中结合分类器141、特征提取器142和学习装置143进行操作而实现的机器人100的学习过程的实施例。

在更新步骤305中,存储此新认知结果以更新机器人的认知模型。换言之,机器人通过学习之后获得的新认知结果成为此机器人的认知模型的部分。

在发送步骤306中,可发送新认知结果。在一个实施例中,可将此新认知结果发送至一个或多个其他机器人,用于其他机器人进行学习。

此外,还可将经更新的认知模型上传至云端,用于由其他机器人从云端获取此经更新的认知模型。

以上描述的根据本公开的各实施例具有以下益处:

(1)认知生成装置的使用使机器人个体具有自主的学习、推断能力,从而具有自主的认知;

(2)机器人利用快速、安全、可靠可见光通信来接收信号,提高了学习的效率和可靠性。

上文中已针对根据本公开的各实施例描述了本公开的多个方面,应当理解,以上各实施例仅是示例性而非限制性的,并且可组合以上多个实施例以形成新的替代实施例,或者可仅执行一个实施例的子集来实践本公开。

本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种说明性逻辑块、模块、电路和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地说明硬件与软件的可互换性,各种说明性组件、框、模块、电路和步骤在上文中是以其功能性的形式来作出一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。本领域技术人员对于每种特定应用可以用不同的方式来实现所描述的功能性,但是此类实现决策不应被视为背离本公开的范围。

结合本文所公开的实施例描述的各种说明性逻辑模块和电路可以用通用 处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其他可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如dsp与微处理器的组合、多个微处理器、与dsp核心协作的一个或多个微处理器、或任何其他此类配置。

结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中具体化。软件模块可驻留在ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域中所知的任何其他形式的存储介质中。示例性存储介质连接到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。

在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或经由其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,此类计算机可读介质可包括ram、rom、eeprom、cd-rom或其他光盘存储、磁盘存储或其他磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其他介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(dsl)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其他远程源传送而来,则该同轴电缆、光纤电缆、双绞线、dsl、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)包括压缩碟(cd)、激光碟、光碟、数字多用碟(dvd)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再 现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。

提供对本公开的先前描述是为使得本领域任何技术人员都能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1