一种面向动物机器人控制训练的三臂迷宫装置及训练方法

文档序号:217199阅读:197来源:国知局
一种面向动物机器人控制训练的三臂迷宫装置及训练方法
【专利摘要】本发明公开了一种面向动物机器人控制训练的三臂迷宫装置及训练方法,包括迷宫和控制主机,其中迷宫包括:中心三角形区域以及绕该中心三角形区域互为120度角分布的三条子臂通道,各子臂通道均为单向通道,且各子臂通道的尽头均设有回转区;中心三角形区域由中心底板和中心顶盖围成;每个子臂通道由子臂底板、相对分布的两块墙板以及子臂顶盖围成;每个子臂通道的内端口处和外端口处设有红外扫描装置;每个子臂通道的内端口与中心三角形区域的连接处设有指示灯和声音刺激发生器;所述红外扫描装置、指示灯和声音刺激发生器均受控于所述控制主机。本发明能够简化动物机器人的控制训练过程,省时省力。
【专利说明】一种面向动物机器人控制训练的三臂迷宫装置及训练方法
【技术领域】
[0001]本发明涉及动物训练装置以及装置的训练方法,具体涉及一种可简化动物行为模式的动物机器人训练装置,以及基于该训练装置的人工训练和自动训练方法。
【背景技术】
[0002]动物机器人是指利用动物的运动机能、动力供应体制,从动物的感受传入或神经支配入手,实现对动物的运动和某些行为的人为控制。
[0003]动物机器人在能源供给、运动灵活性、隐蔽性、机动性和适应性方面较传统机器人具有更明显的优势。已有的动物机器人包括大鼠机器人、飞蛾机器人、鲨鱼机器人、甲虫机器人、海豚机器人、鸽子机器人、蟑螂机器人、壁虎机器人,以及金鱼机器人等,其中大鼠机器人的研究相对成熟。
[0004]以大鼠机器人为例,通过在大鼠大脑的奖赏中心(如内侧前脑束MFB)植入微电极,借助大鼠所背的小型无线电子背包对大鼠脑部发出相应的微电刺激指令,可以给予大鼠奖赏刺激,使老鼠感到兴奋。而给大鼠机器人左、右刺激提示的方法主要有灯亮刺激、声音刺激、震动刺激和电刺激,其中左、右电刺激提示有表皮电刺激和脑部电刺激(在体感皮层桶状区BF植入微电极)两种方式,震动刺激方式是在大鼠的身体背部左、右各固定一个与皮肤接触的微型震动器。
[0005]要想顺利地控制动物机器人(如用于导航任务)需要事先进行行为训练,训练的目地是使动物学会按照所给的刺激指令来做出相应的行为:“向左”刺激提示,则往左行进,“向右”刺激提示,则往右行进,“向前”刺激,则往前行进。训练的原理是操作性条件反射(operant conditioning):给予动物向左(向右)刺激提示,若动物出现向左(向右)行进的行为,则给予奖赏电刺激,通过反复的训练之后,动物一旦受到左(右)刺激提示,便会相应的向左(右)行进;若只给予动物奖赏电刺激,动物会因为兴奋感向前行进,通过反复训练之后,动物在受到奖赏电刺激的时候,会朝着当前方向前进。
[0006]早在几个世纪前迷宫就被运用于实验中, Y迷宫更是被广泛应用于动物行为实验,在神经生理学、神经药理学等方面具有重要地位。用现有的训练装置进行动物控制训练,动物会出现转身、攀爬等复杂行为,不利用训练;每训练完一次都要将动物机器人重新放至起点位置,不能直接从当前位置开始训练,这大大加大了控制训练的工作量,且不适用于动物机器人的自动训练。

【发明内容】

[0007]本发明提供了一种面向动物机器人控制训练的三臂迷宫装置及训练方法,能够简化动物机器人的控制训练过程,既可以用于人工训练,也可以用于自动训练,可用于基于灯亮提示、声音提示、胡须区电刺激提示、表皮电刺激提示和震动提示的动物机器人的控制训练,省时省力。
[0008]一种面向动物机器人控制训练的三臂迷宫装置,包括迷宫和控制主机,所述的迷宫包括:
[0009]中心三角形区域以及绕该中心三角形区域互为120度角分布的三条子臂通道,各子臂通道均为单向通道,且各子臂通道的尽头均设有回转区;
[0010]中心三角形区域由中心底板和中心顶盖围成;
[0011]每个子臂通道由子臂底板、相对分布的两块墙板以及子臂顶盖围成;每个子臂通道的内端口处和外端口处设有红外扫描装置,所述内端口靠近中心三角形区域,所述外端口靠近回转区;
[0012]每个子臂通道的内端口与中心三角形区域的连接处设有指示灯和声音刺激发生器;
[0013]所述红外扫描装置、指示灯和声音刺激发生器均受控于所述控制主机。
[0014]三个子臂通道以120度角均匀分布,使动物机器人每次由子臂内端口进入中心三角形区域时,都有左、右两条目标子臂通道可以选择。
[0015]所述的子臂通道为单向通道,通过设置合适的子臂宽度并架设墙板可以避免动物转身,通过加盖顶盖可以避免动物攀爬,动物在通道无法转身和攀爬使得训练过程中的行为模式和数量大幅减少,简化了训练以及图像识别过程,提高了信息反馈的准确率。
[0016]所述的回转区是为了便于动物机器人在行进至通道尽头后转身,回转区可以适当宽于子臂通道或在动物回转区的周围不再设置所述墙板,例如用于大鼠机器人的训练时,墙板的长度比子臂底板的长度约短15cm,即在子臂通道的尽头留有15cm长度的区域作为回转区,供大鼠机器人转身。
[0017]作为优选,还设有用于承载所述迷宫且能三维移动的三臂载体,以及用于监控动物机器人在迷宫中的行为的跟踪设备,所述跟踪设备接入并受控于所述控制主机。
[0018]作为优选,所述子臂顶盖、中心顶盖、墙板、中心底板和子臂底板均为透明材料。
[0019]透明材料可以采用有机玻璃,三臂载体使迷宫在三维方向上移动,跟踪设备可以围绕迷宫所有方位进行跟踪拍摄,即从迷宫的底部、侧部以及顶部进行跟踪拍摄。
[0020]作为优选,每个子臂通道的声音刺激发生器和指示灯沿竖直方向排列安装。
[0021]作为优选,所述的声音刺激发生器为蜂鸣器。
[0022]为了让声音刺激可调,蜂鸣器的电路中设有变阻器,通过调节变阻器的阻值来改变蜂鸣器音量的大小。
[0023]作为优选,所述的指示灯为发光二极管或灯泡。发光二极管或灯泡的颜色可以依据训练任务选择设置。
[0024]作为优选,所述的红外扫描装置包括相互匹配的红外发射器和红外接收器。动物机器人经过红外扫描装置时,阻挡红外信号的接收,通过红外信号的通断判断动物机器人是否通过相应位置。
[0025]本发明面向动物机器人控制训练的三臂迷宫装置不止针对大鼠机器人的控制训练,因此迷宫的长、宽、高都根据训练的动物类型的体积而定。
[0026]本发明面向动物机器人控制训练的三臂迷宫装置是以经典Y迷宫为基础加以改进,沿用动物机器人控制训练的基本原理,即若动物表现出向目标行进的行为,则给予奖赏,反之则不给。
[0027]本发明面向动物机器人控制训练的三臂迷宫装置既可以用于人工训[0028]练,也可以用于自动训练,进行自动训练可以在光亮环境中,也可以在黑暗环境中,如光亮环境中可采用基于顶部的普通摄像头(即跟踪设备)跟踪的自动训练方法,黑暗环境中可采用基于顶部的红外热成像仪(即跟踪设备)跟踪的自动训练方法,在光亮和黑暗环境中均可以采用基于红外扫描装置的自动训练方法。
[0029]本发明提供了一种利用所述的三臂迷宫装置进行动物机器人的人工训练方法,包括如下步骤:
[0030]a)、将所述迷宫置于三臂载体上,将动物机器人放入迷宫内;
[0031]b)、在所述控制主机中设置奖赏电刺激的刺激参数,具体如下:
[0032]若训练任务为基于灯亮提示的控制训练,则开启指示灯;
[0033]若训练任务为基于声音提示的控制训练,则开启声音刺激发生器;
[0034]若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数;
[0035]若训练任务为基于震动提示的控制训练,则设置左、右震动参数;
[0036]c)、观察动物机器人在迷宫中的行为,并作如下对应的操作,直至完成训练任务:
[0037]当动物机器人的身体处在子臂通道内且头部出现在中心三角形区域时,给动物机器人以左侧或右侧的声首、灯売、电刺激或震动提不;
[0038]当动物机器人在中心三角形区域时,若表现出要进入目标子臂通道的行为,则给予奖赏电刺激;
[0039]当动物机器人进入目标子臂通道时,则给予奖赏电刺激;
[0040]当动物机器人进入非目标子臂通道时,则不给予奖赏电刺激;
[0041]当动物机器人进入回转区时,则不给予奖赏电刺激;
[0042]当动物机器人在回转区表现出要进入子臂通道的行为,则给予奖赏电刺激;
[0043]当动物机器人由子臂通道往中心三角形区域行进时,则给予奖赏电刺激;
[0044]当动物机器人在迷宫中静止不动,则给予奖赏电刺激。
[0045]本发明还提供了一种利用所述的三臂迷宫装置进行动物机器人的自动训练方法,该方法基于跟踪设备进行,在光亮环境中跟踪设备可采用普通跟踪摄像头,在黑暗环境中跟踪设备可选用红外热像成像仪等,具体包括如下步骤:
[0046]A、将所述迷宫置于三臂载体上;
[0047]B、利用跟踪设备在迷宫的正上方采集得到放入动物机器人前的迷宫俯视图作为背景环境图像,在所述背景环境图像上对迷宫的关键位置点进行标定,得到迷宫地图;
[0048]C、在所述控制主机中设置奖赏电刺激的刺激参数,具体如下:
[0049]若训练任务为基于灯亮提示的控制训练,则开启指示灯;
[0050]若训练任务为基于声音提示的控制训练,则开启声音刺激发生器;
[0051]若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数;
[0052]若训练任务为基于震动提示的控制训练,则设置左、右震动参数;
[0053]D、将动物机器人放入迷宫内,利用所述跟踪设备监控动物机器人在迷宫中的行为,通过控制主机自动作如下对应的操作,直至完成训练任务:
[0054]当动物机器人的身体处在子臂通道内且头部出现在中心三角形区域时,给动物机器人以左侧或右侧的声首、灯売、电刺激或震动提不;
[0055]当动物机器人在中心三角形区域时,若表现出要进入目标子臂通道的行为,则给予奖赏电刺激;
[0056]当动物机器人进入目标子臂通道时,则给予奖赏电刺激;
[0057]当动物机器人进入非目标子臂通道时,则不给予奖赏电刺激;
[0058]当动物机器人进入回转区时,则不给予奖赏电刺激;
[0059]当动物机器人在回转区表现出要进入子臂通道的行为,则给予奖赏电刺激;
[0060]当动物机器人由子臂通道往中心三角形区域行进时,则给予奖赏电刺激;
[0061]当动物机器人在迷宫中静止不动,则给予奖赏电刺激。
[0062]本发明还提供了一种利用所述的三臂迷宫装置进行动物机器人的基于红外扫描装置的训练方法,包括如下步骤:
[0063](a)、将所述迷宫置于三臂载体上;
[0064](b)、开启红外扫描装置;
[0065](C)、在所述控制主机中设置奖赏电刺激的刺激参数,具体如下:
[0066]若训练任务为基于灯亮提示的控制训练,则开启指示灯;
[0067]若训练任务为基于声音提示的控制训练,则开启声音刺激发生器;
[0068]若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数;
[0069]若训练任务为基于震动提示的控制训练,则设置左、右震动参数;
[0070](d)、将动物机器人放入迷宫内,利用红外扫描装置判断动物机器人在迷宫中的行为,通过控制主机自动作如下对应的操作,直至完成训练任务:
[0071]当动物机器人从子臂通道进入中心三角形区域时,给动物机器人以左侧或右侧的声音、灯亮、电刺激或震动提示;
[0072]当动物机器人从中心三角形区域进入目标子臂通道时,则给予奖赏的电刺激;
[0073]若动物机器人从中心三角形区域进入非目标子臂通道时,则不给予奖赏电刺激;
[0074]若动物机器人从子臂通道进入回转区,则不给予奖赏电刺激;
[0075]若动物机器人从回转区进入子臂通道,则给予奖赏电刺激。
[0076]本发明面向动物机器人控制训练的三臂迷宫装置及训练方法,能够简化动物机器人在三臂迷宫中的行为模式,既适用于黑暗条件下的训练,也适用于光亮条件下的训练,并且能够基于多种刺激源进行动物机器人的控制训练,应用范围广,训练效率高。
【专利附图】

【附图说明】
[0077]图1为本发明面向动物机器人控制训练的三臂迷宫装置的结构示意图;
[0078]图2为基于本发明面向动物机器人控制训练的三臂迷宫装置的自动训练系统的结构示意图,图中以大鼠机器人为例。
【具体实施方式】
[0079]下面结合附图,对本发明面向动物机器人控制训练的三臂迷宫装置及训练方法做详细描述。[0080]如图1所示,一种面向动物机器人8控制训练的三臂迷宫装置,包括迷宫和控制主机10,其中迷宫包括:
[0081]中心三角形区域以及绕该中心三角形区域互为120度角分布的三条子臂通道,各子臂通道均为单向通道,且各子臂通道的尽头均设有回转区;
[0082]中心三角形区域由中心底板2和中心顶盖5围成;
[0083]每个子臂通道由子臂底板1、相对分布的两块墙板3以及子臂顶盖4围成;
[0084]子臂底板1、墙板3和子臂顶盖4均为矩形,子臂底板I长60cm,宽15cm ;墙板3长40cm,高15cm ;子臂顶盖4长40cm,宽15cm。
[0085]每个子臂通道的内端口处和外端口处设有红外扫描装置11 (红外扫描装置11包括相互匹配的红外发射器和红外接收器),内端口靠近中心三角形区域,外端口靠近回转区;
[0086]每个子臂通道的内端口与中心三角形区域的连接处设有指示灯6和声音刺激发生器7 ;每个子臂通道的声音刺激发生器7和指示灯6沿竖直方向排列安装;
[0087]声音刺激发生器7为固定电压为24V的蜂鸣器,为了让声音刺激可调,蜂鸣器的电路中设有变阻器,通过调节变阻器的阻值来改变蜂鸣器音量的大小;指示灯6为发光二极管;
[0088]红外扫描装置11、指示灯6和声音刺激发生器7均受控于控制主机10。
[0089]子臂顶盖4、中心顶盖5、墙板3、中心底板2和子臂底板I均采用透明的有机玻璃,以便于跟踪设备9从迷宫底部、侧 部和顶部进行拍摄跟踪。
[0090]还设有用于承载迷宫且能三维移动的三臂载体,以及用于监控动物机器人8在迷宫中的行为的跟踪设备9,跟踪设备9接入并受控于控制主机10。
[0091]三臂载体用于改变迷宫的空间位置,例如训练时,将三维迷宫置于高处,可以防止动物机器人8跳出迷宫,跟踪设备9可以为普通摄像头也可以为红外线成像仪,依据迷宫所处环境为光亮或者黑暗进行选择适用。
[0092]本发明面向动物机器人8控制训练的三臂迷宫装置是以经典Y迷宫为基础加以改进,沿用动物机器人8控制训练的基本原理,即若动物根据左刺激或右刺激提示,表现出向目标行进的行为,则给予奖赏电刺激,反之则不给奖赏电刺激。
[0093]例如动物机器人8在子臂通道的内端口处受到“向左”的刺激提示,则当前的目标路径为左边子臂通道,此时若动物机器人8表现出向目标路径行进的行为就会受到奖赏电刺激,当动物机器人8进入目标子臂通道,也会受到奖赏电刺激,当动物机器人8进入到回转区,若表现出向子臂通道行进的行为就会受到奖赏电刺激,如此循环诱导动物根据左刺激、右刺激的提示进入相应的目标子臂通道,直至训练任务结束。
[0094]本发明面向动物机器人8控制训练的三臂迷宫装置既可以用于人工训练,也可以用于自动训练,进行自动训练可以在光亮环境中,也可以在黑暗环境中,如光亮环境中可采用基于顶部摄像头跟踪的自动训练方法,黑暗环境中可采用基于顶部红外热像成像仪跟踪的自动训练方法,在光亮和黑暗环境中均可以采用基于红外扫描装置11的自动训练方法。
[0095]利用所述的三臂迷宫装置进行动物机器人8的人工训练方法,包括如下步骤:
[0096]a)、将迷宫置于三臂载体上,将动物机器人8放入迷宫内;
[0097]b)、在控制主机10中设置奖赏电刺激的刺激参数,具体如下:[0098]若训练任务为基于灯亮提示的控制训练,则开启指示灯6 ;
[0099]若训练任务为基于声音提不的控制训练,则开启声音刺激发生器7 ;
[0100]若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数;
[0101]若训练任务为基于震动提示的控制训练,则设置左、右震动参数;
[0102]C)、观察动物机器人8在迷宫中的行为,并作如下对应的操作,直至完成训练任务;
[0103]当动物机器人8的身体处在子臂通道内且头部出现在中心三角形区域时,给动物机器人8以左侧或右侧的声首、灯売、电刺激或震动提不;
[0104]当动物机器人8在中心三角形区域时,若表现出要进入目标子臂通道的行为,则给予奖赏电刺激;
[0105]当动物机器人8进入目标子臂通道时,则给予奖赏电刺激;
[0106]当动物机器人8进入非目标子臂通道时,则不给予奖赏电刺激;
[0107]当动物机器人8进入回转区时,则不给予奖赏电刺激;
[0108]当动物机器人8在回转区表现出要进入子臂通道的行为,则给予奖赏电刺激;
[0109]当动物机器人8由子臂通道往中心三角形区域行进时,则给予奖赏电刺激;
[0110]当动物机器人8在迷宫中静止不动,则给予奖赏电刺激。
[0111]如图2所示,本发明面向动物机器人8控制训练的三臂迷宫装置也可用于动物机器人8的自动训练,控制主机10通过三臂迷宫正上方的跟踪设备9实时采集训练过程中环境图像,在光亮环境中,顶部跟踪设备9可为普通彩色相机,在黑暗环境中,顶部跟踪设备9可选用红外热像成像仪,接着采用计算机视觉目标跟踪的方法(如光流跟踪等)实时跟踪动物机器人8,根据训练的任务(如顺时针转一圈)和动物机器人8的状态(运动方向、位置和行为)自适应的输出左、右刺激提示和奖赏电刺激,其训练原理与人工训练相同。
[0112]基于跟踪设备9,利用所述的三臂迷宫装置进行动物机器人8的自动训练方法,包括如下步骤:
[0113]A、将迷宫置于三臂载体上;
[0114]B、利用跟踪设备在迷宫的正上方采集得到放入动物机器人8前的迷宫俯视图作为背景环境图像,在背景环境图像上对迷宫的关键位置点进行标定,得到迷宫地图;各个子臂通道为矩形,矩形的四个端点与中心三角形区域的中心点即为三臂迷宫的关键位置点;
[0115]C、在控制主机10中设置奖赏电刺激的刺激参数,具体如下:
[0116]若训练任务为基于灯亮提示的控制训练,则开启指示灯6 ;
[0117]若训练任务为基于声音提示的控制训练,则开启声音刺激发生器7 ;
[0118]若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数;
[0119]若训练任务为基于震动提示的控制训练,则设置左、右震动参数;
[0120]D、将动物机器人8放入迷宫内,利用跟踪设备9监控动物机器人8在迷宫中的行为,通过控制主机10自动作如下对应的操作,直至完成训练任务:
[0121]当动物机器人8的身体处在子臂通道内且头部出现在中心三角形区域时,给动物机器人8以左侧或右侧的声首、灯売、电刺激或震动提不;[0122]当动物机器人8在中心三角形区域时,若表现出要进入目标子臂通道的行为,则给予奖赏电刺激;
[0123]当动物机器人8进入目标子臂通道时,则给予奖赏电刺激;
[0124]当动物机器人8进入非目标子臂通道时,则不给予奖赏电刺激;
[0125]当动物机器人8进入回转区时,则不给予奖赏电刺激;
[0126]当动物机器人8在回转区表现出要进入子臂通道的行为,则给予奖赏电刺激;
[0127]当动物机器人8由子臂通道往中心三角形区域行进时,则给予奖赏电刺激;
[0128]当动物机器人8在迷宫中静止不动,则给予奖赏电刺激。
[0129]利用跟踪设备9采集到的图像对动物机器人8进行行为识别,以普通跟踪摄像头跟踪大鼠机器人为例,具体识别过程如下:
[0130]a、在本发明三臂迷宫装置中放入大鼠机器人,利用跟踪设备9实时采集三臂迷宫俯视图,得到带有大鼠机器人的实时环境图像;
[0131]对当前帧进行二值化处理得到灰度图1。;对于放入大鼠机器人前的三臂迷宫俯视图进行二值化处理得到灰度图1b ;将灰度图1。与灰度图1b做差分处理得到差分图1d ;
[0132]b、对差分图1d做腐蚀操作,并计算目标像素点个数队;
[0133]大鼠机器人体色为白色则计算白色像素点,一般要求大鼠机器人的颜色与三臂迷宫以及背景的颜色有一定色差,本发明中三臂迷宫采用透明材料,便于根据需要更换背景颜色。
[0134]C、用第一参照矩形框(80像素X80像素)由行到列均以40像素的步差搜索整个差分图1d,找出目标像素点最多的第一参照矩形框位置,计算该第一参照矩形框中目标像素点的平均位置匕作为大鼠机器人的身体质心位置,以平均位置匕为中心建立跟踪矩形框Rr;参照矩形框与踪矩形框大小相同;
[0135]d、在差分图1d中以踪矩形框Rr为感兴趣区域(region of interest,即ROI)建立新的图像Ir,采用Sh1-Tomasi特征提取方法提取得到图像Ii中的角点;
[0136]提取得到图像Ir中的角点后,去掉位于三臂迷宫边沿和跟踪矩形框艮边框位置的无效角点;
[0137]e、用第二参照矩形框(40像素X40像素)由行到列均以10像素为步差搜索跟踪矩形框I,找到角点最多的第二参照矩形框Rs,计算第二参照矩形框Rs中各角点的平均位置Ph作为大鼠机器人的头部质心位置,并根据平均位置Ph相对于平均位置匕的指向获得大鼠机器人的身体朝向θ b;
[0138]f、采用非金字塔的Lucas-Kanade稠密光流的算法计算第二参照矩形框Rs中运动跟踪点的个数Nm和平均偏转方向0h,0h做为大鼠机器人的头部偏转方向。
[0139]由平均位置已、平均位置Ph、以及大鼠机器人的身体朝向Θ b可得当前大鼠在三臂迷宫上的空间分布,例如是否处在子臂通道内、处在哪个子臂通道内等。
[0140]头部偏转方向Θ h代表大鼠机器人想要移动的方向,可知大鼠机器人当前想要移动的方向(左、右、前、后缩)。
[0141]若连续50帧步骤F)中运动跟踪点个数Nm都为0,则认为大鼠处在静止状态。
[0142]本发明还提供了一种利用所述的面向动物机器人8控制训练的三臂迷宫装置的基于红外扫描装置11的自动训练方法,这种训练方法无需顶部跟踪设备9,且在黑暗和光亮环境中均可使用,由红外扫描装置11检测动物在子臂单向通道的进出,自动输出左、右刺激提示和奖赏电刺激,其训练原理与基于顶部跟踪设备9的自动训练方法相似,具体包括如下步骤:
[0143](a)、将迷宫置于三臂载体上;
[0144](b)、开启红外扫描装置11 ;
[0145](C)、在控制主机10中设置奖赏电刺激的刺激参数,具体如下:
[0146]若训练任务为基于灯亮提示的控制训练,则开启指示灯6 ;
[0147]若训练任务为基于声音提示的控制训练,则开启声音刺激发生器7 ;
[0148]若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数;
[0149]若训练任务为基于震动提示的控制训练,则设置左、右震动参数;
[0150](d)、将动物机器人8放入迷宫内,利用红外扫描装置11判断动物机器人8在迷宫中的行为,通过控制主机10作如下对应的操作,直至完成训练任务:
[0151]当动物机器人8从子臂通道进入中心三角形区域时,给动物机器人8以左侧或右侧的声音、灯亮、电刺激或震动提示(由子臂通道进入中心三角形区域,即动物机器人8的前一位置为子臂通道内,通过子臂通道内端口的红外扫描装置时,则认为动物机器人8进入中心三角形区域);
[0152]当动物机器人8从中心三角形区域进入目标子臂通道时,则给予奖赏的电刺激;
[0153]若动物机器人8从中心三角形区域进入非目标子臂通道时,则不给予奖赏电刺激;
[0154]若动物机器人8从子臂通道进入回转区,则不给予奖赏电刺激;
[0155]若动物机器人8从回转区进入子臂通道,则给予奖赏电刺激。
[0156]动物机器人8在接受:完基于灯売提不的控制训练之后,受:到左边灯売提不,会往左边行进,受到右边灯亮提示,会往右行进,受到奖赏电刺激,会向前行进;
[0157]在接受:完基于声首提不的控制训练之后,受:到左边声首刺激提不,会往左边行进,受到右边声音刺激提示,会往右行进,受到奖赏电刺激,会向前行进;
[0158]在接受完基于左、右胡须区电刺激提示的控制训练之后,受到向左胡须区电刺激提示,会往左边行进,受到向右胡须区电刺激提示,会往右行进,受到奖赏电刺激,会向前行进;
[0159]在接受:完基于表皮电刺激提不的控制训练之后,受:到左表皮电刺激提不,会往左边行进,受到右表皮电刺激提示,会往右行进,受到奖赏电刺激,会向前行进;
[0160]在接受完基于震动提示的控制训练之后,受到左边震动刺激提示,会往左边行进,受到右边震动刺激提示,会往右行进,受到奖赏电刺激,会向前行进。
【权利要求】
1.一种面向动物机器人控制训练的三臂迷宫装置,包括迷宫和控制主机,其特征在于,所述的迷宫包括: 中心三角形区域以及绕该中心三角形区域互为120度角分布的三条子臂通道,各子臂通道均为单向通道,且各子臂通道的尽头均设有回转区; 中心三角形区域由中心底板和中心顶盖围成; 每个子臂通道由子臂底板、相对分布的两块墙板以及子臂顶盖围成; 每个子臂通道的内端口处和外端口处设有红外扫描装置,所述内端口靠近中心三角形区域,所述外端口靠近回转区; 每个子臂通道的内端口与中心三角形区域的连接处设有指示灯和声音刺激发生器; 所述红外扫描装置、指示灯和声音刺激发生器均受控于所述控制主机。
2.如权利要求1所述的面向动物机器人控制训练的三臂迷宫装置,其特征在于,还设有用于承载所述迷宫且能三维移动的三臂载体,以及用于监控动物机器人在迷宫中的行为的跟踪设备,所述跟踪设备接入并受控于所述控制主机。
3.如权利要求2所述的面向动物机器人控制训练的三臂迷宫装置,其特征在于,所述子臂顶盖、中心顶盖、墙板、中心底板和子臂底板均为透明材料。
4.如权利要求3所述的面向动物机器人控制训练的三臂迷宫装置,其特征在于,每个子臂通道的声音刺激发生器和指示灯沿竖直方向排列安装。
5.如权利要求4所述的面向动物机器人控制训练的三臂迷宫装置,其特征在于,所述的声音刺激发生器为蜂鸣器。
6.如权利要求5所述的面向动物机器人控制训练的三臂迷宫装置,其特征在于,所述的指示灯为发光二极管或灯泡。
7.如权利要求6所述的面向动物机器人控制训练的三臂迷宫装置,其特征在于,所述的红外扫描装置包括相互匹配的红外发射器和红外接收器。
8.一种利用如权利要求1~7任一所述的三臂迷宫装置进行动物机器人的人工训练方法,其特征在于,包括如下步骤: a)、将所述迷宫置于三臂载体上,将动物机器人放入迷宫内; b)、在所述控制主机中设置奖赏电刺激的刺激参数,具体如下: 若训练任务为基于灯亮提示的控制训练,则开启指示灯; 若训练任务为基于声音提不的控制训练,则开启声音刺激发生器; 若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数; 若训练任务为基于震动提示的控制训练,则设置左、右震动参数; C)、观察动物机器人在迷宫中的行为,并作如下对应的操作,直至完成训练任务:当动物机器人的身体处在子臂通道内且头部出现在中心三角形区域时,给动物机器人以左侧或右侧的声首、灯売、电刺激或震动提不; 当动物机器人在中心三角形区域时,若表现出要进入目标子臂通道的行为,则给予奖赏电刺激; 当动物机器人进入目标子臂通道时,则给予奖赏电刺激; 当动物机器人进入非目标子臂通道时,则不给予奖赏电刺激; 当动物机器人进入回转区时,则不给予奖赏电刺激;当动物机器人在回转区表现出要进入子臂通道的行为,则给予奖赏电刺激; 当动物机器人由子臂通道往中心三角形区域行进时,则给予奖赏电刺激; 当动物机器人在迷宫中静止不动,则给予奖赏电刺激。
9.一种利用如权利要求2~7任一所述的三臂迷宫装置进行动物机器人的自动训练方法,其特征在于,包括如下步骤: A、将所述迷宫置于三臂载体上; B、利用跟踪设备在迷宫的正上方采集得到放入动物机器人前的迷宫俯视图作为背景环境图像,在所述背景环境图像上对迷宫的关键位置点进行标定,得到迷宫地图; C、在所述控制主机中设置奖赏电刺激的刺激参数,具体如下: 若训练任务为基于灯亮提示的控制训练,则开启指示灯; 若训练任务为基于声音提不的控制训练,则开启声音刺激发生器; 若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数; 若训练任务为基于震动提示的控制训练,则设置左、右震动参数; D、将动物机器人放入迷宫内,利用所述跟踪设备监控动物机器人在迷宫中的行为,通过控制主机自动作如下对应的操作,直至完成训练任务: 当动物机器人的身体处在子臂通道内且头部出现在中心三角形区域时,给动物机器人以左侧或右侧的声首、灯売、电刺激或震动提不; 当动物机器人在中心三角形区域时,若表现出要进入目标子臂通道的行为,则给予奖赏电刺激; 当动物机器人进入目标子臂通道时,则给予奖赏电刺激; 当动物机器人进入非目标子臂通道时,则不给予奖赏电刺激; 当动物机器人进入回转区时,则不给予奖赏电刺激; 当动物机器人在回转区表现出要进入子臂通道的行为,则给予奖赏电刺激; 当动物机器人由子臂通道往中心三角形区域行进时,则给予奖赏电刺激; 当动物机器人在迷宫中静止不动,则给予奖赏电刺激。
10.一种利用如权利要求1~7任一所述的三臂迷宫装置进行动物机器人的基于红外扫描装置的训练方法,其特征在于,包括如下步骤: (a)、将所述迷宫置于三臂载体上; (b)、开启红外扫描装置; (C)、在所述控制主机中设置奖赏电刺激的刺激参数,具体如下: 若训练任务为基于灯亮提示的控制训练,则开启指示灯; 若训练任务为基于声音提不的控制训练,则开启声音刺激发生器; 若训练任务为基于胡须区或表皮电刺激提示的控制训练,则设置左、右电刺激参数; 若训练任务为基于震动提示的控制训练,则设置左、右震动参数; (d)、将动物机器人放入迷宫内,利用红外扫描装置判断动物机器人在迷宫中的行为,通过控制主机自动作如下对应的操作,直至完成训练任务: 当动物机器人从子臂通道进入中心三角形区域时,给动物机器人以左侧或右侧的声音、灯亮、电刺激或震动提示; 当动物机器人从中心三角形区域进入目标子臂通道时,则给予奖赏的电刺激;若动物机器人从中心三角形区域进入非目标子臂通道时,则不给予奖赏电刺激;若动物机器人从子臂通道进入回转区,则不给予奖赏电刺激;若动物机器人从回转 区进入子臂通道,则给予奖赏电刺激。
【文档编号】A01K15/02GK103461166SQ201310428285
【公开日】2013年12月25日 申请日期:2013年9月18日 优先权日:2013年9月18日
【发明者】潘纲, 俞一鹏, 吴朝晖, 郑能干, 郑筱祥 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1