用于行为监测及校正的系统和方法

文档序号:6593162阅读:1197来源:国知局
专利名称:用于行为监测及校正的系统和方法
用于行为监测及校正的系统和方法相关申请的交叉应用本申请主张2008年1月23日申请的USSN 61/062,173的权益及优先权,其通过 引用的方式被整体并入此处用于所有的目的。
背景技术
为了生存及繁殖,活动在它们的自然环境内的动物必须从事各种行为诸如获取 食物、逃避捕食者、及寻找栖身之处或者性伙伴。因为环境的限制决定进行特定行为的 最适当的时间和地点并且因为许多行为不能被同时进行,故对动物而言,适当地按优先 顺位排列并组织何时及何处从事特殊的行为是必需的。因此,自由活动的动物的行为 的组织代表了对环境的适应。该组织取决于中枢神经系统的综合活动并且反映生理和 行为系统(诸如那些调节能量平衡、热状态、渗透/容量状态、睡眠、繁殖、防御、及 环境卷吸(environmental entrainment))的各种不同阵列的功能和交互。因此监测并鉴别 (characterize)自由活动的动物中的行为的组织的能力具有为检查许多生理和行为系统的 功能及交互提供敏感分析(sensitive assay)的潜能。当前,实质的限制在于我们将最近的生物技术进步应用到分析复杂哺乳动物行 为的神经基质(neural substrate)的能力。与在哺乳动物基因组学的领域内可见的快速的 创新步伐相比,在医药化学及信息技术领域,就小鼠或其它哺乳动物而言,在行为评估 技术的发展方面做出了比较小的进步。这样的过程对探索基因、药物及环境对与诸如精 神分裂、抑郁、及焦虑等常见的神经精神状况相关的脑功能的影响至关重要。例如涉及 为了一组行为测试将小鼠从它们的家笼反复的移动(removal)的标准方案是有问题的,因 为1)它们费时且劳动密集,2)测试管理的顺序可能扭曲结果数据,3)小鼠从家笼的移 动产生了混淆行为数据的解释的压力,及4)由于没考虑到并非研究的主要焦点的行为范 围而引起的频繁地错误解释数据(例如焦虑对学习的测试的影响)。

发明内容
提供了用于持续地监测在定义的区域内的动物对象的各种行为的系统和方法, 包括用于对高分辨率行为数据的分析及过滤的工具。这些系统和方法提供了以先前未能 实现的量化及精度水平来检查行为模式的机会。提供了用于管理和分析由行为监测系统 所产生的非常大并且唯一的数据集的方法和系统,包括质量评估和控制、存档、数据查 询、数据简化(data reduction)、分析过程及可视化技术。这种对自主行为的详细分析提 供了对行为的神经组织的基本理解并且能够以高灵敏度检测基因、药理学及环境对脑功 能的影响。本发明的一个方面涉及质 量评估和过滤行为数据的方法。在某些实施方式中, 该方法涉及检测位置跟踪信息和关于与一个或多个设备交互的信息之间的不一致,和/ 或检测关于与多个设备的交互的信息中的不一致。例如,在某些实施方式中,行为数据 集被接收,该行为数据集包括使用测量系统在测量期间上所收集的动物行为数据,包括关于在定义的测量区域内的动物对象的空间位置的事件信息、关于在定义的区域内在已 知地点的多个设备处的动物对象或带有在定义的区域内在已知地点的多个设备的动物对 象的行为的设备事件信息、以及与所述位置和设备事件信息相关联的时间信息(temporal information)。该方法涉及分析所述行为数据以检测1)与设备事件信息不一致的位置信 息,其中所述检测基于该设备的已知地点,和/或2)与用于任何其它设备的设备事件信 息不一致的用于一个或多个设备的设备事件信息,其中所述检测基于与该设备事件相关 联的时间信息;以及基于至少一些所检测出的不一致来更新所述数据。在特定的实施方式中,过滤所述行为数据集可以包括接收所收集的行为数据; 识别错误的设备事件开始并移除相关联的设备事件信息;通过基于已知的该设备的地点 将在至少一些设备事件期间的位置信息与期望的动物的位置相比较来计算对所述位置信 息的校正;基于所述计算的校正来更新位置信息;并且识别并移除由测量系统检测设备 事件的终止的失败引起的数据。本发明的另一方面涉及组织或将动物行为分类到多个状态,例如,活动的状态 及不活动的状态。根据某些实施方式,提供了自动化的方法,该方法涉及使用从行为监 测系统所接收的空间(例如,位置跟踪)和时间信息来识别动物对象的活动状态与不活动 状态之间的过渡。还提供了分析使用测量系统所收集的动物行为数据的方法,所述行为 数据包括关于定义的测量区域内的动物的位置的空间和时间信息,该方法涉及通过确定 在一段时间期间动物对象运动之间的最长的持续时间的地点,使用该空间信息来识别活 动和不活动状态之间的过渡。本发明的另一方面涉及行为发作分类。在某些实施方式中,提供了分析使用测 量系统在测量期间所收集的一组动物对象行为数据的自动化的方法。该自动化的方法包 括接收测量周期期间在定义的区域内的动物对象的位置跟踪信息以及接收在所述测量周 期期间关于一个或多个行为的时间模式的信息;以及使用该位置跟踪信息和时间信息来 识别一个或多个行为的发作。在某些实施方式中,提供了分析使用测量系统在测量期间所收集的一组动物对 象行为数据的方法,该方法包括接收关于在测量周期期间动物对象的空间位置的空间信 息及关于在测量周期期间一个或多个行为的时间模式的信息;使用该空间信息和该时间 信息来识别一个或多个行为的发作,其中该空间信息包括关于在事件和事件之间的间隔 期间动物对象的空间位置的信息,其中事件之间的间隔是在设备处连续的设备事件之间 的间隔。本发明的另一方面涉 及比较两组动物行为数据(例如,控制和测试组)。在某些 实施方式中,该方法包括使所结合的用于两组的数据聚类并且确定最有助于该两组的差 别的簇。在特定的实施方式中,该方法包括接收具有与一组测试动物对象相关联的行为 数据的测试数据集;接收具有与一组控制动物对象相关联的行为数据的控制数据集;将 来自测试和控制数据集的行为数据结合;将所结合的数据集聚类成被选择的多个簇;基 于控制和测试数据集合中的行为数据是相同的假设来为每一个簇计算卡方(Chi-square)统 计;求所有簇的卡方统计的和以获得测试组数据和控制组数据之间的差别的测量;通过 交换测试和控制组之间的用于动物对象的数据来获得对差别的非偶然的测量;以及如果 该差别是统计学上地非偶然的,则确定最有助于该差别的簇。
根据不同的实施方式,可以被比较的行为的模式包括运动的模式、喂食的模 式、饮用的模式、药物摄入的模式、其它摄食行为的模式、睡眠的模式、与测试对象接 触的模式、及对另一动物或其它感觉刺激物的响应的模式。生理测量(例如指示行为测 量或响应)也可以被比较,包括心率、代谢率、血压和身体温度。同样提供了计算机程序产品,该计算机程序产品包括机器可读介质,在该介质 上存储了用于实施以上所描述的方法中的至少一些部分的程序指令。在此所描述的该方 法的中的任何一个可以被全部或部分地表示为可以被提供在这样的计算机可读介质上的 程序指令。还提供了如在此所描述的被使用和/或生成的数据结构和数据的各种组合。参考相关的附图以下将更详细描述这些及其它特征及优点。


图1是根据本发明的不同实施方式的流程图,其显示了在过滤从行为监测系统 所收集的运动和设备事件数据的方法中所采用的某些操作。图2是示意了 24小时小鼠行为记录的屏幕快照,其中位置以绿色指示,喂食事 件地点橙色显示,而饮用事件地点以蓝色显示。图3是根据本发明的不同实施方式的流程图,其显示了在检测错误设备事件(事 件开始误差)的方法中所采用的某些操作。图4是流程图,其显示了确定位置测量中总的漂移的方法中的某些操作。在某 些实施方式中,全部的位置漂移被用于监测错误设备事件。图5A是示意了图标的屏幕快照,总的位置漂移而在24小时监测时期上的舔食测 试器事件漂移(蓝色)和光子束事件漂移(红色)之间的差别被标绘其上。X和Y轴漂 移被分别标绘。图5B是示意了小鼠行为记录的屏幕快照,其中舔食测试器路径被以红色指示、 喂食事件地点以橙色指示、及饮用事件地点以蓝色指示。潜在的错误饮用事件被标志以 便用户回顾。图6是是根据本发明的不同实施方式的流程图,其显示了在使用设备的已知地 点来校正移动/位置数据的方法中所采用的某些操作。图7是根据本发明的不同实施方式的流程图,其显示了检测设备事件终止失败 的方法中采用的某些操作。图8是示意了小鼠行为记录的屏幕快照,其示出在喂食器附近喂食事件的簇(绿 色方框)以及在舔食测试器附近饮用事件的簇(蓝色圆圈)。在相对角落的两个方框表示 在两个喂食事件期间所确定的动物距离喂食器的最大距离。红色指示它们落在了有效喂 食事件标准的外面。图9显示了示意了小鼠行为记录的屏幕快照,其中位置被以红色指示、喂食事 件地点以橙色指示、及饮用事件地点以蓝色指示。位置严重扭曲朝向测量区域的一个端 部,指示位置检测器(负载束)失灵。图10是根据本发明的不同实施方式的流程图,其显示了检测位置检测器失灵的方法中采用的某些操作。图11和图12是根据本发明的不同实施方式的流程图,其显示了根据从行为监测系统所收集的运动和设备事件数据分类动物对象(一个或多个)的活动和非活动状态的方 法中所采用的某些操作。图13显示了以下例子1)在设备处距离最长的停留的距离相对停留持续时间的 标绘1301,2)3线曲线拟合(1303)以确定非活动状态停留阈值,以及3)按照使用非活动 状态停留阈值所确定的非活动状态位置的图表示意(1305)。图14是根据本发明的不同实施方式的流程图,其显示了计算状态分类误差以优 化时间窗口/运动阈值的方法中所采用的某些操作。图15是根据本发明的不同实施方式的流程图,其显示了计算根据从行为监测系 统所收集的运动和设备事件数据分类动物行为发作的方法中所采用的某些操作。图16显示了示意了数据质量控制的用户接口的屏幕快照。仪表盘A显示了具有 试验循环、小鼠和数据选择框的屏幕。对于该特定的所选择的小鼠-天,列出了两个被 标志误差事件。左边的仪表盘B显示了补充的标绘选择器,其实现了对数据的多个特征 的浏览。漂移差别选项被选择且相应的标绘被显示在右边。仪表盘C和D显示了主屏幕 的两个例子,每一个包含事件标绘(底部)、显示动物位置的震动标绘(右上方)、以及 质量控制按钮的布局、导航按钮和运动位置校正及完成按钮。在C中,两个舔事件(L) 和一个运动事件(A)被标志,如通过事件QC栏中的指示所指明的。在仪表盘D中,舔 事件已经被排除(通过“Le”栏中的“3”所指示的),导致对运动事件标志和笼边界 违反的排除。图17显示了示意被标志的失败检测误差的例子的阶段2QCGUI的屏幕快照。图 中的仪表盘A显示了事件标绘中没有舔事件,除了在该天的最晚期的一个,而仪表盘B 显示了小鼠那天所消耗的水的数量(在方框内被强调的值)类似于正常的日常摄入,对于 该或其它小鼠(apx.4g)强烈建议检测舔事件失败。图18是根据本发明的不同实施方式的流程图,其显示了比较测试和控制组的行 为模式的方法中所采用的某些操作。图19是根据本发明的不同实施方式的流程图,其显示了选择要在比较聚类中使 用的簇的最优数量的方法中所采用的某些操作。图20A和20B是示意性表示的计算机系统,其可以通过在此所描述的方法和装
置来使用。图21显示了在一天期间野生类型(WT)小鼠位置概率密度。使用具有标准内核 功能的内核密度估计器来计算位置概率密度,Icm的带宽,并且通过在每个位置花费的 时间加权单个天期间小鼠的所有位置。对于小鼠和天,最大位置概率的峰为距离巢的被 观察的地点的中心0.8cm,该巢在χ =-13cm且y = 34cm处、笼的左后方。另外,较小 的峰出现在笼的左前方对应于在χ = -12.5cm且y = -2.6cm处的喂食器的地点,并且在 对应于在χ = Ocm且y = Ocm处的舔喷嘴的地点的笼的右前方中。图21B显示了对于如图21A中的相同的野生类型小鼠和天,位置的变化以及摄 入和运动事件的发生。昼夜时间被以暗周期的开始和偏移显示在χ轴,该暗周期由在12 和24的虚线表示。小鼠的位置被按照距离舔喷嘴的顶的距离显示在y轴,该舔喷嘴的顶 的xy坐标被设置成χ = 0及y = 0。黑色的线指示发生在非活动状态器件的位置而绿色 的线指示发生在活动状态期间的位置。在标绘的底部,喂食事件被显示为橙色的光栅而饮用事件被显示为蓝色的光栅。图21C显示了对于如图21A和21C中的相同的野生类型小鼠非活动状态停留阈 值的指示。所有天的位置持续时间被显示在对数X轴而相应的在六个小时窗口中距离最 长位置持续时间的距离被显示在y轴。对于该小鼠非活动状态位置的持续时间阈值为9.3 分钟,指明在该处距离最长位置持续时间的距离的快速增加的持续时间被观察到。非活 动状态位置被以黑色显示而活动状态位置被以绿色显示。图21D显示了对于相同的野生类型小鼠和天,非活动状态位置和摄入事件的地 点。使用在所观察的巢的周围的位置持续时间阈值的簇来分类非活动状态位置,该巢被 显示为小黑框。对于该小鼠和天,非活动状态位置的中心为距离该巢的被观察的地点的 中心0.3cm。黑色的虚线对应于笼的地板而实线对应于笼的顶。喂食器被表示为在笼的 左前方的小框,而水瓶被通过在笼的右前方的圆表示。喂食事件期间小鼠的位置被以橙 色显示并且饮用事件期间被以蓝色显示。图22A涉及在设备处归类。在WT小鼠在所有天IEI发生在光周期期间期间最大 限度地离开喂食器时,二元正态分布的混合被拟合到它的位置。在左手边的仪表盘中, 指定给最后拟合中的九二元正态分布的所有的位置被以不同的颜色和标志显示。在中间 的仪表盘中,仅二元正态分布的中心被用分类为发生在设备处的二元正态分布以橙色显 示,而以绿色显示所有其它的二元正态分布。在右手边的仪表盘,被分类为发生在喂食 器处的尽可能最大地距离IEI的位置被以橙色显示而所有其他位置被以绿色显示,指明发 生在IEI期间的行动离开喂食器。右手边的仪表盘同样显示斜坡的地点,该斜坡提供对喂 食器的访问如凸出进入到笼中的黑色矩形。图22B显示了 IEI持续时间分类的结果。对于相同的小鼠,二元正态的混合被 拟合到发生在所有天数的光周期期间的对数转换的IEI持续时间。直方图显示了给定持续 时间的IEI的数量地均方根。蓝色线显示了预测的各个单正态分布而红色线显示了预测的 到来自各个单正态分布的和的数据的拟合。虚线指明短对于发生在光周期期间的喂食, 16秒的该小鼠IEI持续时间阈值。图22C显示了 IEI分类的结果。作为WBI(在发作内的间隔)或IBI(在发作之 间的间隔),该小鼠的所有光周期IEI的分类确定自IEI最大距离位置发生在设备处及IEI 持续时间为短的概率的均值。对于每个IEI,对数转换的持续时间被显示在χ轴而从喂食 器的距离被显示在y轴。在发作内部IEI是橙色。发作之间,如果小鼠逗留在喂食器但 是持续时间超过短IEI阈值,间隔是红色,如果小鼠从事于行动则为绿色,以及如果小鼠 从事于行动及饮用,则为蓝色。图23A显示了单一光周期活动状态。左手边仪表盘显示了小鼠距离添喷嘴顶的 距离相对昼夜时间。绿色的点指明发生在行动发作期间的位置而红色的点指明在喂食和 饮用发作期间或者其它行为发作期间移动到的位置。红色线显示了在给定为之所花费的 时间。在标绘的底部,垂直的橙色的线示意了喂食事件的开始和持续时间,以及垂直的 蓝色的线示意了饮用事件的开始和持续时间。(在所示意的持续时间,大多数事件没有被 解析为单个线而似乎在一起)。在示意喂食与饮用事件的线的上面,窄的橙色或蓝色的线 指明喂食及饮用发作的开始与偏移。图23B显示了在如图23A示意的活动状态期间被小鼠占据的位置的持续时间和地点。图23C显示了图23A和TDE中示意的活动状态期间笼内所采取的路径。绿色 的标志再次指示发生在行动发作期间的位置而红色标志指示发生在喂食、饮用、及其它 行为发作期间的位置。图24A-C显示了 WT小鼠和OB小鼠的日常数量,密度,以及时间预算。图24A 显示了日常摄入和运动的平均。对于每一个组,框标绘的边沿显示第75和第25个百分 率的值,而在框内的线指示中线(median)。每个小鼠的数据别显示为点。OB小鼠表现 出运动的显著降低(ρ = 4.3x10-8 WT 471 士 37m,OB 78 士 5m)而食物(ρ = 0.047 WT 3.9 士0.lg,OB 4.16 士0.08g)或水摄入(ρ = 0.2 WT 3.3 士0.Ig OB 3.6 士0.Ig)没有显著变 化。图24Β显示了喂食、饮用、及行动的平均日常发作密度。OB小鼠表现出行动 发作的密度的显著降低(ρ = 7.9x10-11 WT13.3士0.4cm/s,OB 5.0士0.2cm/s)而喂食(ρ =0.6 WT 0.78 士0.03mg/s,OB 0.76 士0.03mg/s)或饮用(ρ = 0.03 WT 7.4士0.3mg/s, OB6.4士0.3mg/s)发作的密度没有显著变化。图24C显示了平均时间预算。对于每一个组饼图显示了在IS (黑色)和喂食(橙 色)、饮用(蓝色)、行动(绿色)、及其它行为(红色)之间的时间的分布。OB小鼠显 示出在IS (ρ = 2.3x10-10 WT66.8 士 0.9%,OB 83.5 士 0.5% )花费的时间的百分比的显 著增加以及在行动(P = 2.4x10-5 : WT 3.7士0.3%,OB 1.8士0.1 发作及其它行为(ρ = 3.7x10-11 WT 22.4士0.7%,OB 7.4士0.4% )所花费的时间的百分比的显著降低。花费 在喂食(ρ = 0.6: WT 6.4士0.4%,OB 6.7 士0.2%)和饮用(ρ = 0.08 WT 0.63 士0.03%, OB 0.71 士0.03% )发作的时间的百分比没有显著降低。Bonferroni校正被用于评价数量和 密度(3个测试食品、水、运动)和时间预算(5个测试非活动状态、喂食、饮用、行 动、以及其它发作)的显著性方面的多个测试。图25A-C显示了 WT和2C小鼠的日常数量、密度、及时间预算。图25A显示 了平均日常摄入和运动。2C小鼠表现出运动(ρ = 0.01 WT 515士50m,2C 712士57m) 及食物摄入(ρ = 0.007 WT4.4士O.lg,2C 4.81 士0.09g)的显著增加而无日常水摄入(ρ = 0.8 WT3.6士0.1g2C3.6士O.lg)的显著变化。图25B显示了喂食、饮用、及行动的平均日常发作密度。2C小鼠表现出行 动(ρ = 0.006 WT 12.5 士0.4cm/s,2C 13.9 士0.3cm/s)及喂食发作(ρ = 0.01 WT 0.98士0.07mg/s,2C 1.22士0.04mg/s)的密度的显著增加,而没有饮用用发作(ρ = 0.8 WT 7.6士0.3mg/s,2C7.7士0.4mg/s)的密度的显著变化。图25C显示了平均时间预算。2C鼠表现出花费在IS (ρ = 4.8x10-5 WT 66 士 1%,2C57 士 2%)时间的时间的百分比地显著降低以及花费在其它行为(ρ = 9.&10-7 WT 22.8士0.7 %,2C 32士 1 的发作的时间的显著增加。花费在喂食 (ρ = 0.02 WT 6.4士0.5 %,2C5.0士0.2%)、饮用(ρ = 0.7 WT 0.61 士0.02 %,2C 0.64 士 0.04%)、或行动发作上(ρ = 0.04 WT 4.4 士 0.3%,2C 5.5 士 0.4% )的时间的百分 比没有显著变化。图26Α显示对于WT、ΟΒ、及2C小鼠一天内距离舔喷嘴的距离。森林绿色的 线指示AS位置而黑色的线指示IS位置。在每一个标绘的底部,喂食(橙色)和饮用(蓝色)事件被显示。图26B显示对于喂食(橙色)、饮用(蓝色)、及行动(霓虹绿)事 件,相同的三只小鼠的八天数据。AS开始和偏移被通过事件上的开口条(森林绿)来指 示。图26C以绿色点的形式显示相同天及小鼠的所有AS开始和持续时间。图26D以黑 色点的形式显示相同天及小鼠的所有IS开始和持续时间。对于图26C和26D,开始的昼 夜时间是在χ轴上而对数持续时间是在y轴上。为了将每个小鼠的状态开始及持续时间 的模式与它的组比较,在每个组中64个随机地选择的小鼠的所有状态开始及持续时间被 显示为背景中灰色的点。图27A-27D显示WT和OB小鼠的日常状态模式。使用&11重复的测量ANOVA 来测试基因型(G)的影响、时间(T)、及由于时间交互的基因型。在这个及随后的图 的每一个标绘的右上手角落中,g指示基因型的显著影响,t指示天的时间的显著影响, 而χ指示随天的时间基因型的显著交互。对于这个及随后的图,如果由于时间交互的显 著基因型出现,前件(p0St-h0C)t-测试被进行以比较每个时间仓的状态特性。如果显著 的差别被检测到(p<=0.05),星号被显示在每个仓的中心。随天的时间的变化对于 WT (空心方框)和OB (填充圆)小鼠,被显示在2小时仓中。图27A显示AS概率(G ρ = 1.7x10-10,Tp = 8.2x10-64, GxT ρ = 2.0x10-29);图 27Β 显示 AS 开始率(Gp = 2.5x10-6,Tp = 7.8x10-13, GxT ρ = 1.4x10-6);图 27C 显示 AS 持续时间(G ρ = 0.96, Tp = 5.7x10-25,GxT ρ = 2.8x10-8)而图 27D 显示 IS 持续时间(Gp = 5.7x10-8,T ρ =4.9x10-32,GxT ρ = 1.0x10—5)。图27Ε显示了比较聚类标绘。比较聚类显示WT和OB小鼠之间的持续时间及 AS数量的昼夜时间变化的显著差别(Σχ2 = 703,ρ < 1.6x10-4)。在较高的标绘(WT) 和较低的标绘(OB),每一个点指明AS的开始时间(χ轴)和对数持续时间(y轴)。品 红色的点指明与OB小鼠相比WT小鼠更有助于活动状态的地方的区。灰色的点指明由 两个组做出贡献的活动状态的数量未显著不同的地方的区。具有显著差别的该区占有Σχ2 的91.2%,其指明这些区在AS模式中占有大部分差别。图28A-28D显示了 WT和2C小鼠的日常状态模式。对于WT (空心方框)和 2C(填充圆)小鼠,随时间的天的变化被显示在2小时的仓中。图28D显示AS概率(G ρ = 8.9x10-5,Tp = 7.0x10-148,GxT ρ = 1.2x10-9);图 28Β 显示 AS 开始率(Gp = 0.002,Tp= 1.4x10-52,GxT ρ = 4.4x10-13);图 28C 显示 AS 持续时间(Gp = 0.5, Tp= 1.8x10-48,GxT ρ = 1.2x10-6),and 图 28E 显示 IS 持续时间(Gp = 5.0x10-8,T P = P = 9.6x10-81, GxTp = 6.7x10-15)。图28E显示比较聚类标绘。比较聚类显示WT和2C小鼠之间AS数量与持续时 间得昼夜时间变化的显著差别(Σχ2 = 233,ρ = 0.001)。青蓝色的点指示WT小鼠的2C 小鼠显著地更有助于降低活动状态的区。具有显著差别的区占Σχ2的48.3%。图29Α和29Β显示了示出WT和OB小鼠的喂食和行动发作特性的标绘。随 天的时间的变化被显示如下(al)食品摄入(Gp = 0.1,Tp = 5.7x10-38, GxT ρ =3.4x10-8) ; (a2)每小时的喂食发作(Gp = 8.3x10-7,Tp = 2.5x10-28,GxT ρ = 2.8x10-19);每活动状态小时的喂食发作(Gp = 4.4x10-5,Tp = 8.8x10-5,GxT ρ = 0.2) ; (a4)喂食发作大小(Gp= 1.4x10-5,Tp = 0.0004,GxT ρ = 0.2) ; (bl)运动 (Gp = 2.8x10-8,Tp = 6.3x10-47,GxT ρ = 1.6x10-36) ; (b2)每小时的行动发作(Gp=7.4x10-7,Tp = 1.4x10-44,GxT ρ = 1.0x10-32) ; (b3)每活动状态小时的行动发作 (Gp= 1.8x10-6,Tp = 1.7x10-18,GxT ρ = 3.3x10-13),(b4)行动发作大小(Gp = 0.0167,Tp = 6.5x10-7, GxT ρ = 0.06)。图30Α和30Β显示了示出WT和2C小鼠的喂食和行动发作特性的标绘。随 天的时间的变化被显示如下(al)食品摄入(Gp = 0.01,Tp = 3.2x10-92, GxT ρ = 4.9x10-9) ; (a2)每小时的喂食发作(Gp = 0.6,Tp = 6.1x10-46,GxT ρ = 0.001); (a3)每活动状态小时的喂食发作(Gp = 0.3,Tp = 8.2x10-10, GxT ρ = 0.002) ; (a4) 喂食发作大小(Gp = 0.4,Tp = 2.0x10-54,GxT ρ = 0.02) ; (bl)运动(Gp = 0.016, Tp = 6.8x10-105,GxT ρ = 3.8x10-5) ; (b2)每小时的行动发作(Gp = 0.002,Tp = 9.2x10-106, GxTp = 1.3x10-8) ; (b3)每活动状态小时的行动发作(Gp = 0.06,Tp = 4.2x10-59, GxT ρ = 2.9x10-5) ; (b4)行动发作大小(G ρ = 0.08,T ρ = 4.2x10-18, GxT ρ = 0.006)。图31A-31F显示了涉及WT和OB小鼠的活动状态结构内。对于WT (图31Α) 和OB(图31Β)小鼠,在光周期期间,发生在50个随机被选择的AS起始和结束期间的 喂食(橙色),饮用,及行动事件的开始及偏移被以空心条显示。在y轴上的每一条线显 示单个活动状态的数据。AS期间的时间被以分钟显示在χ轴,其中0指示AS的开始。 在图31C-31F中,对于WT(空心方框)和OB(填充圆)小鼠,由于AS的开始而随时 间的发作概率的变化被显示在一分钟仓内(图31C)喂食发作(Gp = 4.6x10-6, Tp = 3.3x10-65,GxT ρ = 6.2x10-42);(图 31D)行动发作(G ρ = 0.2,T ρ = 6.2x10-18, GxT ρ = 4.2x10-13);(图 31Ε)饮用发作(Gp = 0.6,Tp = 5.3x10-3,GxT ρ = 0.0002); (图 31F)其它发作(Gp = 9.9x10-6,Tp = 6.7x10-63,GxT ρ = 7.9x10-34) .Bonferroni 校正被用于评价发作概率的显著性方面的多个测试(4个测试喂食,饮用,行动,及其 它)。图32A-32F显示了涉及WT和2C小鼠的活动状态结构内。对于WT (图32Α) 和2C (图32Β)小鼠,在光周期期间,发生在50个随机被选择的AS起始和结束期间的喂 食(橙色),饮用(蓝色),及行动(绿色)事件的开始及偏移被以空心条显示。对于图 32C-32F,对于WT (空心方框)和2C (填充圆)小鼠,由于的AS的开始随时间发作概率 的变化被显示在一分钟仓内(图32C)喂食发作(Gp = 0.008, Tp = 4.9x10-154,GxT ρ = 1.2x10-7),(图 32D)行动发作(G ρ = 0.6,Tp = 4.2x10-22, GxT ρ = 0.9),(图 32Ε)饮用发作(Gp = 0.07,Tp = 7.1x10-6,GxT ρ = 0.05),(图 32F)其它发作(G ρ =0.002,Tp = 3.5x10-131,GxT ρ = 0.0001)。图33显示了短和长持续位置的分类。对于来自WT2C比较的所有WT小鼠,所 有IEI分区的均值持续时间和在设备处概率被显示。IEI用于发生在光周期期间的光子束 事件。短持续时间位置通过使用本地插入(lowess平滑器)将线拟合到数据来识别,以便 估计均值分区持续时间,在该持续时间,该组被等同于逗留喂食器或离开喂食器。图34显示了行动发作分类标绘。对于运动速率(A)和转角(B),单个小鼠概率 密度估计被显示。在训练集(MIP)中的运动事件的密度被以红色显示。将被分类的运动 的密度(A^ms)被以绿色显示。虚线指示MIP和%双@密度的交叉处。位置的 运动速率(C)或转角(D)的相对概率不同于MIP位置,其被相对运动速率或转角标绘。使用具有发生在非活动状态及喂食或饮用(红色)期间的运动以及所有其它运动(绿色) 的内核函数的内核密度估计器来估计运动速率或转角的概率密度。两个概率密度的交叉 处被设置为按照在行动发作内或其它行为发作期间的发生(原地移动停止)来分类运动的 阈值。图35显示了涉及在比较聚类的方法中簇数量选择的标绘。根据ο卡方和的卡 方分布计算的P值的对数被相对WTOB比较(A)和WT2C比较(B)的簇的数量所标绘。 虚线显示最小ρ值的地点以及点线显示在器上ρ值未显著不同于最小ρ值的范围。所选 择的仓的数量对于WTOB比较为13而对于WT2C比较为14。图36WT和OB小鼠的活动状态。随天的时间的变化被显示如下(A)AS持续时 间(Gp = 0.96,Tp = 5.7x10-25, GxT ρ = 2.8x10-8),(B) AS 食品(G ρ = 5.6x10-6,T ρ = 2.8x10-21, GxT ρ = 5.57x10-5),(C) AS 水(G ρ = 7.4x10—6,T ρ = 9.6x10—36,GxT ρ = 4.6x10-9), (D)AS 运动(Gp = 7.3x10-5,T ρ = 1.7x10-20,GxT ρ = 4.&10-14)。图37显示了 WT和2C小鼠的活动状态。随天的时间的变化被显示如下(A) AS 持续时间(Gp = 0.96,Tp = 5.7x10-25,GxTp = 2.8x10-8),(B)AS 食品(Gp = 5.6x10-6,Tp = 2.8x10-21, GxTp = 5.57x10-5),(C) AS 水(G ρ = 7.4x10-6,Tp = 9.6x10-36,GxT ρ = 4.6x10-9),(D) AS 运动(G ρ = 7.3x10-5,T ρ = 1.7x10-20,GxT ρ = 4.2x10-14).图38显示了 WT和OB小鼠的饮用和“其它”发作特性。随天的时间的变化被 显示如下(Al)水摄入(Gp = 0.09,Tp = 9.6x10-53,GxT ρ = 7.5x10-7),(Α2)每小 时的饮用发作(Gp = 0.0006,Tp = 2.1x10-50,GxT ρ = 2.9x10-6). (A3)每个活动状态 小时的饮用发作(Gp = 0.5,Tp = 3.6x10-12,GxT ρ = 9.5x10-7),(Α4)饮用发作大小 (Gp = 0.003, Tp = 0.002, GxT ρ = 0.005),(Bi)其它持续时间(G ρ = 2.&10-11,T ρ = 3.3x10-62,GxTp = 3.5x10-40). (Β2)每小时的其它持续时间(Gp = 2.9x10-7,Tp =1.6x10-47,GxTp= 1.4x10-34). (Β3)每个活动状态小时的其它发作(G ρ = 5.6x10-7, Tp = 8.5x10-18,GxTp = 2.5x10-11),(Β4)其它发作持续时间(G ρ = 0.003,Tp = 9.3x10-9, GxT ρ = 0.06)。Bonferroni校正被用于评价数量水摄入的显著性(3个测试 食品、水、运动),在其它发作上花费的时间(5个测试非活动状态、喂食、饮用、行 动、其它),发作率(5个测试非活动状态、喂食、饮用、行动、及其它),水发作大小 (3个测试喂食、饮用、行动),以及其它的持续时间(5个测试非活动状态、喂食、 饮用、行动、及其它)。图39显示了 WT和2C小鼠的饮用和“其它”发作特性。随天的时间的其它变 化被显示如下(Al)水摄入(Gp = 0.8,Tp = 5.5x10-101,GxTp = 5.2x10-9), (Α2) 每小时的引用发作(Gp = 0.04,Tp = 5.1x10-73, GxT ρ = 0.1),(A3)每个活动状态 小时的饮用发作(Gp = 0.9,Tp = 3.9x10-27, GxT ρ = 0.003),(Α4)饮用发作大小(G ρ = 0.007,Tp = 9.4x10-17,GxT ρ = 0.9),(Bi)其它持续时间(Gp= 1.6x10-6,Tp =6.2x10-146, GxTp = 2.0x10-12),(Β2)每小时的其它持续时间(Gp = 0.002,Tp = 7.5x10-108,GxT ρ = 3.4x10-8),(Β3)每个活动状态小时的其它发作(Gp = 0.06,Tp = 8.9x10-54,GxT ρ = 4.8x10-5),(Β4)其它发作持续时间(Gp = 0.5,Tp = 8.9x10-23, GxT ρ = 0.2)。
具体实施例方式1.介绍及相关术语本发明涉及对高分辨率行为数据的收集、管理、及分析的方法、系统及装置。 这些系统和方法提供了以先前未能实现的量化及精度水平来检查行为模式的机会。提供 了用于管理和分析由行为监测系统所产生的非常大且唯一的数据集的方法和系统,包括 质量评估和控制、存档、数据查询、数据简化、分析过程及可视化技术。对自主行为的 这种详细的分析提供对行为的神经组织的基本理解并能够以高灵敏度检测基因、药理学 及环境对脑功能的影响。尽管按照涉及家笼监测(HCM)系统内的动物对象的行为的系统、方法和装置来 陈述以下描述中的大部分,但本发明不被这样的方法所限制。例如,用于过滤并分析行 为数据的方法和系统可以与任何行为监测系统一起被使用。在以下的描述中,多个具体 的细节被阐述以便提供对本发明彻底的理解。然而,明显的是本发明可以被实现而无需 限制在在此所描述的一些具体细节。本发明涉及对来自行为监测系统的数据的过滤、数据质量控制与评估、及分 析。通常,行为监测系统包括在定义的区域内的一个或多个设备,正被监测的动物对象 (一个或多个)在该设备处或与该设备交互。所述监测系统可以是家笼监测系统,诸如 名称为“动物笼子行为系统(Animal Cage Behavior System) ”的专利申请号No.7,086,350 的美国专利内所描述的,在此通过引用将其整体并入用于所有的目的。典型地,所述监 测系统在测量时期提供对运动和设备事件数据的连续监测。例如,所述监测系统可以提 供由对运动(例如,以空间位置相对时间的形式)、及摄取事件、感觉刺激物事件等的持 续监测引起的数据。根据本发明的方法和系统而被使用的行为监测系统产生大容量的数据,例如在 一天内单个对象可以产生几百万的运动、几千万的摄取事件等等。在观察的一周、年 等,用成百或成千的对象乘该数据需要对数据的鲁棒自动化的质量评估和校正技术。以 下讨论数据质量评估和控制的方法和系统。本发明的另一方面是用于定义行为的要素及它们的时间和空间组织的新颖的量 化方案,包括生物学上最相关的数据简化、可视化及分析方法。通过数据质量控制算法 来促进这些方案。特别地,以下描述簇的分类和行为的发作,以及对行为的活动和不活 动状态的分类。在某些实施方式中,提供了允许行为分类被以鲁棒、自动化的方式执行 的方法和系统。以下术语在整个说明书中被使用。该描述被提供以帮助理解该说明书,但无需 限制本发明的范围。行为事件是行为的特定类型的发生或实例。行为事件的类型的例子包括涉及消 耗行为(包括食物、液体、药物、药品等等的消耗)的事件,涉及运动行为的事件,涉及 交流的事件,涉及与被监测的对象相关联的各种普通活动的事件。例如,对于笼子中的 小鼠可以被测量的行为事件包括喂食、饮用及围绕所述笼子的运动。对于人类可以被测 量的行为事件包括喂食、饮用、围绕特定区域的运动、及使用诸如电话或计算机等特殊 的电子设备、等等。其它行为事件可以涉及动物对特殊刺激物或设备的响应。
设备事件是包括与在已知地点处的设备交互的行为事件。该地点可以是固定的 或变化的。例子包括出现在笼内的喂食器处(feeder)的喂食事件,以及出现在笼内的舔 食测试器(Iickometer)处的舔食事件。设备事件的其它例子包括对房子内已知地点处的计 算机的使用,如通过与在特定饭店的设备交互所指示出的出现在该饭店处的喂食事件。设备的例子包括舔食测试器和喂食器,该舔食测试器是提供对由动物消耗的流 体的测量的设备,该喂食器是向圈养的动物提供食物的设备。在某些实施方式中,所述 喂食器提供对由动物所消耗的食物的数量的测量。与设备的交互可以是与被测量的行为 所必须的设备的交互。例如,可以通过在被小鼠舔食以获得水时改变舔食喷口的容量, 在舔食测试器处测量由小鼠消耗的水。类似地,在动物打断光子束(photobeam)以便获得 喂食器内的食物时,可以通过光子束和光子束检测器来测量喂食。其它的设备包括转轮 (ranning wheel) >杠杆和洞。杠杆和洞可以被交互用于传输或提供食物、流体、药物、或 任何感觉刺激物。在某些实施方式中,所述设备是操作型条件反射(operant conditioning) 设备。与设备的交互可以包括暴露给其它动物、感觉刺激物(例如,恶臭物质)或者新 的或熟悉的对象,其中所述测量提供关于动物的对象响应于该暴露或感觉刺激物的行为
I H ; K、,寸寸。事件之间的间隔是同一类型的两个行为事件之间的间隔例如,两个光子束中 断之间的间隔。类似地,如果某种行为通过与计算机的交互而被测量,则事件之间的间 隔可以是正被按压的键盘按键之间、鼠标点击之间、等等的间隔。事件开始误差指的是实际上没有设备事件出现时,对事件的开始的不正确的测 量。对笼的冲撞,通过移动食品(Chow)短暂阻断光子束或通过舔食测量器的电磁场噪音 检测都是偶然的伪喂食和饮用事件测量的源的例子。事件终止误差指的是在设备事件实际上已经被终止时指示它正在进行的不正确 的测量。事件偏移误差的源的例子包括在喂食发作期间喂食器光子束变成由食物微粒所 阻止。舔食测试器不能由自发的滴注、或者在舔食槽内的底料的放置(通过鼠标)所产 生。这样的误差,如果未检测到,将产生对设备事件长度的高估以及产生对由在该设备 处的动物的长期活动的不正确指示。运动数据包括关于动物对象在测量区域内的运动的信息。它可以包括空间和时 间信息,例如,动物在测量时期期间间或的空间位置。在某些时间也可以收集运动数 据,例如1秒,尽管在许多实施方式中,为了降低原始数据集中数据的数量,运动数据 在动物移动大于阈值数量时被收集。数据收集阈值距离根据行为监测系统和对象的类型 而变化对于在大测量区域内的人类对象,跟几千米相似的阈值可能是适当的,对其它 动物而言,几米可能是适当的,对于啮齿类而言,厘米可能是适当的,等等。运动数据 因此可以包括动物的位置和每一个位置的时间,或者自前一位置的持续时间。位置和/ 或运动可以通过任何数量的机构而被测量,包括负载束、RFID应答器、卫星系统、视频
跟踪,等等。漂移指的是与测量相关联的累积误差。全部的位置漂移是在测量时期期间的任 何时间,在测量区域内的χ和y坐标(和/或其它坐标系或者维度,如果测量的话)内 的漂移。例如,在负载束被用于监测动物运动的地方,运动测量被改变笼内质量的分布 所影响。改变可能出现在动物身体重量上、喂食器内食物的数量上以及舔食测量器内的水上,以及由于底料的偏移。Y轴内位置信息的偏移可以由来自在笼的相对端部处的设 备中的食物和水的迁移引起,以致于运动路径和摄食行为地点相对于笼地点上移(Shift up)。设备事件漂移是设备的地点内的明显漂移,如在每一个事件处所测量的。正如全 部的位置漂移,所述设备事件漂移通常被测量用于每一个坐标或维度。动物对象(一个或多个)行为可以被分解成发作和簇。发作是同一行为动作的 发生或反复发生或行为动作的指示(例如,食物消耗或光子束中断),其看来像是及时地 一起聚类和/或没被不同的行为的干扰分开。在某些实施方式中,发作可以通过在特定 地点处的行为的发生和/或重复来表征。簇是同一行为动作的反复发作或看起来是及时 聚类在一起的行为动作(例如,食物消耗或者光子束中断)的指示。动物对象(一个或多个)行为可以进一步被组织成状态,例如,活动的及不活动 的状态。状态可以通过提高特定行为或者行为和/或在一个或多个特性地点处的这些行 为的发生的几率来表征。例如,活动的状态和不活动的状态可以被分类。活动的状态是 在其中存在被提高的一些所测量的行为(诸如喂食,饮用,或行动)的概率的状态。不 活动的状态是在其中在特性地点或地点处的概率高于一些测量窗口的状态。根据捕食或 环境条件,这些特性地点可以用作避难所。在不活动状态期间,动物对象(一个或多个) 可以具有被增加的进行某种被测量的行为(诸如休息或睡眠)的概率。尽管为讨论的目 的,以下描述简单地提到活动/不活动状态分类,该方法并不被如此限制且可以被使用 但可以被用于识别和分类其它状态,在该其它状态中存在出现在特定一个或多个地点处 的一个或多个特定行为的增加的概率。本发明的实施方式涉及有形及无形的计算机可读介质或计算机程序产品,其包 括用于执行各种计算机可执行操作的程序指令和/或数据(包括数据结构)。包括程序 指令和/或数据(包括数据结构)的计算机可读介质或计算机程序产品用于执行各种计算 机可执行的操作。计算机可读介质的例子包括,但不限于,诸如硬盘、软盘、磁带等磁 性介质;诸如CD-ROM设备和全息设备等光学介质;磁光介质;半导体存储器件,及 被特别配置以存储和执行程序指令的硬件设备,比如只读存储器件(ROM)及随机存储存 储器(RAM),及有时的专用集成电路(ASIC),可编程逻辑电路(PLD)及用于传输计算 机可读指令的信号传输介质,例如局域网络,广域网络,及因特网。本发明的该数据和 程序指令还可以被实现在载波上或者其它传送媒介(例如,光路,电子线路,和/或空气 波)。数据库涉及用于记录及取回信息的装置。该数据库可以提供用于存储和/或搜 索所存储的信息的装置。该数据库可包括包括但不限于纸系统、卡系统、机械系统、电 子系统、光学系统、磁系统或其组合的任何方便介质。在某些实施方式中,数据库包括 电子(例如基于计算机的)数据库。用在存储并管理数据库的计算机系统对本领域技术 人员而言是众所周知的,但不限于“个人计算机系统”,主机系统,因特网或内部网上 的分布式节点,在专门的硬件内(如微型芯片内)所存储的数据或数据库,等等。2.数据质量控制行为监测系统生成大量数据。例如,用于小鼠的32笼的监测系统,包含食 物消耗指示器、流体消耗指示器、测量运动的活动工作台的每一个笼具有96个数据收 集设备。每天,每个设备可以记录数以千计的事件,例如,500-5000个喂食事件、1000-10000个舔食测试器事件及10000-350000个空间位置。需要鲁棒自动化质量评估算 法处理这些事件。对大量生物数据集的有效使用需要用于评估数据质量的新方法。例如 通过医疗失败或通过动物对象与设备的特异性的交互(idiosyncratic interactions)能够损害 数据质量。对行为系统数据的质量的评估需要仔细考虑可以损害行为数据质量的多种因
ο本发明的多方面涉及对由行为监测系统所生成的大容量数据的评估和质量控 制。根据各种实施方式,该方法合并了与周期性的摄入测量、动物对象和设备外观、及 环境条件相关的实验者观察。另外,陈述了需要监测行为数据收集设备的功能的自动化 技术。持续地评估喂食、饮用和运动活动的行为监测系统,具有高的时间和空间分辨 率。所收集的数据的高分辨率对于区分具有高敏感度的行为模式的分析方案的发展是至 关重要的。然而,这些行为数据集的复杂本性和大样本量(size)提出了多个挑战。这些 包括1)用于数据存储和查询的大容量行为数据管理系统的需求,2)质量控制工具的开 发,以检测并管理系统噪音事件、设备失误及人类误差,及3)分析技术和数据简化的开 发,以将检测基因或其它对行为模式产生影响的能力最大化。因为这些数据集是独一无 二的,需要新的方案以满足这些挑战。如以上所指出的,该数据集通常包含与测量区域内的动物的空间位置或运动相 关的数据、以及来自一个及更通常地多个设备的行为设备事件数据。根据不同的实施方 式,所述质量控制方法涉及分析行为数据以检测位置信息和设备信息之间和/或从多个 设备所接收的信息之间的不一致性。图1示出了根据某些实施方式过滤数据的处理的概要,其中图2-6示出了图1 中所描述的某些操作的具体实施的细节。图1中所描述的操作的一些或全部可以被用于 数据质量评估并产生用以分析的过滤的数据集。也可以执行附加的质量控制操作。该 处理开始于接收用于测量周期的运动和设备事件数据(101)。用于测量周期和测量区域 (例如,笼)的组合的运动和设备事件数据可以被称为数据集。该数据集可以采取任何 形式,并且可以包括用于多个动物对象的数据,等等。在许多实施方式中,运动数据被 呈现为位置相对时间的数据。设备事件数据可以包括在测量时期期间的不同时间与设备 的交互的指示。例如,该数据集中的位置/行动数据可以包括每次动物运动了比某个预 定义的距离(例如,1cm,10英尺,等等)大的距离的记录。该数据可以是例如以从先 前所记录的地点,在测量时期或持续时间期间的动物地点和时间的形式。类似地,对于 饮用或食用行为,数据集可以包括来自食物和流体消耗设备的信号之间的持续时间的时 间。数据可以被收集,例如,使用在以上所引用的专利号为No.7,086,350美国专利申请 中所描述的、从外部源等接收的以上所参考的方法。通过识别及移除错误的设备事件数据(103)继续该处理。其包括检测也被称为 错误设备事件开始的事件开始误差。诸如笼的冲撞、光子束由于偏移食品的短暂阻断、 由于舔食测试器的电磁场噪音检测等伪设备事件的源可以偶然地生成伪喂食和饮用事 件。类似地,在依靠对象以有计划的方式按压移动电话或跟踪器上的按钮的行为监测系 统中,错误的设备事件开始可能由于意外的交互而发生。导致在实际上没有设备事件发 生时指示设备事件的任何类型的误差是事件开始误差。尽管这些事件通常是罕见的,它们的重要性在设备事件被用于运动位置校正的实施方式(下文描述)中被提高。检测事件开始误差并从数据集移除相关联的设备事件数据后,计算位置运动数 据的校正(103)。在某些实施方式中,位置信息的不精确可以累积。例如,在负载束被 用于监测动物运动的地方,运动测量被笼内质量分布的改变所影响。变化可以出现在动 物身体的重量上、在喂食器中的事物和舔食测试器内的水的数量上、以及由于底料的偏 移。如果这样的变化没有被计入(account for),那么产生位置信息的不精确。运动位置 误差的例子被显示在图2中,其描述了 24小时行为记录,其中行动位置以绿色指示,喂 食事件地点以橙色指示,而饮用事件地点以蓝色指示。这里,在201,我们看到了在Y 轴内位置信息偏移的痕迹,以致于行动路径和摄取行为地点相对于笼的地点向后(向上) 偏移。这样的不精确起因于从笼前方处的设备移动食物和水。图2示出了不精确的例子,其能导致在笼内使用负载束测量位置信息。与位置 检测机制(负载束、视频、RFID、等等)和检测区域无关,数据集内的位置信息可包含 不精确性。设备事件(例如,饮用及喂食器光子束中断)出现在笼或其它测量区域内的 已知地点,且该信息被用于校正运动和位置数据。所校正的行为记录被示意在图2的203 处。以下参考图6进一步描述校正运动位置数据的一个实施方式的细节。应注意到因为 设备的已知地点(及所期望的动物的位置)被用于校正位置数据内的不精确,在校正位置 数据之前,如以上所描述的移除与错误设备事件开始相关联的设备事件数据是理想的。 除了在它们的移除之后,运动位置校正也可以在移除错误设备事件之前被执行。一旦位置数据被校正,由终止设备事件的失败所引起的数据集的不精确被识别 并移除(109)。在某些情况下,动物可以发起在动物离开设备时不终止的设备事件。例 如,在喂食发作期间喂食器光子束可以变成被食物微粒所阻塞。舔食测试器失败可以由 自发性的滴下、或者舔食槽内底料的(通过小鼠)放置而引起。类似地,视频、卫星或电 子跟踪可能失灵,未登记设备事件的终止。如果未被检测到,这样的误差将产生对设备 事件长度的高估及在设备处因动物所延长的活动的不正确的指示。在某些实施方式中, 通过在设备事件期间找出对象的所有位置来检测设备终止的失败,使用其中设备开始误 差已经被检测且排除的数据,并且位置校正已经被进行。在设备事件期间使用快速的最 近邻聚类算法来聚类对象的位置。如果没有事件终止误差,那么应只有一个在设备处被 居中的簇。如果不止一个簇出现,最靠近设备居中的最大的簇被认为包含有效事件,而 发生在别处的事件被排除。以下参考图7讨论根据某些实施方式,检测设备事件终止失 败的进一步细节。在某些实施方式中,在测量时期期间,将全部的所测量的动物的运动与已知的 动物行为比较,以用位置检测机制检测潜在的误差(113)。例如,负载束可能失灵,产 生位置测量的误差。在一个实施方式中,用于发生失灵的实例的筛选策略使用动物的爱 好(predisposition)来探索在24小时记录期的过程期间它们的笼外壳(enclousre)的整个区 域。负载束的饱和导致运动数据的截断或歪曲而比如中枢松开的问题还导致对产生运动 数据的截断的力的低估。以下参考图10讨论根据某些实施方式,的检测负载束或其它位 置检测器失灵的进一步的细节。类似地,对于其它类型的位置检测机制可以将位置数据 与已知的动物行为比较。另外,位置数据可以被检查用于边界违背,即,在测量区域以 外的位置,其中该对象不能到达该处。
以下讨论图1中操作的不同实施方式。A.检测设备开始误差检测潜在设备事件开始误差包括检测所记录的设备事件与独立地收集的位置数 据之间的不一致。例如,来自舔食测试器的信号可以在某个时间的位置数据指示小鼠或 其它对象在该时间不在设备处时,指示舔事件发生在该时间。在这样的情况下,误差或 者存在于设备数据收集或者存在于运动数据收集。在某些实施方式中,该发明的方法使 用位置信息来检测并标志潜在的不正确的设备事件以便移除和/或随后用户回顾。在某些实施方式中,一旦动物的位置数据和设备开始数据之间的不一致被识 别,即做出误差是来自设备数据收集还是来自运动数据收集的决定。如果确定误差来自 设备数据收集,该设备事件可以被自动地移除或者标志并呈现给用户以便确定是否移除 它。如以上所讨论的,当在特定时间的设备事件的指示与在该时间所测量的的动物 的位置不一致时,潜在事件开始误差被检测到。在某些测量系统,通过对于其所计算的 误差可能是个问题的机制来收集位置(运动)数据。该计算的误差被称为漂移。如果 在位置数据指示动物不在设备附近时设备事件发生,则或者大量的位置漂移或错误事件 开始已经发生。通过测量全部的位置漂移并将其与设备激活期间在所指示的动物的位置 中的漂移进行比较,能够区别这些可能性。如果在事件激活的时间,全部的位置漂移类 似于在设备激活的开始时动物的位置内的漂移,则事件将被认为有效。总的漂移和设备 漂移的差别给出了伪设备事件的可能性。图2是处理流程表,其显示了按照某些实施方 式,通过将设备事件漂移与总的设备漂移比较来检测事件开始误差的处理的概要。该处理通过在时限(time period)内测量动物对象的总的位置漂移(PD)而开始 (301)。(以下参考图4讨论测量总的位置漂移)。然后每个设备事件被考虑。对于给 定的设备事件,在事件开始的时间t所指示的或测量的动物对象的位置被获得(303)。然 后确定设备事件漂移(ED) (305)。确定(307)在时间t(PDt)的位置漂移和设备事件漂移 (ED)之间的差别。该差别被与阈值差别进行比较(309);如果该差别大于该阈值,该事 件被标志以呈现给用户(311)。可替代地,设备事件可以因错误及被移除的关联的数据而 被自动地分类。在确定框313,有对剩余的设备事件的核查。如果就对象和测量时期而 言存在剩余的设备事件,所标志的事件被呈现给用户以便回顾(315)。计算ED包括将在事件的时间处所测量的动物的位置与在测量窗口的事件的位置 的第一测量进行比较。如果该类型的第一事件被用于初始化测量区域的坐标,这将是在 基于设备的已知地点的事件期间所期望的动物的位置。对坐标的初始化被描述为以下描 述的运动位置校正的一部分。为了获得对总的位置漂移的估计,在最小和最大位置(X,Y,和/或其它)内 的漂移的估计被获得,其中该位置定义在所测量的区域内对象的运动的边界。在某些实 施时方式中,确定总的位置漂移包括使凸包(convex hull)在滑动的时间窗口内适合于相 对时间的X和Y位置,其中需要在该凸包每一侧上从最小到最大位置的距离必需大于该 笼或其它测量区域的宽度(X位置)或长度(Y位置)的某个百分比。可以使用适于特定 测量区域的任何类型的坐标系统。重叠的凸包被独立地扩展直到需要的距离被达到,产 生对最小和最大位置内总的漂移的估计。然后可平均该位置包络线(envelope),并且该平均被用于获得在数据收集期间在任何时间,对总的漂移的估计。如果该漂移由于不止 某个阈值(例如,X上10cm,Y上15cm)而不同于设备位置内的明显漂移,则该设备事 件被标志用于如操作311中的随后的回顾。图4是显示如以上所描述的获得总的位置漂移的关键操作的处理流程表。该处 理通过接受对于对象和测量时期的位置对时间数据开始(401)。对于位置坐标,例如X, Y和/或任何其它坐标,对于持续时间d及在时间^被初始化的窗口,使凸包适合位置对 时间的坐标(403)。凸包及时地被扩展到时间tn,在时间^该凸包包含预定义数量的坐标 位置单元,x(405)。例如,凸包可以被扩展直到该凸包包含测量区域的总宽度或长度等 的某个百分比(例如80%)。然后为了持续时间d、在时间tn初始化的凸包且被扩展的凸 包,操作403和405被重复直到需要的距离在时间tm被达到(407)。其被重复直到tm是 测量或观察时段,例如,1天。然后通过在任何时间沿着该凸包获得最大和最小位置的手 段来估计坐标的位置漂移,从而获得作为时间函数的位置漂移。对于每一个位置坐标, 执行图4中描述的该处理,生成例如在在Y-方向2cm及在X-方向_3cm的时间t = 3小 时位置漂移。事件开始失败的检测的图表例子被显示在图5A。这些图标图示了在24小时监 测时期总的位置漂移和舔食测试器事件漂移(蓝色)和光子束事件漂移(红色)之间的差 别。X和Y轴漂移被分别图示。在Y轴15cm及在X轴IOcm的情况下,用虚线指示标 志事件的该漂移差别阈值。在这个例子中,两个情况被标志,其中Y轴漂移差别超过舔 食测试器事件的阈值。该舔食测试器事件数据可以被自动地排除或者所标志的事件能够 被呈现给用户以便回顾,如图5B中的那样。B.运动位置校正(MPC)运动位置校正使用设备事件的已知地点来校正运动和位置数据。该MPC算法基 于设备的已知的地点,将在每一个设备事件开始处的动物的位置(如根据运动/位置数据 所计算的)与所期望的动物的位置进行比较。如果按照不止一个阈值数量,所计算的和 所期望的位置不同,则先前回路中的运动数据被校正。图6的处理流程表内示意了某些操作。该处理通过初始化坐标开始(601)。在 每个部分(测量时期)的开始处,动物对象的坐标被初始化。尽管任何适当的初始化可 以被使用,但在如图6所示的例子中该初始化可以发生在第一设备事件,该第一设备事 件具有根据在设备处的所期望的动物对象的位置初始化的动物对象的坐标。在第一设备 事件(或其它初始化)之前,动物的位置可以随后被再次计算(back-calculated)。在下一 个设备事件(DEn),如通过负载束、视频跟踪、其它位置检测机制等等所测量的一样, 基于该设备的已知地点将动物对象的位置与所期望的动物对象的位置比较(603)。此差别 为位置漂移(PD)。对于每一个位置维度(该离子中的X和Y)进行该比较。如果在设 备事件期间所测量的和所期望的位置之间的差别超过某个阈值(见决定框605),则通过 将穿过所测量的位置的该差别分布在DEn和先前的设备事件之间来校正数据集内的位置 数据(607)。可以按照位置之间运动的距离来加权(weight)该分布。对于下一个设备事 件DEn+1该处理被重复(609)直到在测量时期内的所有的设备事件被考虑到。对MPC工具在校正笼内小鼠的运动和位置数据方面的使用被显示在以上所讨论 的图2中。然而,MPC工具可以被用于各种实验性设置,其中动物对象与具有已知地点
26的任何设备的交互可以用来验证(validate)和校正位置信息。在图1中,MPC工具被显 示为在检测和除去错误设备开始之后被执行这可能是重要的,因为MPC依赖于所期望 的动物对象的位置以校正位置信息。在某些实施方式中,MPC工具可以在移除错误设备 事件之前被运行,并在它们被移除之后再次被运行。C.检测设备事件终止失败如以上所指出的,在某些实施方式中,检测设备未终止的例子包括使用最近邻 聚类算法。在设备事件期间的动物对象的所有位置被聚类。图7示出了处理流程表中的 关键操作该处理由接收用于特定设备的所有设备事件的所有位置数据开始(701)。如 以上所指出的,这是对于其设备开始误差已经被检测并且被排除、并且MPC工具已经被 运行或者再次运行的数据。对于每一个设备事件,获得从该事件的起始位置的最大位置 (703)。然后执行簇分析,以聚类这些最大位置(705)。如果没有事件终止误差,那么应 仅有一个在所期望的设备位置被居中的簇。如果不止一个簇存在,被居中最靠近所期望 的设备地点的最大的簇被认为包含有效事件,并且出现在别处的该事件被排除。因此, 最靠近所期望的设备位置的簇被接受(707)。除了所接受的簇,具有最大位置的所有事件 被移除(709)。本领域的技术人员将理解到可以使用不同的聚类和排除标准。应注意到 事件数据可以被自动地移除、或标志并且呈现给用户用于关于移除的决定。图8中显示了在小鼠家笼监测系统内聚类喂食及饮用事件的图表示例。在图8所 显示的例子中,在喂食器附件的喂食事件的簇(绿色方框)以及在靠近舔食测试器(蓝色 圆圈)附近的饮用事件的簇已经被标识。在相对角落的两个方框代表两个喂食事件期间 所确定的动物距离喂食器的的最大距离。红色指示它们落在有效喂食事件的标准以外。D.位置检测器失灵的检测在某些实施方式中,行为监测系统利用负载束作为确定动物运动和位置的力传 感器(force transducer)。偶然地,负载束可能失灵,在这些测量中产生误差。负载束的 饱和导致运动数据的切断或歪曲而诸如使中枢松散等问题可能导致对引起运动数据的切 断的力的低估。在其中这样的误差已发生的数据的例子被图表性地显示在图9,其中所测 量的位置为绿色。这些类型的误差的潜能不仅仅存在于负载束,而且存在于其它类型的 位置检测。例如,位置检测可以由于天气而在某些地理区域丢失接收/传输,该位置检 测依赖于诸如城市等大面积测量区域内的移动跟踪设备。在某些实施方式中,对这样的误差的检测包括在测量时期期间将所有校正的运 动位置与已知或期望的动物行为模式比较。一个例子是小鼠的偏好,以在24小时的测量 时期的过程内探索它的整个笼区域。另一个例子是人类对象的期望或者喜好,以在一天 或一周的过程期间漫游挨着工作地点设立的区域。在某些实施方式中,这样的误差的检测包括绘制所有校正的运动位置的凸包并 将该凸包与已知或所期望的动物行为模式进行比较。例如,该比较可以包括计算该凸 包所占居的测量区域的百分比。如果该凸包所占据了小于笼区域的某个百分比(例如 80%),则来自天或数据的其它测量时期的数据可以被标志用于随后的用户回顾。图10 是处理流程表,其显示了根据测量时期所接收的的位置数据,在检测位置检测器失灵的 一个实施方式中的关键操作。该处理由生成测量区域的凸包开始以定义测量区域足印 (1001)。可以使用其它方法来生成或使用测量区域足印的先存在的资料。在测量时期内,生成所有测量位置的凸包(1003),并且计算该凸包的交叉率(1005)。将该交叉与决 定方框1007内的阈值进行比较如果它大于该阈值,则该数据被接受,或者至少不被标 志(1011)。如果它小于该阈值,做出是否移除该数据的决定(1009)。可以在用户回顾 之后做出该确定,或者在其它实施方式中,数据可以被自动地移除。在某些实施方式中,将测量位置与测量区域的足迹的比较可以包括分析测量区 域的具体区域的重叠,例如城市的东北象限(quadrant)等。注意其它类型的位置误差检 测也可以被采用,包括检测边界违反(boundary violation)。将测量区域足迹与测量区域 的比较可以显示具有未知检测器的体系失灵,比如负载束饱和,如与比如从测量区域以 外所采集的寄生信号等已隔离的误差相对的。E.自动及用户数据质量控制的计算机执行方法如以上所描述的,数据质量控制算法可以包括与自动算法结合的一些用户回 顾。例如,由用户输入评价或以上所描述的自动算法产生的数据质量控制决定可以具有 三级结构,在该结构中每一个事件被分配1(使用)、2(标志以便进一步调查)、或3(不 使用)的质量。2的质量指示必需被调查者调查的潜在误差的存在。为了促进该调查, 提供将允许实验者观察和处理这些潜在误差的工具。数据可视化技术促进了对数据和被 标志的误差的检查,允许调查者确定每一个标志是否保证排除状态的降级或者到“可以 使用”状态的升级。在某些实施方式,可以在两个主要阶段(阶段1和阶段2)中执行质量控制处 理。在阶段1,自动算法被运行以搜索例如位置检测器失败、错误设备事件开始、位置 数据中累积的误差。潜在的误差可以被标志以便进一步调查。然后该实验者将使用图形 用户界面(GUI)处理所有被标志的误差。一旦其被完成,所有的运动数据将或者被排除 或者被校正。这整个处理的运动数据然后被运行通过第二阶段,其中设备终止算法使用 校正的位置数据来搜索及排除设备终止误差。在这点,对设备误差的所有自动检测被完 成,且来自设备事件之间的所期望的相关(例如光子束时间和舔数量)及摄取的任何大的 偏差将被标志以便调查。这样的偏差可能由数据输入误差或设备检测事件的失败引起。 然后试验者将使用GUI来观察并处理因为可能的数据输入或设备失败而被标志的数据, 以及已经被用户标志用于例如在食物漏斗非常低时、提高动物已经被剥夺食物的可能性 的回顾的数据。图16显示了阶段IQC GUI的屏幕快照。仪表盘A和B显示了阶段IQC GUI的 屏幕快照,其显示试验循环/小鼠/日期选择框(仪表盘A)以及补充的标绘选择器/观 察器(仪表盘B)。(使用Matlab导引GUI设计界面来制作所显示的该屏幕快照,Matlab 导引GUI设计界面允许将按钮、图等等放进设计并且允许改变它们的属性(即,颜色、 状态等))。在该选择框中,两个误差标志正被显示,“笼边界违反”和“漂移差别违 反”。漂移差别违反被清楚地呈现在仪表盘B的位置漂移差别图中。因为这些杂散的舔 的确似乎是实际上的舔设备失败,用户现在能理解第二误差的来源(“笼边界违反”); 因为在舔事件期间小鼠位置被运动位置校正算法使用以校正该运动,以上所标志的坏的 舔位置导致小鼠似乎运动超过笼子,如在仪表盘C中所显示的(MPC工具的副产品)。为 了校正这些问题,用户将使用GUI以通过点击“3”(在“Le”栏的)无线电按钮来排 除坏的舔,然后再次运行MPC工具。如在仪表盘D中所见的,该过程如所期望的移除
在某些实施方式中,通过简单地排除其漂移差大于某阈值的所有的舔来自动地 排除所排除的舔。然而,如以上所述描述的,计算漂移差的算法依赖于估计运动漂移的 算法的准确性。估计该漂移是非平凡的问题,所以在许多实施方式中,可以存在试验者 使用阶段IQC GUI检查任何被标志的舔或者喂食事件的需要。其它被标志的误差也能够 被以这种方式检查。图17显示了阶段IQC GUI的屏幕快照。这里我们看到被标志的失败到检测 (failure-to-detect)误差的例子。除了在该天的结束处的一个事件,图中的仪表盘A在 事件图中显示没有舔事件。然而,仪表盘B显示了小鼠那天消耗的水的数量不是异常 的——既不是在被与在实验的其它天上它的摄入比较,也不是与在实验中的其它小鼠的 摄入比较。这指出添设备失败到检测误差,而该小鼠的添事件数据和天必须被排除。然 而,事物射入量和运动数据不必被排除。再次,可以由使用阶段2QC GUI的实验者来检 查类似其的误差。用户界面及显示分类结果的进一步细节被包括在所附的附件1和2中。3.活动及非活动的状态分类本发明的其它方面涉及对活动和非活动状态的分类。通常,活动状态是其中 存在所增加的发生某些测量行为(包括运动)的可能性,在正处于特征地点(一个或多 个)中可能性大且休息和睡眠可能发生的不活动状态期间,被非活动状态所不时打断的 状态。活动和非活动状态之间的过渡代表自由行动的动物的行为组织的基本特征。以下 描述的将这些状态分类的方法和系统可以被跨种类等应用。同样,如指出的,这些方法 可以被用于除活动和非活动状态以外的其它状态的分类,其中存在行为或行为发生的高 可能性和/或正在特征地点的高可能性。在某些实施方式中,提供了用于自动化活动和非活动状态的对象指示的方案, 该活动和非活动状态如所指出的可以用作行为组织的基本特征。这允许对行为序列和生 理节奏及对活动状态特性的次昼夜影响的详细的分析。一旦活动和非活动状态被分类, 时域变化可以被表征。该特征的例子以下进一步讨论,以及在例子中。在某些实施方式中,活动状态分类包括得出活动位置持续时间阈值。具有比非 活动阈值长的持续时间的位置被分类为非活动。为了精确及更强地识别该阈值,有必要 确定两个参数时间窗口和空间过滤参数。该时间窗口被用于捕获其中使用单个基地 (homebase)的信号出现时间;在一段时期,动物可以重新定位它们的基地,例如,小鼠 可以被改变它的巢的地点,人类可以在两个地点之间走动,在一个住处(home)度过一些 夜晚而在第二个住处度过其它的夜晚等等。使用其中使用单个基地(无论该基地是哪个 或者在哪里)的时间窗口被用于确保睡眠和休息时间在不同的巢度过,第二住处地点等 等,被正确地识别为非活动状态。应用空间滤波器被来消除没有将动物从该基地的低点 移除的小运动,例如,在床上翻转的人,在巢内改变位置的小鼠等等。通过最小化状态 分类误差来选择时间窗口和空间过滤器的理想的组合。图11是显示分类活动和非活动状态的处理中操作的处理流程表。该处理由选择 时间窗口和运动阈值(1101)开始。数据集中的原始数据通常包括测量时期上的运动信息 (位置相对时间),例如12小时、24小时、36小时。如以上所描述的,在位置内的阈值
29变化处记录原始数据集中的运动数据。例如,对于Icm的阈值,在动物运动至少Icm时 运动信息被收集并被存储在原始数据集中。时间窗口可以从0变化到测量时期,例如, 对于24小时的测量时期,从0到24小时,1,2,4,6,12,24,等。可以通过选择运 动阈值来应用空间过滤器,该运动阈值可以从数据收集阈值中,例如lcm,2cm, 3cm等
等变化。非活动状态阈值然后被选择以定义非活动状态开始及偏移(1103)。如以上所指 出的,非活动状态阈值是将位置分类为非活动的阈值持续时间。以下参考图12进一步讨 论确定非活动状态阈值。应注意到,尽管取决于正在考虑的运动阈值,该非活动状态阈 值产生了不同的非活动状态。例如,如果非活动状态阈值为1小时,将状态分类为非活 动取决于该运动阈值如果动物1小时内移动10cm,如果运动阈值为15cm但不是如果 运动阈值为5cm,则该状态被分类为非活动。因此,一旦使用正在考虑得用于时间窗口 和移动阈值组合的非活动状态阈值来定义非活动状态开始及偏移,计算非活动状态误差 百分比(1105)。其在下文被进一步讨论,但在某些实施方式中,其还包括在被分类为非 活动状态期间(在此期间这样的事件不应发生)检查设备事件发生。然后校正,即,重 新分类,被错误地分类为非活动的状态(1107)。然后可以计算总的误差率(1109),艮口, 包括错误地分类为活动状态的误差率。整个分类和误差率处理(操作1101-1109)然后被 重复用于时间窗口和移动阈值的所有组合(1111)。基于该总的误差率来选择非活动分类 (1113)(即,如通过操作1107所校正的操作1103中执行的对活动状态的分类)。A.确定非活动状态阈值持续时间以定义非活动状态开始及偏移图12是示意确定非活动状态阈值操作的处理流程表。这是非活动状态的最小的 持续时间,即,动物不移动的最小持续时间(其中“移动”通过如以上所描述的运动阈 值来确定)。如以上所描述的(见图11的操作1103),该非活动的状态阈值持续时间定 义非活动状态开始和偏移,从而提供在测量时期期间对动物的行为的较高次序(order)的 时域分类。确定非活动状态阈值的处理由找出正在考虑的具有最常持续时间或LDP的时间 窗口 /运动阈值期间的位置开始(1201)。该LDP将根据时间窗口和运动阈值变化。然 后,所有其它位置距离该LDP的距离被获得(1203)。这些距离被按照这些位置的持续 时间的记录所图示。在图13中1301处显示了这样的在图处的例子。如可以从图13看 出的,该图表明了相对地靠近该时间窗口内的最长停顿的长停顿的簇或类(class)。非活 动状态阈值持续时间是在其中距离LDP的最大距离显著增加的持续时间。在某些实施 方式中,通过将停顿持续时间装仓(1207)及为每一个仓确定距离最长的停顿的最大距离 (1209)来出找出该持续时间。然后,使用最小二乘曲线拟合(least squares curve-fitting) 来使三条线适合于最大的停顿距离相对对数停顿持续时间(1211)。图13中的标绘1303, 第二和第三线的交叉处1305(S卩,距离LDP的最大距离显著增加的地方)可以被用于定 义不动状态的停顿阈值(1213)。然后非活动状态可以被定为为具有比非活动状态阈值大 的持续时间的连续的位置(或单个位置)(1215)。根据该标准,可以获得非活动状态开始 及偏移(1217)。图13中的标绘1305显示了从非活动状态阈值的应用所表明的笼内非活 动时期(红色)的组。这些状态被限制在动物的巢地点。获得非活动状态开始及偏移也 给出了活动状态开始及偏移。
B计算状态分类误差如上所描述的,找出最佳时间窗口 /运动阈值包括分类误差率。如果以上方法 在分类活动状态是准确的,则在非活动状态期间应没有设备事件发生。在某些实施方 式,确定摄入分类误差包括计算包含设备事件的非活动状态的百分比。活动状态分类误 差可以例如被确定为缺少设备事件及在此期间被动物覆盖的区域不大于非活动状态期间 被动物覆盖的所有区域中的最大的活动状态的百分比。然后可以例如通过对非活动和活 动状态分类误差求和,来从非活动和活动状态分类误差两者确定活动分类误差。图14是 显示计算状态分类误差的一个方法中的操作的处理流程表。该处理起始于接收非活动状 态开始及偏移(1401)。包含设备事件的非活动状态(即该开始和偏移之间的时期)被识别 (1403)。然后根据所识别的非活动状态的数量来计算非活动状态的误差率,在图14所示 的例子中,误差率是包含设备事件(1405)的非活动状态的百分比。储存该非活动状态误 差以便在计算总误差率中使用,因此运动阈值的合理性。然后校正分类使得没有非活动 包含设备事件(1407)。非活动状态的校正是基于用来定义非活动状态的标准,例如,具 有比非活动状态阈值大的持续时间的连续位置,因此具有设备事件的非活动状态可被再 分类到继续周围设备状态的单个设备事件中,可以被分成活动和不活动的状态等等。在 修整被实现后,基于所更新的分类计算活动状态误差率(1409)。按照某些实施方式,活 动状态误差率是通过查看在其中没有设备事件(例如,动物不吃,不饮用,不与刺激物 等交互等)及在其中动物未覆盖大面积的活动状态来计算的。在图14流程表中,例如, 活动状态误差率是在其中没有设备事件并在此期间由动物所覆盖的区域大于最大的非活 动状态区域的活动状态的百分比。每一个互动和非活动状态的区域可以通过使凸包适合 于每一个非活动及活动状态的位置来找出。然后可以基于非活动状态误差率来计算总的 误差率。4.发作分类使用作为行为元素的发作的概念来组织在活动状态内的行为。发作是被及时聚 类在一起并且没有其它行为干扰的行为的重复。为喂食、饮用及其它行为的量化,提供 用于发作识别的自动算法,该自动算法结合关于行为的时域和空间特性的信息。如上所 述,根据其识别发作的数据包括设备事件信息,例如,光子束中断表明在喂食器处存在 小数等。本发明的处理允许以自动的方式,将行为分类成行为和运动的发作,以及另外 地,允许发作的组织簇(organization-clusters)的较高级。对于发作的识别,通过评估每个设备事件结束与在该设备的随后的事件开始之 间(事件之间的间隔,IEIs)被动物所占据的地点到分类计划,可以将空间信息结合到分 类方案中。在某些实施方式中,如果动物在IEI期间离开了设备,那么干预行为已经发 生。因此,例如,动物在IEI期间逗留在设备的可能性被估计如果逗留在该设备的概 率大于0.5,则IEI被分类为“在设备”。行为的时域模式也被结合到该分类方案如果 事件被及时聚集,那么IEI持续时间,IDs,应表现出至少两个不同的类型可能发生在 喂食发作内的IDs以及可能发生在喂食发作之间的IDs。(参见,例如,Langton,S.D., Collett, D., and Sibly,R.M. (1995) .Splitting Behavior Into Bouts ; A Maximum Likelihood ApproachBehaviour 132, 781-799 and Tolkamp, B.J., Allcroft, D.J., Austin, E.J., Nielsen, B.L., and Kyriazakis, I. (1998) .Satiety splits feeding behavior into bouts.Journal
31oftheoretical biology 194, 235-250, both of which areincorporated herein by reference.)(参
见,例如,兰顿,SD,科莱特,D.和西布利,RM(1995年)。进入发作的分裂行为; 一个最大似然法行为132,781-799和Tolkamp,北京,阿克罗夫特,播音员,奥斯汀, 对EJ,尼尔森,BL与Kyriazakis,一(1998年)。饱食分裂喂食行为发作。理论生物学 杂志194,235-250,两者均以引用的方式被合并入此处。)在某些实施方式中,ID分布 被分为两个组(短和长)而IEI为短的概率被估计。然后,作为发作内间隔(WBI)或发 作之间间隔(IBI),对每个IEI的指定可以根据IEI发生在设备处的概率和它为短的概率两 者来作出。图15是显示将行为事件信息组成使用空间与时间信息的发作的方法中高级操作 的处理流程表。该处理起始于接收设备事件和运动信息(1501)。此信息包括空间信息, 该空间信息包括动物在事件和事件之间的时间(IEIs)期间的空间位置。如上所指出的, IEI是设备事件开始和随后的事件在该设备处的发生之间的间隔。所收到的信息还包括时 间信息,该时间信息包括事件之间的间隔的持续时间。为了识别发作,空间信息被通过 对于每个IEI评估由动物所占据的地点而结合到分类方案中。对于每个IEI,确定正在考 虑的位置,在该位置距离设备(最大限度远离IEI位置或MDIP)最远(1503)。然后根据正 在考虑的该设备的MDIPs来估计动物在IEI期间逗留在该设备的概率(1505)。时间信息 被结合到分类方案中,通过基于正在考虑的设备的事件之间的间隔的持续时间(IDs)来估 计IEI为短的概率(相对于长)。然后基于所估计的与空间相关及与时域相关的概率来将 IEI分类为处于发作内间隔(WBI)或发作之间间隔(IB),例如通过平均该概率(1509)。 然后将WBIs的未中断串(string)分类为正发作(1511)。图22示意了此方案区别于具有不同的空间及时域特性的IEIs的种群(population) 的证据。对于每个IEI,距离喂食器的最大距离被指示在在Y轴上而它的持续时间的对数 被指示在X轴。被指定为WBIs的IEIs以橙色显示,并且全部出现在喂食器周围。在绝 大多数IBI期间,动物偏离喂食器(绿色),其中水摄入发生在这些的子集中(蓝色)。 一小簇IEIs出现在喂食器(红色)周围,但由于它们的长的持续时间而被分类为IBIs。 因此,与单独地使用空间或时间信息相比,将空间和时间信息用于发作分类产生不同的 分类。A.将IEI分类为在设备处或离开设备如以上所描述的,在某些实施方式,通过估计可能性、或者将IEI分类为在设备 处或离开设备将空间悉信息结合到发作分类方案。在某些实施方式中,其通过在IEI期间 将二元正态的混合(mixture of bivariate normals)调整到MDIP来达成。使用快速最近邻 聚类算法来聚类所调整的二元正态的心迹线(centroid)。心迹线最靠近设备的二元正态的 簇被分类为“在设备处”(AD)。在该簇中的二元正态被指定为AD 二元正态(除了弥 漫性二元正态(diffuse bivariate normals)可以被排除)。AD 二元正态的较后的概率可以 被相加以产生每个最大地远离IEI位置(MDIP)是在设备处的概率估计。在某些实施方式 中,IEI被分类为发生“在设备处”如果概率是0.5或更高。在某些实施方式中,然后 使用该概率,与涉及的时域概率一起来将IEI分类为在发作内间隔或发作之间间隔,如以 上所描述的。图22A显示了对于笼内的小鼠,将二元正态调整到MDIPs的结果的例子。在左手边的仪表盘中,以不同的颜色和标志显示在最后的拟合中分配给九个二元正态分布的 所有的位置。在中间的仪表盘,只二元正态分部的心迹线被显示,其中该二元正态分部 被分类为以橙色显示的发生在设备和以绿色显示的所有其它二元正态分部。在右手边的 仪表盘,被分类为发生在喂食器的MDIP被以橙色显示而其它的位置被以绿色限制,指 示离开喂食器的行动在IEI期间发生。B.将IEI分类为短或长为了区分可能发生在喂食发作内的IDs以及可能发生再喂食发作之间的IDs,每 一个动物的ID分布与对数正态分布(Iognormaldistributions)的混合拟合。已经发现,分 布通过与出现的IDs的不同类型一致的3或更多对数正态分布的混合被最佳地拟合。然 后通过基于动物逗留在设备处的概率将对数正态分布分成两组(例如短和长)来确定IEI 为短的概率。在某些实施方式,通过将单变化正态调整到对数转换的IDs来确定相对于总的分 布为短的概率。图22B中显示了示例,该示例显示了五个被调整到对数转换IDs的单变 化正态。在图22B中,对数正态ID(min)被显示在χ轴,其中非正态的概率(该ID的 频率平方根)在y轴。然后将持续时间数据分区,通过找出每个正态分布的每个ID的后验概率。为 了将数据分区,然后由最短到最长存储该IDs。每个ID被硬聚类,S卩,根据正态分布索 引ID,它具有最高的后验概率,该后验概率属于在图22B所示的例子中,每个持续时 间,数据点将有1,2,3,4或5的索引。每当索引变化时,即,在硬聚类的识别从一个 簇变化到另一个时,将该数据分区。空间信息,然后被用来按照具有短或长或短的持续时间分类分区,其中短的持 续时间与是WBI的IEI的高概率一致(如上所述计算)。为了将分区持续时间分类为短 或长,给定组(例如Ob小鼠)的所有分区被结合,以减少个体差异的影响。作为对数转 换分区持续时间的均值(mean)的函数,平滑线被拟合到分区AD (在设备)概率。一个 例子被显视在图33中。对于WBI,组持续时间标准,IDWBI_group,然后被设置为持续时 间,在该持续时间动物可能被等同于逗留在或离开该设备。具有比标准少的平均持续时 间的所有分区被分类为短间隔分区,该标准的分区AD概率大于0.5。同样地,具有比组 持续时间标准少的平均持续时间的所有分区可以被分类为长间隔分区,该标准的分区AD 概率小于0.5。对于每一个动物,短和长分区之间的过渡可以被用作短IEI持续时间标准。然后 平均持续时间小于持续时间标准的单正态的后验概率被相加,以产生每个IEI为短的概率 的估计。5.移动发作分类本发明另一个方面涉及在活动状态(AS)期间但非另外的设备事件发作期间、将 运动分类到运动器运动(LM)或非运动器运动(NLM)中的方法。使用监督的学习算法来 达成其,该监督的学习算法将在非活动状态期间或摄入发作期间的运动用作训练集。因 为这些运动在一个有限的区域发生,它们代表“适当移动”(MIP)的行为并应反映NLM 事件的特性。因此,当动物在笼或其它测量区域周围移动时,MIP运动应不同于在行 动的发作期间发生的运动。在一个实施方式中,为了将参数化的MIP事件的训练集参
33数化,使用了每一个位置的转向角度(两个运动矢量的点产品的角度)和运动速率。然 后,最可能发生在行动期间的不间断的多串运动运动事件被用于定义行动发作的开始和 偏移。最后,活动状态内的时间可被分类为“其它”行为(如审视,养育,理毛,挖 掘,等)的发作,在该活动状态期间,动物未从事与某些设备(例如,摄入)或运动器发 作相关联的行为发作。结合运动发作分类的具体实施方式
的进一步讨论被包括在以下的例子中。6.比较聚类本发明的另一方面提供使用从各个对象所收集的信息以在动物的组之间进行比 较,从而研究基因、药品和环境因素对行为的神经调节的的影响的方法。对行为的时域 模式的详细量化评估,可以提供这样的实验操作对大脑功能的影响的高敏感的指标。在 解释发生在个体中的行为模式的变异性时,其需要用于在实验组中检测行为模式差别的 分析方法。提供了用于比较两个组或种群(如WT小鼠和OB小鼠)之间的行为模式的新方 法。聚类方法的比较确定模式是否在两个组之间不同以及识别最有助于任何所观察的差 别的模式的方面。参考活动状态(AS)开始时间和持续时间来讨论该算法的一个例子,尽 管本领域的技术人员将理解到把它应用到其它行为数据。该方法包括测试两个组具有例如AS开始时间和持续时间的相同模式无效假设。 其通过将所有天的AS开始时间及持续时间结合进该两个组(在无效假设下其是适当的) 及将所结合的数据中的每一个AS分配到多个簇之一被实现。对于每个簇,卡方统计然 后被基于控制并测试向簇贡献了等比例的ASs的组的无效假设来计算。在所有簇上的 卡的和被用作对日常模式内差别的测量。任何差异显着性可以通过在两个组之间交换动 物来确定任何差别的显著性,以获得卡方的原始和相对于交换后的卡方和的百分比等级 (percentile rank)。如果在全部模式中存在显著差别,通过获得被用于调整多个比较的每 一个簇的ρ值来找出最有助于该差别的部分模式,该多个比较使用分阶再采样算法3。见 特罗德尔(Troendle),J.F. (2000)。分阶正态理论多个测试程序控制错误发现率(Stepwise normal theory multiple test procedurescontrolling the false discovery rate)。统计规戈丨J禾口推理杂 志(Journal of Statistical Planning and Inference) 84,139-158,通过引用将其并入本申请。图18是显示根据某些实施方式比较两个组的方法中的操作的处理流程图。首 先,来自两个对比组的数据在无效假设下被组合(1801年)。通常,测试组和控制组是具 有行为测量数据或每个组中用于对象的正在考虑的数据的两个群体。选择簇的数量(1803 年)。下文进一步讨论选择簇的最优数量的处理。然后,所组合的数据集中的每个数据点 被分配到簇之一(1805)。基于无效假设为每一个簇计算卡方统计(1807年)。在整个所 有簇上对该卡方求和(1809)。如以上所述的,这是对两个组的模式之间的差别的测量。 然后动物对象被在两个组之间交换(1811年)。这样做是为了测试两个组之间的差别。 如果显著差异出现,多比较测试被执行,以找到有助于模式中的差别的簇(1813年)。图19是处理流程图,其示出了选择簇的最优数量的方法中的操作。如可以看出 的,它包括在组比较之间和内部之间的δ卡方的最小化ρ值。图19所示的处理是一个 例子,本领域技术人员将理解到可以进行变化及优化。7.计算机硬件
其应当是明显的,本发明的某些实施方式采用在指令的控制下行动的过程和/ 或在一个或多个计算机系统内存储的或在一个或多个计算机系统内传输的数据。某些实 施方式还涉及到执行这些操作的装置。该装置可以为所需要的目的而专门设计和/或构 造,或者它可以是通过在计算机所存储的或反之其它计算机可用的数据结构和/或一个 或多个计算机程序选择性地配置的一般目的的计算机。在此陈述的过程本质上是不涉及 任何特定的计算机或其他装置。特别地,各种一般目的的具有根据本申请的教导所写的 程序的机器可以被使用,或者可以更方便地构建更专业化的装置以执行所需要的方法步 骤。下文示出并描述用于各种这些机器的具体结构。此外,某些实施方式涉及到计算机可读介质或计算机程序产品,其包括用于执 行各种至少与以下任务相关联的计算机执行的操作的程序指令和/或数据(包括数据结 构)(1)从仪器获得原始数据,(2)执行自动的及用户界面的数据质量控制,(3)将活动 和非活动状态分类,(4)分析和表征这些状态中的时域变化,(5)分类的行为发作,(6) 分类运动发作,(7)跨组执行簇比较。本发明还涉及执行指令从而以执行任意或所有的 这些任务计算器装置。它还涉及到包括以指令编码以便执行这些任何的计算机可读介质 的计算装置。适于使用本发明的计算机程序产品和计算装置的有形计算机可读介质的例子包 括但不限于,如硬盘、软盘、及磁带的磁介质,如CD-ROM磁盘的光学介质;磁光介 质,半导体存储器件(例如,闪速存储器),以及比如读存储器(ROM)和随机存取存储 器(RAM)等被专门配置以存储和执行程序指令的硬件设备。在此所提供的该数据和程序 指令还可以被实现在载波或其它传输介质(包括电子器件或光学传导通路)。程序指令的例子包括如由编译器产生的低级代码,以及使用翻译器可通过计算 机执行的较高级代码。此外,该程序指令可以是机器代码、源代码和/或任何其它代码 直接或间接控制的计算机器的操作。该代码可以指定输入、输出、计算、条件、分支、 迭代循环等。图20A以简单的方块形式示意了根据某些实方式,在被适当地配置或设计时, 可用作计算装置的典型的计算机系统。该计算机系统2000包括耦合到存储设备的任何数 量的处理器2002 (也称为中央处理单元,或CPU),该存储设备包括主存储器1906 (通常 是随机存取存储器,或RAM)、主存储2004 (通常是只读存储器,或ROM)。CPU 2002 可以具有包括微控制器和微处理器的各种类型,如可编程器件(例如,CPLD和FPGA) 和如门阵列ASIC或一般目的的微处理器等非可编程器件。在所描述的实施方式中,主 存储器2004用以单向地向CPU传输数据和指令,而主存储器2006通常被用来以双向的 方式传输数据和指令。这些主存储器设备都可以包括任何如以上所描述的合适的计算机 可读介质。大容量存储器设备2008也被双向耦合到主存储器2006并提供额外的数据存 储容量,并且可包括上文所述的计算机可读介质中的任何一个。大容量存储器设备2008 可被用于存储程序、数据及类似物,大容量存储器设备2008通常是如硬盘等二级存储介 质。通常,这样的程序,数据等暂时被复制到主存储2006以便在CPU 2002上执行。将 认识到,在大容量存储器设备2008内保留的信息,在适当情况下,可以以标准的方式结 合为主存储器2004的一部分。如CD-ROM 2014等具体的大容量存储器设备也以向CPU 或主存储器单向地传递数据。
CPU 2002也耦合到接口 2010,该接口 2010连接到一个或多个比如视频监控、跟
踪球、鼠标、键盘、麦克风、敏感触摸显示器、传感器智能卡阅读器、磁性或纸带阅读 器、图像输入板、光笔、语音或手写识别外围设备、USB端口、或其它众所周知的比如 当然其它计算机等的输入设备的输入/输出设备。最后,CPU 2002可选地可以被耦合到 外部设备,比如使用在2012 —般显示的外部连接的数据库或计算机或远程通信网络。用 这样的连接,可以设想到在执行在此所描述的方法步骤的过程中,CPU可以从网络接收 信息或可以向网络输出信息。在一个实施方式中,如计算机系统2000的系统被用作数据导入、数据关联、及 能够执行部分或所有在此所描述的任务的查询系统。通过网络连接2012可以提供由研究 者下载的包括数据文件的信息和程序。可替代地,这可以在存储器设备上向研究者提供 样的信息、程序和文件。在具体的实施方式,计算机系统2000被直接耦合到数据获取系统,如微阵列或 从样本数据捕获的高吞吐量筛选系统。通过系统2000为分析通过接口 2012提供来自这 样的系统的数据。可替代地,从诸如数据库或相关数据的其它库等数据存储器源提供由 系统2000处理的数据。一旦装置2000中,如主存储器2006或大容量存储器2008等存 储设备至少暂时地缓存或存储相关数据。存储器也可以存储各种例行程序和/或用于导 入、分析及呈现数据的程序。本发明可以被实现在固定介质或可传播的程序组件中,其包含根据本发明的方 法,在被加载到适当配置的计算设备时、使该设备对数据集执行一个或多个分析操作的 逻辑指令和/或数据(例如,将行为分类为发作、识别行为发作的昼夜模式、在簇行为内 分类、比较组等)。图20B示出了数字设备,其可以被理解为能从介质2067和/网络端口 2069读 取指令的逻辑装置。装置2050此后可使用这些指令以直接分析行为数据直接,创建,排 序,搜索及读取行为数据库,等等。在某些实施方式,根据本发明数字设备可以被直接 连接到一个或多个笼行为系统,以及可选地实时地运行。在某些实施方式,数字设备可 以简化访问、分析和/或操作之前收集的数据。可以实现本发明的一种类型的逻辑设备是如2050中所示意的计算机系统,该计 算机系统包含CPU 2057、可选的输入设备20592061、磁盘驱动器2065和可选的监测器 2055。固定介质2067可被用于编程这样的系统以及可以代表磁盘类型的光学和/或磁介 质,和/或存储器或类似物。通信端口 2069也可以被用于编程这样的系统并且可以代表 任何类型的通信连接(例如到数据获取系统的连接)。本发明还可以被实施方式在专用集成电路(ASIC)或可编程逻辑设备(PLD)内。 在这种情况下,可以计算机可以理解的描述语言来实现本发明,该描述语言可被用于创 建像在此所描述的那样操作的ASIC或PLD。本发明的方法可以被实现宰本地化的或分布式的计算环境中。在分布式环境 中,该方法可以被实现在包括多个处理器的单个计算机上或者实现在多个处理器组成的 计算机上多样性的计算机上。这些计算机可以被链接,例如通过通用总线,但更最好的 计算机(一个或多个)为网络上的节点。该网络可以是一般化的或专门的本地或广域网 络,以及在某些优选实施方式中,计算机可以是内部网或因特网的组件。
在某些因特网的实施方式中,客户端系统通常执行Web浏览器并且被耦合到执 行Web服务器的服务器计算机。Web浏览器通常是比如微软的IE浏览器、或Netscape 或Opera等程序。在Web服务器通常但不必需是如IBM的HTTP守护进程或其它WWW 守护进程等程序。通过线路或通过无线系统与该服务器计算机耦合的客户端计算机是双 向的。相应地,与提供对实现本发明的方法的软件的访问的网站(该网站服务承载该网 站)耦合的服务器计算机可以是双向的。连接内部网或因特网的客户端用户能让客户端请求资源,该资源是托管提供对 本发明的方法的实现的应用(一个或多个)的该网站(一个或多个)的一部分。服务器 程序(一个或多个)然后处理该请求以返回所指定的资源(假设它们当前可用)。采用 标准的命名约定包括若干类型的地点名称,如众所周知的统一资源定位符(“URL”)。 该约定包含了若干类型的地点名称,目前包括比如超文本传输协议(“http”)、文件传 输协议(“ftp”)、地鼠程序,和广域信息服务(“WAIS”)等子类。在资源被下载 时,它可以包括额外资源的URL。因此,客户端用户可以很容易地了解他或她没有特别 要求的新资源的存在。实施本发明的方法(一个或多个)的软件可以本地运行在真正的客户端服务器架 构中的托管网站的服务器上。因此,客户端计算机向运行本地所要求的过程(一个或多 个)的主机服务器公布请求,然后下载返回的客户端的结果。可替代地,本发明的方法 可以“多层”形式被实现,其中通过客户端本地执行该方法(一个或多个)的组件。基 于客户端(例如,Java应用程序)请求,这可以通过自服务器下载的软件来实现,或者可 以通过“永久”安装在客户端的软件来实现。在一个实施方式中,实施本发明的方法的应用(一个或多个)被分成帧。在这 个范例中,如下是有利的不将应用程序更多的看作特征或功能的集合,而是,看作是 离散的帧或视图的集合。典型的应用,例如,一般包括一组菜单项,其中的每一个激活 特定的巾贞——亦即,指明应用的某些功能的形式。以这个角度来看,应用被认为不是代 码的单片体,而是小程序集合,或功能包。以这样的方式,在浏览器中,用户将选择将 相应地调用应用程序(即子应用)的特定帧的Web页链接。因此,例如,一个或多个帧 可为特定动物或品系提供输入和/或访问动物行为图的功能,而其它帧提供用于识别发 作、簇、昼夜模式等工具。除了将应用表示为帧的收集,应用也可以被表示为内部网和/或因特网的地 点;URL(统一资源定位器)地址指向应用。每个URL优选地包括两个特征URL的内 容数据(即,无论什么数据存储在服务器上)连同数据类型或MIME(多用途互联网邮件 扩展)类型。该数据类型允许Web浏览器确定应该如何解释从服务器(例如,如解释作为 位像的gif文件)所接收的数据。实际上,这用作对一旦在浏览器接收到数据怎样处 理该数据的描述。如果二进制数据流被以HTML类型接收,则浏览器将其呈现为HTML 页。另一方面,如果相反它收到位图类型,则浏览器将其呈现为位像,等等。在Microsoft Windows中,存在着不同的技术,以允许主机应用注册感兴趣的对 象(即,特定类型的数据)。一种技术是用于向Windows注册特定文件扩展中的兴趣的 应用,以便(例如,doc- “Microsoft Word文档”);这是Window应用采用的最常见的 技术。在Microsoft对象链接和嵌入(OLE)中采用的另一种方案是使用类(class)全局唯
37一标识符或GUID-表明特定服务器应用的16-字节标识符来调用(以托管具有GUID的文 档)。类ID是被注册在被连接到特定的DLL (动态链接库)或应用服务器的特定机器。在一个特别关心的实施方式中,用于与文档关联的主机应用的技术是通过使用 MIME类型。MIME提供封装文档对象的标准化技术。它包括用于指示哪个应用适于托 管该文档的MIME头,以适于通过因特网传输的格式所包含的全部。在一个优选实施方式中,本发明的方法被以使用MIME类型而部分地实现,以 使用本发明的该方法。MIME类型包含本地创建文档(如Microsoft ActiveX文档)所需 的信息,但是其另外还包括查找和下载用于呈现文档的视图的程序代码,如果必要。如 果该程序代码本地已经存在,则只需要为更新本地备份的目的下载。这定义了一个新的 文件类型,其包括支持可下载的用于呈现文档视图的程序代码的信息。MIME类型可以与APP的文件扩展相关联。带有APP扩展的文件是由OLE DocObject执行的OLE文件。因为APP文件是文件,它能被放置在服务器上并且被链接以 使用HTML HREF。该APP文件优选地包含以下数据片(1) ActiveX对象的CLSID,其 为按照适合于使用本发明的方法的一种或多种方式来实现的OLE文档查看器(viewer); (2)可以找到对象的代码的代码库的URL,以及(3)(可选地)被请求的版本号。一旦 APP DocObject处理器代码被安装并注册APP MIME类型,则其可以被用来将APP文件 下载到用户的Web浏览器中。在服务器侧,由于APP文件确实是文件,Web服务器简单地接收请求并给客 户端返回文件。当APP文件被下载时,APPDocObject处理器要求操作系统下载APP 文件中所指定的对象的代码库。通过CoGetClassObjectFromURL函数,该系统功能在 Windows是可用的。在ActiveX对象的代码库被下载之后,APPDocObject处理器要求浏 览器在其自身创建视图,例如通过调用在探索器(Explorer)文档地点上的ActivateMe方 法。该IntemetExpl0rer然后后退调用DocObject以例示视图,它通过从已下载的代码创建 ActiveX视图对象的例子进行其。一旦被创建,ActiveX视图对象获得在Internet Explorer 中被适当地激活,其创建了适当的表格(form)以及所有它的子控件。一旦创建了表格,它能建立退回到任何远程服务器对象的连接,它需要执行它 的功能。在这点,用户可以与该表格交互,其将出现嵌入在Internet Explorer的框架中。 当用户变化到不同的页面时,浏览器假定负责最后关闭和破坏该表格(以及放弃任何未 连接到远程服务器的其它连接)。在一个优选的实施方式中,从终端用户的桌面,系统的入口点是企业主页或者 其它的的特定网站的主页。该页可选地以常规的方式可以包括多个链接。响应于用户点 击应用页面的特定链接(例如,提供本发明的方法的功能的页面),Web浏览器连接到驻 留在服务器的应用页面(文件)。在一个用户请求访问本发明的方法的实施方式中,用户被指引到特定页面类 型,例如,原地执行Web浏览器内的应用(执行本发明的方法的一个或多个元素)的应 用(appdoc)页面。由于每个应用页面使用URL来定位,其它页面可以具有到它的超链 接。通过制作包含到该应用页面的超链接的目录页可将多个应用页面组合在一起。当用 户选择指向该应用页面的超链接时,Web浏览器下载的应用程序代码并执行浏览器内的 该页面。
一旦浏览器下载该应用页面,浏览器(基于已定义的MIME类型)调用本地处理 器,用于类型的文件的处理器。特别地,该应用页面优选地包括全局唯一标识符(GUID) 和用于识别远程(下载)应用以为托管该文件而调用的代码库URL。给定了文档对象以 及以应用页面到达的GUID,本地处理器查找客户端计算机,以查看主机应用是否已驻留 在本地(例如,通过检查Windows 95/NT注册表)。在这点本地处理器可以选择调用本 地备份(如有)或下载该主机应用的最新版本。下载代码的不同型号通常可用。在代码被下载时,“代码库”说明(文件)最 初从服务器请求。代码库自身可以从简单的DLL文件到包含多个压缩文件的柜体文件 (Cabinet file) (Microsoft.cab文件)。继续进一步,信息(如Microsoft.inf)文件可被用于
指导客户端系统如何安装已下载的应用。这些机制在选择应用的哪个组件被下载以及何 时被下载方面有足够大的灵活性。在某些实施方式中,被用于自动地下载程序代码本身的机器有赖于标准的 Microsoft ActiveX API (应用编程接口)调用。虽然ActiveX API不提供对Web传递的应
用的本地支持,它的API可以被调用,以定位程序代码的正确版本、将它复制到本地机 器,验证它的完整性、以及向客户端操作系统注册它。一旦代码已经被下载,处理器可 以继续调用现已出现的应用主机以呈现文档对象(以类似于通过注册表调用主机应用的 方式,如果它已经被安装)。一旦主机应用程序(OLE服务器)在客户端被加载,客户端系统可以采用OLE文 档视图架构,以在浏览器中正确地呈现该应用,包括使用常规的OLE方法以便将应用的 菜单添加到浏览器的菜单以及以便根据浏览器的新大小来正确地再次调整该应用的大小 (与要求应用在单个Active X控件的矩形(前面提到的限制)内执行相反)。一旦该应用 在客户端被执行,它可以执行诸如使用RPC(远程进程调用)方法的远程逻辑。以这种 方式,优选地被作为远程进程(一个或多个)执行的逻辑仍然可以被使用。在某些优选的实施方式,本发明的方法被实现为一个或多个提供了以下功能的 框架。组织、搜索、保存、和找回原始行为数据或减少/数据行为数据(例如,由本发 明的设备产生的数据)的功能(一个或多个),识别和/或分类发作的功能,识别/分类 发作的簇的功能,识别/分类昼夜模式的功能,在发作行为内分类/识别的功能,比较和 对比行为一览表的功能,以图形化表示行为一览表的功能,等等。此外,该功能还可以可选地提供对通过本地因特网络和/或内部网可访问的私 有和/或公共数据库的访问,借此数据库中所包含的一个或多个行为一览表可以被输入 到本发明的方法内。实现内部网和/或计算和/或数据访问过程的内部网,对于本领域技术人员是众 所周知的,并且被详细地进行了证明(例如,见克卢尔等。(1992)为总体框架面向对象 的查询,国立SIGMOD上的数据,加州圣迭戈,管理国际会议,6月2日五,1992年, SIGMOD记录优化,第二卷。21,第2期,6月,1992年;斯通布雷克,米,编辑; ACM出版,页。383 392,ISO标准ANSI和工作草案,“信息技术数据库语言SQL”, 吉姆梅尔顿,编辑,国际标准化组织和美国状态标准学会,1992年7月,微软公司“的 ODBC 2.0程序员参考和SDK指南。微软..商标为Microsoft Windows和Windows NT.... ..商标,微软开放式数据库连接..商标..软件开发工具包“,1992年,1993年,1994年微软出版社,页打开数据库标准。3304156,国际标准化组织工作草案,“数据库语言 SQL的第2部分基金会(的SQL/基础)”,CD90752 199。志。SQL中,1997年 9月11日,等等)。本领域技术人员认识到在不脱离本发明的范围的情况下,可以对这种配置做出 修改。例如,在两层配置中,执行的WWW网关的功能的服务器系统也可以执行Web服 务器的功能。例如,上文所述的实施方式中的任何一个可以被修改,以除了 URL以外的 其它形式来接受来自用户/用户终端的请求。另一个修改还将涉及对多个管理环境的适 应性修改。Mi对于家笼行为模式的分析,小鼠被单独地圈养在家笼监测(HCM)的笼中14 天。最初的4天被认为是适应时期,而接下来的10天的数据被用于得出并分析行为元素 及它们的模式。获取的对于每只小鼠的多天的数据允许我们开发对每只小鼠的平均日常 行为的详细描述,以及评估每天根本的行为元素和它们的模式的再现性。1.实验过程A.动物肥胖自发突变的小鼠纯合(homozygous) (Lepob, B6.V-Lepob/J OB)和小鼠 (WT)的控制CWBL/W被从杰克逊实验室(JacksonLaboratory)(巴尔哈伯(Bar Harbor), ME)获得。在UCSF通过将htr2c-等位基因(基于C57BL/6J背景的同类系)的杂合雌性 与从从杰克逊实验室获得C57BL/6J雄性交合来繁殖承受伴性的htf2c基因(Tecott等人, 1995)及控制WT WT litter mates的无效突变的血清素2C受体突变体雄性(2C)。用于 htr2c-等位基因的基因通过PCR分析来执行。以12小时光/黑循环在在室温(18_23°C ) 圈养动物,其中可以自由地接触水和标准的食品饮食(PicoLab Mouse Diet 20,Purina Mills, Richmond, IN)。根据照顾病使用实验室动物的健康指导的状态研究所和加利 福尼亚大学动物研究协会的指导(the guidelines of the National Institutes of Health Guide for Care and Use of Laboratory Animals and the University of California Committee on Animal Research)来进行试验。B.数据收集雄性小鼠被单独地圈养在家笼检测系统(HCM)中14天,该家笼检测系统由 45x24x17cm的有机玻璃外壳组成,其中喂食器和水瓶被安装在一个端部。金属丝斜面 使进入到4x4cm喂食器成为可能,其中动物可以通过将它们的头穿过2.5x2.5cm的小孔 侵入到食物柜中来获取粉末状的食品。为了检测喂食,头部浸入打断了被放置在斜坡中 开口下方的光子束(DiLog仪器,Tallahassee,FL)。为了检测饮用,动物从附着于被放 置在具有0.5x2.5cm的孔金属板后的水瓶的金属喷口舔。该金属喷口允许来自待检测的 舔接触的容量变化(DiLog仪器,Tallahassee,FL)。为了监测动物的重心的位置,我 们将有机玻璃外壳放在具有中心枢轴点并且两个负载束在前面的活动监测平台上(DiLog 仪器,Tallahassee,FL)。数据被收集到放置在相邻房间的个人计算机(DiLog仪器, Tallahassee, FL)。摄入事件文件记录开始和光子束的偏移以及舔接触、每毫秒采样的中 断。运动事件被定义为动物的重心超出了 1厘米的半径的变化(在以500毫秒过滤移动 的平均窗口之后,根据动物的身体重量和两个负载束上的力在线计算的)。运动事件文件
40记录了每隔20毫秒所采样的运动事件的开始以及在χ和y所移动的距离。为了确定食物和水的摄入,在数据收集被再次启动之后数据收集被停止而重新 称食物和水的重量。日常维持的该时期发生在9和11时之间并且小于2小时。每一天, 我们在通过按照Y7个分割按照X笼的3个分割所定义的21个区段之一中,记录动物的 巢的地点。我们从11-14周龄的雄性小鼠收集数据WKn = 8)和OB (η = 8) ; WT (η =16)而 2C(n = 16)。为了证实对光子束中断时间的使用以及舔接触数量如日常食物和水摄入的测量 一样,在初始数据收集之后,我们对于小鼠的子集在3天的7am,在3天的7am和7pm, 以及在3天的7am、1pm、7pm、和IOpm称食物和水的重量。具有横跨一天的不同时 间的设备测量的摄入的强相关证实这些设备测量可被用于估计一天中任何时间的输入量 (对于所有的小鼠两个摄入设备,喂食R2(平均士sd,小鼠的数量)WT0.95±0.04N =8,2C 0.97士0.01N = 6 ;饮用 R2 WT 0.98士0.01,N = 8,2C 0.98士0.01N = 8 ; P < 0.0001)。为了估计跨时间的摄入,我们通过总的食品摄入除以总的光子束中断时间 来计算喂食系数(mg/s),以及通过总的水摄入除以总的舔接触数量来计算舔系数(mg/ lick)。通过喂食系数乘以光子束中断持续时间或舔系数乘以舔接触的数量,我们估计跨 时间的摄入。C.数据简化及质量控制大量的行为数据需要建立有效的评估及最大化数据质量的方法。为了达成这 个目标,我们使用每一个数据收集设备的输出来交叉检查笼中其它设备的性能。以 MATLAB编程语言在内部开发的数据质量控制算法自动地检测误差并且标记该数据以便 排除或以便由试验者使用内装式的图形用户接口来回顾。为了便于分析,对于所有的设 备,仅具有无误差数据的小鼠天被用在分析中。i.对摄入时间开始误差的检测我们估计位置中的总漂移(见下文的运动位置校正)并且将其与动物在摄入事件 开始期间的位置中的偏移进行比较。为了估计总的位置漂移,我们在最小和最大动物位 置如何在日常数据收集期间随时间变化之后,(分别为χ和y)计算位置包络线。例如在X,这可以通过使用由在X的位置所组成的时间序列以及计算多个凸包 来达成,该凸包的顶点定义了 X位置相对时间的包络线。最初,我们使第一凸包适合于 该天的第一个15分钟内的χ数据。然后,该包被扩展直到动物所经过的最大距离至少在 X上为15cm(或在y为35cm),表明该动物已经穿过大多数的笼(在X或Y)。然后我 们在前一个凸包结束后,调整包括下一 15分钟内的数据的下一个凸包。该包被以与第一 个凸包相同的方式扩展。我们继续使凸包适合于χ数据,直到整个日常的数据收集时期 被覆盖。其产生了位置包络线,该包括线定义了动物在笼类的运动的边界,提供对漂移 如何在最小和最大X位置随时间变化的估计。最大和最小位置中的漂移的估计被平均, 从而估计X位置中的漂移。如果该漂移与摄入设备位置中的明显漂移不同在X超过IOcm 或在y超过15cm,摄入和运动设备事件被标志以便随后的回顾。事件发生误差导致排除 3个小鼠天(3m0USedayS)的光子束中断数据及4个小鼠天的舔接触数据。ii.运动位置校正
因为我们使用加在活动平台负载束上的力来估计位置,可以由于改变笼内质量 的分布而将误差引入到这些估计中(由于从笼的前方移除食物和水,对基座(bedding)、 排尿、及排便的移动引起的)。为了校正这些误差,我们首先使用喂食和舔检测设备的已 知地点来设置在该设备处时所期望的动物的重心的位置。该期望的位置在该天的第一设 备检测期间被设置,因为该位置将有最小数量的漂移。然后基于输入设备的地点在根据 运动数据预计的随后的摄入事件位置和所期望的位置之间,进行比较(在排除了如上的 错误的输入事件开始之后)。如果所预测的和所期望的位置差别在X或Y超过2cm(平均 差士运动事件的33 士 9%),我们校正发生在当前和后续的摄入事件之间的位置如下 1)分别为χ和y确定位置漂移,2)总漂移被按照在每一个运动事件之间移动的距离分配 在所加权的位置之间。iii.对摄入事件偏移误差的检测检测摄入事件的偏移的失败可能发生在喂食器光子束变的被食物微粒阻塞时。 为了检测这种误差,使用被称为Ameoba的快速最近邻聚类算法聚类横跨假定光子束中断 期间的小鼠的所有天的所有位置。为了识别发生在光子束中断期间的不同的簇,我们使 用了 5cm的簇标准。只有一个被居中在该设备处的簇存在指出所有的摄入事件偏移时间 是准确的,因为小鼠在所有的设备事件期间是靠近设备的。当不止一个簇出现时,我们 假设被居中的最靠近摄入设备的最大的簇包含有效事件。我们排除在其它簇中的事件, 因为动物在这些事件期间是远离该设备的。这导致从480个总的小鼠天中排除了 68个小 鼠天的光子束中断(14%)。同样的算法被用来测试对舔事件误差的检测,但没有检测到 这样的误差vi.对其它误差的检测数据也因为数据收集中的若干特异性误差而被排除。对于被观察在喂食器中的 睡眠的一个小鼠而言,第13-14天的光子束中断数据被排除。对于一个小鼠因为它在第 12天排空了食物漏斗并且可能已经被剥夺了食物,所以第12-14天的所有数据被排除。 所有,对于在WTOB群组中的所有小鼠,由于控制缺失导致第8天监测室内温度若干小 时为31°C,所以所有第8-9天的数据被排除。D.不活动状态分类对于每个小鼠,行为被分成两个状态非活动状态(IS)和活动状态(AS),在非 活动状态期间,小鼠靠近单个地点度过了较长的时段,在活动状态期间,动物在笼的周 围移动。通过得到如以上所描述的非活动位置持续时间阈值来完成该分类。具有比非活 动阈值长的持续时间的位置被分类为非活动。因为在一段时端上,动物可以重新放置它 们的家笼,我们变动时间窗口以在单个家笼被使用期间捕获信号出现时间(epoch)。空间 滤波器被应用于消除没有将动物从家笼的地点移除的小的运动。为了选择适当的时间窗 口和空间滤波器,我们最小化状态分类误差,如参照图11在上文所描述的。时间窗口是从2-24小时(2,3,4,6,12,24小时起始于昼夜时间零,(灯 标))变化。作为空间滤波器,我们使用从Icm至8cm(1,2,3,4,5,6,8cm)变化的 运动阈值,该运动阈值靠近这些小鼠(参考)的体长。对于每一个时间窗口长度和运动阈 值的组合,我们计算所有的位置距离每一个窗口中具有最长持续时间的位置的距离。与 每个位置相关联的是持续时间和在该窗口中道最长持续时间的距离。然后这些位置被关于它们的持续时间的对数而放入仓中(不包括空仓的仓宽度为0.1对数毫秒)。利用非线 性最小二乘回归,我们使三线适合于每个仓中的最大距离。第二和第三的交叉处被设置 为小鼠的非活动阈值。然后,我们通过将相邻的非活动位置聚集来定义IS开始及偏移。为了确定IS分类误差,我们计算包含输入事件的IS的百分比。为了确定AS分 类误差,我们识别没有摄入事件的AS,其中小鼠所覆盖的区域不大于IS期间小鼠所覆盖 的所有区域中的最大。状态分类误差然后被通过求IS和AS分类误差的和来计算。然 后,我们使用1x7重复的测量ANOVA差别比较(WTOB 2cm; WT2C 3cm),来选择产生 了最低状态分类误差的运动阈值。窗口持续时间没有显着地改变误差率并且被设置为最 大的窗口(WTOB 12小时;WT2C4小时)。利用这些运动阈值和时间窗口,群组的状态 分类误差率(平均士sd)为WTOB 7士 10% ; WT2C 5士 10%以及非活动阈值(平均值 士sd) WTOB WT 5士 1 OB 13士4 ; WT2C WT 8士2 2C 8士2,分钟。按照误差分类的状 态在进一步分析之前被校正。E.摄入发作分类对于每一个小鼠,我们通过检查一个摄入事件的偏移和下一个摄入事件(事件 之间的间隔,IEIs)的开始之间的所有间隔的特性分别将发作分类,用于喂食和饮用。为 了将每一个IEI分类成发作内间隔(WBI)或者发作之间间隔(IBI),我们检验两个特性 1)小鼠在IEI期间逗留在设备处的概率和2)IEI相对于IEI持续时间的全部分布的持续时 间。在IEI分类后,发作开始及偏移随着摄入事件之间的发作内部间隔的不中断串而被识 别。根据发生在暗周期期间的IEI s的分类来分别进行发生在光周期期间的IEI的分类。IEI期间动物在设备处的概率通过使二元正态(下文讨论拟合过程的细节)适合 于IEI期间(图T2A)距离设备最远的位置(X,y)来估计。使用被称作amoeba的快速 最近邻聚类算法来聚类适合的二元正态的质心。Ameoba允许簇在任何方向成长,只要簇 内的任何点具有比用户组距离标准更近的最近的邻。距离标准从1到2.4cm变化,产生 二元正态的簇。其质心最接近的该设备的二元正态的簇被分类为“在设备处”(AD)。 在该簇中,该二元正态被指定为AD 二元正态,其排除了弥漫性二元正态。然后,我们 对AD 二元正态的后验概率求和,以产生每一个最大地离开IEI位置(MDIP)是在设备处 的概率的估计。变形虫的最终距离标准被选择以铜鼓最小化分类熵来最小化两组之间的 重叠,
厶 A「O pik <0.5Ec = -ΣΣ& ^g(Pik),Zik = /
i=lI1 ^ik - U·J其中plk是对于位置i和簇k在设备处的概率,Nc是簇的数量而Nd是位置的数量 (Biernacki et al.,2000 ; Celeux and Soromenho,1996)IEI相对于全部的分布为短的概率通过使单变化正态(适合过程细节下文描述) 适合于对数转换的IEIs (图22B)来确定。然后,我们从最短到最长来排序IEIs并且定义 连续的IEIs之间的分区的边界,其中硬聚类标识(Zlk)从一个簇到另一个是变化的。对于 单个小鼠,这导致3至9个喂食IEIs的分区及4至15个饮用IEIs的分区。分区数量的 变化主要是因为峰的可变数量小于喂食的1分钟及小于饮用的一秒。对于喂食,峰值的 数量内跨小鼠的变化可以反映小鼠如何处理食物的差别(例如头部侵入对爪子喂食)。 对于饮用,跨小鼠的变化反映了在舔事件发作期间错过舔的数量与某些小鼠在高度一成
43不变的舔的流中频繁地错失一个或两个舔接触的差别。这产生1至3个峰,该峰比是小 于预期的正态分布(kurtotic)等,这些山峰比所期望的正态分布(kurtotic)窄使得这些峰中 的每一个可能需要不止一个正态分布,以提供对IEI分布足够适合的适合度。由于分区数量的变化,我们利用空间信息来将具有短或长持续时间的分区分 类,其中短持续时间与作为WBI的IEI的高概率一致。由于我们期望具有短持续时间 的间隔将由增加的的在设备处剩余的概率来表征,我们检查每个分区中平均持续时间之 间的关系,以及动物在摄入设备处的概率(图33)。分区持续时间被以下面的方式分类 为长或短。为了将分区持续时间分类为短或长,我们组合指定组(如OB小鼠)的所有 分区,以减少个体差异的影响。然后我们按照对数转换分区持续时间的函数,使平滑线 (lowess,跨度20%的数据点的总数)适合于分区AD概率(图33)。对于WBI,组持续 时间标准IDWBI_group然后被设置为持续时间,在该持续时间小鼠可能被等同于逗留在或者 离开设备。平均持续时间小于分区AD概率大于0.5的所有的分区被分类为短间隔分区。 类似地,具有平均持续时间大于其分区AD概率小于0.5的组持续时间标准的所有分区被 分类为长间隔分区。一些分区(<1%)既不符合这些标准,也未给出它们的最近的邻分 区分类。对于每个小鼠,短和长分区之间的过渡可以被用作短IEI持续时间标准, IDWBIm。然后平均持续时间小于持续时间标准的单正态的后验概率被相加,以产生每 个IEI为短的概率的估计。对于异常的弥漫单正态(sd大于1.5),比标准短的IEI的后验 被增加到短组并且大于标准的IEI后验被增加到长组。最后,IEI的概率是发作内间隔,其通过平均小鼠在IEI期间在设备处的以及IEI 为短的概率来确定。然后,我们将IEI分类为发作内,如果该概率估计大于通过下式给定 的标准
权利要求
1.一种过滤使用测量系统在测量时期内所收集的一组动物行为数据的方法,其中所 述数据包括关于在定义的测量区域内的动物对象的空间位置的事件信息、关于在所述定 义的区域内在已知地点处的多个设备处或具有在所述定义的区域内在已知地点处的多个 设备的所述动物对象的行为的设备事件信息、以及与所述位置和设备事件信息相关联的 时间信息;所述方法包括接收所述收集的行为数据;分析所述行为数据以检测1)与设备事件信息不一致的位置信息,其中所述检测基 于所述设备的所述已知地点,和/或2)与用于任何其它设备的设备事件信息不一致的用 于一个或多个设备的设备事件信息,其中所述检测基于与所述设备事件相关联的时间信 息;以及基于至少一些所述检测的不一致来更新所述数据。
2.根据权利要求1所述的方法,其特征在于,其中与用于任何其它设备的设备事件信 息不一致的用于一个或多个设备的所述设备事件信息包括识别在同时的或重叠的时间期 间、或者在小于阈值时间期间的间隔发生的用于第一和第二设备的设备事件。
3.根据权利要求1所述的方法,其特征在于,其中分析所述行为数据包括识别错误设 备事件开始。
4.根据权利要求1所述的方法,其特征在于,其中检测与设备事件信息不一致的位置 信息包括通过基于所述设备的所述已知地点将至少一些设备事件期间的所述位置信息与 所述动物的所述期望的位置相比较来计算对所述位置信息的校正。
5.根据权利要求1所述的方法,其特征在于,其中检测与设备事件信息不一致的位置 信息包括识别并除去由所述测量系统检测设备事件的终止的失败所产生的数据。
6.根据权利要求1所述的方法,其特征在于,其中所述设备事件信息包括关于所述动 物对象的固体和/或流体消耗的信息。
7.根据权利要求1所述的方法,其特征在于,其中所述定义的区域包括笼区域。
8.根据权利要求1所述的方法,其特征在于,其中所述动物对象是啮齿动物。
9.根据权利要求1所述的方法,其特征在于,其中所述设备包括食物消耗指示器。
10.根据权利要求1所述的方法,其特征在于,其中所述设备包括流体消耗指示器。
11.根据权利要求1所述的方法,其特征在于,其中所述设备包括药物消耗指示器。
12.根据权利要求1所述的方法,其特征在于,其中所述设备包括所述动物对象的对 感觉刺激物的响应、操作性(operant)响应、或对新对象的响应的指示器中的至少一个。
13.—种过滤使用测量系统在测量时期内所收集的一组动物行为数据的方法,其中所 述数据包括关于在定义的测量区域内的动物对象的空间位置的事件信息以及关于在所述 定义的区域内的已知地点处的一个或者多个设备处或者具有在所述定义的区域内的已知 地点处的一个或者多个设备的所述动物对象的行为的设备事件信息;所述方法包括接收所述收集的行为数据;识别错误设备事件开始以及移除关联的设备事件信息;基于所述设备的所述已知地点,通过将至少一些设备事件期间的所述位置信息与所 述动物的所述期望的位置相比较来计算对所述位置信息的校正;基于所述计算的校正来更新位置信息;以及识别并除去由所述测量系统检测设备事件的终止的失败所产生的数据。
14.根据权利要求13所述的方法,其特征在于,其中识别错误设备事件包括在所述测量时期内,以时间的函数的方式来计算测量的位置中的漂移;对于每一个设备事件,将在设备事件的时间处的测量的位置中的所述漂移与所述设 备事件漂移相比较。
15.根据权利要求14所述的方法,其特征在于,其中识别错误设备事件还包括对 于每一个设备事件,计算在所述设备事件的时间处的测量的位置中的所述漂移与所述设 备事件漂移之间的差别,以及如果所述差别超过预定义的阈值,则将所述设备事件标志 为潜在的设备事件开始误差。
16.根据权利要求15所述的方法,其特征在于,其中识别错误设备事件和移除关联的 设备事件信息包括向用户呈现被标志的设备事件的列表,用于确定是否移除与所述被标 志的设备事件中的每个相关联的事件信息。
17.根据权利要求14所述的方法,其特征在于,所述方法还包括通过沿所述定义的区 域内对时间的坐标生成所述动物的测量的移动的边界的位置包络线来对于每一个位置坐 标,计算测量的位置内的所述漂移。
18.根据权利要求17所述的方法,其特征在于,其中测量测量的位置内的所述漂移包 括对于每一个坐标,从所述位置包络线来估计所述位置内的所述最小和最大漂移。
19.根据权利要求18所述的方法,其特征在于,所述方法还包括平均最大和最小位置 中的所述漂移,以在测量时期内,计算在测量的位置内对时间的所述漂移。
20.根据权利要求17所述的方法,其特征在于,其中生成位置包络线包括将连续 的凸包拟合到对时间的所述坐标位置,其顶点定义了相对于时间的所述坐标位置的包络 线;并且其中拟合凸包包括扩展所述包直到在所述凸包的每一侧上从所述最小到所述最 大位置的距离至少是预定义的量。
21.根据权利要求20所述的方法,其特征在于,其中所述预定义的量至少是所述测量 区域沿所述坐标的总长度的70%。
22.根据权利要求13所述的方法,其特征在于,其中识别并移除由所述测量系统检测 设备事件的终止的失败产生的数据包括接收与特定设备相关联的用于所有设备事件的位置信息;对于每一个设备事件,确定具有从所述设备事件的起始位置的最大距离的位置;执行簇分析以聚类所述最大距离位置;接受基于所述设备的所述已知地点,在设备事件期间最靠近所述动物的所述期望的 位置的簇;移除在所述接受的簇外部与具有最大距离位置相关联的所有的设备事件信息。
23.根据权利要求13所述的方法,其特征在于,所述方法还包括检测所述测量系统中 的平台误差,其中检测平台误差包括生成所述测量区域的凸包,以定义测量区域足迹;生成在测量时期内的所述动物的所有测量的位置的凸包;计算所述凸包的重叠;基于所述凸包和关于在所述定义的测量区域内的所述动物的运动的先前已知信息之间的重叠的量来确定是否排除在所述测量时期内所述被收集的数据。
24.一种在测量时期内所收集的一组动物行为数据中识别可能的错误设备事件的方 法,其中所述数据包括关于在定义的测量区域内的动物对象的空间位置的事件信息以及 关于在所述定义的区域内在已知地点处的设备处或具有在所述定义的区域内在已知地点 处的设备的所述动物对象的行为的设备事件信息;所述方法包括对于所述测量时期,以时间的函数的方式来计算所述位置测量的总的漂移;以及对于每一个设备事件,将基于所述设备的所述已知地点的所述动物的所述期望的位 置与在所述设备事件期间所述动物的所述测量的位置相比较,以计算设备事件漂移,并 且将所述设备事件漂移与在所述设备事件的所述时间处的所述总的漂移相比较。
25.一种计算在测量时期内所收集的一组动物行为数据中的位置测量内的漂移的方 法,其中所述数据包括关于在定义的区域内的动物对象的空间位置的事件信息,所述方 法包括生成连续的对时间的位置的凸包,以由此生成定义在所述测量时期期间,所述动物 对象的所述测量位置的边界的位置包络线;从所述位置包络线,以时间的函数的形式确定最大位置中的漂移和最小位置中的漂移;从所述最大和最小位置漂移,以时间的函数的方式计算总的位置漂移。
26.根据权利要求25所述的方法,其特征在于,其中总的位置漂移对于每一个空间维 度而言被独立地计算。
27.根据权利要求26所述的方法,其特征在于,其中所述生成对时间的位置的连续 的凸包包括将连续的凸包拟合到对时间的维度位置,所述凸包的顶点相对于时间定义 了所述维度位置的包络线;并且其中拟合凸包包括扩展所述包直到在所述凸包的每一侧 上,从所述最小到所述最大位置的距离至少是所述定义的区域的总的维度长度的预定义 的百分比。
28.根据权利要求25所述的方法,其特征在于,其中所述总的位置漂移通过平均所述 最小和最大位置内的所述漂移而被计算。
29.一种校正在使用测量系统在测量时期内所收集的一组动物行为数据中的动物位 置信息的方法,其中所述数据包括关于在定义的区域内的动物对象的空间位置的事件信 息,以及关于在所述定义的区域内的已知地点处的一个或多个类型的设备处的或具有在 所述定义的区域内的已知地点处的一个或多个类型的设备的所述动物对象的行为的设备 事件信息,所述方法包括接收用于测量时期的对象的相对于时间的位置数据;接收关于在一个或多个类型的设备处的动物行为的设备事件信息;通过将在所述第二设备事件处的所述动物对象的所述测量的位置与基于所述设备的 所述已知地点的所述动物的所述期望的位置相比较,来校正第一和第二设备事件之间的 测量的位置,确定所述测量的和期望的位置的差别是否超过预定义的阈值,以及,如果 所述差别超过了所述预定义的阈值,则通过将所述差别跨所述测量的位置分布以由此校 正它们而调整所述位置信息。
30.根据权利要求29所述的方法,其特征在于,其中按照由连续的位置之间的距离而加权的方式来分布所述测量的与期望的位置之间的差别。
31.根据权利要求29所述的方法,其特征在于,所述方法进一步包括初始化在类型的 第一设备事件处的空间位置坐标,以及校正所述类型的所有随后的设备事件和所述类型 的先前的设备事件之间的测量的位置。
32.根据权利要求29所述的方法,其特征在于,所述方法包括为一个或多个类型的设 备事件校正类型的所有连续的设备事件之间的运动位置。
33.—种识别测量系统检测在使用所述测量系统在测量时期内所收集的一组动物行为 数据中的设备事件的终止的失败的方法,其中所述数据包括关于在定义的区域内的动物 对象的空间位置的事件信息以及关于在所述定义的区域内的已知地点处的一个或多个类 型的设备处或者具有在所述定义的区域内的已知地点处的一个或多个类型的设备的动物 对象的行为的设备事件信息;所述方法包括接收在具有共同类型的所有设备事件期间的位置信息;对于所述类型的每一个设备事件,确定具有距所述设备事件的起始位置最大距离的 位置;执行簇分析以聚类所述最大距离位置;接受在基于所述设备的所述已知地点的设备事件期间最靠近所述动物的所述期望的 位置的簇;将与具有最大距离位置的事件相关联的设备事件信息移除到所述接受的簇之外。
34.一种检测用于收集动物行为数据的系统内的平台失灵的方法,所述数据包括关于 在测量区域内的动物对象的空间位置的事件信息,所述方法包括生成所述测量区域的凸包,以定义测量区域足迹;生成在测量时期内的动物的所有收集的位置的凸包;计算所述凸包的重叠;基于所述凸包和关于在所述定义的测量区域内的所述动物的运动的先前已知信息之 间的重叠的量来确定是否排除在所述测量时期内所述被收集的数据。
35.根据权利要求34所述的方法,其特征在于,其中所述系统包括用于检测动物对象 的所述空间位置的负载束。
36.根据权利要求35所述的方法,其特征在于,其中检测平台失灵包括检测负载束饱 和失灵。
37.一种计算机执行的过滤并显示一组动物行为数据的方法,所述数据包括关于在定 义的区域内的动物对象的空间位置和运动的事件信息以及关于在所述定义的区域内的已 知地点处的一个或多个设备处或者具有在所述定义的区域内的已知地点处的一个或多个 设备的所述动物对象的行为的设备事件信息;所述方法包括接收所述收集的行为数据集;识别潜在的错误设备事件开始;识别潜在的错误运动事件;将所述识别的潜在的错误设备事件和识别的潜在的错误运动事件信息呈现给用户;接收用户选择的将与所述识别的错误信息相关联的质量指示,其中从用户向计算机 系统的输入接收所述指示;基于所述用户选择的质量指示从所述行为数据移除设备事件信息,以生成更新的数 据集;以及基于所述更新的数据集来校正位置信息。
38.根据权利要求37所述的计算机执行的方法,其特征在于,所述方法进一步包括, 使用所述校正的位置信息,识别由所述测量系统检测设备事件的终止的失败产生的数 据。
39.根据权利要求37所述的计算机执行的方法,其特征在于,其中识别潜在的错误设 备事件包括计算在所述测量时期内在位置测量中的总的漂移;以及对于每一个设备事 件,将基于所述设备的所述已知地点的所述动物的所述期望的位置与在所述设备事件期 间所述动物的测量的位置相比较以计算设备事件漂移,并且将所述设备事件漂移与在所 述设备事件的所述时间处的总的漂移相比较。
40.根据权利要求39所述的计算机执行的方法,其特征在于,其中将所述识别的潜在 的错误设备事件和识别的潜在的错误运动事件信息呈现给用户包括呈现显示在所述测量 时期内、在位置测量中的所述总的漂移的标绘。
41.根据权利要求39所述的计算机执行的方法,其特征在于,其中将所述标识的潜在 错误设备事件及标识的潜在的错误运动事件信息呈现给用户包括呈现显示对于每一个设 备事件的总的漂移与设备事件漂移的差别的标绘。
42.根据权利要求37所述的计算机执行的方法,其特征在于,所述方法还包括将从所 述期望的相关的偏离呈现给所述用户。
43.一种分析使用测量系统收集的动物行为数据的自动化的方法,所述行为数据包括 关于在定义的测量区域内的动物的位置的空间和时间信息,所述方法包括使用所述空间和时间信息识别所述动物对象的活动状态和非活动状态之间的过渡。
44.根据权利要求43所述的方法,其特征在于,所述方法还包括使用所述空间信息和 所述时间信息两者来表征识别的活动状态内的行为状态。
45.一种分析使用测量系统收集的动物行为数据的方法,所述行为数据包括关于在定 义的测量区域内的动物的位置的空间和时间信息,所述方法包括使用所述空间信息以识别活动和非活动状态之间的过渡包括确定在一个时间期间动 物对象运动之间最长的持续时间的地点。
46.根据权利要求45所述的方法,其特征在于,其中使用所述空间信息识别活动和非 活动状态之间的过渡还包括确定所述动物对象的其它位置在所述时间期间距离所述最长 的持续时间地点的相对距离。
47.根据权利要求45所述的方法,其特征在于,其中识别活动和非活动状态之间的过 渡包括确定非活动位置持续时间阈值。
48.根据权利要求45所述的方法,其特征在于,所述方法还包括使用空间信息和时间 信息两者表征识别的活动状态内的行为状态。
49.一种从使用测量系统在测量时期内所收集的动物行为数据中识别动物对象在时间 窗口期间的非活动状态的方法,所述动物行为数据包括关于在测量区域内的所述动物对 象的空间位置的事件信息;所述方法包括接收关于在所述时间窗口期间所述动物对象的所述空间位置的事件信息;分析所述事件信息以确定关于所述时间窗口内的位置的持续时间的信息; 确定所述时间窗口内的最长的持续时间位置;确定关于距离所述最长的持续时间位置的每一个位置的所述空间距离的信息;以及 使用所述距离和持续时间信息来识别所述动物对象在所述时间窗口中的非活动状态。
50.根据权利要求49所述的方法,其特征在于,其中所述动物行为数据还包括关于在 所述测量区域内的已知地点处的一个或多个类型的设备处或者具有在所述测量区域内的 已知地点处的一个或多个类型的设备的所述动物对象的行为的设备事件信息,以及还包 括识别发生在所述识别的非活动状态期间的任何设备事件。
51.根据权利要求50所述的方法,其特征在于,所述方法还包括基于非活动状态误差 率更新所述分类。
52.根据权利要求50所述的方法,其特征在于,其中所述非活动状态误差率是在所述 识别的非活动状态期间设备事件的发生。
53.根据权利要求50所述的方法,其特征在于,所述方法还包括将具有设备事件的非 活动状态重新分类为活动状态。
54.根据权利要求53所述的方法,其特征在于,所述方法还包括计算活动状态误差率。
55.根据权利要求54所述的方法,其特征在于,其中计算活动状态误差率包括将每一 个活动状态期间由所述动物对象占据的区域与非活动状态期间由所述动物对象占据的区 域进行比较。
56.根据权利要求49所述的方法,其特征在于,所述方法还包括在所述测量时期内对 于多个时间窗口识别所述动物对象的非活动状态,以及选择时间窗口。
57.根据权利要求49所述的方法,其特征在于,所述方法还包括对于多个运动阈值识 别所述动物对象的非活动状态,其中所述运动阈值在确定位置的持续时间中定义两个连 续的位置之间的最小距离,以及选择运动阈值。
58.一种分析使用测量系统在测量时期内所收集的一组动物对象行为数据的自动化的 方法,包括接收在测量时期期间在定义的区域内所述动物对象的位置跟踪信息以及关于在所述 测量时期期间一个或多个行为的时间模式的信息;以及使用所述位置跟踪信息和所述时间信息来识别所述一个或多个行为的发作。
59.根据权利要求58所述的自动化的方法,其特征在于,所述方法还包括接收关于在 所述定义的测量区域内的已知地点处的一个或多个设备处或者具有在所述定义的测量区 域内的已知地点处的一个或多个设备的所述动物对象的行为的设备事件信息,其中每一 个设备与特定行为相关联。
60.一种分析使用测量系统在测量时期内所收集的一组动物对象行为数据的方法,所 述方法包括接收关于在所述测量时期期间所述动物对象的空间位置的空间信息以及关于在所述 测量时期期间一个或多个行为的时间模式的信息;使用所述空间信息和所述时间信息来识别所述一个或多个行为的发作;其中所述空间信息包括关于在事件和事件之间的间隔期间所述动物对象的所述空间 位置的信息,其中所述事件之间的间隔是在设备处的连续的设备事件之间的间隔。
61.根据权利要求60所述的方法,其特征在于,其中使用空间信息来识别行为发作包 括对于每一个事件之间的间隔确定事件之间的间隔位置的最大地距离(MDIP),其中所述 MDIP是在事件之间的间隔期间所述动物对象距离所述设备的最大距离。
62.根据权利要求61所述的方法,其特征在于,其中使用空间信息来识别行为发作还 包括将每一个MDIP分类为正在或远离正在考虑中的所述设备。
63.根据权利要求62所述的方法,其特征在于,其中将每一个MDIP分类为正在或远 离正在考虑中的所述设备包括确定在所述事件之间的间隔期间所述动物正在所述设备处 的概率。
64.根据权利要求63所述的方法,其特征在于,其中使用空间信息来识别行为发作包 括将二元正态的混合模型拟合到所述确定的MDIPs。
65.根据权利要求64所述的方法,其特征在于,其中拟合所述混合模型包括使用采用 来自先前正态分布的本地数据集的创建的自动化的初始化方法来将每一个前分布分裂成 二个,用于进一步的用所有可能的组合的初始化。
66.根据权利要求60所述的方法,其特征在于,其中所述时间信息包括关于每个事件 之间的间隔的持续时间的信息(ID),其中事件之间的间隔是在设备处的连续的设备事件 之间的间隔。
67.根据权利要求66所述的方法,其特征在于,其中使用时间信息来识别行为发作包 括将对数正态分布的混合拟合到所述ID分布。
68.根据权利要求67所述的方法,其特征在于,其中所述对数正态分布基于所述动物 逗留在所述设备处的概率而被分裂成两个组。
69.根据权利要求67所述的方法,其特征在于,其中所述对数正态分布基于关于在所 述事件之间的间隔期间所述动物的位置的空间信息而被分裂成两个组。
70.根据权利要求60所述的方法,其特征在于,其中使用所述空间信息和所述时间信 息来识别所述一个或多个行为的发作包括对于每一个事件之间的间隔,估计所述动物在 所述设备处的概率以及将所述事件之间的间隔的持续时间与其它事件之间的间隔的持续 时间相比较。
71.—种将测试组的行为数据模式与控制组的行为数据模式相比较的方法,所述方法 包括接收包括与测试动物对象的组相关联的行为数据的测试数据集;接收包括与控制动物对象的组相关联的行为数据的控制数据集;将来自所述测试和控制数据集的所述行为数据组合;将所述组合的数据组聚类成选择的多个簇;对于每一个簇基于所述控制和测试数据集合中的所述行为数据是相同的假设来计算 卡方统计;对于所有的簇求所述卡方统计的和,以获得所述测试组数据和所述控制组数据之间 的差别的测量;通过在所述测试和控制组之间交换用于所述动物对象的数据来获得所述差别的显著的测量;以及如果所述差别是统计显著,则确定最有助于所述差别的簇。
72.根据权利要求71所述的方法,其特征在于,所述方法进一步包括通过最小化内部 之间及组比较之间的σ卡方的ρ值来选择多个簇。
73.根据权利要求71所述的方法,其特征在于,其中运动的模式被比较。
74.根据权利要求71所述的方法,其特征在于,其中喂食的模式被比较。
75.根据权利要求71所述的方法,其特征在于,其中引用的模式被比较。
76.根据权利要求71所述的方法,其特征在于,其中药品摄取的模式被比较。
77.根据权利要求71所述的方法,其特征在于,其中睡眠的模式被比较。
78.根据权利要求71所述的方法,其特征在于,其中与测试对象接触的模式被比较。
79.根据权利要求71所述的方法,其特征在于,其中对另一个动物或感觉刺激物的反 应的模式被比较。
80.根据权利要求71所述的方法,其特征在于,其中操作性响应的模式被比较。
81.根据权利要求71所述的方法,其特征在于,其中生理测量被比较。
82.根据权利要求81所述的方法,其特征在于,其中所述生理测量选自心律、代谢 率、血压和体温中的一个。
83.根据权利要求71所述的方法,其特征在于,其中活动状态频率或持续时间被比较。
84.根据权利要求71所述的方法,其特征在于,其中非活动状态频率或持续时间被比较。
85.根据权利要求71所述的方法,其特征在于,其中行为发作频率或持续时间被比较。
86.根据权利要求71所述的方法,其特征在于,其中摄入量信息被比较。
87.一种动物行为监测系统,包括 定义的测量区域;在所述定义的测量区域内的已知地点处的多个设备,以收集关于在所述定义的测 量区域内的动物的行为的数据,其中所述数据包括关于在所述定义的测量区域内的动物 对象的空间位置的事件信息,关于在所述定义的区域内的已知地点处的多个设备处的或 具有在所述定义的区域内的已知地点处的多个设备的所述动物对象的行为的设备事件信 息,以及与所述位置和设备事件信息相关联的时间信息;被配置为从所述多个设备接收所述收集的行为数据的接口; 用于存储所述收集的行为数据的一个或多个存储器;一个或多个处理器以分析所述行为数据以检测1)与设备事件信息不一致的位置信 息,其中所述检测是基于所述设备的所述已知地点,和/或2)与用于任何其它设备的设 备事件信息不一致的用于一个或多个设备的设备事件信息,其中所述检测是基于与所述 设备事件相关联的时间信息;以及基于至少一些所述检测的不一致来更新所述数据。
88.一种动物行为监测系统,包括 定义的测量区域;在所述定义的测量区域内的已知地点处的多个设备,以收集关于在所述定义的测 量区域内的动物的行为的数据,其中所述数据包括关于在所述定义的测量区域内的动物 对象的空间位置的事件信息,关于在所述定义的区域内的已知地点处的多个设备处的或 具有在所述定义的区域内的已知地点处的多个设备的所述动物对象的行为的设备事件信 息,以及与所述位置和设备事件信息相关联的时间信息;被配置为从所述多个设备接收所述收集的行为数据的接口; 用于存储所述收集的行为数据的一个或多个存储器;一个或多个处理器用于识别错误设备事件开始并移除相关联的设备事件信息;通过 将至少在一些设备事件期间的位置信息与基于所述设备的所述已知地点的所述动物的所 述期望的位置相比较来计算对所述位置信息的校正;基于所述计算的校正来更新位置信 息;以及识别并移除由所述测量系统检测设备事件的终止的失败所产生的数据。
全文摘要
提供了用于分析在定义的区域内的动物对象的各种行为的系统和方法,包括用于过滤和分析高分辨率行为数据的工具。这些系统和方法提供了以先前未被实现的精度及量化水平来检查行为模式的机会。提供了管理和分析由行为监测系统产生的非常大且唯一的数据集的方法和系统,其包括质量评估和控制、存档、数据查询、数据简化、分析过程及可视化技术。自发性行为的这种细节分析提供了对行为的神经组织的基本理解并且能够实现以高敏感度对基因、药理学和环境对脑功能的影响的检测。
文档编号G06E1/00GK102016745SQ200980110652
公开日2011年4月13日 申请日期2009年1月21日 优先权日2008年1月23日
发明者劳伦斯·特科特, 卡特林·申克, 埃文·古尔丁 申请人:加州大学评议会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1