时空自组织映射的制作方法

文档序号:6567096阅读:266来源:国知局
专利名称:时空自组织映射的制作方法
技术领域
本发明涉及利用自组织映射的数据分析,尤其涉及例如人体传感器网 络中的时空数据分析。
背景技术
自组织映射是一种熟知的神经网络中的工具,如果存在从输入空间到 输出空间的非线性投影,就能实现高维输入空间的可视化,其中,所述输
出空间通常被布置为输出单元的二维阵列。自组织映射的训练(training) 和应用是所熟知的。
实质上,自组织映射将输入空间区域与特定的输出单元或输出单元组 相关联。为了利用自组织映射来进行分类,可以用相应的类别标签对每个 输出单元进行标记,从而输出单元的激活表示对自组织映射的输入属于与 该输出单元相关联的类别。
人体传感器网络,即分布在对象身体上的传感器网络,可以用在多种 应用领域中,例如用于健康护理中,其中需要监视对象的活动。这种人体 传感器网络是必须处理静态和动态数据的分类的应用的具体例子。静态数 据可以从诸如坐、站立或躺的姿势中获得,动态数据可以从诸如走路、跑 步或骑车的活动中获得。利用可以佩戴在对象身体上的人体传感器网络来 提醒护理者例如病人活动的变化,这是需要将静态数据和动态数据两者分 类为属于给定类别集(set)中之一的例子。
由于自组织映射不是自然地捕获时间信息,因此如果输入空间不仅具 有空间结构而且具有时间结构,即属于特定类别的输入信号不是恒定的而 是随时间变化的,则会出现特别的问题。因此,如果时间上波动的信号被 提供给自组织映射的输入,则输出将简单地根据输入的波动而波动,而不 提供时间结构的任何有用处理。

发明内容
在独立权利要求l、 10、 14以及16中陈述了本发明的一些方面。进 一步地,在从属权利要求中描述了可选的特征。
通过在用于静态输入信号的静态映射和用于动态输入信号的动态映 射之间进行自动地切换来提供一种时空自组织映射。动态映射利用输入的 时间变化的表示从而能对较宽范围的数据进行分类。如下面关于具体实施 例所论述的,映射之间的自动切换可以基于输入的时间变化的多个量度中 的一个或多个。


现在参考仅作为示例的多个具体实施例以及结合附图来描述本发明, 其中
图l是一个具体实施例的方框图2是才艮据该具体实施例的训练时空自组织映射的方法的流程图3是应用时空自组织映射的方法的流程图4和5是可替换实施例的方框图;以及
图6是人类对象身上多个传感器的定位的示意性表示。
具体实施例方式
总的来说,将要描述的实施例是建立在用于进行分类以提供一种对动 态数据和静态数据两者进行分类的方法的自组织映射的构思上。这种数据 的一个例子是M类对象身上的加速度传感器获得的数据。例如走或跳的 活动将会产生来自至少一些加速度传感器的动态信号,而不同的姿势例如 站或坐将会产生表示各种传感器关于重力的方位的静态信号(静态传感器 生成对由于重力而导致的加速度进行度量的大小和方向基本恒定的信号, 当然传感器噪声除外)。
对两种类型的数据进行分类是通过以下方式实现的分别训练静态映 射和动态映射,定义判断变量,并根据用于判断变量的阈值在静态映射和 动态映射之间切换而实现的。这是一种两阶段推理过程,其中数据首先利 用适当的自组织映射而被分类为动态或静态,该自组织映射随后被用于分 类正确的姿势或活动。静态映射和动态映射之间的主要区别在于各自的输
入表示-静态映射釆用原始或有条件的数据向量(例如釆用低通滤波), 而动态映射采用每个传感器信号的时间变化的量度来作为输入。
参照图l,在一个具体的实施例中,第一静态映射110响应输入数据 112而生成输出。响应输入数据112的映射110的输出被用于计算切换参 数的装置114接收,其中,模式选择装置116利用所述切换参数将输入数 据的给定的记录或者分配给第一映射110或者分配给具有相应的特征提 取117的第二动态映射118。可以使这种模式选择结构重复几层,从而采 用具有直到最终映射120的相应特征提取的多个映射。
现在参照图2论述根据该具体实施例的训练时空自组织映射的方法。 在训练的准备中,获得包括多个数据记录的数据集合。为给定姿势或活动 的试验记录下每个记录,并且每个记录被标记有其相应的类别标签。数据 记录包括数据样本的时间序列,并且可以被细分为一个或多个时间窗,其 中每个时间窗包括多个样本。每个数据样本包括具有多个特征或值的数据 向量,其中每个特征是在记录样本时从一个传感器的传感器通道或多个传 感器的M感器通道得到的。
在步骤210中,为静态数据构造第一静态映射(i-l),并在步骤212 中进行初始化。在步骤214中,利用适当选择的数据来训练该映射。由于 第一静态映射既对静态数据进行分类又提供选择参数(参照下述),因此
以这样的做法用于第一映射的训练数据集合除了包拾铮态数据外还应该 包括从动态活动中获得的数据或在动态活动中出现的身体形态。因此,用 于静态映射的训练数据应该在静态数据和动态数据的整个输入空间中被 均匀地采样。然而,实际上,只要覆盖了整个输入空间,则对输入空间进 行适当的稀疏的采样就足够了。例如,只要覆盖了整个输入数据空间,则 从所有数据记录中均匀采样得到的数据样本的随机采样的子集就是足够 的了。
可利用任何传统的用于自组织映射的训练算法实现映射本身的训练, 例如利用下面以伪码表示的算法
1. 初始化权向量wj ,学习邻域函数(neighbourhood function )hj,i(x)(t) 的速率和"有效宽度,,o(t)。
2. 对于每个输入向量x(t), (t是时步指数(time step index)): a. 确定获胜(winning )输出单元i(t),<formula>formula see original document page 8</formula>
b.计算邻域函数,
<formula>formula see original document page 8</formula>
其中dj,i是输出单元i和j的权向量之间的距离。
c. 更新IUi输出单元及其相邻单元(Neighbours)的权向量,
<formula>formula see original document page 8</formula>
d. 减小"有效宽度,,o(t)(排序状态(ordering phrase))和学习
速率n(t)。
3.重复步骤2直到满足收敛条件为止;如果需要的话就再次利用输 入数据。
一旦静态映射的训练已经收敛,则静态映射的输出就被用于为数据集 合之中的每个记录计算切换^L为此,每个数据记录的样;^t应用于该 映射,并记录其输出。切换参数必须是来自每条记录的输入的时间变化的 量度。在该具体实施例中,映射的输出的时间变化的量度,即用于每个样 本的获胜输出单元的激活,被用作为输入的时间可用性(availability)的 量度。
根据激活的输出单元(p)上的概率分布或在后续的时间步(d)激 活的输出单元之间的过渡距离,可以计算映射的输出的时间可用性的多个 量度
1. 归一化熵0>)=
2. 能量^)=|>2
3. 最大值(p)=腿a
艺-_p,l0g2(/7,.)
4. 标准—偏差(p)=、 -刃2
5. 变化系数(p)-标准-偏差(p)/平均值(p)
6. 平滑度(p"、 +标准—i偏差(p)
其中向量p表示时间窗中输出单元激活中的被激活的输出单元
i-l...N上的概率分布,N表示时间窗中提供的样本数量,p(i)是激活输出 单元i的样本被N除的数量。
7.平均j巨离<formula>formula see original document page 9</formula>
其中W是时间窗中样本的数量,向量d中每个元素d(i,i+l)表示在时 刻i被激活的输出单元与在时刻i+l被激活的输出单元之间的距离。
归一化熵在0 (静态数据)和1之间变化,高度动态的输入接近1 (归 一化熵为l相应于所有输出单元被激活的概率相等)。概率分布的能量和 最大概率在静态情况下具有最大值l,而在动态情况下较小。标准偏差的 变化系数和概率分布的平滑度在静态情况下具有最小值0,在动态情况下 增加,对于大的标准偏差平滑度接近l。
接着,将选择的时间变化的量度与阔值进行比较,以便在静态数据记 录和动态数据记录之间进行区另U,并在步骤218中将整个数据集合划分为 用于第一静态映射的数据记录和用于分类的第二动态映射的数据记录。为 了在静态映射和动态映射之间进行区分,如果单个选择参数被用于在静态 输入和动态输入之间进行区分,则将选择参数与预定义的阔值进行比较, 其中所述阈值可以手动设置或者从被标记的训练数据中学习得到。
在上述的例子中,如果选择参M过该阈值,则采用动态映射。选择
得距离(Euclidean distance)导出,或者可以作为贝叶斯估计(即平均数 的不确定性加权平均)导出。当然,为了降低选择的整体不确定性,可以 釆用多于一个的判断变量,在这种情况下用选择边界超平面 (hyper-surface)有效地代替阈值。
一旦在步骤218中划分了数据,则在步骤220中利用步骤218中分配 给静态映射的数据,将类别标签分配给所述静态映射的输出单元。当训练 数据提供到输入时至少被激活一次的输出单元被标记有这样一种类别的 标签,即,该类别最频繁地激活讨论中的输出单元(步骤220)。对于用 来进行训练的任何数据记录没有被激活的输出单元被标记最近的相邻单 元的类别标签(步骤222)。该最近的相邻单元被确定为具有与讨论中的 单元中的一个最相似的权向量w的输出单元。
一旦已经训练了映射并且将类别标签分配给输出单元,就确定是否存
在用于训练第二映射的足够的数据记录(i=2;步骤224)。如果存在足够 数量的记录,例如,多于数据集合之中的记录的数量除以类别数量,则从 数据中提取时间特征(下面更详细地描述的步骤226),构建新的动态映 射(即i=2 )(步骤228 ),在步骤212为该动态映射再次启动学习算法。 如果仅剩下数量不足的记录,则停止学习(步骤230)。
作为进一步的、可选的处理步骤,当学习停止时,任何留下的数据可 以被用于将标签分配给最后的映射的输出单元,例如用于没有通过其它方 式分配的输出单元。例如,如果没有足够的数据来学习动态映射,则还没 有用于静态映射的数据可以用于标记静态映射的输出单元。
于是,用于动态映射的训练算法本质上与用于静态映射的训练算法相 同,其区别在于每个种类的映射利用不同的输入表示。在静态情况下,可 以假i5Li^的传感器信号在时间窗中不发生显著的变化,因此用于导出静 态映射的输入的一种可能就是简单地选取记录的样本并将该样本用作特 征向量。当然,存在很多为静态映射准备输入数据的方法,例如,可以以 任何其它适当的方式过滤数据记录。例如,可以对数据进行低通滤波。
尽管用于静态映射的输入可以安全地忽略信号的任何时间变化(假设 为噪声),但是,正是该变化形成了至动态映射的输入信号的基础。原则 上,输入向量从一个样本到下一个样本的任何时间变化的量度都是合适 的,例如,在时间窗中计算的预定义数量样本延迟的自动相关函数、数据 向量的差异、最大偏差或任何其它的合适的时间变化的量度。
输入信号的时间变化的导出的量度的两个具体例子是从每个特征的 平均值测量的平均峰值面积和在每个传感器集合上的峰值持续时间(窗大 小被调整为1 )。
<formula>formula see original document page 10</formula> (1)
<formula>formula see original document page 10</formula> (2)
其中,f表示特征指数,i表示样本指数,s表示代表特征或值的集合 的每个传感器集合S的指数,以及W是当前窗口中记录指数的集合。通 it) t过零(平均值)的次数进行计数,可以估计每个窗口中峰值或极值的数量。
因此,通过对每个传感器计算每个特征的导出的时间变化的量度,或 对每个传感器对特征进行平均,可以从传感器数据导出至动态映射的输 入。所导出的量度用于形成导出数据向量(例如,对于每个导出的量度有 一项),每项被应用于自组织映射的输入单元。当然,输入可以由这些量 度中多于一个的量度形成,并且可以包括上述量度的组合。至动态映射的 输入还可以包括从静态映射中提取的特征,例如熵。
对于输出单元激活中计算的可替换的时间变化的量度是关于静态映
射的每个轴的中心的正面积APA(t)和负面积ANA(t)的移动平均( moving avarage )。 即
<formula>formula see original document page 11</formula>,其它
其中ft是移动窗的大小,D和cCr)分别是映射维数和被激活的输出 单元沿给定轴的坐标。实际上,这些特征反映了被激活的节点轨迹关于映 射的每个象限的平均位置。
直到这一点的讨论集中于两个映射的训练上,即一个静态映射一个动 态映射,但是可以同样地设想对多于两个映射的训练。在这种情况下,第 二动态映射的输出可以用于计算时间可用性的进一步的量度,这次是在几 个时间窗中测量。例如一个健康状况受限的vU^楼梯,当他喘气时,可能 使得在爬楼周期中散布有站立周期。这可能产生第二动态映射的输出的时 间改变图案,其可以按与第一静态映射的时间变化输出相同的方式而被检 测到。如果检测到这种第二时间变化行为,则可以训练第三映射,以便利 用适当的输入表示来对数据进行分类。这就相应于进一步迭代步骤212 和224到228之间的循环以构建用于i大于1的映射。
随着静态和动态自组织映射被训练而收敛,分配各个类别标签、定义 选择参数和阈值,推理包括两步骤的过程第一步切换到适当的自组织映 射,第二步用于分类。
在目前所述的该具体实施例中,输入数据在第一步骤中被提供给静态
映射,然后利用静态映射的输出的归一化熵或上述量度中的另 一种来判定
是否
(1)在第二步骤中利用所述静态映射进行分类,或;
(2 )利用应用于动态映射的记录的输入数据的适当表示(如上所述), 其中动态映射的输出接着被用于进行分类。
分类步骤包括读取前面与获胜输出单元相关联的分类标签。所述得胜 的输出单元是输入特征向量及其权向量之间例如通过点积测量得到的距 离最小的单元。
现在参照图3详细描述该具体实施例的推理算法。当在步骤310接收 数据时,步骤312确定是否为当前映射已经接收了足够数量的样本。原则 上,尽管第一静态映射可以仅对单个样本执行分类,但是实际上,在时间 窗中计算熵来作为静态映射的输出的时间变化的量度的这一需要意味着
该推理算法必须等待样本的时间窗到来。如果在步骤312中确定目前接收 的数据还不够,则该算法在步骤314中等待更多数据到来。
如果如步骤312或314所确定的已经接收了足够数量的数据,则该算 法继续从数据中为当前映射(即第一次迭代中的静态映射)提取输入特征。 对于静态映射,在时间窗中收集的每个样本都被用于发现该映射的获胜输 出单元。在步骤320中,如上所述的那样,计算用于当前映射的切换参数, 例如,如上所述,计算被所提供的样本激活的所有输出单元的归一化熵。
在判断节点322,该算法确定切换>|*是否小于前面确定的阈值(在 归一化熵、能量、最大概率或平均距离被用作切换参数的情况下-在标准 偏差、变化系数或概率分布的平滑度被用作切换参数的情况下,步骤322 检查是否超过了阁值)。如果在步骤322的检查结果为正,则假设传感器 数据是来自静态基础的统计分布,静态映射被用于进行分类,输出在步骤 318确定的当前类别标签。如果如可能的情况那样,当时间限制的样4^L 提供给映射时,多于一个的输出单元是获胜输出单元,则糸遞被最频繁激 活的输出单元来确定类别标签。
如果在步骤322的检查结果为负,则计数器i增加l,下一个动态映 射被用于对数据进行分类。算法循环回到步骤312,以便来确定是否为当 前动态映射已经接收了足够的数据。实际上,由于在该算法开始处理第一 映射之前已经接收了数据样本的时间窗,因此算法在该阶段通常会直接进 行到步骤316并提取用于当前动态映射的特征。如上所述,这将是在时间
窗中计算的数据样本的时间变化的量度。
步骤316中的特征提取一般会产生时间窗的特征的单个样本,在步骤 318,所述样#应用到动态映射,以便找到该映射的获胜输出单元。如 果仅采用两个映射,则获胜输出单元被用于确定相应于所提供的样本的映 射i的类别标签,算法直接进行到步骤324以便输出类别标签。
如果在另一方面,采用多于一个的动态映射,则在进行到步骤316 之前,步骤312和314等待多个时间窗的到来。这是因为必须要将表示数 据的时间变化的导出的量度的多个样a供给动态映射,以^更能够计算用 于下一个映射的切换参数。如上所述, 一旦接收了足够的数据,则在步骤 316提取多个样本( 一个样本用于每一个接收的时间窗),并且在步骤318 将其提供给映射,映射的输出被用于在步骤320计算切换参数,所述切换 参数则被用于判定是否利用当前映射的输出或在步骤322引用另一个进 一步的映射。很明显,可以对该算法进行迭代操作的最大次数是由要用于 进行分类的随后映射的数量来确定的。
现在参照图4和5描述几个可替换的实施例。
在第 一可替换实施例中,利用数据自身的时间变化的任何适当的量 度,从数据410直接计算一个切换参数或多个切换参数412。例如,如上 面所定义的那样,平均峰值面积或峰值持续时间可以被用于形成比较,以 便确定数据是静态饿还是动态的。也可以采用时间变化的多个其它量度, 例如在时间窗中计算的采样特征的差异,或在给定样本延迟下的适当的自 动相关。特别是与加速度传感器使用的其它量度可以是最大加it^或移动 速度(加速度积分)。
然后,在模式选择414中利用一个或多个量度,将它们与阈值或判断 面相比较,以决定利用哪个映射。如果确定数据是静态的,则在提取了合 适的特征(416)后采用第一静态映射418。如果确定数据是动态的,则 在合适的特征被提取(420)后采用第二动态映射422。也可以实现具有 相应的特征提取(424)的多个可选的进一步的动态映射426,对动态数 据进行细分。动态数据的该细分可以是基于例如与相应的映射相关联的多 个连续范围的选择参数。
为了训练图4中可替换实施例的映射,基本上可以采用与参照图2 所述的算法相同的训练算法,其中在步骤212和214之间移去步骤218和 220。而且,因为对训练数据进行标记,因此可以根据类别标签来区分静
态数据和动态数据(例如坐是静态的,跑是动态的),从而不需要为每个
数据记录计算各自的切换^ (216 )。由于直接对传感器数据计算切换参 数,因此也简化了推理。可以根据数据直接选择适当的映射,并在适当的 特征提取后将该映射用于分类。
图5中的可替换实施例表示特定实施例与图4中可替换实施例的组 合。静态映射512首先接收数据510,静态映射512的输出被用于计算一 个切换参数或多个切换参数(514 )。接着,切换参数被直接用于静态映射 512和具有相应的特征提取516的一个或多个动态映射514之间的模式选 择。类似地进行训练,这些映射是上述学习算法的组合,其中图2的学习 算法用于第一映射,步骤216和218向上移动的算法用于动态映射。推理 过程类似于图4的可替换实施例,因为根据切换参数来选择多个可替换映 射中之一。然而,该推理算法也类似于该具体实施例的推理算法,因为尽 管不像在具体实施例中那样存在映射的流水线操作(pipeline),但是静态 映射的输出被用于计算切换参数。
为了使STSOM (或等同地,SOM)提供数据的良好表示,需要提供 足够数量的输出单元。例如,如果没有提供足够数量的输出单元,则 STSOM将具有比充分的表达能力,结果就会给出这样的一种表示,其中 一个输出单元被多个类别激活。因此只要与STSOM有关,就会混淆这些 分类。解决该问题的一个方法是简单地增加输出单元的总数。然而,这样 计算成本就会增加。
一种相对廉价的策略是执行适应性的局部扩展,以避免从开始就重建 较大的映射。为该目的开发的现有的策略包括Rauber A、 Merkl D、 Dittenbach M的Growing Hierarchical Self-Organising Map ( GHSOM) (The growing hierarchical self-organising map: exploratory analysis of high-dimensional data。 IEEE Transactions on Neural Networks 2002; 13(6): 1331-1341 )。该策略包含了 Fritzke提出的网格生长(grid growing) 的概念 (Growing grid: a self-organising network with constant neighbourhood range and adaptation strength。 Neural Processing Letters 1995; 2(5): 9-13),用以在单元之间适应性地插入神经元的新的行或列, 其中权向量和输入向量之间具有最大的偏差。接着用其邻单元的平均值初 始化输出单元的权向量。该方法还允许用多层SOM,以高的分层误差来 扩雇>每个输出单元。van Laerhoven K.提出了另 一种方法(在Proceedings of the International Conference on Artificial Neural Networks 2001;
464-469中的Combining the self-organizing map and k-means clustering for on-line classification of sensor data), 该方法采用K-means子聚类
(sub-clusters)来扩展每个神经元,以避免在映射上重写原形向量
(prototype vector )。
这些方法所存在的问题是节点的扩展没有直接考虑分类信息,因此就 不能必然地提高分类准确度。因此,作为上述的STSOM算法的进一步的 特征,下面描述了类别特定的输出单元的扩展方案,即,当一个输出单元 被扩展时,属于相同类别的所有其它输出单元也扩展。这种方法更加有效, 因为其利用分类信息来引导输出单元的扩展。
应该理解,下面描述的算法同才羊适用于标准的SOM,这从下面的描 述中可以清楚地看到,因为其中该算法被应用到相应于传统SOM的 STSOM的静态层。然而,在STSOM的情况下,仅当存在来自不同类别 的数据的合理支持水平时才执行输出单元的扩展。这一点很重要,因为这 避免了相应于动态类别的转换的输出单元的扩展。
该算法的第一步骤是根据原始信号或数据记录的特征向量来生成静 态映射。 一旦生成静态映射,则仅根据该映射构建混合矩阵(confusion matrix )。所述混合矩阵包含关于从分类系统得到的实际的和预测的分类 的信息。所述矩阵的对角线元素表示正确分类的数量,即,分类器返回与 实际类别相同的预测类别的情况。不在对角线上的元素表示错误分类的数 量,并且可以被用作类别重叠的指示。
下一步骤是识别类别重叠,以便形成组合类别的集合。实现此的一种 方法是利用分层式聚类法,其将每行当作单独的聚类,并接着合并这些聚 类以形成树状图(Godbole S, Sarawagi S, Chakrabarti S. Scaling multi-class support vector machines using intere-class confusion. 出处 Proceedings of the Eighth ACMSIGKDD International Converence on Knowledge Discover and Data Mining 2002; 513-518 )。足巨离测量(或类 似测量)可以基于类别对之间的混合矩阵的不在对角线上的元素。由于混 合矩阵是非对称的,因此釆用单链分层式聚类法(single linkage hierarchical clustering )。在每个步骤中,将其中两个最近的成员具有最小 距离的两个聚类进行合并。通过在聚类间距离急剧增加的点上将阈值应用 于输出树状图,可以形成表示组合类别的子组。
STSOM算法的随后的步骤是应用所述的算法来分离类别重叠,这或 者通过引入动态映射或者通过适应性的输出单元扩展来实现。为了将静态活动与动态活动相分离,例如可以采用归一化指数熵。这将把与动态类别 相关联的活动更新到动态映射,可能使与动态类别被聚类在一起的任何静 态类别被明确地分类。如果动态类别与多于一个的静态类别重叠,则上述
余的静态类别。
类别分离过程中的最后步骤是解决静态-静态重叠(即,被聚类为混 合的静态类别之间的类别重叠)。这可通过上述的输出单元扩展来实现。
下面为模式学习和推理提供了被应用于STSOM算法的输出单元扩 张的具体例子。
模式学习
1) 用标准SOM训练算法训练静态映射。
2) 通过下述方法将类别标签分配给每个输出单元
(a) 将静态映射应用于训练集合,并保留每个输出单元的活动频率 的记录;
(b) 删除活动频率低于特定阈值的输出单元的标签;
(c) 使用最近标记的相邻单元的标签,来将标签分配给未被标记的 输出单元。
3) 通过下述方法形成混合类別的子聚类(sub-clusters):
(a) 将静态映射应用于训练集合;
(b) 计算混合矩阵;
(c )构建类别间距离的列表并且仅保留其值大于特定阈值的类别对;
(d) 根据距离列表执行单链式聚类(single link clustering);
(e) 将每个独立的生成树表示为混合类别的子聚类。
4) 如^J巨离列表为空,则通过重复步骤2(a)和2(c)来重新标记静态 映射,输出该映射,然后结束。否则,计算混合子聚类中类别的指数熵。
5) 提取数据样本用于动态映射训练
(a) 利用在固定窗n。上计算的指数熵来划分混合类别的数据;
(b) 根据具有最大数量的数据样本的划分的相应的熵,来确定混合 类别^l:静态类别还是动态类别。
6) 为相应于动态类别的样本,对静态映射的输出执行特征提取,并 利用它们来构建动态映射。
7) 对于混合静态类别的每个子聚类,建立更高层的静态映射;分配 整数矩阵来存储类别-映射指数。
8) 保留模式推理的有关被标记的映射、熵阔值、窗大小、使用的特 征,以及类另'J-映射指数的记录。
模式推理
1. 对于每个输入向量,xs(t) (t是时步指数),确定静态映射s的获 胜输出单元is(t)。
2. 在固定窗Q。上计算指数熵。
3. 如果该熵大于指定的阈值,则
为动态映射d计算输入向量xd(t); ■确定获胜输出单元id(t); 输出所述输出单元id(t)的标签。 否则,
(a) 利用所述输出单元is(t)的标签和类另'J-映射指数来确定适当的静 态映射
<formula>formula see original document page 17</formula>
(b) 如果映射h与映射s相同,则将输出单元is(t)的标签输出,否

■根据输入向量Ut)来确定静态映射h的获胜神经元ih(t); 把输出单元ih(t)的标签输出。
现在参照图6描述上述被应用的STSOM算法的具体例子,图6表示 将一组加速度传感器46a到46g附着在人体的不同部位的人类对象。所述 算法被用于从对象身体上的加速度传感器来推断对象的身体姿势或活动。
传感器46a到46g检测传感器位置处身体的加速度,包括由于重力产 生的恒定加速度。每个传感器沿三个垂直轴测量加速度,因此能够4艮据传 感器信号的恒定分量导出传感器关于重力的方位,以及从加速度信号的时 间变化导出关于对象移动的信息。
如图6中所示,传感器遍布身体放置(每个肩部、肘部、腰部、膝部 以及踝部都有一个传感器),给出了总共36个通道或特征(每个传感器3 个),这些特征被传送给具有足够处理能力的中央处理器。应该理解,可 以等同地设想其它的传感器配置。例如,传感器可以仗故置在一半身体上 (例如仅使用传感器46g到461 ),或者可以定位传感器以便在所讨论的类 别之间提供最佳区别。在与自组织映射的计算和选择#有关的计算负担 相对低的情况下,任何商业上可得到的个人或甚至手持计算机应足以完成 这种任务,实际上微控制器可能就足够了。
特别地,以50Hz的频率对信号进行采样,并在50个样本的时间窗 中分析信号。通常,l秒到2秒的时间窗尺寸对于这里所述的具体应用是 合适的。静态映射和动态映射的输入元素的数量取决于所采用的输入表 示。例如,如果单个样本被用于静态映射,平均峰值面积被用于动态映射, 则接收特征向量的输入单元的数量将等于传感器通道的数量,即在图3 例子中为36。静态映射的输出单元被布置为4x4的矩形网格,因此可以 捕获最多16个不同的类别。动态映射的输出单元被布置为6x6的矩形网 格,因此通过该映射可以捕获多达36个不同的活动。实际上,在输出单 元上的类别的分布趋向于是次最佳的,因此,可以被存储的类别的有效数 量小于前面提到的最大值。尽管在具体例子中的矩形网格上布置输出单 元,但是对于技术人员明显的是也可以采用输出单元的其它几何布置。
在可替换的、嵌入式的实施方案中,在单个电路板上提供了自组织映 射的集合(例如静态的和动态的)以及加速度传感器。可以在适当编程的 集成电路或芯片上执行自组织映射(包括映射选择算法)。可替换地,也 可以设想类似的实施方案。
每个嵌入的传感器/处理单元对其自己的三个通道传感器信号进行选 择和映射处理,并且仅将自组织映射的输出传送到中央处理器。在4x4 的静态映射和6x6的动态映射的例子中,在简单的传送方案中仅需J^ 个时间窗6位的速度,以传送自组织映射的获胜输出单元的身份 (identity)-因此,6位的二进制字可以被用于对识别每个输出单元的标 签进行编码,并且为每个时间窗仅传送获胜输出单元的标签。这表示与 传送数字化传感器信号(例如,假设仅有16个数字化级和50个样本的时 间窗,需要4乂50 = 200位来传送在时间窗中搜集的原始数据)的需要相 比,极大地节省了用于传送到中央处理器所需要的功率和带宽。另外,还 设想更有效的传输方案,例如,仅当获胜输出单元变化时,嵌入的单元才
可以传送信号。
如上所述,每个嵌入的自组织映射的输出被传送到中央处理器。在嵌 入式实施方案中,嵌入的自组织映射中之一可以用作主机,并接收所有其 它自组织映射的输出,以便生成分类结果。可替换地,设想将自组织映射 的输出传送到更强大的处理器,例如个人计算机或手持计算机,这允许各 个输出的更复杂的处理和进一步的数据融合。例如,可以根据各个自组织 映射输出而将贝叶斯分类器用于进行分类,这将允许考虑与每个映射的输 出或任何其它信息源相关的不确定性。
上述的分类算法,特别是关于加速度(及其方位)传感器的集合的执 行可以被应用于其中对监视人的活动非常重要的领域范围。例如,在健康 护理监视中,背景信息通常是重要的。例如,从其身上采样生理信号的病 人的活动的可靠检测对于这些信号的正确解释是重要的。急剧的心跳和恶 化的心电图信号的主要原因可能是病人的剧烈运动以及心律失常而引起 的。因此,所提出的分类算法可以与这种临床监测技术结^f吏用,以实现 临床诊断结果的更可靠检测。
一系列活动的检测,对于其本身正确或为进一步的生理测量提供背 景,在家庭护理中的病人监视中都非常重要。因此,所提出的分类方法在 远程治疗中具有特殊的应用,在远程治疗中,病4家中就可以皿视, 并且,如果处理的测量结果显示出有必要的话,就可以采取适当的措施。 可以检测用于识别在时间上和空间上不同的日常活动例如吃、喝、阅读或 休息的活动信息,而且可以识别与情感相关的活动状态,例如激动、不安 或走来走去。借助于健康和社会护理监视,异常的个人事件或活动的检测 在维持虚弱的人和老人的独立生活方面是非常有价值的。
>^速度传感器导出的信号也可以用于导出人的姿势,并可以被用作 为一种新颖的用户接口。不同的手和身体的运动可以被解释为用于控制设 备或处理的不同的输入命令,例如,在家庭环境中开启或关闭电气设备, 或在计算机屏幕的窗口中导航。对于娱乐表演,可以将检测到的姿势信息 馈入到合成器中以生成电子音乐,或者可以将姿势用作计算机游戏的输入 接口。姿势识别的其它应用是外科训练,其中运动的准确检测对于训练外 科医生的技术评估非常重要。特别地,手部姿势分析可以为外科技术评估 提供一种新的方法。在这种情况下,利用光或电磁传感器和/或数据手套 就可以获得手和手指的三维位置,传感器的输出可以合适地用作静态或动 态自组织映射的输入。
在活动或姿势识别方面实现用户之间的普及需要消除依赖于用户的 特征。另一方面,在生物测定应用中,这些依赖于用户的特征可以被用作 用户识别符号的输入。例如,对于用户特定的步态信息可以是用于以易于
决方案。
最后,除了人的运动监视外,所提出的算法可以被用于物体、环境或 相互作用监视,这包括在家庭环境中使用的传感器。例如,所提出的算法 可以被用于生成家庭环境中的水、气和电气设备的使用的概括的行为简 档。这种筒档可以被用于指示和预测居住者的健康状况。
上述实施例描述了一种时空分类方法。对技术人员明显的是,这种方 法可以用于除上面特别提到的情况外的多种情况。上述具体实施例旨在仅 举例说明由所附权利要求界定的本发明。
权利要求
1.一种将数据记录分类为属于多个类别中之一的方法,所述数据记录包括多个数据样本,每个样本包括在时间点从传感器信号中采样的值导出的多个特征,所述方法包括(a)在时间窗中定义指示传感器信号的时间变化的选择变量;(b)为选择变量定义选择标准;(c)将选择变量的值与选择标准比较,以选择用于具有多个输入和输出单元的自组织映射的输入表示,以及根据所选择的输入表示从时间窗中的数据样本导出输入;以及(d)将所述输入应用到与所选择的输入表示相对应的自组织映射,并根据该自组织映射的获胜输出单元对数据记录进行分类。
2. 如权利要求l所述的方法,所述选择变量是在时间窗上计算的所 述自组织映射的输出单元的变化的量度。
3. 如权利要求2所述的方法,所述选择变量是在时间窗上计算的获 胜输出单元的概率分布的归一化熵,获胜输出单元的概率分布的值是该输 出单元为获胜输出单元的样本的数量被时间窗中的样本数量除而得到的 值。
4. 如前面的权利要求中任一项所述的方法,所述方法包括将时间窗 的数据样本应用于第一映射,并利用该第一映射的输出来计算选择变量; 所述方法还包括根据所述选择变量来决定是利用所述第一映射还是第二 映射来对数据进行分类。
5. 如权利要求l所述的方法,所^i^择变量是数据样本的时间变化 的量度。
6. 如前面的权利要求中任一项所述的方法,所述选择标准包括用于 区分静态数据记录和动态数据记录的阈值或判断面,所述静态数据记录从 具有基本不变的统计分布的传感器信号中采样,所述动态数据记录从具有 随时间变化的统计分布的传感器信号中采样。
7. 如权利要求6所述的方法,被确定为是动态数据集合的数据记录 的输入表示包括对特征的集合计算的平均峰值持续时间,该平均峰值持续 时间被计算为该集合中特征的数量除以时间窗中每个特征的局部极值的 数量的总和。
8. 如权利要求6所述的方法,被确定为是动态数据集合的数据记录 的输入表示包括为每个特征计算的平均峰值面积,该平均峰值面积是通过 以下方式计算得到的对于所述时间窗中所有记录的、每个记录的每个相 应特征的值与针对时间窗中所有记录计算的该特征的平均值之间的绝对 差的总和,除以该时间窗中极值的数量。
9. 如前面的权利要求中任一项所述的方法,其中所述的对数据记录 进行分类包括e) 在将映射与输出单元相关联或与和输出单元相关的标签相关联的 表格中查找与获胜输出单元相关联的相关映射;f) 如果相关映射是所述自组织映射,则利用与该获胜输出单元相关 的标签对数据记录进行分类;以及否则g) 将数据记录应用于该相关映射,并根据该映射的获胜输出单元对 数据记录进行分类。
10. —种用于执行如前面的权利要求中任一项所述的方法的系统。
11. 如权利要求10所述的系统,所述系统包括多个传感器/处理单元, 每个单元包括一个或多个传感器、以及被配置为定义选择变量和用于选择 变量的选择标准的选择器,其中所述选择变量指示时间窗中传感器信号的 时间变化,所述选择器还被配置为将选择变量的值与选择标准进行比较, 以便选择用于具有多个输入和输出单元的自组织映射的输7^示,并根据 所选择的输入表示从时间窗中的数据记录导出输入;所述单元还包括用于 将所述输入应用到与输入表示相对应的自组织映射的接口 ,和用于将所述 自组织映射的输出传送到中央处理器的传送器。
12. —种承载有计算^l4呈序的计算机可读介质,其中所述计算机程序 包括用于执行如权利要求1到9中任一项所述方法的计算机代码指令。
13. —种表示计算初4呈序的电磁信号,其中所述计算机程序包括用于 执行如权利要求1到9中任一项所述的方法的计算机代码指令。
14. 一种训练用于将翁:据记录分类为属于多个类别中之一的分类器的 方法,所述数据记录包括多个数据样本,每个样本包括从时间点的传感器 信号中采样的值导出的多个特征,所述方法包括(a)计算指示时间窗中动态数据记录的特征的时间变化的导出的表示;(b) 将所述导出的表示用作第二自组织映射的输入;以及(c) 根据训练算法更新该自组织映射的参数。
15. —种如权利要求14所述的训练分类器的方法,所述方法包括从 属于多个类别的多个静态记录和动态记录采样多个样本;将所述样本用作 第一自组织映射的输入;计算每个记录中所述样本的时间变化的量度;以 及根据所述量度将多个记录划分为静态记录和动态记录。
16. —种训练分类器的方法,特别是如权利要求14或15所述的方法, 包括为多个类别计算混合矩阵,所述多个类别与多个被标记的数据记录的 自组织映射的输出单元相关联;M确定为要被混合到混合中的类别聚类 在一起,将混合聚类的类别中的每个类别与进一步的自组织映射相关联, 并将被标记为属于特定混合聚类的类别的那些数据记录用作为到相应的 进一步自组织映射的输入以对其进行训练。
全文摘要
一种将数据记录分类为属于多个类别中之一的方法,所述数据记录包括多个数据样本,每个样本包括在时间点从传感器信号中采样的值导出的多个特征,所述方法包括在时间窗中定义用于指示所述传感器信号的时间变化的选择变量;为所述选择变量定义选择标准;将所述选择变量的值与所述选择标准比较,以便选择用于自组织映射的输入表示,所述映射具有多个输入和输出单元,并根据所述选择的输入表示从所述时间窗的所述数据样本中导出输入;以及将所述输入应用到与所述选择的输入表示相对应的自组织映射,并根据所述自组织映射的获胜输出单元而对所述数据记录进行分类。
文档编号G06K9/62GK101194273SQ200680012774
公开日2008年6月4日 申请日期2006年3月16日 优先权日2005年3月16日
发明者卢秉礼, 杨广中, 舒拉帕·蒂姆亚鲁什 申请人:皇家创新有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1