用于模式发现和识别的方法

文档序号:6596287阅读:323来源:国知局
专利名称:用于模式发现和识别的方法
技术领域
本发明涉及一种用于模式发现和识别的方法。本发明还涉及用于模式发现和识别的计算机程序产品。而且,本发明涉及一种用于模式发现和识别的设备。
背景技术
所有模式发现方法中的基本思想都是模型化统计规则性并将模型与实际表示相比较以便度量所创建(学习)的模型与在分析中的当前模式之间的相似性。用于模型化和识别序列中模式的已知方法和技术之一是马尔可夫模型,其假设要模型化的序列具有马尔可夫性质。具有马尔可夫性质意味着,给定当前状态,将来状态就独立于过去状态。换句话说,仅有当前状态的描述就完全获取了可能影响过程的将来演化的所有信息。将通过概率过程而不是确定性过程到达将来状态。在每个步骤,系统可根据某一概率分布将其状态从当前状态改变为另一状态,或保持在同一状态。状态的改变称为转移,并且与各种状态改变相关联的概率称为转移概率。许多物理过程和由物理过程创建的对应可观察序列具有强结构,诸如可通过高阶相关系数度量的时间结构。因此,根据所用的时间分辨率,所创建的序列可能具有宽结构 (在时间或空间上),其不能由将来状态独立于过去状态的马尔可夫链准确地模型化。

发明内容
本发明的一个目的是提供用于模式发现和识别的方法、用于模式发现和识别的计算机程序产品和用于模式发现和识别的设备。本发明的目的通过提供一种方法实现,其中接收包括与概念相关的第一序列符号的第一序列和与第一序列相关联的标签,从表示第一序列中不同距离的第一序列符号之间的转移出现的频率数据的转移频率矩阵中获得转移概率矩阵,并且学习每个标签和每个距离的转移概率矩阵以便获得确定出现在第二序列中的概念的激活函数。本发明的目的还通过提供一种计算机程序产品实现,其接收包括与概念相关的第一序列符号的第一序列和与第一序列相关联的标签,从表示第一序列中不同距离的第一序列符号之间的转移出现的频率数据的转移频率矩阵中获得转移概率矩阵,并且学习每个标签和每个距离的转移概率矩阵以便获得确定出现在第二序列中的概念的激活函数。此外,本发明的目的通过提供一种设备实现,其接收包括与概念相关的第一序列符号的第一序列和与第一序列相关联的标签,从表示第一序列中不同距离的第一序列符号之间的转移出现的频率数据的转移频率矩阵中获得转移概率矩阵,并且学习每个标签和每个距离的转移概率矩阵以便获得确定出现在第二序列中的概念的激活函数。本发明的实施例涉及根据独立权利要求1的方法。此外,本发明的实施例涉及根据独立权利要求10的计算机程序产品。还有,本发明的实施例涉及根据独立权利要求11的设备。在从属权利要求中定义了另外的实施例。
根据本发明的实施例,一种方法包括接收包括与概念相关的第一序列符号的第一序列和与第一序列相关联的标签,从表示第一序列中不同距离的第一序列符号之间的转移出现的频率数据的转移频率矩阵中获得转移概率矩阵,并且学习每个标签和每个距离的转移概率矩阵以便获得确定出现在第二序列中的概念的激活函数。根据本发明实施例的方法可在设备中执行,该设备例如可以是计算机系统、便携机或移动电话机,其中软件执行模式发现和识别过程。其次,模式发现和识别过程可由处理器(例如数字信号处理器(DSP)芯片)执行,该处理器已经适合于执行模式发现和识别过程。术语“概念”(模式)是指序列中(或两个不同序列之间)某种类型的统计规则性,其不同于其它概念(其它规则性)并形成与所有类似噪声的不规则性的清楚对照。术语“标签”是指一个指示,其与序列相关联,或者几个标签与同一序列相关联,并且这些关联被称为概念。术语“转移”是指序列符号(索引,标记)对。序列符号是序列的基本元素,并且序列符号对在一对内部在序列符号之间具有距离(换句话说,每个符号对在序列中具有一定位置和相互距离(位置中的差))。根据本发明的实施例,在前一实施例中公开的方法包括接收包括概念的第一信息。第一信息例如可以是语音或图像。根据本发明的实施例,在前面任一实施例中公开的方法包括将标签与第一序列相关联。根据本发明的实施例,在前面任一实施例中公开的方法包括离散化和量化包括概念的第一信息,并以一维(ID)第一序列形式表示第一信息。还有,可用不同方式对视觉(空间)2D信息采样以形成ID序列。出于这个原因,具体实施方式
仅限于顺序(ID)信息。在更复杂的情况下,可以处理这些序列之间的一组ID序列还有关联性(例如音频和视觉表示之间的关联性)。根据本发明的实施例,在前面任一实施例中公开的方法包括收集第一序列中序列符号之间的转移出现的频率数据。构想出包括至少一个矩阵的一组矩阵,对于每个标签,其由频率数据构成。该组中的矩阵数取决于从序列中收集的不同距离的符号对数和与概念相关联的标签数(例如矩阵Mkbldistance. tag),其中a * b定义矩阵的大小,并且矩阵数等于距离乘以标签)。根据本发明的实施例,在前面任一实施例中公开的方法包括将第一序列中转移出现的频率数据存储到转移频率矩阵。根据本发明的实施例,在前面任一实施例中公开的方法包括根据随后表示的公式 (1)-(3)将转移频率矩阵规格化成转移概率矩阵。根据本发明的实施例,在前面任一实施例中公开的方法,其中通过离散化和量化第二信息来从包括概念的第二实际信息处理第二序列,以便以第二序列形式表示第二信肩、ο根据本发明的实施例,在前面任一实施例中公开的方法用于例如与语音识别或图像识别相关的模式识别。执行方法所用的算法采取以离散量化形式给出的信息流。信息可通过任何时变过程例如音频视觉信号创建,或者它可以只是空间变化的,例如静止图片。
根据本发明实施例的方法可在设备例如计算机系统、便携机或移动电话机中执行,其中软件执行模式发现和识别过程。其次,模式发现和识别过程可由编程处理器(例如数字信号处理器(DSP)芯片) 执行,该处理器适合于执行模式发现和识别过程。执行根据本发明实施例的方法的算法通过从实际序列中收集证据来学习统计,构建这些序列的统计模型,并将它们应用于模式发现和分类中。统计基于在空间情况下的不同空间距离或在时间情况下的滞后中找到的序列符号对的频率。在时间序列的情况下,序列符号对可解释为状态转移,并且它们的对应相对频率可被规格化以产生对应的转移概率。可收集不同序列符号对的出现次数以形成频率矩阵或表格。每个空间或时间距离(滞后)将创建其自己的矩阵或表格。相应地,可以在两个不同序列之间创建相关联统计。转移统计必定存在多模型输入(标签),使得每个标签指示与其相关联的时间序列中的一个概念(模式)。在训练模型之后,可以从新序列中识别出是早前学习的那些之一的未知概念。该算法特别设计用于在序列用高级失真和噪声破坏的条件下和事件依赖性分布在时间或空间上的条件下的模式识别,使得相邻事件不能可靠地视为彼此依赖。根据本发明实施例的方法与马尔可夫链之间的一个差异是,根据本发明实施例的方法从首次计数在不同距离找到的所有标记对数的序列中收集统计证据,并且然后执行两次不同的规格化(具体实施方式
中的公式(1)和( ),将这两个统计表示组合,之后进行第三次规格化以导出最后那组激活矩阵。所导出的表示中只有一个,滞后1的状态转移矩阵,与马尔可夫链方法已知的表示是等效的。在导出激活矩阵时所用的其它两个表示中,统计证据的处理与先前已知的那些有很大不同。另一个差异是,马尔可夫链通常不利用大于1的滞后上的统计,并且当它使用时, 可通过简单的矩阵相乘(Chapman-Kolmogorov公式)从滞后1转移矩阵中导出统计。在根据本发明实施例的方法中,通过矩阵相乘直接从序列中获取而不是近似(估计)更大滞后上的统计。根据本发明实施例的方法与马尔可夫链之间的这个差异是,根据本发明实施例的方法并行利用每个概念的两个不同表示(公式O))和对于不同距离的标记对获得的所有激活矩阵(公式G))。由此,组合的激活模式不仅取决于当前或早前的状态,而且取决于那组激活矩阵描述的序列中的所有那些早前事件。根据本发明实施例的方法的优点出现在干扰已经完全损坏或严重破坏在有限时间或空间窗口中原始信息的情况下处理数据时。仅当模型能够利用在邻居中可用的信息时,并且甚至还当模型能够基于附近未被破坏的信息进行正确关联时,才能恢复(校正)原始信息。


接下来,将根据附图参考示范实施例更详细地描述本发明的各方面,附图中图1例示了根据本发明的有利实施例用于模式发现和识别的方法的示范性总流程图2A例示了根据本发明的有利实施例用于模式发现的方法的示范性流程图;图2B例示了根据本发明的有利实施例用于模式识别的方法的示范性流程图;图3例示了作为时间的函数的话语中词表示的激活在没有对激活进行中值过滤的情况下的视图;图4例示了作为时间的函数的话语中词表示的激活在对激活进行了中值过滤的情况下的视图;以及图5例示了算法的特征学习曲线的视图。
具体实施例方式图1表示描述根据本发明实施例的模式发现和识别方法100的总流程图。首先在步骤110收集数据,例如语音识别过程中的包括几个词的话语。在步骤120处理收集的数据,使得可以从处理的数据中找到统计规则性(模式), 并且创建所找到的模式的统计模型。在学习阶段,同时的外部标签指示该组模式中的哪一个(随后要识别的)存在于实际序列中某处。最后,在步骤130,模式的统计模型与新的先前未见的实际数据进行比较以便发现所创建的模式的统计模型与实际模式之间的相似性。图2A仅通过示例公开了更详细描述根据本发明实施例的发现方法200的流程图。在步骤205方法开始期间,执行该方法的计算机和/或应用程序开启,并且提供在模式学习过程、发现和识别之前的必要级,诸如应用程序设置定义以及不同变量和参数初始化。在这种情况下,用户考虑到模式学习、发现和识别而定义设置、变量和参数。接下来,在步骤210,在学习(训练)过程中所用的信息,诸如包括人说出的一个或多个词的话语,通过诸如话筒的接收器以及信号处理单元被引入模式发现和识别软件,该信号处理单元能够将接收的音频信号修改成适合于模式发现和识别软件的形式。在步骤215,离散化和量化所接收的信息(样本),然后在步骤220,以ID序列形式表示离散和量化的信息。然后在步骤225,用标签指定与该序列相关联的某事件(模式),该标签可以是例如数字或字母。因此,到系统的输入包括离散元素的时间序列或空间信息,它们被采样以形成ID 序列,并且在训练阶段,标签指定与该序列相关联的某事件或模式。在一些情况下,一种信息模态可为另一模态提供标签。序列的基本元素称为标记,并且在最简单的情况下,它们可以指矢量量化码书中的项目,或者它们可通过时间序列或图像的任何种类的离散化而被产生。在更复杂的情况下,它们可以指信息的某种更高级表示,例如,可能反映清楚定性性质的事件或项目。一种示例可以是模型化股票市场和复杂的计量经济过程。其它信息源(可能的另一种模态源)由一组所谓的概念标签c表示。标签通常是表示另一过程的与时间序列输入相关联的不变输出(例如,在语音识别情况下在另一种模态如视觉或触觉中执行的分类过程,或者需要与时间序列相关联的人工定义的事件的某种其它组合)的整数值。这种机制也可以反方向工作;听觉事件可充当用来学习视觉模式的标签。一种模态可形成对其它模态的标签以帮助学习。更一般地说,这种方法允许构造不同模态之间的统计关联。这是模型化和理解意义的形成和学习(由代理和人)过程中的关键问题之一。在步骤230,当激活概念(标签)并且表示序列时,算法开始收集在序列中距离为 1的标记对(转移)出现的频率数据。在步骤235,算法将所收集的标记对出现的频率数据存储到直方图表格或矩阵 T(转移频率矩阵)。当需要对应标记对的出现次数时,原始标记可用作到T的指针。在随后步骤M0,在T中收集的直方图然后用于产生另一个表示P。算法的主干是大小为NtlXNtl的矩阵&。,其中N,是码书的大小,矩阵Pu类似转移概率矩阵,但不含有良好定义的概率,而有些含有累积概率和。它保持记录在同时存在概念 c的情况下从标记a[t-l]到标记a[t]的规格化转移概率,其中1,c,t e Z,1是集合1 = (IijI2jI3,-.. ,U的元素,且c是集合c = {1,2,3,···,NcJ的元素。换句话说,Nc是引入系统的概念的总数。如果定义N1 = I 111 I,则存在总共Np = N1 * N。个P矩阵实例,一个实例对应于在特定滞后的一个概念。矩阵T1,。类似于&。,只是它保持记录在存在概念c的情况下的转移频率而不是从标记a[t-l]到标记a[t]的规格化转移概率。由于P的值由于三级规格化过程而不是0与1之间范围内的经典概率,因此P的值将称为激活值,并且P将称为激活矩阵。将通过使用存储在T中的频率信息计算存储在 P中的激活值。接下来,描述在方法中如何提供训练。为了简化符号表示,以形式P(ai, |l,c)和 T (ai; aj 11,c)表示矩阵Pu和T1,。的元素,其中前两个变量 和…定义标记的矩阵元素索引(从 转移到…或同时出现 和a」),而1定义滞后,c定义概念。输入包括训练序列S = Is1, &,. . .,sn}和序列相关概念V = Iv1, v2,...,vn},其中每个Vi= {ci,c2,...,cn},vec。在序列Si中以滞后1出现的所有转移都被更新到转移频率矩阵1\,。,其中c是与Si相关联的Vi的元素。对于训练材料中的所有S重复这个过程。以下伪码示例例示了转移频率的收集过程
权利要求
1.一种方法,包括接收包括与概念相关的第一序列符号的第一序列和与第一序列相关联的标签;从表示第一序列中不同距离的第一序列符号之间的转移出现的频率数据的转移频率矩阵中获得转移概率矩阵;以及学习每个标签和每个距离的所述转移概率矩阵,以便获得确定出现在第二序列中的所述概念的激活函数。
2.根据权利要求1所述的方法,其中所述方法还包括接收包括所述概念的第一信息。
3.根据权利要求1或2所述的方法,其中所述方法包括将所述标签与第一序列相关联。
4.根据权利要求1-3中任一项所述的方法,其中所述方法还包括离散化和量化包括所述概念的第一信息,并以第一序列的形式表示第一信息。
5.根据权利要求1-4中任一项所述的方法,其中所述方法还包括收集第一序列中所述转移出现的频率数据。
6.根据权利要求1-5中任一项所述的方法,其中所述方法还包括将所收集的第一序列中所述转移出现的频率数据存储到所述转移频率矩阵。
7.根据权利要求1-6中任一项所述的方法,其中所述方法包括将所述转移频率矩阵规格化成所述转移概率矩阵。
8.根据权利要求1-7中任一项所述的方法,其中通过离散化和量化包括所述概念的第二信息来从第二信息处理第二序列,以便以第二序列的形式表示第二信息。
9.根据权利要求1-8中任一项所述的方法,其中所述方法用于语音识别或图像识别。
10.一种计算机程序产品,被配置成当所述计算机程序产品在计算机上运行时执行根据权利要求1-9中任一项所述的方法。
11.一种设备,被配置成执行根据权利要求1-9中任一项所述的方法。
全文摘要
本发明涉及用于模式发现和识别的方法,其中接收包括与概念相关的第一序列符号的第一序列和与第一序列相关联的标签,从表示第一序列中不同距离的第一序列符号之间的转移出现的频率数据的转移频率矩阵中获得转移概率矩阵,并且学习每个标签和每个距离的转移概率矩阵以便获得确定出现在第二序列中的概念的激活函数。本发明还涉及计算机程序产品和执行所述模式发现和识别方法的设备。
文档编号G06K9/62GK102308307SQ200980156251
公开日2012年1月4日 申请日期2009年12月28日 优先权日2008年12月31日
发明者O·拉萨内恩, U·莱内 申请人:阿尔托大学理工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1