一种多特征条件下的模式识别方法与流程

文档序号:13283025阅读:262来源:国知局
一种多特征条件下的模式识别方法与流程

本发明涉及计算机及通信互联网领域模式识别的方法,具体地,涉及一种在多特征条件下实现精确模式识别的方法。



背景技术:

随着当代科技的快速发展,各种设备包括手机,平板,电脑等产生了海量的数据,从而带来了大数据分析的兴起。在信息化的时代,数据意味着价值,海量的数据意味着无与伦比的价值。然而海量的数据中包含着错综复杂,相互交叉扰乱的信息。如何理清数据间错综复杂的关系,从海量的数据中提取出有用数据成为数据分析的关键。

与此同时,随着产生数据的设备数目的急剧增长以及对于精确数据分析日益增长的需求,大数据分析带来了机器学习特别是模式识别的蓬勃发展。模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。随着计算机技术的发展,模式识别成为人工智能以及计算机智能化的基础以及瓶颈,特别是在要求大数据分析的应用中。

经对现有文献研究发现,文献“基于隐马尔可夫模型的物体识别”(j.hornegger,h.niemann,d.paulusandg.schlottke,objectrecognitionusinghiddenmarkovmodels,patternrecognitioninpracticeiv,pp.37-44)提供了一种使用隐马尔可夫模型来实现模式匹配的方法,该方法可以在单特征条件下识别满足一定预设条件的物体,也即模式匹配。但是该方法缺乏对于多种非独立特征条件的考虑,在多特征模式下匹配性能欠佳。

文献“贝叶斯人脸识别”(babackmoghaddam,tonyjebara,alexpentland,bayesianfacerecognition,patternrecognition,vol.33,no.11,pp.1771-1782,2000)采用图像特征提取以及贝叶斯相似度估计方法来识别人脸,该方法可以实现简单模式匹配,无法处理多特征以及时变特征下的模式匹配。

文献“使用条件随机场进行物体识别”(ariadnaquattoni,michaelcollins,trevordarrell,conditionalrandomfieldsforobjectrecognition,nips,2004)提出了使用条件随机场来识别物体(模式匹配)的方法。该方法试图通过以条件概率代替联合概率的方式来组合多种特征,因此实现在多特征条件下进行模式匹配并且取得较好的匹配效果。但是条件随机场采用无向图模型,两节点间的边没有区分方向,因此在需要区分方向的应用中,比如说在有方向的模式识别中无能为力。

文献“一种使用新颖的反向追踪粒子滤波器的模式匹配室内定位”(widyawanwidyawan,martinklepal,stéphanebeauregard,anovelbacktrackingparticlefilterforpatternmatchingindoorlocalization,proceedingsoftheacminternationalworkshoponmobileentitylocalizationandtrackingingps-lessenvironments,2008)采用粒子滤波器来实现模式识别以及匹配,该粒子滤波器使用了反向追踪功能,可以在当前模式匹配的同时改进匹配历史记录。该方法试图从局部特征出发,可在多种特征条件下实现模式匹配。但是该方法缺乏对于全局条件的考虑,使得该方法在应用中具有极大的局限性,在各种应用之中的稳定性欠佳,同时计算复杂度随着粒子数的增加而指数增长,使其在大多数应用中的性能并不出色。

上述模式识别方法或者只能在单特征条件下进行模式识别,或者因所实现技术的局限性而使得该模式识别办法在通用性上受到极大限制。同时,上述模式识别方法的准确性也有待进一步改进。



技术实现要素:

针对现有技术中的缺陷,本发明的目的是提供一种在多特征条件下从全局考虑的精确模式识别方法。

根据本发明提供的一种多特征条件下的模式识别方法,包括:

步骤1、建立所需识别目标模式的有向连通图模型;

步骤2、定义连通的节点与边的特征,所述特征用函数的形式表现;

步骤3、获得实时观测信号,并预处理为可使用观测信号;

步骤4、根据可使用观测信号计算有向连通图模型中所有节点以及边的特征函数;

步骤5、根据特征函数计算当前各节点的状态概率与各边的转移概率;

步骤6、反复进行步骤二至步骤五,并记录每一轮的相关信息;

步骤7、通过译码识别最佳匹配模式。

优选的,步骤2中所述特征包括区分有向连通图中的节点、边的特征。

优选的,步骤2中所述特征为单一或者多种特征。

优选的,步骤3中所述实时观测信号包括单一和多种信号。

优选的,步骤3中所述可使用观测信号可直接应用于步骤二中所定义的函数。

优选的,步骤5中所述的根据特征函数计算当前各节点的状态概率与各边的转移概率,包括:

每个节点的m个特征函数组合为状态概率πi;

每个边的m′个特征函数组合为转移概率pi;

根据当前状态概率矩阵π={πi(i=1,2,…,n)}与转移概率p={pi(i=1,2,…)}获得新的状态概率矩阵п=π×p,n为有向连通图模型中的节点数目。

优选的,步骤6中所述的相关信息包括:

每一轮的状态概率矩阵πt,以及维特比网格矩阵,所述维特比网格矩阵是一个n×t的矩阵,n为有向连通图模型中的节点数目,t为观测时间长度,其中第i行第t列代表了在时间t具有最大概率转移到节点i的节点编号。

优选的,步骤7包括:

步骤7.1、获得当前状态矩阵πt中具有最大状态概率的节点编号vt

步骤7.2、根据维特比网格矩阵获得在时间t-1具有最大概率转移到vt的节点编号vt-1

步骤7.3、依次类推,反向获得具有最大概率的识别序列[vt,vt-1,…,vt,…,v0];

步骤7.4、将该识别序列倒序输出,获得最佳识别模式[v0,v1,…,vt,…,vt]。

优选的,还包括步骤8,验证最佳识别模式的可信度并输出。

优选的,所述最佳识别模式的可信度为正确模式的概率,包括两种计算及表示方式:

1、用步骤7.4中的最佳识别模式[v0,v1,…,vt,…,vt]的概率pc来衡量可信度,

2、估计最佳识别模式的标准差σ来衡量可信度,以时间t为例,n为有向连通图模型中的节点数目,xi为节点的位置信息,μt为当前均值,当前标准差σt的计算包括

与现有技术相比,本发明具有如下的有益效果:

从图论的角度出发,将所要识别的目标模式分解为多个特征函数,使得各观测结果可以与单个或者多个特征函数直接联系起来,从而增加了特征函数的表征能力同时降低了计算复杂度,使得任意特征条件下的模式识别变得简单高效。

同时,多个特征函数之间的智能组合有效融合了多种观测结果,使得整个模式识别方法可以完全兼容于具有不同观测结果的环境以及应用中,根据具体环境以及应用的观测及需求提供最佳识别结果,具有非常强的可伸缩性。

本方法以时间序列的形式来实现模式识别,因此可以采用分布式计算,在计算能力较低的设备,比如移动设备中的应用尤为广泛。同时采用分布式计算可以在最大程度上缩短模式识别时间,提高整个系统的实时性及稳定性。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为简单的模式识别系统框图;

图2为多特征条件下的模式识别系统框图;

图3至图6为特征数据预处理流程图;

图7为零速检测效果图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。

图1所示为简单的模式识别系统,此系统通常由三个部分组成:预处理、特征选择和提取,以及识别。

数据预处理是为了使计算机能够对各种现象进行分类识别,通过测量、采样和量化,用矩阵或向量等这些计算机可以运算的符号来表示所研究的对象。为了使输入的模式适应识别要求,要对数据进行一些预处理,以煎炒甚至去除噪音,加强有用的信息,以便抽取模式识别所需要的特征。

特征选择和提取是要根据识别方法的要求提取特征,作为识别的依据。一般来说,要求提取出来的特征能够足够代表这个模式,另一方面要求它们的数量尽量少,从而能有效地进行分类和描述。

识别是计算机把产生的分类规则和程序用于待分类样本的对象识别。输入计算机的分类识别的知识和方法以及有关对象的知识越充分,这个系统的识别功能就越强,错误率或造成的损失就越小。

多特征条件下的模式识别系统框图如图2所示,模式识别从建立模型开始,然后从模型中提取特征,按照规则对特征进行提取和预处理,在这三者的基础上建立特征函数,计算状态转移概率,进行多轮观测和记录,最终识别出最佳匹配,经过验证输出该模式识别可信度。

本发明优选的行人惯性导航零速检测实施例包括:

所述零速检测是指行人步行过程中脚部接触地面的时间即零速区间的检测,零速检测用于惯性导航系统消除速度累积误差。

如图2所示,所述实施例包括以下步骤:建立模型,特征选择,特征获取和预处理,建立特征函数,计算状态转移概率,循环测试和记录,求出最佳匹配,结果验证与可信度输出。其中,所述模型是指表示计算对象关系的数学模型,所述特征依赖于所述模型的建立,并共同影响特征的获取和预处理过程,以及特征函数的建立。

步骤s1:建立模型

所述模型为所需识别目标模式的有向连通图模型g,也可称为隐马尔可夫模型,它的状态不能直接观察到,但能通过观察向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每个观测向量是由一个具有相应概率密度分布的状态序列产生。

所述有向连通图模型g具有模型参数,包括:

1、观测信号z;

2、角速度峰值(节点)v,个数n;

3、隐含状态(边)e。

所述的需识别目标模式包括需要进行识别的单一模式或者模式集合。简单的识别目标包括正方形,圆形;较为复杂的常见识别目标包括人脸,体型,车牌。

所述的图包括数学与计算机科学中常用的图模型,是表示物件与物件之间关系的方法,是图论的基本研究对象。一个图是由一些小圆点(称为顶点或节点v)和连结这些圆点的直线或曲线(称为边e)组成的(g={v,e})。节点实际代表着需识别目标模式的固定特征,边的作用是将节点连接在一起并且代表两个节点之间的相互关系。两个具有公共边的节点称为相邻。

所述的连通包括从上述图中任意一点出发,通过有限的边以及节点后,均可到达任意另一节点。

所述的有向是指上述图中的边均具有方向,只能沿着边的方向从一个节点到达另一个节点,而不可反向为之。根据实际应用,在本发明中该有向图可为单向图、双向图。单向图是指两个相邻节点之间仅有一条有向边,意味着仅能从一个节点到达另一节点。而双向图是指两个相邻节点之间具有两条方向相反的有向边,因而两个节点均可到达对方。

步骤s2:特征选择,定义连通的节点与边的单种或者多种特征f

所述特征包括可区分所述连通图中的节点、边的特征。通常而言,所述特征可以区分所述连通图的任意两个节点(边),或者区分某一组节点(边)与图中的剩余节点(边)。所述的区分可包括非0即1的是非判断,和常见的概率判断(该特征以一定代表某节点或者边)。

对于行人的步行运动而言,在运动中的任意时刻至少有一只脚处于与地面接触状态,所以,按照步行过程中脚的运动状态,可以将一个步行周期大体分为两个阶段:静止阶段与摆动阶段。摆动阶段又可以分为三部分,即前脚尖离地、空中摆动、后脚跟着地三个过程。因此,行人在一个步行周期内存在4种隐含状态,设定全脚掌着地过程为状态ⅰ,前脚尖离地过程为状态ⅱ,空中摆动过程为状态ⅲ,后脚跟着地为状态ⅳ,每个状态都对应着不同的角速度输出峰值v。

所述特征的作用在于将实时观测信号与有向连通图模型g联系起来,其表现形式包括:函数。函数关系包括:角速度信号与角速度输出峰值f(z,v),角速度信号与步行状态f(z,e),或者观测信号同时与角速度峰值和步行状态f(z,v,e)。即,所定义特征会关联观测信号与节点f(z,v)或者观测信号与边f(z,e),或者观测信号同时与节点和边f(z,v,e)。

步骤s3:获得实时观测信号并预处理为可使用观测信号z

所述实时观测信号包括单一信号和多种信号,所述多种信号通常对应着多种特征。由于单一特征的信息量较小,可提供的模式识别范围较窄,可信度较低,因此多种特征的模式识别在现实应用中更为广泛。所述可使用观测信号包括可以直接应用于步骤s2所定义的特征函数f中的信号形式。

为了获取行人运动的惯性信息,探索行人的步行运动特性,将惯性测量单元安装于行人的脚部,所述惯性测量单元包括加速度计、角速度计,用来记录行走运动过程的加速度与角速度信息,并设置采样频率为200hz,以保证记录的数据能够真实地反映全部步行运动过程。

根据人的步行运动过程中,理想的状态传递过程是ⅰ→ⅱ→ⅲ→ⅳ,然而行人的运动存在一定的随机性,加上外部因素的干扰,状态传递往往不是在理想的情况下进行的,因此,原始的角速度数据不能直接作为观测样本,需要对其进行一系列的处理,包括,平滑滤波,峰值提取。

所述平滑滤波是低频增强的空间域滤波技术,可以消除噪音。由于原始的角速度数据波形存在尖峰,因此,需要对数据进行平滑滤波处理,获得滤波后较为平滑的数据波形图。

所述峰值提取包括,对滤波后的数据进行峰值提取得到仅保留峰值的数据,以及将统一状态内多余的峰值进行滤除仅保留绝对值最大的峰值。

如图3至图6所示,其中横坐标为时间,单位为s,纵坐标为x轴角速度,单位为red/s。其中,图3为原始数据,波形图存在尖峰;图4为平滑滤波后的数据,消除了尖峰;图5为峰值提取,仅保留峰值的数据;图6为剔除多余峰值,仅保留了绝对值最大的峰值。

步骤s4:根据可使用观测信号z计算有向连通图模型g中所有节点以及边的特征函数

所述特征函数包括步骤s2中定义的特征函数f(z,v),f(z,e),和f(z,v,e),本文以下特征函数全部由f(z,v,e)标记。

步骤s5:根据特征函数计算当前各节点的状态概率和转移概率

状态概率pi为节点vi速度峰值点的概率,各状态概率之和1≤i≤n,其中n是有向连通图模型g中的节点数目。

转移概率pi为边ei隐含状态的概率,任意一个节点向别的节点转移的所有边的概率之和1≤i≤d,其中d是该节点的出度,为该速度峰值点(节点)转向隐含状态(边)的数目。

每个节点的m个特征函数f1(z,v,e),f2(z,v,e),…,fm(z,v,e)组合为状态概率πi,组合方式包括但不限于以下四种方式:

表1

这里采用特征函数之和的方式:

每个边的m′个特征函数组合为转移概率,组合方式包括以下四种方式:

表2

这里采用特征函数之和的方式:

根据当前状态概率矩阵π={πi(i=1,2,…,n)}与转移概率p={pi(i=1,2,…)}获得新的状态概率矩阵:

π=π×p

步骤s6:循环观测和记录

反复进行步骤s2至s5,并记录每一轮的相关信息。

每一轮的相关信息包括:

1、每一轮的状态概率矩阵пt

2、维特比网格矩阵:该矩阵是一个n×t的矩阵(n是图g的节点数目,t是观测时间长度),其中第i行第t列代表了在时间t具有最大概率转移到节点i的节点编号。

步骤s7:通过译码识别求出最佳匹配

所述的最佳匹配模式包括给定的所有目标模式中具有最大概率的模式。

所述的最佳匹配模式采用译码方法,包括以下步骤:

1.获得当前状态矩阵пt中具有最大状态概率的节点编号vt

2.根据维特比网格矩阵获得在时间t-1具有最大概率转移到vt的节点编号vt-1

3.依次类推可反向获得具有最大概率的识别序列[vt,vt-1,…,vt,…,v0]。

4.将该序列倒序输出即可得最佳识别模式[v0,v1,…,vt,…,vt]。

按照节点位置和排序可以绘制零速区间,如图7所示,其中,实线hmm为算法结果输出,虚线为特征数据原始图形。

步骤s8:结果验证与可信度输出

所述的可信度包括所输出的最佳识别模式为正确模式的概率,包括以下两种方式计算及表示:

1、以所述步骤s7中的最佳识别模式[v0,v1,…,vt,…,vt]的概率为pc来衡量可信度,

该概率并不是位于[0,1]之间的绝对概率,而是不同可能模式之间的相对概率,因此在不同应用需要进行转换。

2、以估计最佳识别模式的标准差σ来衡量可信度。以时间t为例,n为有向连通图模型中的节点数目,xi为节点的位置信息,μt为当前均值,当前标准差σt的计算包括:

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1