一种应用于手势识别的旋转特征码的距离测度方法

文档序号:6604417阅读:116来源:国知局
专利名称:一种应用于手势识别的旋转特征码的距离测度方法
技术领域
本发明属于模式识别与人工智能技术领域,特别是涉及一种应用于手势识别的旋 转特征码的距离测度方法。
背景技术
基于加速度传感器的人运动识别是近年来计算机领域中新兴起的研究前沿方向 之一,即将加速度传感器穿戴在用户身上或将它集成在手机或PDA等手持设备上,通过分 析人运动时所产生的加速度信号来进行检测、识别用户的运动状态并对其行为进行理解和 描述,它属于穿戴式计算(Wearable Computing)和普适计算(Ubiquitous Computing)的 重要研究内容之一。 目前,基于加速度传感器的人运动识别主要包括人运动状态识别和人手势识别两 方面。运动状态识别主要是识别人在日常生活中走路、跑步、坐着、站立等基本动作;而手 势识别主要是识别一些简单的电话手势、自定义的用于控制设备的简单手势、阿拉伯数字 0-9。基于加速度传感器的人运动识别的关键在于特征提取,许多研究人员都从加速度信号 中提取了有效的特征用于识别人的运动状态和手势,综合起来可以把这些特征分成两类 时域特征和频域特征。常用的时域特征主要有均值、方差或标准差、两轴之间的相关系数、 加速度信号的峰值和谷值等等;常用的频域特征有FFT系数等。在基于加速度传感器的人手势识别中,识别在三维空间书写的阿拉伯数字0-9受 到一些研究人员的重视,因为基于三轴加速度传感器的三维空间书写不同于传统的二维平 面书写,用户只需要手握嵌入三轴加速度传感器的书写设备在空中自由书写,它既不受某 个特定的书写平面的限制(如手写板、触摸屏),也不需要任何外挂设备(如摄像头),提供 了一种全新的数字笔实现方式,因而具有很好的应用研究价值。尽管在基于三轴加速度信号的手势识别领域的研究人员已经从事了大量的研究 工作,但从目前已公开的技术来看,如何从书写过程产生的三轴加速度信号中提取有效的 特征还是一个研究难点,而且提取有效特征后,如何将该特征进行有效处理更是没有相关 公开资料。

发明内容
本发明的目的在于提供一种应用于手势识别的旋转特征码的距离测度方法。为了实现上述发明目的,采用的技术方案如下一种应用于手势识别的旋转特征码的距离测度方法,其采用加速度传感器测得用 户在三维空间进行书写的三个轴向的加速度信号,并取得该加速度信号分别投影到y-z, z-x,和x-y平面上所对应的旋转特征码Cyz,Czx和Cxy,最后采用编辑距离来度量不同样本的 旋转特征码之间的差异。上述技术方案中,所述编辑距离的度量如下令符号序列=识…为第i个样本的Cyz编码,c' e {0,1,2,3} ,cjyz = cki…ci为第j个样本的cyz编码,ci e {0,1,2,3},再令E = {es, ei ed}分别表示序列C丨/变换为时替 换、插入和删除一个符号的代价,则和的编辑距离递归地表示为 其中, 相应地计算出Czx和Cxy的编辑距离。所述编辑距离还进行归一化,所述和的归一化编辑距离表示为 其中,|C;z|,|qz|分别表示序列cy口 (丄的长度,相应地计算出Czx和Cxy的归一化编辑距离。所述第i个样本和第j个样本的旋转特征码间的距离表示为 其中乂卿^,“琍^^^必,“扮别是第i个样本和第j个样本的Czx编码和
cxy编码的编辑距离。本发明根据从三轴加速度信号中提取了旋转特征之后,针对不同样本的旋转特征 码的长度不一致,无法直接计算它们之间的差异,故而采用编辑距离来度量不同样本的旋 转特征码间的差异,使得旋转特征可有效应用于字符识别领域。


图1是基于加速度传感器的三维书写字符识别的流程图;图2是本发明的基于y_z平面提取的旋转特征;图3是本发明的对加速度的方向变化的编码图;图4是本发明的距离测度方法流程图。
具体实施例方式下面结合附图对本发明做进一步的说明。基于旋转特征的三维空间书写识别算法的系统流程图如附图1所示,具体步骤包 括1、预处理对于采集到的三维加速度信号首先通过减去均值去除重力加速度的影响,然后进 行幅度归一化处理,接着对其进行高斯滤波,滤除加速度信号中包含的测量时的噪声及由于手腕抖动产生的噪声。2、提取旋转特征码基于加速度传感器的三维空间书写不同于传统的二维平面书写,它采集不到书写 者的书写轨迹,只能获得由三轴加速度传感器测得的三个轴向的加速度信号。如何利用这 三个轴向的加速度信号来识别出书写者写的是什么,特征提取是关键。三轴加速度传感器能同时测量手势运动时产生的相互正交的三个轴向的加速度, 分别用ax (t),ay (t),az (t)表示x轴、y轴和z轴的加速度信号。记A(t) = [ax(t),ay(t),az(t)]是某个手势运动时产生的一个三轴加速度信号, 信号的长度记为S。定义B(t) = A(t) XA(t+l)(1)则B(t)也是一个矢量,且B(t)的方向只有两种情况,一种是垂直于A(t)和 A(t+1)的平面向上,另一种是垂直于A(t)和A(t+1)平面向下。当B(t)的方向垂直于A(t) 和A(t+1)的平面向上时,加速度信号A(t)从t到t+1时刻逆时针旋转;当B(t)的方向垂 直于A(t)和A(t+1)的平面向下时,加速度信号A(t)从t到t+1时刻顺时针旋转。当t从0变化到S-1时刻加速度信号就会产生一系列的顺时针和逆时针旋转,即 书写每个字符时,加速度信号都会产生一系列的顺时针和逆时针旋转变化。本发明提出的 旋转特征正是记录三维空间书写时加速度信号产生顺时针旋转和逆时针旋转的变化过程。对于一个三维空间书写时产生的三轴加速度信号A(t),分别从三维空间中下述三 个投影特征Ayz(t) = [ay(t), az(t))]Azx(t) = [az(t),ax(t)](2)Axy(t) = [ax(t), ay(t)]式(2)中,二维矢量~2(0,^0,和47(0分别是三轴加速度信号A (t)在y-z, z-x,和x_y平面的投影。以Ayz(t)为例来说明提取的旋转特征,根据式(1)可以做如下定义Byz(t) = Ayz(t) XAyz(t+l)(3)贝UByz(t)的方向垂直于Ayz(t)和Ayz(t+1)平面向上时加速度Ayz(t)逆时针旋转; Byz(t)的方向垂直于Ayz(t)和Ayz(t+1)平面向下时加速度Ayz(t)顺时针旋转。如果把每个 时刻的顺时针和逆时针旋转都记录下来,通过观察会发现在某个时间段内,加速度信号一 直在做顺时针(或逆时针)旋转。所以没必要把这个时间段内的每个时刻点都取为旋转特 征。记第i个旋转特征为RFyz(i),i > 1。则旋转特征RFyz(i)的提取满足如下原则Rfyz(l) =Ayz(0)RFyz(i) = Ayz(t+1),当 Byz(t)和 Byz(t_l)的方向相同,但Ayz(t+1)和 Ayz(t)不在同一象限;或当Byz(t)和Byz(t_l)的方向相反时RFyz(i)是一个由ay(t)和az(t)确定的矢量。由于旋转是由矢量的方向决定的, 所以在用ay(t)和~(0表示提取的旋转特征RFyz(i)时,将矢量的大小取为相等。附图2 是对6个人书写数字8时产生的三轴加速度信号基于y-z平面提取的旋转特征点RFyz(i), 并把它们用y轴和z轴的加速度[ay(t),az(t)]表示出来。图中垂直方向的轴表示ay(t),水平方向的轴表示az (t),箭头指向是各个轴的加速度方向。为了方便进行数字运算,规定了如附图3所示的加速度方向变化的编码规则。对 附图2提取的旋转特征RFyz(i)进行编码得到旋转特征码Cyz,同样,可以对Azx(t)和Axy(t) 提取旋转特征点并进行上述编码,得到旋转特征码Czx和Cxy。一个三轴加速度信号的旋转 特征码表示为C = {Cyz,Czx,Cxy},Cyz,Czx和Cxy分别是对Ayz (t),Azx (t),和Axy (t)的加速度 变化顺序的编码。3、生成每个类的模板从总样本中随机选取k个样本作为训练样本,将训练样本中相同类别的样本放在 一起,在每个类别中,分别计算每个样本和类内其他样本的旋转特征码间的编辑距离之和, 然后将样本按编辑距离之和从小到大排列后作为每个类的类模板。4、生成训练样本集计算每个训练样本和所有类模板的旋转特征码间的编辑距离,作为该样本的特 征。则对k个训练样本可以得到一个kXk的训练特征矩阵 其中,是第i个训练样本和第j个类模板间的距离,i = U2,…k,j = 1, 2,…k,k是所有类的类模板数。5、生成测试样本集对每个测试样本,计算它和所有类模板的旋转特征码间的编辑距离,作为该测试 样本的特征。对1个测试样本就可以得到一个lXk的测试特征矩阵 其中,是第i个测试样本和第j个类模板间的距离,i = 1,2,= 1, 2,…k,1是测试样本的个数,k是所有类的类模板数。上述第3、4、5步骤所采用的编辑距离计算是核心关键之一,也是本发明的具体内 容,具体如附图4所示由于不同样本的旋转特征码的长度不一致,无法直接计算它们之间的差异,采用 编辑距离来度量不同样本的旋转特征码间的差异。设符号序列
为第i个样本的cyz编码,
第j个样本的cyz编码,ci € {0,1,2,3} oE= {es,ei;ed}分别表示序列CI变换为CJ时替换、插 入和删除一个符号的代价,则和C〗z的编辑距离递归地表示为 其中,)
。在这里,替换、插入和删除符号的代价与符号的 Ed {cn ,e) = ed,[0, otherwise
具体取值及其在序列中的位置无关,一般情况下,可取替换、插入和删除符号的代价为1,即 由于编辑距离度量的是2个序列之间差异的绝对值,在分析长度变化范围较大的 序列时,容易使长序列之间的编辑距离远大于短序列之间的距离。这显然是不合适的,因此 需要对其进行归一化。上述符号序列的归一化编辑距离表示为 其中,C; ,C4分别表示序列CL和G的长度 所以,第i个样本和第j个样本的旋转特征码间的距离可表示为
(6)其中,rf舰和分别是第i个样本和第j个样本的Czx编码和 cxy编码的编辑距离。6、支持向量机(SVM)分类用上面生成的训练样本集训练SVM分类器,然后用SVM分类器识别出每个测试样 本书写的数字。本发明的优异性能通过大样本的实验得到了证实。下面描述采用本发明所述的距 离测度方法,对大量三维空间书写数字样本进行相关实验的结果。由于基于加速度传感器的三维空间书写数字识别是一个新兴发展起来的识别技 术,目前还没有一个公共的数据库。本实施例设计了基于三轴加速度传感器的加速度信号 采集器,采集了 60个人的数据,每个采集者单手握着加速度信号采集器在三维空间自由书 写数字0到9,每个采集者书写三遍,共采集到180套数据。每个类随机选取144套样本(占 每类总样本数的80% )进行训练,总训练样本数为1440,余下的36套样本用于测试,总的 测试样本数目为360。在实验中将本发明提出的旋转特征与峰值谷值特征、时域原始特征及传统的频域 FFT特征的性能做了比较。对每个特征,进行了三次实验,然后取平均值。表1给出了每个 类别基于四种特征提取方法的识别率。表1四种不同特征对10个空中手写数字的识别率的比较 由表1中可以看到,采用本发明提出的旋转特征及其距离测度,其识别率明显高 于时域原始特征、峰值谷值特征、及FFT特征。而且,对于每个类别,基于旋转特征的识别 率都是较高的,实验结果表明由本发明所述的方法获得的旋转特征在识别性能方面的有效 性。
权利要求
一种应用于手势识别的旋转特征码的距离测度方法,其特征在于采用加速度传感器测得用户在三维空间进行书写的三个轴向的加速度信号,并取得该加速度信号分别投影到y-z,z-x,和x-y平面上所对应的旋转特征码Cyz,Czx和Cxy,最后采用编辑距离来度量不同样本的旋转特征码之间的差异。
2.根据权利要求1所述的应用于手势识别的旋转特征码的距离测度方法,其特征在于 所述编辑距离的度量如下令符号序列 为第i个样本的Cyz编码,4 € {0,1,2,3} ,Cjyz = c(ci ".ci为第j 个样本的Cyz编码,ci € {0,1,2,3},再令E = {es, ei;ed}分别表示序列变换为C^z时替换、插 入和删除一个符号的代价,则的编辑距离递归地表示为 其中, 相应地计算出Czx和Cxy的编辑距离。
3.根据权利要求2所述的应用于手势识别的旋转特征码的距离测度方法,其特征在于 替换、插入和删除符号的代价为1,即es = ei = ed = 1。
4.根据权利要求2或3所述的应用于手势识别的旋转特征码的距离测度方法,其特征 在于所述编辑距离还进行归一化,所述C“和Cjz的归一化编辑距离表示为 其中,|c;z|,|qz|分别表示序列的长度,相应地计算出Czx和Cxy的归一化编辑距离。
5.根据权利要求2或3所述的应用于手势识别的旋转特征码的距离测度方法,其特征 在于所述第i个样本和第j个样本的旋转特征码间的距离表示为 其中,^^ ,<^)和"_(4,(^)分别是第i个样本和第j个样本的Czx编码和Cxy 编码的编辑距离。
全文摘要
本发明提供了一种应用于手势识别的旋转特征码的距离测度方法,其采用加速度传感器测得用户在三维空间进行书写的三个轴向的加速度信号,并取得该加速度信号分别投影到y-z,z-x,和x-y平面上所对应的旋转特征码Cyz,Czx和Cxy,最后采用编辑距离来度量不同样本的旋转特征码之间的差异。本发明根据从三轴加速度信号中提取了旋转特征之后,针对不同样本的旋转特征码的长度不一致,无法直接计算它们之间的差异,故而采用编辑距离来度量不同样本的旋转特征码间的差异,使得旋转特征可有效应用于字符识别领域。
文档编号G06F3/01GK101853073SQ20101020459
公开日2010年10月6日 申请日期2010年6月18日 优先权日2010年6月18日
发明者薛洋, 金连文 申请人:华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1