一种基于四边形骨架结构的静态手势特征描述方法

文档序号:6466729阅读:201来源:国知局

专利名称::一种基于四边形骨架结构的静态手势特征描述方法
技术领域
:本发明属于图像生物特征识别
技术领域
,涉及一种静态手势的特征描述方法,具体涉及一种基于四边形骨架结构的静态手势特征描述方法。
背景技术
:手势识别,属于肢体语言识别范畴的相关技术,是一种生物特征识别技术;可以用于人机交互、哑语翻译等领域。根据手势的运动状态可以将手势定义为静态手势和动态手势。静态手势的特征描述,是手势识别技术中的关键环节,现有的静态手势的特征描述,多采用不变矩、傅里叶描述符、交点统计等方法,但这些方法对于复杂手势的识别正确率较低、耗时长,不能满足对特征手势实时提取的要求。-
发明内容本发明的目的在于提供一种基于四边形骨架结构的静态手势特征描述方法,提高复杂手势识别的正确率,节省时间,并能实时进行手势特征的提取。本发明所采用的技术方案是,一种基于四边形骨架结构的静态手势特征描述方法,通过肤色检测获得静态手势的二值模板,对该二值模板构造四边形骨架结构,然后,提取四边形骨架结构的14个具有縮放不变性的特征量,并对该特征量进行归一化处理,用以对不同的手势进行描述,该方法按以下步骤进行步骤l:提取拍摄的静态手势视频帧画面中的手势区域采用现有的肤色检测方法,将RGB色系下拍摄得到的视频帧画面中的手势区域根据以下公式转换到YIQ色系,生成该手势区域的二值模板<formula>formulaseeoriginaldocumentpage6</formula>及Gl5r=-,g=-,6=-o255255255式中,R、G、B分别为图像的红色、绿色、蓝色通道的三基色值,"、g、6分别表示RGB色系下归一化后的三基色值,r、/、^分别表示转换到YIQ色系后图像的亮度、色调和饱和度;步骤2:根据手势二值模板构建手势四边形骨架结构根据步骤1得到的静态手势的二值模板,构建静态手势的四边形骨架结构,具体构建步骤如下1)找出静态手势二值模板的四个边界像素点,根据该四个边界像素点构建一个外接矩形,锁定手势区域,2)将步骤l)构建的外接矩形均分为四个子矩形,3)按以下公式分别求取步骤2)得到的四个子矩形区域内包含的静态手势部分的质心,质心的计算公式为式中,S表示连通域,即子矩形中的部分手势所构成的区域,^表示连通域内像素的个数,"",、)为质心的坐标,以确定的四个质心为顶点,依次连接构成一个四边形,该四边形即为静态手势的骨架结构;步骤3:提取静态手势四边形骨架结构的特征1)分别求取步骤2构建的四边形骨架结构的边周比、角周比、矩形度边周比根据两点间距离公式=)2+0^-^)2分别计算出步骤2得到的四边形的四条边和两条对角线的长度,按逆时针,分别求取各线段的长度分别与四边形的周长CS的比值,生成以下六个特征量式中,AB、BC、CD、DA分别为按逆时针四边形各边的长度,AC、BD分别是四边形两对角线的长度,角周比根据余弦定理逆时针分别计算出四边形四个顶角的值,各顶角的值与四边形内角和的比生成以下四个特征量/7=^4/360;/8=ZB/360;/9=ZC/360;A-ZD/360;式中,J、ZS、ZC、ZD分别表示四边形四个顶角的值,矩形度分别计算各子矩形内手势部分连通域面积4与各子矩形面积4的比式中,A;、^2、、^W分别表示各子矩形内手势部分的连通域面积,AR1,AR2,AR3,AR4分别表示各子矩形的面积,2)对上面得到的14个特征量迸行归一化处理,即计算各特征量的特征量和,-堂y;,然后,将各特征量用"-y;"訓代替,所获得的归一化后的14个特征构成一个14维的特征向量,用以表示不同的静态手势。本发明静态手势特征描述方法,,采用四边形骨架结构替代复杂的手势,实现了手势特征提取的简单化,达到了对手势特征实时的提取,适用于不同人手的不同手势的识别,无论是对手指根数和手指朝向不同的轮廓差异较大的手势,还是对手型相同但朝向不同的轮廓差异细微的手势,均可获得良好的识别结果。图1是采用肤色检测方法生成的静态手势的二值手势模板图;图2是采用本发明方法构建的静态手势四边形骨架结构图。具体实施例方式下面结合附图和具体实施方式对本发明迸行详细说明。本发明方法,首先利用现有肤色检测方法提取手势区域生成的二值手势模板,然后,根据该二值手势模板构建四边形骨架结构,并依据构建的四边形骨架结构生成静态手势特征,该方法按以下步骤进行步骤l:提取拍摄的静态手势视频帧画面中的手势区域采用现有的肤色检测方法,将人手显示的具体静态手势,在RGB色系下拍摄,将得到的视频帧画面中的手势区域,根据以下公式转换到YIQ色系,并将其提取出来,生成如图1所示的该手势区域的二值模板<formula>formulaseeoriginaldocumentpage9</formula>其中,R、G、B分别为图像的红色、绿色、蓝色通道的三基色值,r、g、6分别表示RGB色系下归一化后的三基色值,F、/、^分别表示转换到YIQ色系后图像的亮度、色调和饱和度。本发明方法采用YIQ色系下进行肤色检测,是因为人手肤色分布在一定的颜色区域内,静态手势对环境光照条件差异具有适应性,且在YIQ色系下,人手肤色在/e的范围内具有良好的聚类特性。步骤2:根据手势二值模板构建手势四边形骨架结构根据步骤1得到的静态手势的二值模板,构建静态手势的四边形骨架结构,具体构建步骤如下1)寻找静态手势二值模板的外接矩形对静态手势二值模板进行上、下、左、右四个方向的搜索,找出该模板的四个边界像素点,并根据边界像素点构建一个如图2所示的外接矩形,锁定手势区域。2)划分子矩形确定l)中构建的外接矩形的各边中点,将相对两条边的中点连线,该中点连线将外接矩形划分为四个子矩形,按逆时针依次记为1、2、3、4,如图2所示。3)构造静态手势的骨架结构分别求取四个子矩形区域内包含的静态手势部分的质心,质心的计算公式为xmSx少附Z!少式中,s表示连通域,即子矩形中的部分手势所构成的区域,^表示连通域内像素的个数,"-h)为质心的坐标。如果某个子矩形内不存在静态手势二值模板的像素点,则用l)中所得外接矩形的中心点替代该子矩形的质心,记为A、B、C、D。以确定的四个质心为顶点,依次连接构成四边形ABCD,该四边形即为静态手势的骨架结构,如图2所示。3.提取静态手势四边形骨架结构的特征、手势输入时,由于人手离拍摄镜头远近的不同,手势在图像中的大小随之发生相应变化,同时,相同的手势形状但不同的手指朝向,在手势的定义中意味着不同的含义,所以,提取的静态手势的特征必须保证同一手势特征量的縮放不变性,特征量必须能够将其明确地区分,故采用0到1之间的比例数作为静态手势四边形骨架结构的特征量;1)边周比根据两点间距离公式^,-^/(a-a)2+(力-h)2分别计算出步骤2得到的四边形ABCD的四条边AB、BC、CD和DA以及对角线AC、BD的长度。按逆时针,将上述各线段的长度分别与四边形ABCD的周长Cs求比,生成以下六个特征<formula>formulaseeoriginaldocumentpage11</formula>选取周长CS作为分母,保证了特征为0到1之间的小数;2)角周比根据余弦定理逆时针分别计算出顶角Z^、J、ZC、^D的值,各顶角的值与四边形内角和的比生成以下4个特征<formula>formulaseeoriginaldocumentpage11</formula>四边形内角和恒为360度,因此,保证了该特征为0到1之间的小数,并且具备统一的分母;—3)矩形度矩形度是描述连通域与矩形相似程度的量,分别计算各子矩形1、2、3、4内手势部分连通域面积^与各子矩形面积^i的比值,该比值为以下四个特征<formula>formulaseeoriginaldocumentpage11</formula>子矩形面积为手势外接矩形等分而成,故A产A^A严A,,使得矩形度公式的分母相同,且特征量在0到1之间,4)对1)、2)和3)得到的14个特征量进行归一化处理,即计算各特征量的特征量和幼附=|;/,然后,将各特征量用/'-y;""m代替,所获得的归一化后的14个特征构成一个14维的特征向量,用以表示不同的手势。本发明方法,根据不同手势的形状不同,将其二值模板的分布特性通过四边形骨架连接方式进行连接,之后,统计该四边形骨架的形状特征,获得对不同手势特征的描述,手势的骨架结构是一种抽象、简化形状的方法,在小计算量的前提下,能够有效地区分相似静态手势特征。权利要求1.一种基于四边形骨架结构的静态手势特征描述方法,通过肤色检测获得静态手势的二值模板,对该二值模板构造四边形骨架结构,然后,提取四边形骨架结构的14个具有缩放不变性的特征量,并对该特征量进行归一化处理,用以对不同的手势进行描述,其特征在于,该方法按以下步骤进行步骤1提取拍摄的静态手势视频帧画面中的手势区域采用现有的肤色检测方法,将RGB色系下拍摄得到的视频帧画面中的手势区域根据以下公式转换到YIQ色系,生成该手势区域的二值模板<mathsid="math0001"num="0001"><math><![CDATA[<mrow><mfencedopen='['close=']'><mtable><mtr><mtd><mi>Y</mi></mtd></mtr><mtr><mtd><mi>I</mi></mtd></mtr><mtr><mtd><mi>Q</mi></mtd></mtr></mtable></mfenced><mo>=</mo><mfencedopen='['close=']'><mtable><mtr><mtd><mn>0.299</mn></mtd><mtd><mn>0.587</mn></mtd><mtd><mn>0.114</mn></mtd></mtr><mtr><mtd><mn>0.596</mn></mtd><mtd><mo>-</mo><mn>0.275</mn></mtd><mtd><mo>-</mo><mn>0.321</mn></mtd></mtr><mtr><mtd><mn>0.212</mn></mtd><mtd><mo>-</mo><mn>0.515</mn></mtd><mtd><mn>0.311</mn></mtd></mtr></mtable></mfenced><mfencedopen='['close=']'><mtable><mtr><mtd><mi>r</mi></mtd></mtr><mtr><mtd><mi>g</mi></mtd></mtr><mtr><mtd><mi>b</mi></mtd></mtr></mtable></mfenced></mrow>]]></math></maths><mathsid="math0002"num="0002"><math><![CDATA[<mrow><mi>r</mi><mo>=</mo><mfrac><mi>R</mi><mn>255</mn></mfrac><mo>,</mo></mrow>]]></math>id="icf0002"file="A2008101509160002C2.tif"wi="15"he="9"top="125"left="53"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths><mathsid="math0003"num="0003"><math><![CDATA[<mrow><mi>g</mi><mo>=</mo><mfrac><mi>G</mi><mn>255</mn></mfrac><mo>,</mo></mrow>]]></math>id="icf0003"file="A2008101509160002C3.tif"wi="16"he="9"top="125"left="73"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths><mathsid="math0004"num="0004"><math><![CDATA[<mrow><mi>b</mi><mo>=</mo><mfrac><mi>B</mi><mn>255</mn></mfrac><mo>.</mo></mrow>]]></math>id="icf0004"file="A2008101509160002C4.tif"wi="16"he="9"top="125"left="94"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>式中,R、G、B分别为图像的红色、绿色、蓝色通道的三基色值,r、g、b分别表示RGB色系下归一化后的三基色值,Y、I、Q分别表示转换到YIQ色系后图像的亮度、色调和饱和度;步骤2根据手势二值模板构建手势四边形骨架结构根据步骤1得到的静态手势的二值模板,构建静态手势的四边形骨架结构,具体构建步骤如下1)找出静态手势二值模板的四个边界像素点,根据该四个边界像素点构建一个外接矩形,锁定手势区域,2)将步骤1)构建的外接矩形均分为四个子矩形,3)按以下公式分别求取步骤2)得到的四个子矩形区域内包含的静态手势部分的质心,质心的计算公式为<mathsid="math0005"num="0005"><math><![CDATA[<mrow><msub><mi>x</mi><mi>m</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>S</mi></msub></mfrac><mo>&CenterDot;</mo><munder><mi>&Sigma;</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>&Element;</mo><mi>S</mi><mo>)</mo></mrow></munder><mi>x</mi><mo>,</mo></mrow>]]></math>id="icf0005"file="A2008101509160003C1.tif"wi="29"he="11"top="29"left="52"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths><mathsid="math0006"num="0006"><math><![CDATA[<mrow><msub><mi>y</mi><mi>m</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>S</mi></msub></mfrac><mo>&CenterDot;</mo><munder><mi>&Sigma;</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>&Element;</mo><mi>S</mi><mo>)</mo></mrow><mtext></mtext></munder><mi>y</mi><mo>;</mo></mrow>]]></math>id="icf0006"file="A2008101509160003C2.tif"wi="30"he="11"top="29"left="99"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>式中,S表示连通域,即子矩形中的部分手势所构成的区域,NS表示连通域内像素的个数,(xm,ym)为质心的坐标,以确定的四个质心为顶点,依次连接构成一个四边形,该四边形即为静态手势的骨架结构;步骤3提取静态手势四边形骨架结构的特征1)分别求取步骤2构建的四边形骨架结构的边周比、角周比、矩形度边周比根据两点间距离公式<mathsid="math0007"num="0007"><math><![CDATA[<mrow><mi>dist</mi><mo>=</mo><msqrt><msup><mrow><mo>(</mo><msub><mi>x</mi><mn>1</mn></msub><mo>-</mo><msub><mi>x</mi><mn>2</mn></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>y</mi><mn>1</mn></msub><mo>-</mo><msub><mi>y</mi><mn>2</mn></msub><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mrow>]]></math>id="icf0007"file="A2008101509160003C3.tif"wi="53"he="6"top="122"left="77"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>分别计算出步骤2得到的四边形的四条边和两条对角线的长度,按逆时针,分别求取各线段的长度分别与四边形的周长Cs的比值,生成以下六个特征量f1=AB/Cs;f2=BC/Cs;f3=CD/Cs;f4=DA/Cs;f5=AC/Cs;f6=BD/Cs;式中,AB、BC、CD、DA分别为按逆时针四边形各边的长度,AC、BD分别是四边形两对角线的长度,角周比根据余弦定理逆时针分别计算出四边形四个顶角的值,各顶角的值与四边形内角和的比生成以下四个特征量f7=∠A/360;f8=∠B/360;f9=∠C/360;f10=∠D/360;式中,∠A、∠B、∠C、∠D分别表示四边形四个顶角的值,矩形度分别计算各子矩形内手势部分连通域面积ASi与各子矩形面积ARi的比值,形成以下四个特征量f11=AS1/AR1;f12=AS2/AR2;f13=AS3/AR3;f14=AS4/AR4;式中,AS1、AS2、AS3、AS4分别表示各子矩形内手势部分的连通域面积,AR1、AR2、AR3、AR4分别表示各子矩形的面积,2)对上面得到的14个特征量进行归一化处理,即计算各特征量的特征量和<mathsid="math0008"num="0008"><math><![CDATA[<mrow><mi>sum</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>14</mn></munderover><msub><mi>f</mi><mi>i</mi></msub><mo>,</mo></mrow>]]></math>id="icf0008"file="A2008101509160004C1.tif"wi="21"he="10"top="133"left="30"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>然后,将各特征量用f′i=fi/sum代替,所获得的归一化后的14个特征构成一个14维的特征向量,用以表示不同的静态手势。全文摘要本发明公开的一种基于四边形骨架结构的静态手势特征描述方法,首先通过肤色区域检测获得静态手势区域的二值模板;然后,根据该二值模板构建外接矩形,并将该外接矩形等分为四个子矩形;并分别在四个子矩形中寻找落在其内部的二值模板像素点集的质心,连接四个质心构造一个能够反映不同手势的四边形骨架;之后,提取该四边形骨架的六个周长比,四个角周比和四个矩形度作为描述特征量,对该描述特征量进行归一化处理,形成14维的特征向量,用于表示不同的静态手势。本发明方法不仅能够给出区分常用手势的特征,而且能给出区分复杂静态手势的特征,并能满足实时处理的要求,提高复杂手势的识别正确率。文档编号G06K9/00GK101359367SQ20081015091公开日2009年2月4日申请日期2008年9月11日优先权日2008年9月11日发明者吴瑞杰,孙国清,徐骁斐,曹建斌,虹朱,栋王,洁许,赵朝杰,欢金,韩永鹏申请人:西安理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1