一种基于双目结构光的三维手势控制智能电视的方法与流程

文档序号:15079580发布日期:2018-08-03 12:26阅读:239来源:国知局

本发明涉及人机交互领域,特别是一种手势控制的方法。



背景技术:

随着互联网技术的发展,智能电视——一种具备开放式操作系统与芯片,拥有开放式应用平台,可实现双向人机交互功能,集影音、娱乐、数据等多种功能于一体,以满足用户多样化和个性化需求的电视产品成为了电视的潮流趋势。

传统的按键式遥控器主要是由集成电路电板和用来产生不同讯息的按钮所组成。内装有一个中央处理器CPU,CPU在制造时就将电视机各种菜单密码信息输入其中,电视机的遥控发射器只要发出与之对应的密码就可以实现电视机的遥控了。

智能电视的发展对电视的交互操作提出了更多的要求。首先便是需要简洁方便的文字输入、网页浏览和频道选取,传统的遥控器显然无法满足新的交互需求。如果在智能电视上外接鼠标和键盘,用户则需要配置多个控制终端,且无法在远距离(3~5米)和复杂环境下(鼠标、键盘需要相对平坦的桌面)完成交互,给用户操作带来了很多的障碍。这也是目前电视的人机交互落后于计算机和手持设备的原因。

目前,基于视觉的电视人机交互成为一个主流技术,而手势识别是其中非常重要的研究领域。手势语言是一种依靠动作和视觉进行交际的特殊语言,它是包含信息量最多的人体语言。而手势识别是的本质就是根据用户的手势,识别出所表达的意义。然而目前的手势检测、指尖定位等图像处理技术大部分是基于二维的,适合近距离、简单背景的,不符合智能电视的交互需求。而三维手势识别能够判断出三维空间内的手势变化,以更为自然、直观的交互方式得到广泛关注,但是目前来讲,一些三维手势识别设备使用了数据手套,虽然其识别率高,但也失去了手势交互的自然性,费用也很昂贵;一些利用飞行时间的设备,对硬件要求高、费用高昂、分辨率也较低;基于双目视觉的设备视角较小、在昏暗环境下以及特征不明显的情况下效果较差;而基于结构光的设备非常容易受到光照影响。可以说现有的手势识别设备都存在不同程度的缺陷。



技术实现要素:

为解决现有技术的不足,本发明的目的在于提供一种基于双目结构光的三维手势控制智能电视的方法,本发明通过双目摄像头和红外结构光结合的方式获得优质的双手的三维信息,然后进行实时手势分割、检测以及指尖定位,完成三维手势动作与电视指令的实时转换,满足电视人机交互操作实时性的要求。

为了实现上述目标,本发明采用如下的技术方案:

一种基于双目结构光的三维手势控制智能电视的方法,包括如下步骤:

步骤一,采集图像;通过设置于智能电视内的双目摄像头捕获摄像头前方图像,采集到的左视图、右视图分别储存进储存器,再由处理器分别处理储存器内的两张图片;

步骤二,重建图像三维;根据双目匹配算法,找出左视图、右视图之间各像素点的一一对应关系,根据他们之间的像素位置的横坐标差得到视差图,然后根据投影模型与三角测量原理,获得原始图像的深度信息;

步骤三,预处理深度图像;对深度图像进行中值滤波去除噪声点,再对深度图像中的内部空洞进行形态学处理;

步骤四,检测手势图像;对获得的图像深度数据进行分析,将人和背景分离开来,只选取人体的像素信息,将其余像素信息全部置零,获得人体的深度图像,最后获得手势的轮廓;

步骤五,识别三维手势;根据获得的手势轮廓,对手势轮廓提取中心距特征,中心距是指图形中必点到各边缘点的距离;设点O(x0,y0)为手势的几何中心点,点集C={(xi,yi)|i=1,2,…,N}为手势的边缘轮廓,不妨把手势的边缘轮廓看成有一个个边缘点连接而成,由此,几何中心点O(x0,y0)和中心距d可由如下公式计算:

再结合三维信息,利用基于贝叶斯网络的分类器进行识别;

步骤六,执行操作指令;根据在双目摄像头前做出的手势,智能电视执行相应的预先设定的操作指令,完成人机交互。

前述的一种基于双目结构光的三维手势控制智能电视的方法,步骤一,采集图像;通过红外探测器探测操作环境的光照情况,若红外光过多则打开红外激光器;再通过设置于智能电视内的双目摄像头捕获摄像头前方图像,采集到的左视图、右视图分别储存进储存器,再由处理器分别处理储存器内的两张图片。

前述的一种基于双目结构光的三维手势控制智能电视的方法,若红外探测器探测操作环境的红外辐射强度小于0.2W/m2*850nm,则打开红外激光器。

前述的一种基于双目结构光的三维手势控制智能电视的方法,步骤三中的形态学处理即对图像边缘存在的毛刺和图像的内部空洞进行开、闭运算。

前述的一种基于双目结构光的三维手势控制智能电视的方法,步骤四中获得手势的轮廓的具体步骤为;通过像素的灰度值反映改点距离镜头的远近,统计出人体的深度图像的灰度分布直方图,灰度直方图较小的峰是手部区域的灰度分布,较大的峰是人体躯干的灰度分布,从而分割出人体的手部图像,再对手部图像使用Canny边缘算子进行边缘检测,从而获得手势的轮廓。

前述的一种基于双目结构光的三维手势控制智能电视的方法,步骤五中利用基于贝叶斯网络的分类器进行识别的具体步骤如下:

步骤a,计算不同手势类别下所有特征的高斯分布信息,即是计算所有的均值与方差;

步骤b,对于测试的每一个输入样本,求出它在手势1类别下,各个特征的概率,由于每个特征是相互独立的,因而特征下的概率分布也满足独立性,由此便可以得出该输入样本在手势1类别下的总概率;以此类推,求出该样本在所有手势类别下的不同概率;

步骤c,比较输入样本在不同类别下得到概率值,找出其最大概率值所属的类别,便预测该类别就是输入样本所属的类别。

本发明的有益之处在于:本发明提供一种基于双目结构光的三维手势控制智能电视的方法,本发明通过双目摄像头和红外结构光结合的方式获得优质的双手的三维信息,然后进行实时手势分割、检测以及指尖定位,完成三维手势动作与电视指令的实时转换,满足电视人机交互操作实时性的要求;

本发明因为采用了双目视觉和结构光结合的方式,可以有效地提高环境抗干扰能力、降低光照条件的便会对指尖定位的影响,当在室内或环境昏暗时采用结构光测量深度信息,当太阳光照较强时则转为纯双目的方式。而且双目结构光的标定与激光器无关,当激光器损坏时替换较为方便;

本发明通过对手势图像的前景分割减少了手势检测的遍历范围,可以满足电视人机交互操作实时性的要求。

附图说明

图1是本发明的一种实施例的结构示意图;

图中附图标记的含义:

1红外摄像头,2红外探测器,3红外激光器,4电视。

具体实施方式

以下结合附图和具体实施例对本发明作具体的介绍。

如图1所示,本发明的所需的所有模块都集成在智能电视4当中。水平安装在智能电视4左右两边的是已经标定好的红外摄像头1,用于获取左右视角的图像。在两个红外摄像头1中间的是红外激光器3,用来发出红外条纹光,增加表面纹理,便于双目匹配,方便在昏暗条件下依旧能够准确识别手势。激光器旁边的是红外探测器2,用来监测操作环境的红外情况,以选择是否打开红外激光器3。而后续的图像三维重建、深度图像预处理、手势图像检测、三维手势识别以及人机交互则由智能电视4内的处理器来完成。

一种基于双目结构光的三维手势控制智能电视4的方法,包括如下步骤:

步骤一,采集图像;

先通过红外探测器2探测操作环境的红外辐射情况,若红外辐射强度大于0.2W/m2*850nm,激光器发出的编码光斑容易被淹没,则选用纯双目的方式;若红外辐射强度小于0.2W/m2*850nm,编码光斑不容易被干扰,则打开红外激光器3,以提高双目匹配精度。

再打开水平安装在智能电视4机内已经标定好的两个相同型号的红外摄像头1,双目摄像头以25帧每秒捕获摄像头前方图像,采集到的图像大小为640×480的RGB彩色空间的数字图像,并将双目摄像头拍摄的的左视图、右视图分别储存在智能电视4里两个独立的存储空间,再由处理器分别处理储存器内的两张图片。

步骤二,重建图像三维;根据双目匹配算法,找出左视图、右视图之间各像素点的一一对应关系,根据他们之间的像素位置的横坐标差得到视差图,然后根据投影模型与三角测量原理,获得原始图像的深度信息;

步骤三,预处理深度图像;由于获得的深度图像中手势边缘的深度值不稳定,有许多0值噪声点,直接处理会对算法的效果造成影响,因此采用中值滤波去除噪声点,降低目标边缘的模糊程度。再对深度图像中的内部空洞进行形态学处理;形态学处理即对图像边缘存在的毛刺和图像的内部空洞进行开、闭运算。

步骤四,检测手势图像;对获得的图像深度数据进行分析,将人和背景分离开来,只选取人体的像素信息,将其余像素信息全部置零,获得人体的深度图像,最后获得手势的轮廓;获得手势的轮廓的具体步骤为;通过像素的灰度值反映改点距离镜头的远近,统计出人体的深度图像的灰度分布直方图,灰度直方图较小的峰是手部区域的灰度分布,较大的峰是人体躯干的灰度分布,从而分割出人体的手部图像,再对手部图像使用Canny边缘算子进行边缘检测,从而获得手势的轮廓。

步骤五,识别三维手势;根据获得的手势轮廓,对手势轮廓提取中心距特征(SCCD),中心距是指图形中必点到各边缘点的距离;设点O(x0,y0)为手势的几何中心点,点集C={(xi,yi)|i=1,2,…,N}为手势的边缘轮廓,不妨把手势的边缘轮廓看成有一个个边缘点连接而成,由此,几何中心点O(x0,y0)和中心距d可由如下公式计算:

再结合三维信息,利用基于贝叶斯网络的分类器进行识别;

利用基于贝叶斯网络的分类器进行识别的具体步骤如下:

步骤a,计算不同手势类别下所有特征的高斯分布信息,即是计算所有的均值与方差;

步骤b,对于测试的每一个输入样本,求出它在手势1类别下,各个特征的概率,由于每个特征是相互独立的,因而特征下的概率分布也满足独立性,由此便可以得出该输入样本在手势1类别下的总概率;以此类推,求出该样本在所有手势类别下的不同概率;

步骤c,比较输入样本在不同类别下得到概率值,找出其最大概率值所属的类别,便预测该类别就是输入样本所属的类别。

步骤六,执行操作指令;根据在双目摄像头前做出的手势,智能电视4执行相应的预先设定的操作指令,完成人机交互。

本发明提供一种基于双目结构光的三维手势控制智能电视4的方法,本发明通过双目摄像头和红外结构光结合的方式获得优质的双手的三维信息,然后进行实时手势分割、检测以及指尖定位,完成三维手势动作与电视4指令的实时转换,满足电视4人机交互操作实时性的要求;

本发明因为采用了双目视觉和结构光结合的方式,可以有效地提高环境抗干扰能力、降低光照条件的便会对指尖定位的影响,当在室内或环境昏暗时采用结构光测量深度信息,当太阳光照较强时则转为纯双目的方式。而且双目结构光的标定与激光器无关,当激光器损坏时替换较为方便;

本发明通过对手势图像的前景分割减少了手势检测的遍历范围,可以满足电视4人机交互操作实时性的要求。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1