基于Kinect的感兴趣区域检测方法

文档序号:6544648阅读:185来源:国知局
基于Kinect的感兴趣区域检测方法
【专利摘要】本发明公开了一种基于Kinect的感兴趣区域检测方法,用于解决现有基于改进显著图模型的感兴趣区域检测方法准确度差的技术问题。技术方案是利用Kinect3D摄像头获取二维RGB图像和深度信息;在此基础上,利用RGB图像提取多种视觉特征并构建多尺度视觉特征图;然后,将特征图与深度图进行融合生成显著图,并利用胜者全取策略生成二值显著图;最后,对二值显著图进行膨胀处理,检测出最终的感兴趣区域。本发明利用Kinect摄像头生成的RGB-D格式的3D图像即可检测出与人眼感知结果一致的感兴趣区域。在相同条件下利用本发明方法自动检测出感兴趣区域的吻合率由【背景技术】的82.5%提高到91.2%,提高了8.7%。
【专利说明】基于Kinect的感兴趣区域检测方法
【技术领域】
[0001]本发明涉及一种感兴趣区域检测方法,特别是涉及一种基于Kinect的感兴趣区域检测方法。
【背景技术】
[0002]基于人眼视觉特征的感兴趣区域检测方法引起国内外研究者的关注。
[0003]文献“基于边缘与深度特征的感兴趣区域检测技术.夏召强,冯晓毅,彭进业.计算机仿真,2009,(7) ;248-251”公开了一种基于改进显著图(Saliency Map)模型的感兴趣区域检测方法。该方法首先从二维RGB图像中提取的灰度、颜色、方向与边缘等视觉特征生成二维显著图,然后利用该显著图检测出与人眼检测结果相一致的感兴趣区域。该方法通过采集100幅图片,然后让5个用户标定出图片中的感兴趣区域。对于每幅图片,取5个用户标定的区域的并集作为参考的感兴趣区域。自动检测出感兴趣区域,并与参考的感兴趣区域进行比较,吻合率为82.5%。
[0004]基于文献的二维显著图模型的感兴趣区域检测方法存在两个问题:一是该方法采用的深度信息来自对二维图像的估计;二是该方法在融合各视觉特征生成二维显著图时,没要考虑到不同特征对感兴趣区域检测的作用大小不同。因此,该方法检测的感兴趣区域的位置和大小与人眼的感知仍有较大差异。

【发明内容】

[0005]为了克服现有基于改进显著图模型的感兴趣区域检测方法准确度差的不足,本发明提供一种基于Kinect的感兴趣区域检测方法。该方法利用Kinect3D摄像头获取二维RGB图像和深度信息;在此基础上,利用RGB图像提取多种视觉特征并构建多尺度视觉特征图;然后,将特征图与深度图进行融合生成显著图,并利用胜者全取策略生成二值显著图;最后,对二值显著图进行膨胀处理,检测出最终的感兴趣区域。本发明无需复杂的3D图像获取装置,利用Kinect摄像头生成的RGB-D格式的3D图像即可检测出与人眼感知结果一致的感兴趣区域。
[0006]本发明解决其技术问题所采用的技术方案是:一种基于Kinect的感兴趣区域检测方法,其特点是包括以下步骤:
[0007]步骤一、利用Kinect3D摄像头和微软提供的应用程序接口,获取RGB-D格式的3D图像。
[0008]步骤二、多尺度特征图的计算。包括多尺度图像的生成、灰度特征图的提取、颜色特征图的提取、方向特征图的提取和边缘特征图的提取。
[0009]多尺度图像的生成:对二维RGB图像中的R、G和B三个通道,在水平方向与垂直方向上分别进行隔行采样,依此形成多尺度R通道图Μκ( σ )、多尺度G通道图Me( σ )和多尺度B通道图ΜΒ(σ),σ为尺度水平。
[0010]灰度特征图提取:由某尺度上图像的三个颜色通道的平均值来表征图像在该尺度的灰度特征图:
[0011]
【权利要求】
1.一种基于Kinect的感兴趣区域检测方法,其特征在于包括以下步骤: 步骤一、利用Kinect3D摄像头和微软提供的应用程序接口,获取RGB-D格式的3D图像; 步骤二、多尺度特征图的计算;包括多尺度图像的生成、灰度特征图的提取、颜色特征图的提取、方向特征图的提取和边缘特征图的提取; 多尺度图像的生成:对二维RGB图像中的R、G和B三个通道,在水平方向与垂直方向上分别进行隔行采样,依此形成多尺度R通道图Mk( σ )、多尺度G通道图Me( σ )和多尺度B通道图Mb ( σ ),σ为尺度水平; 灰度特征图提取:由某尺度上图像的三个颜色通道的平均值来表征图像在该尺度的灰度特征图:
【文档编号】G06K9/60GK103971116SQ201410166147
【公开日】2014年8月6日 申请日期:2014年4月24日 优先权日:2014年4月24日
【发明者】彭先霖, 夏召强, 冯晓毅, 彭进业, 王珺, 毛晓菲, 崔明辉, 胡旭涛 申请人:西北工业大学, 西安云望电子科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1