一种基于智能手机传感器的物体识别方法

文档序号:6524045阅读:214来源:国知局
一种基于智能手机传感器的物体识别方法
【专利摘要】本发明公开了一种基于智能手机传感器的物体识别方法,该发明充分利用了智能手机丰富的传感器参数,其中包括GPS定位,摄像头,摄像头参数等,提出了基于地理空间位置的概率FOV模型以及相关的剪枝策略和基于视觉空间的相似度度量方法。通过多模态结合的方式,本发明的方法能够正确的识别出用户查询的物体。
【专利说明】一种基于智能手机传感器的物体识别方法【技术领域】
[0001]本发明涉及空间数据索引,图像识别和检索以及信号处理领域中的稀疏编码,尤其涉及一种基于智能手机传感器的物体识别方法。
【背景技术】
[0002]空间数据是指用来表示空间实体的位置、形状、大小及分布特征诸多方面信息的数据,目前空间数据主要应用于地理信息系统(GIS)领域。在空间数据的使用中,需要大量的查询、插入、删除等空间运算操作,因此高效的空间数据索引显得至关重要。R树是目前应用最为广泛的一种空间索引结构,R树是B树在多维空间的扩展,是一种平衡的树结构。R树结构采用平行于数据空间轴的最小的边界矩形来近似复杂的空间对象,其主要优点是用一定数量的字节来表示一个复杂的对象。尽管这样会丢失很多的信息,但是空间物体的最小边界矩形保留了物体的最重要的几何特性,即空间物体的位置和其在整个坐标轴上的范围。
[0003]在图像识别和检索领域,视觉单词(Bag-of-visual-words)是一种最常用也是效果比较出色的方法。该方法受文本检索领域中词袋(Bag-of-words)模型启发,在离线阶段将大量图片的局部特征点聚类,这些聚类中心即为视觉单词。对于新的图片,只需要将检测出来的局部特征投影到这些事先得到的视觉单词上面去,就把一副图像表示成为一个视觉单词的特征向量,向量的维度就是视觉单词的大小,每个维度上的值的含义是在该图像中,这个视觉单词出现的频率。一旦将图像向量化,那么向量模型中的相似度计算(如余弦距离)就能够适用了。通过使用k-近邻分类器或者支持向量机对已有的训练样本学习,就能够识别出新来的图像类别。
`[0004]稀疏编码最早起源于神经科学,神经生理学家在视觉系统上展开了全面深入的研究,并且取得了一些有重要意义的研究成果.这就使得在工程上利用计算机来模拟视觉系统成为可能。基于这一认识,利用已有的生物学科研成果,联系信号处理、计算理论以及信息论知识,通过对视觉系统进行计算机建模,使计算机能在一定程度上模拟人的视觉系统,以解决人工智能在图像处理领域中碰到的难题。稀疏编码的基本假设是有一系列的基向量(basis vector),那么对于任意的输入信号(向量),都能够将其表示成为这些基向量的线性组合,其中,这些线性组合的系数只有少数项是非零的,这些系数即为“稀疏的编码”。

【发明内容】

[0005]本发明的目的在于针对现有技术的不足,提供一种基于智能手机传感器的物体识别方法。
[0006]本发明解决其技术问题采用的技术方案如下:一种基于智能手机传感器的物体识别方法,其特征在于,该方法的步骤如下:
[0007](I)用户在智能手机上提交一个物体查询需求,包括GPS坐标,相机FOV参数,摄像头捕捉到的图片信息;[0008](2)通过GPS坐标发起一个空间索引R树查询,获得空间近邻的图片集合;
[0009](3)在上述图片集合中集合GPS坐标和相机FOV参数建立概率FOV模型,该模型考虑到了 GPS定位和相机参数的不确定性,可以估计出某个物体被相机捕捉到的概率;所述概率FOV模型为;
【权利要求】
1.一种基于智能手机传感器的物体识别方法,其特征在于,该方法的步骤如下: (1)用户在智能手机上提交一个物体查询需求,包括GPS坐标,相机FOV参数,摄像头捕捉到的图片信息。 (2)通过GPS坐标发起一个空间索引R树查询,获得空间近邻的图片集合; (3)在上述图片集合中集合GPS坐标和相机FOV参数建立概率FOV模型,该模型考虑到了 GPS定位和相机参数的不确定性,可以估计出某个物体被相机捕捉到的概率;所述概率FOV模型为。
【文档编号】G06F17/30GK103678610SQ201310690339
【公开日】2014年3月26日 申请日期:2013年12月16日 优先权日:2013年12月16日
【发明者】寿黎但, 陈珂, 陈刚, 胡天磊, 彭湃 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1