本发明涉及复杂曲面物体分类方法,特别涉及一种基于点云VFH描述子和神经网络的复杂曲面物体分类方法。
背景技术:
随着3D摄像头的出现,引入深度信息的三维图像成了机器人视觉领域的新的焦点,如何让机器人对物体进行分类并配准有着重要的意义。现有的基于点云vfh描述子直方图的分类方法存在着显著的问题,如果大量采集数据建立Kd树则会造成搜索数据的过分庞大,如果采集数据过少则会造成分类识别效果的减弱。
技术实现要素:
本发明的目的是为了解决如果大量采集数据建立Kd树则会造成搜索数据的过分庞大,如果采集数据过少则会造成分类识别效果的减弱的问题,而提出的一种基于点云VFH描述子和神经网络的复杂曲面物体分类方法。
上述的发明目的是通过以下技术方案实现的:
步骤一、在训练阶段,对每个物体均匀分成M个角度,在M个角度中的每一角度所在的视角上采集点云并计算点云对应的vfh特征描述子x=(x1,x2,...,xi,...,xM)T;xi表示构成vfh特征描述子x的向量;
步骤二、根据步骤一得到的vfh特征描述子计算每个向量xi和平均vfh向量Ψ的差值向量di;
步骤三、运用主成分分析法计算向量di的特征vfh描述子空间w;
步骤四、将步骤一计算得到的vfh特征描述子和差值向量di投影到特征vfh描述子空间的坐标为Ωi:
Ωi=wTdi(i=1,2,...,M)
步骤五、计算待识别物体每个vfh特征向量Γ与差值向量di投影到特征vfh描述子空间的坐标ΩΓ:
ΩΓ=wT(Γ-Ψ)
步骤六、确定训练BP神经网络的输入维数和输出维数,其中,输入维数是点云VFH描述子在特征vfh描述子空间下投影的维数,输出维数为M;输出维数的每一维代表步骤一中所采集的M个角度中所在视角中的每一个视角;
步骤七、将输入视角下的点云的vfh描述子在特征vfh描述子空间w下进行投影,将投影后的vfh描述子对应角度输出为1,其余输出为0;
步骤八、将物体重复步骤一至步骤六得到BP神经网络库;
步骤九、将待识别物体都通过BP神经网络库的每个BP神经网络进行识别判断;若神经网络的输出大于阈值,则待识别物体为当前BP神经网络所属物体的视角的点云;
步骤十、比较作为当前BP神经网络所属物体的视角点云的待识别物体的输出值,将待识别物体的输出值的最大值接近为1的作为最终结果;
步骤十一、旋转步骤九中的作为当前BP神经网络所属物体的视角点云的待识别物体,若旋转两次的该待识别物体的输出均大于阈值,则将该BP神经网络所属的待识别物体作为最终结果。
发明效果
本发明虽然训练阶段可能耗时较多,但是通过神经网络的训练,将判别当前vfh与大量样本的相似程度转化成一次神经网络的运算和判别,在使用时可以极大的提高分类准确率和减小计算时间,同时采用特征vfh描述向量的概念,可以极具代表性的涵盖物体的主要空间特征,识别准确率提高,可以识别大量物体。
附图说明
图1为具体实施方式一提出的点云模型示例图,
图2为具体实施方式一提出的vfh描述子示例图。
具体实施方式
具体实施方式一:本实施方式的一种基于点云VFH描述子和神经网络的复杂曲面物体分类方法,具体是按照以下步骤制备的:
引入机器学习中的神经网络到分类过程中
步骤一、在训练阶段,根据物体实际情况,对每个物体均匀分成M个角度,在M个角度中的每一角度所在的视角上采集点云并计算点云对应的vfh(Viewpoint Feature Histogram)特征描述子x=(x1,x2,...,xi,...,xM)T如图1和图2;
步骤二、根据步骤一得到的vfh(Viewpoint Feature Histogram)特征描述子xi计算每个向量xi和平均vfh向量Ψ的差值向量di;
步骤三、运用主成分分析法计算向量di的特征vfh描述子空间w;
步骤四、将步骤一计算得到的vfh特征描述子和差值向量di投影到特征vfh描述子空间的坐标为Ωi:
Ωi=wTdi(i=1,2,...,M)
步骤五、计算待识别物体每个vfh特征向量Γ与差值向量di投影到特征vfh描述子空间的坐标ΩΓ:
ΩΓ=wT(Γ-Ψ)
步骤六、确定训练BP神经网络的输入维数和输出维数,其中,输入维数是点云VFH描述子在特征vfh描述子空间下投影的维数,输出维数为M;输出维数的每一维代表步骤一中所采集的M个角度中所在视角中的每一个视角;
步骤七、将输入视角下的点云的vfh描述子在特征vfh描述子空间w下进行投影,将投影后的vfh描述子对应角度输出为1,其余输出为0;
步骤八、将物体重复步骤一至步骤六得到BP神经网络库;
步骤九、识别阶段,将待识别物体都通过BP神经网络库的每个BP神经网络进行识别判断;若神经网络的输出大于阈值,则待识别物体为当前BP神经网络所属物体的视角的点云;
步骤十、比较作为当前BP神经网络所属物体的视角点云的待识别物体的输出值,将待识别物体的输出值的最大值接近为1的作为最终结果;
步骤十一、旋转步骤九中的作为当前BP神经网络所属物体的视角点云的待识别物体,若旋转两次的该待识别物体的输出均大于阈值,则将该BP神经网络所属的待识别物体作为最终结果。
本实施方式效果:
本实施方式虽然训练阶段可能耗时较多,但是通过神经网络的训练,将判别当前vfh与大量样本的相似程度转化成一次神经网络的运算和判别,在使用时可以极大的提高分类准确率和减小计算时间,同时采用特征vfh描述向量的概念,可以极具代表性的涵盖物体的主要空间特征,识别准确率提高,可以识别大量物体。
具体实施方式二:本实施方式与具体实施方式一不同的是:步骤二中根据步骤一的vfh(Viewpoint Feature Histogram)特征描述子xi计算每个向量xi和平均vfh向量Ψ的差值向量di具体为:
步骤二一、根据步骤一的vfh特征描述子计算得到平均vfh向量Ψ:
其中,M=200;
步骤二二、计算每个向量xi和平均vfh向量Ψ的差值向量di:
di=xi-Ψ,i=1,2……M。其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是:步骤三中运用主成分分析法计算向量di的特征vfh描述子空间w具体为:
步骤三一、构建协方差矩阵C;
其中,A为向量di的集合;
步骤三二、求出ATA的特征值λi和正交归一化特征向量νi;采用奇异值分解(SingularValue Decomposition,SVD)定理选取ATA特征值λi的贡献率最大的前p个特征值及p个特征值对应的特征向量;
步骤三三、求出协方差矩阵C的特征向量ui;
步骤三四、则特征vfh描述子空间w为:
w=(u1,u2,...,up)。其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:步骤三一中A=(d1,d2,...,di,...,dM)。其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:步骤三二中贡献率是指选取的p个特征值的和与占所有特征值的和比,即:
其中,a为训练样本在前p个特征向量集上的投影;一般取a=99%即使训练样本在前p个特征向量集上的投影有99%的能量。其它步骤及参数与具体实施方式一至四之一相同。