一种由粗至精的室内场景图像布局估计方法与流程

文档序号:13073543阅读:364来源:国知局
一种由粗至精的室内场景图像布局估计方法与流程

本发明涉及一种由粗至精的室内场景图像布局估计方法,属于图像场景理解技术领域。



背景技术:

图像场景理解一直都是计算机视觉领域的研究热点,室内场景布局估计作为其初始也是关键单元,基本目标是根据给定的室内场景图像恢复出场景内房间的布局结构。对于人眼这种高度精确且即时的视觉系统来说,识别房间的布局并不困难,仅需一瞥,即可获知视场范围内场景的上下文信息,但利用现有计算机技术模拟人类视觉系统,使计算机具有“观察”世界的能力并非易事,需要经历较复杂的机器学习过程。主要是因为场景内部存在大量的杂物,例如家具、个人等,都会对房间的布局边界造成遮挡,使得布局的恢复变得极具挑战性。

近年来,许多的场景布局估计研究工作中致力于提出有效的方法进行布局估计。文献[hedauv,hoiemd,forsythd.recoveringthespatiallayoutofclutteredrooms.internationalconferenceoncomputervision.2009:1849-1856.]提出将房间布局边界参数化为3d盒模型结构,基于估计的消失点生成布局候选项,提取线段、几何上下文等特征进行学习。文献[leedc,hebertm,kanadet.geometricreasoningforsingleimagestructurerecovery.computervisionandpatternrecognition.2009:2136-2143.]在此基础之上又引入方向图特征。文献[zhangj,kanc,schwingag,etal.estimatingthe3dlayoutofindoorscenesanditsclutterfromdepthsensors.ieeeinternationalconferenceoncomputervision.2013:1273-1280.]除给定rgb图像之外加入了深度信息,对仅基于外观信息特征提取的进行补充。文献[schwingag,hazant,pollefeysm,etal.efficientstructuredpredictionfor3dindoorsceneunderstanding.ieeeconferenceoncomputervisionandpatternrecognition.2012:2815-2822.]提出一种新的参数化方法,将房间布局边界参数化为由消失点引出的成对射线之间的夹角,问题转化为四个离散随机变量的基础预测,对目标函数采用新方法求解。随着卷积神经网络狂潮的掀起,文献[mallyaa,lazebniks.learninginformativeedgemapsforindoorscenelayoutprediction.internationalconferenceoncomputervision.2015:936-944.]对场景布局的边界进行预测,提取新的边界特征。上述方法主要从特征提取和模型求解这两方面进行优化,并没有对模型本身进行修改。

上述方法所涉及的特征都是从既定场景布局候选项的划分区域内逐个提取拼接而成,则所提取的特征都是区域级特征,并没有将基于整幅图像所提取的全局特征融入进去考虑。



技术实现要素:

本发明所要解决的技术问题是提供一种由粗至精的室内场景图像布局估计方法,采用改进型消失点估计方法基于图像中检测出的线段进行消失点估计,用于生成布局候选项;基于卷积神经网络提取的全局特征,对布局候选项进行粗选取,将误差较大的剔除;根据布局估计问题定义结构化学习模型,利用几何积分图像提取区域级特征,进行特征参数的学习。本发明的方法充分融合了全局特征和区域级特征,对布局估计结果进行严格约束。

本发明为解决上述技术问题采用以下技术方案:

本发明提供一种由粗至精的室内场景图像布局估计方法,包括以下步骤:

步骤a、针对室内场景图像,采用改进型的消失点估计方法对图像中检测出的边缘线段进行消失点估计,生成若干场景布局候选项;

步骤b、针对室内场景图像,基于卷积神经网络提取布局边界和布局类别信息,融合成全局特征,对步骤a生成的场景布局候选项进行粗选取;

步骤c、根据布局估计问题定义结构化回归问题模型,通过训练图像集对结构化回归问题模型进行训练学习,通过训练学习完成的模型进行室内场景布局估计;最后用查询图像测试。

作为本发明的进一步技术方案,步骤a具体为:

a1,针对室内场景图像,采用canny算子进行边缘检测,并设置边缘线段的阈值,将小于阈值的边缘线段剔除,将剩余的长直边缘线段用于消失点估计;

a2,将图像中长直边缘线段进行竖直方向、水平方向线段的划分,分别用于估计竖直方向消失点、水平及投影方向消失点,其中,竖直方向的线段用于估计竖直方向上的消失点,水平方向的线段用于估计水平和投影方向上的消失点;

a3,由估计得到的竖直方向、水平方向的消失点等间隔地引出射线,两两成对射线相交确定图像内区域面的划分情况,从而生成若干场景布局候选项。

作为本发明的进一步技术方案,步骤a2中长直边缘线段进行竖直方向、水平方向线段划分的方法为:首先,设定一竖直方向的消失点,计算该消失点与任一长直边缘线段重点的连线与前述长直边缘线段的夹角,若该夹角大于20°则前述长直边缘线段划分为水平方向的线段,否则划分为竖直方向的线段。

作为本发明的进一步技术方案,步骤a2中采用投票得分机制估计竖直方向消失点、水平及投影方向消失点,具体为:

1)竖直方向的线段集合记为{lvi},1≤i≤n,n为竖直方向上的线段数目,pk为{lvi}中线段两两相交的形成第k个交点,1≤k≤k,k为{lvi}中线段两两相交的形成的交点数目,则第i个竖直方向线段lvi对pk的得分贡献为:

其中,α表示lvi与pk和lvi中点的连线之间的夹角,γ是设定阈值;

2)将所有竖直方向线段对pk的得分贡献进行求和,得到pk的得分

3)所有k个交点中得分最高的即为竖直方向的消失点vp1;

4)基于消失点的正交性准则:<vp1,vp2>=0、<vp1,vp3>=0、<vp2,vp3>=0,分别获得若干符合上述消失点的正交性准则的水平方向消失点和投影方向消失点的可能项,再基于如1)至3)中相同的投票得分机制,即可得到最终的水平方向的消失点vp2与投影方向向的消失点vp3。

作为本发明的进一步技术方案,步骤b具体为:

b1,针对室内场景图像,采用基于vgg-16的全卷积神经网络对图像的布局边界进行估计,估计得到场景的布局边界信息;

b2,提取步骤b1中基于vgg-16的全卷积神经网络中最后一层卷积层的输出特征作为一个浅层神经网络的输入,进行布局类别标注概率的训练,估计得到场景的布局类别信息;

b3,将步骤b1中估计得到的布局边界信息和步骤b2中估计得到的布局类别信息融合生成全局特征,通过全局特征对场景布局候选项的边界位置和结构进行约束,实现对场景布局候选项的粗选取。

作为本发明的进一步技术方案,步骤b1中采用联合训练的机制,采用基于vgg-16的全卷积神经网络对布局边界图和几何上下文图进行联合训练,该神经网络的损失函数为:

l(i,e,g)=ledge(e,e*)+lgc(g,g*)

其中,l(i,e,g)表示该神经网络的损失函数,ledge(e,e*)表示布局边界损失函数,lgc(g,g*)表示几何上下文图损失函数,i表示输入的室内场景图像,e和e*分别表示预测和基准标注的信息化边界图,g和g*分别表示预测和基准标注的几何上下文gc图,m表示室内场景图像中的像素点个数,ez和分别表示像素点位置z的预测和基准标注的信息化边界图,gz和分别表示像素点位置z的预测和基准标注的几何上下文gc图。

作为本发明的进一步技术方案,步骤b2中的浅层神经网络由1层全连接层和1层softmax层构成,该浅层神经网络的损失函数定义如下

其中,o表示输入室内场景图像的提取的基于vgg-16的全卷积神经网络最后一层卷积层的特征,c表示室内场景图像对应的场景类别基准标注,h表示场景布局类别数目,θ表示需要训练的浅层神经网络模型参数矩阵,a、b均表示任一场景布局类别索引值,θa、θb分别表示矩阵θ的第a、b行向量;δ(·)表示冲击函数,若括号内的表达式为0则δ(·)取值为1,否则δ(·)取值为0。

作为本发明的进一步技术方案,步骤b3具体为:首先,针对任一场景布局候选项,计算由该候选项映射得到的布局边界图与步骤b1中估计得到的布局边界图之间的重合像素点数目,并参照室内场景图像的大小进行归一化处理,即得到布局边界得分s1;然后,针对该场景布局候选项,从步骤b2估计得到的各个布局类别标注概率中找出该候选项映射得到的布局类别标注概率,即为布局类别得分s2;再后,针对该场景布局候选项,计算该候选项的总得分s=α1×s1+α2×s2,α1、α2均为权值,α1+α2=1;最后,针对所有场景布局候选项,选择得分较高的m个候选项保留,舍弃其余候选项,从而完成场景布局候选项的粗选取,其中,m的取值根据实际需要选取。

作为本发明的进一步技术方案,步骤c具体为:

c1,针对训练图像集中的室内场景图像及其对应的基准标注布局,分别通过canny算子进行边缘检测获得室内场景图像的边缘线段信息、通过基于vgg-16的全卷积神经网络获得室内场景图像的几何上下文信息、通过基于vgg-16的空间多尺度卷积神经网络获得室内场景图像的法向量信息和深度信息,通过几何积分图像方式将提取的线段信息、几何上下文信息、法向量和深度信息经线性变换拼接为特征向量的形式,形成区域级特征,实现室内场景图像到特征域的映射;

c2,将布局估计问题转化为步骤b中粗选取后的场景布局候选项的最优选取问题,定义结构化回归问题模型,其目标函数为:

其中,f(x,y;w)表示室内场景图像x与其基准标注布局y之间的映射关系,w表示权重向量,f(x,y)=wtψ(x,y),ψ(x,y)表示室内场景图像x针对其基准标注布局y所提取的区域级特征;

c3,根据步骤c1中训练图像集中的室内场景图像的区域级特征,对步骤c2中的结构化回归问题模型进行训练学习,求解得到权重向量w,完成结构化回归问题模型的训练学习完成具体为:

将目标函数转化为以下问题:

其中,λ表示常量,xq表示训练图像集中第q个室内场景图像,1≤q≤q,q表示训练图像集中室内场景图像的数目;ξq表示xq的松弛变量,y表示xq经过步骤a和步骤b处理后得到的粗选取后的布局候选项集合,y′表示集合y中的元素,yq表示xq的基准标注布局,ψ(xq,yq)表示xq对应的基准标注布局yq所提取的区域级特征,ψ(xq,y′)表示xq对应的粗选取后的布局候选项y′所提取的区域级特征,δ(yq,y′)表示用于量化yq和y′两种布局之间的测度的损失函数;

c4,用查询图像测试,具体为:采用步骤a和b的方法对查询图像进行处理,得到粗选取后的布局候选项,将粗选取后的布局候选项分别映射为区域级特征的形式,输入训练学习完成的结构化回归问题模型即可获得最优布局候选项,将最优布局候选项标注为布局估计的结果,从而完成室内场景图像布局的估计。

作为本发明的进一步技术方案,步骤c3中采用cutting-plane算法对c2中的结构化回归问题模型进行训练学习,求解权重向量w。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:

1)本发明引入布局候选项粗选取步骤,基于卷积神经网络对初始图像提取有关整幅图像的全局特征,对生成的大量布局候选项的边界位置和结构进行粗略约束,仅将较优的布局候选项保留下来进行后处理,故得到的估计结果更好;

2)本发明同时对区域级特征进行了更新,在原始特征的基础上引入极具空间几何信息的法向量和深度特征,使得提取的特征更具鲁棒性且习得的模型参数更能有效的估计出最佳的布局候选项。

附图说明

图1是由粗至精的室内场景图像布局估计流程图;

图2是提取全局特征采用的全卷积神经网络;

图3是估计法向量和深度图采用的卷积神经网络。

具体实施方式

下面结合附图以及具体实施例对本发明的技术方案做进一步的详细说明:

本发明提供了一种由粗至精的室内场景图像布局估计方法,如图1所示,包括如下步骤:

步骤a,针对训练图像集中的室内场景图像,采用改进型的消失点估计方法对室内场景图像中检测出的边缘线段进行消失点估计,生成若干布局候选项。

步骤a1,针对训练图像集中的室内场景图像,采用canny算子进行边缘线段的检测,并将检测出的边缘线段根据设定的阈值进行筛选,将小于阈值的边缘线段剔除,剩下的长直边缘线段则用于估计消失点。

由于实际的室内场景图像的大小并不是固定值,因此将边缘线段的长度阈值σ设置为随图像大小变化的,即其中,height、width分别表示图像的宽和长,固定参数ε取值为ε=0.025。

步骤a2,将长直边缘线段竖直方向、水平方向线段的划分,分别用于估计竖直方向消失点、水平及投影方向消失点,其中,归为竖直方向的线段用于估计竖直方向消失点,归为水平方向的线段用于估计水平及投影方向消失点,由此合成规范化的消失点估计值。

本发明中,对长直边缘线段进行竖直方向、水平方向线段划分的方法为:首先,设定一竖直方向的消失点p1=[0,-105],计算点p1与任一长直边缘线段重点的连线与前述长直边缘线段的夹角,若该夹角大于20°则前述长直边缘线段划分为水平方向的线段,否则划分为竖直方向的线段。

本发明中,采用投票得分机制估计竖直方向消失点、水平及投影方向消失点,具体为:

1)将消失点表示为vps=[vp1,vp2,vp3],其中,vp1表示竖直方向上的消失点,vp2表示水平方向上的消失点,vp3表示投影方向上的消失点;

2)假设竖直方向上的线段集合为{lvi}(1≤i≤n),n为竖直方向上的线段数目,则由竖直方向上的线段两两相交所形成交点都是vp1的可能值,采用投票得分机制估计即可得到竖直方向消失点。针对{lvi}中线段两两相交的形成第k个交点pk,,1≤k≤k,k为{lvi}中线段两两相交的形成的交点数目,第i个竖直方向线段lvi对pk的得分贡献可表示为

其中,α表示lvi与pk和lvi中点的连线之间的夹角,γ是设定阈值,取值为0.1。

3)所有竖直方向上的线段对点pk的得分贡献求和得到点pk的得分为

4)比较所有k个交点的得分情况,其中得分最高的交点即为竖直方向消失点vp1。

5)在求得vp1的前提下,基于消失点的正交性准则:<vp1,vp2>=0、<vp1,vp3>=0、<vp2,vp3>=0,可以获得多个符合上述正交性准则的vp2和vp3的可能项,再基于相同的投票得分机制即可确定水平方向的消失点vp2与投影方向向的消失点vp3。

相比较于传统的消失点估计方法,采用投票得分机制所基于的线段是全部的长直线段,且直接将得分最高的交点标记为vp1,这样并不严格满足消失点vps=[vp1,vp2,vp3]定义,因为只有当得分最高的点是竖直方向上的线段交点时才能判定为vp1,同时将所有长直线段考虑在内增加了计算复杂度和干扰影响,故改进型消失点估计方法通用性更强,求解速度更快。

步骤a3,由估计得到的竖直方向、水平方向的消失点等间隔地引出射线,两两成对射线相交确定图像内区域面的划分情况,从而生成若干场景布局候选项。

步骤b,针对训练图像集中的室内场景图像,基于卷积神经网络提取布局边界和布局类别信息,融合成全局特征,对步骤a生成的场景布局候选项进行粗选取。

步骤b1,针对训练图像集中的室内场景图像,基于以vgg-16为原型修改的全卷积神经网络fcns实现对室内场景图像的布局边界图的估计,将估计得到的场景的布局边界信息作为全局特征之一。

基准标注的布局边界太细,若直接用于估计误差较大,故首先将布局边界的宽度扩大至8个像素点。且为了取得更好的布局边界预测效果,采用联合训练的机制,将布局边界图与几何上下文图(geometriccontext,gc)的估计任务放入同一模型中进行训练,具体的fcns网络模型如图2所示,其损失函数定义如下

l(i,e,g)=ledge(e,e*)+lgc(g,g*)

其中,l(i,e,g)表示该神经网络的损失函数,ledge(e,e*)表示布局边界损失函数,lgc(g,g*)表示几何上下文图损失函数,i表示输入的室内场景图像,e和e*分别表示预测和基准标注的信息化边界图,g和g*分别表示预测和基准标注的几何上下文gc图,m表示室内场景图像中的像素点个数,ez和分别表示像素点位置z的预测和基准标注的信息化边界值,gz和分别表示像素点位置z的预测和基准标注的几何上下文gc值。在这里,图的表现形式是矩阵,z是图中的像素点位置,也就是矩阵中的索引位置,则表示的应该是某一点的数值。

步骤b2,同样针对训练图像集中的室内场景图像,可以通过将上述全卷积神经网络fcns模型提取的最后一层特征作为一个浅层神经网络的输入,实现对室内场景图像的布局类别标注概率的估计,将估计得到的布局类别信息作为另一个全局特征。

给定一幅室内场景图像,将上述用于估计布局边界图与几何上下文图的fcns模型中最后一层特征(即fc7层特征)提取出来,作为一个浅层神经网络的输入,进行场景布局类别标注概率的训练。该浅层神经网络主要由1层全连接层和1层softmax层构成,由于最终的目的是实现场景布局的类别标定估计,故可看做是一个多值问题,其损失函数定义如下

其中,o表示输入室内场景图像的提取的基于vgg-16的全卷积神经网络最后一层卷积层的特征,c表示室内场景图像对应的场景类别基准标注,h表示场景布局类别数目,θ表示需要训练的浅层神经网络模型参数矩阵,a、b均表示任一场景布局类别索引值,θa、θb分别表示矩阵θ的第a、b行向量;δ(·)表示冲击函数,若括号内的表达式为0则δ(·)取值为1,否则δ(·)取值为0。

步骤b3,将b1和b2中提取的两种信息融合生成全局特征,对场景布局候选项的边界位置和结构起到粗略的约束作用,实现对场景布局候选项的粗选取。

针对任一布局候选项,计算由该候选项映射得到的布局边界图与b1中估计得到的布局边界图之间的重合像素点数目,并参照图像大小进行归一化处理,得到的结果记为布局边界得分s1;同时,从b2中估计得到的各个布局类别标注概率中找出该候选项映射得到的布局类别的概率结果,记为布局类别得分s2;则每一个布局候选项的总得分记为s=α1×s1+α2×s2,α1+α2=1。根据每个布局候选项的总得分将得分较高的前若干个保留下来,其余则舍弃,从而实现粗选取的目的。

本发明中进行全局特征融合的目标为:(1)保证最佳的布局候选项经过粗筛选后仍然在布局候选项中,(2)粗筛选后的布局候选项的平均误差尽量小,即选出的布局候选项较优。将这两个目标作为学习权重的优劣性判定指标,对权重进行调整学习出最佳的权重值。当α1=0.26,α2=0.74,且粗选取结果为100个布局候选项时,获得的选取效果最好。

步骤c,根据布局估计问题定义结构化学习模型,通过几何积分图像方式将提取的线段成员信息、几何上下文、法向量及深度信息进行线性变换,拼接为区域级特征向量的形式,实现布局候选项到特征域的映射,进行特征参数的学习获得最佳的模型参数;最后用查询图像测试。

步骤c1,针对训练图像集中的室内场景图像及其对应的基准标注布局,分别通过canny算子进行边缘检测获得室内场景图像的边缘线段信息、通过基于vgg-16的全卷积神经网络获得室内场景图像的几何上下文信息、通过基于vgg-16的空间多尺度卷积神经网络获得室内场景图像的法向量信息和深度信息,通过几何积分图像方式将提取的线段信息、几何上下文信息、法向量和深度信息经线性变换拼接为特征向量的形式,形成区域级特征,实现室内场景图像到特征域的映射。

对布局估计需要用到的信息进行提取,本发明中主要考虑4种信息:线段信息征、几何上下文信息、法向量和深度信息。

针对任意一种场景布局所提取的区域级特征,通过几何积分图像方式将提取的线段信息、几何上下文信息、法向量和深度信息经线性变换拼接为特征向量的形式,实现布局候选项到特征域的映射。

线段信息,依据的是消失点估计的过程中检测出的长直边缘线段。针对房间布局估计中的任意一个区域面fu,1≤u≤5,分为地面、中墙、左墙、右墙、天花板这5个区域面,其无权重的线成员特征vr定义如下:

其中,lu表示检测出的线段rg位于区域面fu内部的所有线段的集合,uu表示检测出的线段rg可以归属为构成区域面fu的所涉及到两个消失点的所有线段的集合,g是线段的索引值。需要注意的是公式中的|rg|表示线段rg的长度。

几何上下文信息,由于上述进行边界估计的全卷积神经网络的另一路输出是对几何上下文图的预测,故将输出结果进行提取即可。

法向量和深度信息,基于卷积神经网络构建的多尺度输入模型根据一幅rgb图像估计出对应的法向量和深度图,通过适当的变换提取相应的特征。该基于vgg-16的空间多尺度卷积神经网络模型的结构如图3所示,具体的损失函数定义如下:

l(i,d,n)=ldepth(d,d*)+lnormal(n,n*)

其中,l(i,d,n)表示整个神经网络的损失函数,ldepth(d,d*)表示深度损失函数,lnormal(n,n*)表示法向量损失函数;d和d*分别表示预测和基准标注的深度图,d表示两者的差值,即d=d-d*;z表示图像中的像素点位置,m表示图像中所有的像素点个数;▽hdz和▽sdz分别代表水平和数值方向上的像素点之间的深度变化值。n和n*分别表示预测和基准标注的法向量图。

图像中任意点像素的法向量是一个3维的特征,每一维分别代表该像素点所位于的平面的法向量方向(实际上第二维数据全部为负值,因为方向向后的像素点都被其他方向的像素点遮挡住),故只有往左、右、前、上、下5个方向。受方向图的启发,将3通道的法向量图nh×w×3转化为5通道的法向量特征fh×w×5。假设法向量的任意像素点为(χ1,χ2,χ3),相同像素点位置的法向量特征为(η1,η2,η3,η4,η5),则它们之间的转换关系如下

其中,βi值表示根据χτ(τ=1,2,3)绝对值的大小所赋予的权重因子,绝对值越大的表示对应的方向性越强,故赋予较大的权重值,相反的,绝对值越小的赋予较小的权重值。本文的实验中,将β分为3个等级。由此生成对应的法向量特征,因为深度信息只是1通道的信息,故只需对其进行归一化处理。

步骤c2,将室内场景图像布局的估计看做对粗选取后的场景布局候选项进行最优化选取的问题,故可定义为结构化回归问题,确定其目标函数。通过将由室内场景图像粗选取得到的场景布局候选项参数化为固定特征域的特征向量的形式,求解室内场景图像与布局估计结果之间的映射函数。

假设一幅室内场景图像用x表示,其基准标注布局用y={f1,f2,f3,f4,f5}表示,要实现对布局的最佳估计就需要找到它们的映射关系,表示为映射函数f(x,y;w),w表示权重向量,需进行学习得到。该映射函数依据布局候选项与输入图像基准标注布局的相似度计算得分,相似度越高得分越高,排名越靠前,具体数学表达式(即结构化回归问题的目标函数)如下:

其中,f(x,y;w)表示室内场景图像x与其基准标注布局y之间的映射关系,通过在给定的训练图像集(室内场景图像与其对应基准标注布局)上进行训练学习,求得上述映射关系f。假设f(x,y)=wtψ(x,y),其中,ψ(x,y)表示表示针对任意一种场景布局所提取的区域级特征,则对映射关系的求解问题可以转化为对w权重向量的求解。故可将上述目标函数转变为以下问题:

其中,λ表示常量,本发明中λ=1;xq表示训练图像集中第q个室内场景图像,1≤q≤q,q表示训练图像集中室内场景图像的数目;ξq表示xq的松弛变量,y表示xq经过步骤a和b处理后得到的粗选取后的布局候选项集合,y′表示集合y中的元素,yq表示xq的基准标注布局,ψ(xq,yq)表示xq对应的基准标注布局yq所提取的区域级特征,ψ(xq,y′)表示xq对应的粗选取后的布局候选项y′所提取的区域级特征,δ(yq,y′)表示用于量化yq和y′两种布局之间的测度的损失函数。

本发明中,采用cutting-plane算法对c2中的结构化回归问题模型进行训练学习,求解权重向量w,完成结构化回归问题模型的训练学习。

步骤c3,给定一幅室内场景图像(查询图像),将粗选取后的布局候选项都映射为区域级特征ψ(x,y)的形式,在权重向量w的引导下求得wtψ(x,y)的数值得分,将计算得分最高的布局候选项标注为估计的布局结果,从而实现了对室内场景图像布局估计任务。

针对每个场景布局候选项,通过几何积分图像方式将提取的上述信息进行线性变换,拼接为区域级特征向量的形式,实现布局候选项到特征域的映射,放入定义结构化模型中采用cutting-plane算法进行模型参数的学习。

本发明公开的一种由粗至精的室内场景图像布局估计方法,针对一幅室内场景rgb图像,首先基于canny边缘检测结果,设置阈值获得相应长直线段,对线段进行方向上的归类并估计消失点,由竖直和水平方向上的消失点等间隔地引出成对射线生成大量布局候选项;然后,构建以vgg-16为原型的全卷积神经网络预测信息化边界图,并将fc7层提取特征经softmax分类器获得布局类别信息,两者融合生成全局特征进行布局候选项的粗选取;最后,建立布局估计的结构化回归模型,在提取线段、几何上下文、等常规特征的基础之上,融入基于vgg-16的空间多尺度输入卷积神经网络生成的法向量和深度等信息,经几何积分图像形成区域级特征,实现布局候选项到特征域的映射的同时进行特征参数的学习,从而获得布局估计参数模型。该方法同时考虑了全局特征和区域级特征,能更全面、更有效地对布局候选项进行约束,提高了布局估计的准确率,在室内场景的3d重建中具有重要的应用价值。

以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1