单目位姿估计与校正的制作方法

文档序号：37903682发布日期：2024-05-09 21:48阅读：12来源：国知局

背景技术：

1、各个行业都经历了因在转售领域中价值提高的品牌和产品激增而受欢迎程度提高。一些类型的特殊型号商品的限量发行使得这些限量发行的商品成为市场上最令人垂涎的商品。由于限量发行商品的排他性，假冒商品在市场上激增。从多家市场或商店之一购买了限量发行商品的倒霉用户不知道所购买的商品是否是真品。虽然该市场担保商品是真品，但消费者多次被骗。有时，甚至市场或店主也不确定一些商品的真实性。这导致对交易缺乏信任，并可能最终导致阻碍各种行业的增长。

技术实现思路

1、位姿校正引擎(“引擎”)的各种实施例通过提供对用于确定在用户源图像中描绘的对象是否是欺骗性的或伪造的用户源图像的预处理，提供了相对于常规系统的显著改进和优点。例如，引擎为用户提供捕获呈各种预定义位姿的物理对象的源图像的灵活性，而不需要用户捕获描绘与各种预定义位姿完美比对的物理对象的源图像。用户可以将源图像上传到引擎，引擎基于用户的源图像输出位姿校正图像。引擎输出表示源图像的位姿校正图像，就好像用户成功捕获了物理对象的与预定义位姿完美比对的视图一样。

2、本文描述的装置、方法、系统和计算机程序产品的各种实施例涉及位姿校正引擎(“引擎”)。引擎生成目标对象的参照图像。参照图像描绘根据第一位姿而定向的目标对象(“对象”)。引擎接收对象的实例的源图像。源图像描绘根据第一位姿的变化而定向的对象的实例。引擎确定参照图像的第一位姿与源图像的第一位姿的变化之间的差异。引擎基于所确定的差异识别因源图像中描绘的第一位姿的变化而不清楚的对象的形状的三维(3d)图的一个或多个部分。引擎生成对象的实例的位姿校正图像，其描绘源图像的至少一部分和对象的形状的3d图的至少所识别的部分。应当理解的是，在各种实施例中，目标对象可以是任何类型的物理对象。

3、在一些实施例中，用户可以设法确定特定鞋是否是真品。用户捕获鞋的一个或多个源图像，其中每一个相应的图像描绘鞋的特定视角视图。用户将一个或多个源图像上传到引擎。引擎对一个或多个源图像进行预处理，为特定鞋的身份验证处理做准备。

4、引擎访问特定鞋的参照图像，但是参照图像可以根据具体位姿(即，位置和方向)而描绘该特定鞋。源图像也可以根据与参照图像的具体位姿几乎相似的位姿来描绘该特定鞋。换句话说，源图像的位姿可能不是与参照图像的具体位姿的完美匹配。引擎根据分割阶段、深度估计阶段、缩放阶段和配准阶段对源图像和参照图像进行预处理，以便生成位姿校正图像。引擎所输出的位姿校正图像表示根据参照图像的具体位姿对特定鞋进行描绘的源图像的版本。

5、在各种实施例中，引擎生成并存储针对一种或多种类型的目标对象的多个参照图像。例如，对于特定类型的鞋，引擎生成该特定类型的鞋的多个参照图像，其中每一个相应图像描绘呈不同的位姿(即，在不同的位置和方向)的该特定类型的鞋。

6、在一个或多个实施例中，引擎在训练阶段期间在参照图像上训练机器学习网络。在各种实施例中，训练阶段包括反馈传播环路。

7、根据一些实施例，引擎所实现的缩放阶段包括基于参照图像将一个或多个缩放因子应用于深度图图像。

8、在各种实施例中，引擎所实现的配准阶段生成一个或多个平移参数以及一个或多个旋转参数。引擎将在旋转参数中的平移参数应用于源图像，以生成位姿校正图像。

9、在一个或多个实施例中，用户可以将物理对象放置在灯箱中，灯箱将物理对象置于特定的预定义位姿。灯箱可以包括用于预定义的固定相机镜头位置的一个或多个孔口。用户可以利用与灯箱相关联的相机捕捉一个或多个源图像。引擎可以对在灯箱处捕获的特定源图像进行预处理，以输出相对应的位姿校正图像。引擎可以进一步利用来自该特定源图像配准阶段的数据，以便生成在灯箱处捕获的其他源图像的相应位姿校正图像。

10、各种实施例包括用于编辑隐私信息/数据、加密信息/数据以及匿名化数据的模块和/或一个或多个功能，以确保用户和平台信息/数据的机密性和安全性，以及遵守美国和/或国际司法管辖区中的数据隐私法律和法规。

11、通过具体实施方式、权利要求和附图，本公开的其他应用领域将变得清楚。具体实施方式和具体示例仅用于说明，而不用于限制本公开的范围。

技术特征：

1.一种计算机实现的方法，包括：

2.根据权利要求1所述的方法，在确定所述差异之前还包括：

3.根据权利要求1所述的方法，其中确定所述参照图像的所述第一位姿与所述源图像的所述第一位姿的变化之间的差异包括：

4.根据权利要求3所述的方法，还包括：

5.根据权利要求4所述的方法，其中所述缩放因子包括下列中的一个或多个：

6.根据权利要求4所述的方法，其中基于所确定的所述差异识别因所述源图像中描绘的所述第一位姿的变化而不清楚的所述对象的形状的三维(3d)图的一个或多个部分包括：

7.根据权利要求6所述的方法，其中将投影的所述源3d图和参照3d图进行比对以识别一个或多个差异包括：

8.一种系统，包括：

9.根据权利要求8所述的系统，在确定所述差异之前还包括：

10.根据权利要求8所述的系统，其中确定所述参照图像的所述第一位姿与所述源图像的所述第一位姿的变化之间的差异包括：

11.根据权利要求10所述的系统，还包括：

12.根据权利要求11所述的系统，其中所述缩放因子包括下列中的一个或多个：

13.根据权利要求11所述的系统，其中基于所确定的所述差异识别因所述源图像中描绘的所述第一位姿的变化而不清楚的所述对象的形状的三维(3d)图的一个或多个部分包括：

14.根据权利要求13所述的系统，其中将投影的所述源3d图和参照3d图进行比对以识别一个或多个差异包括：

15.一种包含非瞬态计算机可读介质的计算机程序产品，所述非瞬态计算机可读介质具有包含在其中通过一个或多个处理器来执行的计算机可读程序代码，所述程序代码包括用于以下的指令：

16.根据权利要求15所述的计算机程序产品，在确定所述差异之前还包括：

17.根据权利要求15所述的计算机程序产品，其中确定所述参照图像的所述第一位姿与所述源图像的所述第一位姿的变化之间的差异包括：

18.根据权利要求17所述的计算机程序产品，还包括：

19.根据权利要求18所述的计算机程序产品，其中所述缩放因子包含下列中的一个或多个：

20.根据权利要求18所述的计算机程序产品，其中：

技术总结
各种实施例涉及位姿校正引擎(“引擎”)。引擎生成目标对象的参照图像。参照图像描绘根据第一位姿而定向的目标对象。引擎接收对象的实例的源图像。源图像描绘根据第一位姿的变化而定向的对象实例。引擎确定参照图像的第一位姿与源图像的第一位姿的变化之间的差异。引擎基于所确定的差异识别因源图像中描绘的第一位姿的变化而不清楚的对象形状的三维(3D)图的一个或多个部分。

技术研发人员：H·K·桑阿帕,J·阿曼,R·时尤凡特,A·莎尔玛
受保护的技术使用者：因特如披公司
技术研发日：
技术公布日：2024/5/8

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：H·K·桑阿帕,J·阿曼,R·时尤凡特,A·莎尔玛
技术所有人：因特如披公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。