一种缩小域差异的图像迁移方法及系统

文档序号：29910324发布日期：2022-05-06 01:12阅读：154来源：国知局

1.本发明属于计算机视觉技术领域，尤其涉及一种缩小域差异的图像迁移方法及系统。

背景技术：

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。
3.随着图形处理器(graphics processing unit,gpu)等硬件的不断发展迭代，以实时光线追踪(real-time ray tracing)技术为代表的现代图形学技术在近年来逐渐被大众所熟知，英伟达的rtx系列显卡和虚幻引擎5的技术演示则进一步加强了计算机图形学的热度。高质量渲染所生成的虚拟图像与真实图像几乎无异，例如，逼真的电影特效足以做到以假乱真，先进的计算机图形学技术也逐渐进入了人工智能研究者的视野。逼真的虚拟图像的用途在于辅助深度学习算法进行训练，使用大量的虚拟数据与少量的真实数据组合在一起作为训练集训练出的算法在性能上可以接近甚至超过仅使用真实数据训练出的算法。生成虚拟数据相比采集真实数据具有如下优点：生成效率高且成本低，在高性能图形处理器和高质量实时渲染算法的加持下，一小时便可生成上万张带有标签信息的虚拟数据，而采集同数量级的真实数据，从寻找场地、搭建采集设备、进行采集到数据标注至少需耗费数周的时间。
4.然而，虚拟图像虽然优点众多，但存在一个关键的问题：虚拟图像与真实图像间存在域差异(domain gap)，深度学习的训练过程十分依赖数据，当针对不同场景下的不同任务时往往需要截然不同的训练数据，这也使得深度学习的泛化能力十分有限，这导致当训练集和测试集存在一定域差异时，准确率将大幅下降，域差异的问题制约着虚拟图像的可用性。

技术实现要素：

5.为了解决上述背景技术中存在的技术问题，本发明提供一种缩小域差异的图像迁移方法及系统，减小了生成的迁移图像与真实图像间的域差异，提高了生成的迁移图像的真实性。
6.为了实现上述目的，本发明采用如下技术方案：
7.本发明的第一个方面提供一种缩小域差异的图像迁移方法，其包括：
8.获取虚拟图像；
9.基于虚拟图像，采用不同的着色器生成虚拟图像的多个辅助图；
10.基于虚拟图像的多个辅助图，采用基于卷积核的生成对抗网络的生成器，得到迁移图像；
11.其中，基于卷积核的生成对抗网络的生成器采用卷积层分别对多个辅助图进行卷积，对卷积层的输出进行加法操作后输入一个卷积层，得到融合特征图，基于融合特征图得
到迁移图像。
12.进一步的，所述基于卷积核的生成对抗网络的训练方法为：
13.基于卷积核的生成对抗网络的生成器输入为训练集中的虚拟图像的多个辅助图，输出迁移图像；
14.将迁移图像与训练集中的真实图像输入基于卷积核的生成对抗网络的辨别器；
15.对生成器和辨别器的参数交替进行更新。
16.进一步的，所述对生成器和辨别器的参数交替进行更新采用梯度下降法。
17.进一步的，所述训练集包含一个真实图像以及若干条虚拟数据，每条虚拟数据包含一个虚拟图像及其多个辅助图。
18.进一步的，所述辅助图包括彩色图、深度图、法线图和语义分割图。
19.进一步的，所述虚拟图像由虚拟场景和三维物体组成。
20.进一步的，所述着色器通过blender的着色器编辑器得到。
21.本发明的第二个方面提供一种缩小域差异的图像迁移系统，其包括：
22.图像获取模块，其被配置为：获取虚拟图像；
23.辅助图生成模块，其被配置为：基于虚拟图像，采用不同的着色器生成虚拟图像的多个辅助图；
24.图像迁移模块，其被配置为基于虚拟图像的多个辅助图，采用基于卷积核的生成对抗网络的生成器，得到迁移图像；
25.其中，基于卷积核的生成对抗网络的生成器采用卷积层分别对多个辅助图进行卷积，对卷积层的输出进行加法操作后输入一个卷积层，得到融合特征图，基于融合特征图得到迁移图像。
26.本发明的第三个方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的一种缩小域差异的图像迁移方法中的步骤。
27.本发明的第四个方面提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的一种缩小域差异的图像迁移方法中的步骤。
28.与现有技术相比，本发明的有益效果是：
29.本发明提供了一种缩小域差异的图像迁移方法，其面对不同需求与任务可以以虚拟图像的形式快速输出大量虚拟图像，并使用基于卷积核的生成对抗网络对虚拟图像做域迁移，以减小其与真实图像间的域差异，最终使深度学习算法可以仅通过大量虚拟图像进行训练，并在真实图像上做预测，大大缩小了迁移图像与真实图像之间的域差异，提升了迁移图像作为深度学习训练数据的可行性，并进一步提升了深度学习在各种场景下的落地效率。
附图说明
30.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
31.图1是本发明实施例一的生成器的部分结构图；
32.图2是本发明实施例一的虚拟图像的示意图；
33.图3是本发明实施例一的虚拟图像的彩色图、深度图、法线图和语义分割图的示意图；
34.图4是本发明实施例一的迁移结果示意图。
具体实施方式
35.下面结合附图与实施例对本发明作进一步说明。
36.应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
37.需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
38.实施例一
39.本实施例提供了一种缩小域差异的图像迁移方法，使用渲染引擎生成带有标签的虚拟图像，并使用生成对抗网络(cyclegan)进一步减小域差异，具体包括以下步骤：
40.步骤1、获取用户构建的虚拟图像。
41.具体的，根据需求和任务，在三维图形学引擎中搭建合理的虚拟场景，并放置的三维物体，三维场景和三维物体组成虚拟三维场景，放置虚拟相机后将虚拟三维场景投影至显示器平面生成如图2所示的虚拟图像。三维图形学引擎包含着渲染引擎(渲染器)、三维场景编辑、三维建模等等，例如blender，c4d 等软件都是三维图形学引擎。
42.步骤2、基于三维虚拟场景，渲染器采用用户设计的四个不同着色器同步生成虚拟图像的多个辅助图(彩色图、深度图、法线图和语义分割图)。
43.具体的，设计四个不同的着色器，渲染器基于四个不同的着色器分别生成如图3所示的彩色图、深度图、法线图和语义分割图。
44.在具体的应用中，彩色图、深度图、法线图和语义分割图除了用于图像迁移任务，还可用于图像语义分割任务、目标检测和分类检测等任务，这时需要标注相应的标签(例如，做图像语义分割任务时每个像素的标签为每个像素所属的对象类别，做目标检测时标签为每个像素是否为检测框，做分类检测时标签为图像所属的类别)，可以根据所需标签，设计四个不同的着色器，生成如图3所示的彩色图、深度图、法线图和语义分割图及其标签。
45.着色器使用blender的着色器编辑器进行设计得到；渲染器为cycles渲染器。
46.步骤3、基于虚拟图像的彩色图、深度图、法线图和语义分割图，采用基于卷积核的生成对抗网络的生成器，得到迁移图像。具体的，如图4所示，基于卷积核的生成对抗网络的生成器采用四个卷积层(conv)分别对彩色图、深度图、法线图和语义分割图进行卷积后，对四个卷积层的输出进行加法操作后输入一个卷积层，得到融合特征图，基于融合特征图得到迁移图像(迁移至目标域的图像)。
47.具体的，将生成对抗网络cyclegan中生成器的输入模块修改为如图4所示的卷积块rconv，得到基于卷积核的生成对抗网络。
48.基于卷积核的生成对抗网络的训练方法为：
49.获取训练集，训练集中包含一个真实图像以及若干条虚拟数据，每条虚拟数据包含一个虚拟图像(一个源域)及其彩色图、深度图、法线图和语义分割图；
50.基于卷积核的生成对抗网络的生成器输入为训练集中的虚拟图像(源域)的彩色图、深度图、法线图和语义分割图，输出迁移图像(迁移至目标域的图像)；将迁移图像与训练集中的真实图像(目标域的数据)输入基于卷积核的生成对抗网络的辨别器；使用梯度下降法对生成器和辨别器的参数交替进行更新。
51.训练结束后仅使用生成器对渲染图像做域迁移，将虚拟图像迁移至真实图像。以减小生成的迁移图像与真实图像间的域差异，提升生成的迁移图像的准确率。
52.因rconv的引入，cyclegan的损失函数中一致性映射损失函数(identitymappingloss)也需要做出相应修改。设源域的彩色图为x_r，深度图x_d，法线图x_n，语义分割图x_m，生成器为g，生成器的输出为g(x)，其中x＝[x_r,x_d,x_n,x_m]，真实图像(目标域的数据)为y；基于卷积核的生成对抗网络与cyclegan一样，还包含一个辅助生成器f，该生成器的输入为目标域的数据，输出为源域的数据，目的是结合identitymappingloss保持生成器g的输入内容与输出内容一致(仅进行域迁移而不改变内容)，本发明将cyclegan中的identitymappingloss修改为：
[0053]
l
identity
(g)＝e
x～pdata(x)
||f(g(x))
–
x_r||1[0054]
其中，pdata即为f(g(x))，rconv块可以最大限度地利用虚拟数据的优势，将法线图、深度图等作为补充的信息，可以使基于卷积核的生成对抗网络生成更加符合真实图像的结果；将建筑物的虚拟图像和目标域的真实图像输入基于卷积核的生成对抗网络，对虚拟数据进行域迁移，结果如图4所示，可以看出，使用rconv块作为输入的cyclegan生成器(图4右下角图像)相比原cyclegan生成器(图4左下角图像)，输出的结果鬼影更少，内容更加贴近原渲染图。将迁移图像作为数据集训练深度学习算法，可以提升算法的准确率，相比使用未迁移的虚拟数据，迁移后的数据可以更加稳定地训练深度学习，获得更好的泛化性。
[0055]
实施例二
[0056]
本实施例提供了一种缩小域差异的图像迁移系统，其具体包括如下模块：
[0057]
图像获取模块，其被配置为：获取虚拟图像；
[0058]
辅助图生成模块，其被配置为：基于虚拟图像，采用不同的着色器生成虚拟图像的多个辅助图；
[0059]
图像迁移模块，其被配置为基于虚拟图像的多个辅助图，采用基于卷积核的生成对抗网络的生成器，得到迁移图像；
[0060]
其中，基于卷积核的生成对抗网络的生成器采用卷积层分别对多个辅助图进行卷积，对卷积层的输出进行加法操作后输入一个卷积层，得到融合特征图，基于融合特征图得到迁移图像。
[0061]
此处需要说明的是，本实施例中的各个模块与实施例一中的各个步骤一一对应，其具体实施过程相同，此处不再累述。
[0062]
实施例三
[0063]
本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例一所述的一种缩小域差异的图像迁移方法中的步骤。
[0064]
实施例四
[0065]
本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例一所述的一种缩小域差异的图像迁移方法中的步骤。
[0066]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0067]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0068]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0069]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0070]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory， rom)或随机存储记忆体(random accessmemory，ram)等。
[0071]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高瑞梅海艺张道良
技术所有人：山东大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。