以下总体上涉及图像处理,并且更具体地涉及使用机器学习的自动化图像处理。
背景技术:
1、数字图像处理是指使用计算机以使用算法或处理网络来编辑数字图像。例如,可以对由新手摄影师拍摄的图像执行数字图像处理以增强图像的整体吸引力。在一些情况下,可以对图像进行处理以提高图像清晰度。例如,数字图像可能包括黑暗区域、不想要的色调或对象。
2、然而,即使使用高级图像编辑软件,编辑这些属性也可能是困难和耗时的。此外,常规图像编辑系统不能进行基于自然言语请求的图像编辑。因此,本领域需要改进的图像处理系统和方法以基于用户请求而自动编辑图像。
技术实现思路
1、本公开的实施例涉及用于基于用户请求来自动处理图像的系统和方法。在一些示例中,将请求划分为修版(retouching)命令(例如,全局编辑)和图像修补(inpainting)命令(例如,局部编辑)。生成修版掩膜和图像修补掩膜,以指示将应用编辑的区域。将照片请求注意力和多模态调制过程应用于表示图像的特征,并且使用已修改的特征来生成合并用户请求的已修改的图像。
2、描述了一种用于图像处理的方法、装置、非暂态计算机可读介质和系统。该方法、装置、非暂态计算机可读介质和系统的一个或多个方面包括:标识图像和针对图像的编辑命令;对编辑命令进行编码,以获取图像修补向量和修版向量;基于图像修补向量来生成图像修补掩膜,并且基于修版向量来生成修版掩膜;基于图像和图像修补掩膜来生成图像特征表示;基于图像特征表示、修版掩膜和使用修版向量所计算的注意力矩阵来生成已修改的图像特征表示;以及基于已修改的图像特征表示来生成已修改的图像,其中已修改的图像表示编辑命令对图像的应用。
3、描述了一种用于训练的、用于图像处理的神经网络的方法、装置、非暂态计算机可读介质和系统。该方法、装置、非暂态计算机可读介质和系统的一个或多个方面包括:接收训练数据,该训练数据包括训练图像、编辑命令和真实值图像,该真实值图像表示编辑命令对训练图像的应用;对编辑命令进行编码,以获取图像修补向量和修版向量;基于图像修补向量来生成图像修补掩膜,并且基于修版向量来生成修版掩膜;基于训练图像和图像修补掩膜来生成图像特征表示;基于图像特征表示、修版掩膜和使用修版向量所计算的注意力矩阵来生成已修改的图像特征表示;基于已修改的图像特征表示来生成已修改的图像,其中已修改的图像表示编辑命令对训练图像的应用;基于已修改的图像和真实值图像来计算损失函数;以及基于损失函数来训练神经网络。
4、描述了一种用于图像处理的装置、系统和方法。该装置、系统和方法的一个或多个方面包括:文本编码器,被配置为针对图像的编辑命令进行编码,以获取图像修补向量和修版向量;短语条件真实(pcg)网络,被配置为基于图像修补向量生成图像修补掩膜,并且基于修版向量来生成修版掩膜;图像编码器,被配置为基于图像和图像修补掩膜来生成图像特征表示;多模态调制网络,被配置为基于图像特征表示、修版掩膜和使用修版向量所计算的注意力矩阵来生成已修改的图像特征表示;以及解码器,被配置为基于已修改的图像特征表示来生成已修改的图像,其中已修改的图像表示编辑命令对图像的应用。
1.一种图像处理方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,还包括:
4.根据权利要求1所述的方法,还包括:
5.根据权利要求1所述的方法,还包括:
6.根据权利要求1所述的方法,还包括:
7.根据权利要求1所述的方法,还包括:
8.根据权利要求7所述的方法,还包括:
9.根据权利要求1所述的方法,还包括:
10.根据权利要求1所述的方法,其中:
11.根据权利要求1所述的方法,其中:
12.一种训练用于图像处理的神经网络的方法,包括:
13.根据权利要求12所述的方法,还包括:
14.根据权利要求12所述的方法,其中:
15.一种用于图像处理装置,包括:
16.根据权利要求15所述的装置,还包括:
17.根据权利要求16所述的装置,其中:
18.根据权利要求15所述的装置,还包括:
19.根据权利要求15所述的装置,其中:
20.根据权利要求15所述的装置,其中: