经由语言请求的自动照片编辑的制作方法

文档序号：34046652发布日期：2023-05-05 14:59阅读：152来源：国知局

以下总体上涉及图像处理，并且更具体地涉及使用机器学习的自动化图像处理。

背景技术：

1、数字图像处理是指使用计算机以使用算法或处理网络来编辑数字图像。例如，可以对由新手摄影师拍摄的图像执行数字图像处理以增强图像的整体吸引力。在一些情况下，可以对图像进行处理以提高图像清晰度。例如，数字图像可能包括黑暗区域、不想要的色调或对象。

2、然而，即使使用高级图像编辑软件，编辑这些属性也可能是困难和耗时的。此外，常规图像编辑系统不能进行基于自然言语请求的图像编辑。因此，本领域需要改进的图像处理系统和方法以基于用户请求而自动编辑图像。

技术实现思路

1、本公开的实施例涉及用于基于用户请求来自动处理图像的系统和方法。在一些示例中，将请求划分为修版(retouching)命令(例如，全局编辑)和图像修补(inpainting)命令(例如，局部编辑)。生成修版掩膜和图像修补掩膜，以指示将应用编辑的区域。将照片请求注意力和多模态调制过程应用于表示图像的特征，并且使用已修改的特征来生成合并用户请求的已修改的图像。

2、描述了一种用于图像处理的方法、装置、非暂态计算机可读介质和系统。该方法、装置、非暂态计算机可读介质和系统的一个或多个方面包括：标识图像和针对图像的编辑命令；对编辑命令进行编码，以获取图像修补向量和修版向量；基于图像修补向量来生成图像修补掩膜，并且基于修版向量来生成修版掩膜；基于图像和图像修补掩膜来生成图像特征表示；基于图像特征表示、修版掩膜和使用修版向量所计算的注意力矩阵来生成已修改的图像特征表示；以及基于已修改的图像特征表示来生成已修改的图像，其中已修改的图像表示编辑命令对图像的应用。

3、描述了一种用于训练的、用于图像处理的神经网络的方法、装置、非暂态计算机可读介质和系统。该方法、装置、非暂态计算机可读介质和系统的一个或多个方面包括：接收训练数据，该训练数据包括训练图像、编辑命令和真实值图像，该真实值图像表示编辑命令对训练图像的应用；对编辑命令进行编码，以获取图像修补向量和修版向量；基于图像修补向量来生成图像修补掩膜，并且基于修版向量来生成修版掩膜；基于训练图像和图像修补掩膜来生成图像特征表示；基于图像特征表示、修版掩膜和使用修版向量所计算的注意力矩阵来生成已修改的图像特征表示；基于已修改的图像特征表示来生成已修改的图像，其中已修改的图像表示编辑命令对训练图像的应用；基于已修改的图像和真实值图像来计算损失函数；以及基于损失函数来训练神经网络。

4、描述了一种用于图像处理的装置、系统和方法。该装置、系统和方法的一个或多个方面包括：文本编码器，被配置为针对图像的编辑命令进行编码，以获取图像修补向量和修版向量；短语条件真实(pcg)网络，被配置为基于图像修补向量生成图像修补掩膜，并且基于修版向量来生成修版掩膜；图像编码器，被配置为基于图像和图像修补掩膜来生成图像特征表示；多模态调制网络，被配置为基于图像特征表示、修版掩膜和使用修版向量所计算的注意力矩阵来生成已修改的图像特征表示；以及解码器，被配置为基于已修改的图像特征表示来生成已修改的图像，其中已修改的图像表示编辑命令对图像的应用。

技术特征：

1.一种图像处理方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求1所述的方法，还包括：

4.根据权利要求1所述的方法，还包括：

5.根据权利要求1所述的方法，还包括：

6.根据权利要求1所述的方法，还包括：

7.根据权利要求1所述的方法，还包括：

8.根据权利要求7所述的方法，还包括：

9.根据权利要求1所述的方法，还包括：

10.根据权利要求1所述的方法，其中：

11.根据权利要求1所述的方法，其中：

12.一种训练用于图像处理的神经网络的方法，包括：

13.根据权利要求12所述的方法，还包括：

14.根据权利要求12所述的方法，其中：

15.一种用于图像处理装置，包括：

16.根据权利要求15所述的装置，还包括：

17.根据权利要求16所述的装置，其中：

18.根据权利要求15所述的装置，还包括：

19.根据权利要求15所述的装置，其中：

20.根据权利要求15所述的装置，其中：

技术总结
本公开的实施例涉及经由语言请求的自动照片编辑。本公开涉及用于基于用户请求自动处理图像的系统和方法。在一些示例中，将请求划分为修版命令(例如，全局编辑)和图像修补命令(例如，局部编辑)。生成修版掩膜和图像修补掩膜以指示将应用编辑的区域。将照片请求注意力和多模态调制过程应用于表示图像的特征，并且使用已修改的特征来生成合并用户请求的已修改的图像。

技术研发人员：徐宁,林哲,F·德恩昂克特
受保护的技术使用者：奥多比公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐宁林哲 F
技术所有人：奥多比公司
我是此专利的发明人

上一篇：一种行星减速箱的行星架模块的制作方法
下一篇：一种裁剪装置的制作方法

该领域下的技术专家

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！