用于生成图像的方法、装置、设备和介质与流程

文档序号:37141668发布日期:2024-02-26 16:54阅读:15来源:国知局
用于生成图像的方法、装置、设备和介质与流程

本公开的示例性实现方式总体涉及图像生成处理,特别地涉及用于基于提示词来生成图像的方法、装置、设备和计算机可读存储介质。


背景技术:

1、机器学习技术已经被广泛地用于视觉任务。例如,目前已经提出了基于文本来生成图像的多种机器学习模型。用户可以利用文本来描述期望生成的图像,然而机器学习模型生成的图像有时并不符合用户需求,这导致用户不得不不断调整输入的文本。此时,期望可以提供更为简单并且有效的图像生成技术方案。


技术实现思路

1、在本公开的第一方面,提供了一种用于生成图像的方法。在该方法中,获取用于指定将被生成的图像的提示词。基于提示词来生成第一图像。提供第一图像以及用于调整第一图像的至少一个推荐标签,其中,至少一个推荐标签用于调整第一图像的以下至少任一项:风格、背景、以及前景中的对象的至少一个属性。

2、在本公开的第二方面,提供了一种用于生成图像的装置。该装置包括:获取模块,被配置用于获取用于指定将被生成的图像的提示词;生成模块,被配置用于基于提示词来生成第一图像;以及提供模块,被配置用于提供第一图像以及用于调整第一图像的至少一个推荐标签,其中,至少一个推荐标签用于调整第一图像的以下至少任一项:风格、背景、以及前景中的对象的至少一个属性。

3、在本公开的第三方面,提供了一种电子设备。该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使电子设备执行根据本公开第一方面的方法。

4、在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时使处理器实现根据本公开第一方面的方法。

5、应当理解,本内容部分中所描述的内容并非旨在限定本公开的实现方式的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。



技术特征:

1.一种用于生成图像的方法,包括:

2.根据权利要求1所述的方法,其中所述至少一个推荐标签是基于以下至少任一项来确定的:所述提示词中的关键字、所述第一图像的风格特征、颜色特征、纹理特征、以及几何特征。

3.根据权利要求1所述的方法,进一步包括:

4.根据权利要求3所述的方法,其中所述第二图像是基于以下来确定的:

5.根据权利要求3所述的方法,其中所述调整需求包括文本和图像中的至少任一项,并且所述方法进一步包括:提供用于调整所述第二图像的至少一个推荐标签。

6.根据权利要求1所述的方法,其中获取所述提示词包括:

7.根据权利要求6所述的方法,其中确定所述提示词包括以下至少任一项:

8.根据权利要求6所述的方法,其中所述提示词模板包括用于指定将被生成的图像的至少一个描述词以及所述至少一个描述词的值,所述至少一个描述词包括以下至少任一项:将被生成的图像的风格、前景、背景、色调、时间、地点、人物。

9.根据权利要求8所述的方法,其中所述提示词模板包括可编辑部分以及不可编辑部分。

10.根据权利要求9所述的方法,进一步包括:响应于接收到针对所述至少一个描述词中的目标描述词的值的第四交互,更新所述提示词模板。

11.一种用于生成图像的装置,包括:

12.一种电子设备,包括:

13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时使所述处理器实现根据权利要求1至10中任一项所述的方法。


技术总结
提供了用于生成图像的方法、装置、设备和介质。在一种方法中,获取用于指定将被生成的图像的提示词。基于提示词来生成第一图像。提供第一图像以及用于调整第一图像的至少一个推荐标签,其中,至少一个推荐标签用于调整第一图像的以下至少任一项:风格、背景、以及前景中的对象的至少一个属性。利用本公开的示例性实现方式,推荐标签可以向用户提供关于修改图像内容的建议,并且用户可以在无需重新修改提示词的情况下,直接点击标签来调整图像的内容。以此方式,可以以更为简单并且有效的方式来生成更加符合于用户预期的图像。

技术研发人员:夏亮,王道裕,孙辉,郑紫阳
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:
技术公布日:2024/2/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1