基于原图像和动态信息融合的息屏画面生成方法

文档序号:24875965发布日期:2021-04-30 12:51阅读:146来源:国知局
基于原图像和动态信息融合的息屏画面生成方法

本发明涉及深度学习和神经网络技术领域,且更为具体地,涉及一种基于原图像和动态信息融合的息屏画面生成方法、基于原图像和动态信息融合的息屏画面生成系统和电子设备。



背景技术:

随着oled显示屏被应用于终端设备(例如,智能手机等),其为智能手机的屏幕显示功能多样化提供新的硬件支持。相较于lcd显示屏,oled显示屏具有独特的“只点亮部分屏幕像素”的硬件能力,因此,在智能手机处于灭屏状态下,oled显示屏可只允许小部分像素常亮,以实现aod息屏显示功能。

在智能手机处于息屏状态下,oled屏幕上仍可显示工作时钟和一些常用提示信息,以使得终端设备的用户比较少地按下电源键点亮整个屏幕来查看时钟盒和有没有来电等提示性消息。但是,应用于智能手机的息屏界面仅显示固定内容,效果单一。

因此,期待一种生成可动态变化的aod息屏界面的技术方案。

目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为生成可动态变化的aod息屏界面提供了新的解决思路和方案。



技术实现要素:

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于原图像和动态信息融合的息屏画面生成方法、基于原图像和动态信息融合的息屏画面生成系统和电子设备,其基于卷积神经网络的图像生成器的方案,将用户当前自定义的手机息屏界面的图像和可以添加的动态信息在高维抽象空间中进行融合,以生成新的基于原图像的生成图像,通过这样的方式,向目前的手机息屏界面添加符合原图像的动态信息,可以提升aod的趣味性和互动性。

根据本申请的一个方面,提供了一种基于原图像和动态信息融合的息屏画面生成方法,其包括:

获取用户当前自定义的手机息屏界面的图像和待添加的动态信息,所述待添加的动态信息包括多条文本形式的动态信息;

将所述手机息屏界面的图像作为输入图像通过深度卷积神经网络以获得原图像特征图;

将所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量;

将所述多个文本向量分别通过多个全连接层进行编码,以获得多个文本特征向量,其中,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同;

将所述原图像特征图分别与所述多个文本特征向量中每个文本特征向量进行矩阵相乘,以获得多个动态信息特征向量;

将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图;

将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图;以及

将所述融合特征图输入生成器网络,以获得新的基于源图像的生成图像。

在上述基于原图像和动态信息融合的息屏画面生成方法中,将所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量,包括:将所述多条文本形式的动态信息中各条动态信息分别通过词嵌入模型,以获得多个文本向量。

在上述基于原图像和动态信息融合的息屏画面生成方法中,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图,包括:将所述多个动态信息特征向量按样本维度进行拼接,以获得拼接矩阵;以及,对所述拼接矩阵以所述原图像特征图的全局平均值进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图。

在上述基于原图像和动态信息融合的息屏画面生成方法中,将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图,包括:以预设权重计算所述动态信息特征图与所述原图像特征图之间的按像素位置的加权和,以获得融合特征图。

在上述基于原图像和动态信息融合的息屏画面生成方法中,所述深度卷积神经网络为深度残差神经网络。

在上述基于原图像和动态信息融合的息屏画面生成方法中,所述生成器网络为对抗生成网络,所述对抗生成网络的训练过程,包括:将已完成的动态信息添加的图像作为参考图像通过所述深度卷积神经网络以获得参考特征图;将所述参考特征图与所述融合特征图输入对抗生成网络以获得鉴别器损失函数值;以及,以所述鉴别器损失函数值对所述对抗生成网络进行训练。

在上述基于原图像和动态信息融合的息屏画面生成方法中,进一步包括:将所述待添加的动态信息中图标类的图像数据添加到所述生成图像中。

根据本申请的另一方面,一种基于原图像和动态信息融合的息屏画面生成系统,其包括:

信息获取单元,用于获取用户当前自定义的手机息屏界面的图像和待添加的动态信息,所述待添加的动态信息包括多条文本形式的动态信息;

原图像特征图生成单元,用于将所述信息获取单元获得的所述手机息屏界面的图像作为输入图像通过深度卷积神经网络以获得原图像特征图;

文本向量生成单元,用于将所述信息获取单元获得的所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量;

文本特征向量生成单元,用于将所述文本向量生成单元获得的所述多个文本向量分别通过多个全连接层进行编码,以获得多个文本特征向量,其中,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同;

动态信息特征向量生成单元,用于将所述原图像特征图生成单元获得的所述原图像特征图分别与所述文本特征向量生成单元获得的所述多个文本特征向量中每个文本特征向量进行矩阵相乘,以获得多个动态信息特征向量;

动态信息特征图生成单元,用于将所述动态信息特征向量生成单元获得的所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图;

融合特征图生成单元,用于将所述动态信息特征图生成单元获得的所述动态信息特征图与所述原图像特征图生成单元获得的所述原图像特征图融合,以获得融合特征图;以及

生成图像生成单元,用于将所述融合特征图生成单元获得的所述融合特征图输入生成器网络,以获得新的基于源图像的生成图像。

在上述基于原图像和动态信息融合的息屏画面生成系统中,所述文本向量生成单元,进一步用于:将所述多条文本形式的动态信息中各条动态信息分别通过词嵌入模型,以获得多个文本向量。

在上述基于原图像和动态信息融合的息屏画面生成系统中,所述动态信息特征图生成单元,包括:拼接矩阵生成子单元,用于将所述多个动态信息特征向量按样本维度进行拼接,以获得拼接矩阵;以及,插值子单元,用于对所述拼接矩阵生成子单元获得的所述拼接矩阵以所述原图像特征图的全局平均值进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图。

在上述基于原图像和动态信息融合的息屏画面生成系统中,所述融合特征图生成单元,进一步用于:以预设权重计算所述动态信息特征图与所述原图像特征图之间的按像素位置的加权和,以获得融合特征图。

在上述基于原图像和动态信息融合的息屏画面生成系统中,所述深度卷积神经网络为深度残差神经网络。

在上述基于原图像和动态信息融合的息屏画面生成系统中,所述生成器网络为对抗生成网络。

在上述基于原图像和动态信息融合的息屏画面生成系统中,进一步包括:图标添加单元,用于将所述待添加的动态信息中图标类的图像数据添加到所述生成图像生成单元获得的所述生成图像中。

根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于原图像和动态信息融合的息屏画面生成方法。

根据本申请的再又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于原图像和动态信息融合的息屏画面生成方法。

与现有技术相比,本申请提供的基于原图像和动态信息融合的息屏画面生成方法、基于原图像和动态信息融合的息屏画面生成系统和电子设备,其基于卷积神经网络的图像生成器的方案,将用户当前自定义的手机息屏界面的图像和可以添加的动态信息在高维抽象空间中进行融合,以生成新的基于原图像的生成图像,通过这样的方式,向目前的手机息屏界面添加符合原图像的动态信息,可以提升aod的趣味性和互动性。

附图说明

通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法的应用场景图;

图2图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法的流程图;

图3图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法的系统架构示意图;

图4图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法中,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图的流程图;

图5图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法中,所述对抗生成网络的训练过程的流程图;

图6图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成系统的框图。

图7图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成系统中动态信息特征向量生成单元的框图。

图8图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。

场景概述

如前所述,随着oled显示屏被应用于终端设备(例如,智能手机等),其为智能手机的屏幕显示功能多样化提供新的硬件支持。在智能手机处于息屏状态下,oled屏幕上仍可显示工作时钟和一些常用提示信息,以使得终端设备的用户比较少地按下电源键点亮整个屏幕来查看时钟盒和有没有来电等提示性消息。但是,应用于智能手机的息屏界面仅显示固定内容,效果单一。

针对上述问题,本申请的发明人期望将手机端与服务端建立连接,使得aod息屏界面可动态变化,如:随着早中晚变化,aod息屏界面分别显示日出、正午、日落的太阳景象。但是,对于用户已经设置的自定义手机息屏界面,用户很可能不希望改变当前的自定义的手机息屏界面内容。

因此,期望基于服务端提供的信息与用户当前的自定义的手机息屏界面内容进行结合,以便获得能够支持动态变化,且同时又不会影响用户自定义的手机息屏界面内容的呈现的方案。

基于此,本申请采用基于卷积神经网络的图像生成器的方案,来基于用户当前自定义的手机息屏界面的图像和可以添加的动态信息来生成新的基于原图像的生成图像。例如,现有原图像分别在清晨、正午和黄昏背景下的生成图像。此外,除了表示时间的动态信息之外,还可能存在其它动态信息,比如在正午背景下,除了基于正午背景修改原图像之外,还可以显示正午太阳图形,或者其它相关图形,比如防晒霜图形等。

因此,在本申请的方案中,首先获取用户当前自定义的手机息屏界面的原图像作为输入图像,并输入卷积神经网络以获得原图像特征图。然后,获取需要添加的动态信息,这里,需要添加的动态信息可以包括两类,一类是以文本形式的需要结合输入图像的,一类是可以直接添加的图标类的图像。

对于文本形式的动态信息,首先将各条动态信息都转换为向量,并分别通过多个全连接层转换为特征向量,全连接层的最后一层的输出位数与所述原图像特征图的宽度或者高度维度相同。然后,将多个特征向量分别与所述原图像特征图相乘,以便获得多个映射到原图像特征图的特征空间的动态信息特征向量,以便在与输入图像相同的特征空间中表达需要添加的动态信息。接下来,将动态信息特征向量按照样本维度进行拼接之后再进行插值,就可以获得与原图像特征图相同维度的动态信息特征图,并将原图像特征图与动态信息特征图融合,例如计算加权和,就可以获得用于输入生成器网络的输入特征图。

这样,通过向目前的手机息屏界面添加符合原图像的动态信息,可以提升aod的趣味性和互动性。

基于此,本申请提出了一种基于原图像和动态信息融合的息屏画面生成方法,其包括:获取用户当前自定义的手机息屏界面的图像和待添加的动态信息,所述待添加的动态信息包括多条文本形式的动态信息;将所述手机息屏界面的图像作为输入图像通过深度卷积神经网络以获得原图像特征图;将所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量;将所述多个文本向量分别通过多个全连接层进行编码,以获得多个文本特征向量,其中,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同;将所述原图像特征图分别与所述多个文本特征向量中每个文本特征向量进行矩阵相乘,以获得多个动态信息特征向量;将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图;将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图,以及,将所述融合特征图输入生成器网络,以获得新的基于源图像的生成图像。

图1图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法的应用场景图。

如图1所示,在该应用场景中,首先获取用户当前自定义的手机息屏界面的图像和待添加的动态信息;然后,将所述手机息屏界面的图像和待添加的动态信息输入至部署有基于原图像和动态信息融合的息屏画面生成算法的服务器中(例如,如图1中所示意的s),其中,所述服务器能够基于原图像和动态信息融合的息屏画面生成算法对所述手机息屏界面的图像和待添加的动态信息进行处理,以生成新的基于源图像的生成图像,所述生成图像在所述手机的显示屏上显示。

在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图2图示了基于原图像和动态信息融合的息屏画面生成方法的流程图。如图2所示,根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法,包括:s110,获取用户当前自定义的手机息屏界面的图像和待添加的动态信息,所述待添加的动态信息包括多条文本形式的动态信息;s120,将所述手机息屏界面的图像作为输入图像通过深度卷积神经网络以获得原图像特征图;s130,将所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量;s140,将所述多个文本向量分别通过多个全连接层进行编码,以获得多个文本特征向量,其中,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同;s150,将所述原图像特征图分别与所述多个文本特征向量中每个文本特征向量进行矩阵相乘,以获得多个动态信息特征向量;s160,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图;s170,将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图,以及,s180,将所述融合特征图输入生成器网络,以获得新的基于源图像的生成图像。

图3图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法的架构示意图。如图3所示,在所述基于原图像和动态信息融合的息屏画面生成方法的网络架构中,首先,将获取的手机息屏界面的图像(例如,如图3中所示意的in0)通过深度卷积神经网络(例如,如图3中所示意的cnn)以获得原图像特征图(例如,如图3中所示意的f1);接着,将多条文本形式的动态信息转化而来的多个文本向量(例如,如图3中所示意的in1到ink)分别通过多个全连接层(例如,如图3中所示意的fcl)进行编码以获得多个文本特征向量(例如,如图3中所示意的v1到vk);接着,将所述原图像特征图分别与所述多个文本特征向量中每个文本特征向量进行矩阵相乘(例如,如图3中所示意的),以获得多个动态信息特征向量(例如,如图3中所示意的vt1到vtk);接着,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图(例如,如图3中所示意的ft);接着,将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图(例如,如图3中所示意的fm);接着,将所述融合特征图输入生成器网络(例如,如图3中所示意的gan),以获得新的基于源图像的生成图像。

在步骤s110中,获取用户当前自定义的手机息屏界面的图像和待添加的动态信息,所述待添加的动态信息包括多条文本形式的动态信息。如前所述,为了实现aod息屏界面的动态变化,期望基于服务端提供的信息与用户当前的自定义的手机息屏界面内容进行结合,以便获得能够支持动态变化,且同时又不会影响用户自定义的手机息屏界面内容的呈现的方案。

具体地,在本申请实施例中,用户当前自定义的手机息屏界面的图像和待添加的动态信息可通过计算机软件获取,这里,需要添加的动态信息可以包括两类,一类是以文本形式的需要结合输入图像的,一类是可以直接添加的图标类的图像。

在步骤s120中,将所述手机息屏界面的图像作为输入图像通过深度卷积神经网络以获得原图像特征图。也就是,以深度卷积神经网络提取出所述手机息屏界面的图像中的各高维特征。

特别地,在本申请实施例中,所述深度卷积神经网络为深度残差神经网络,例如,resnet50。本领域普通技术人员应知晓,相较于传统的卷积神经网络,深度残差网络为在传统卷积神经网络的基础上提出的一种优化网络结构,其主要解决在训练过程中的梯度消失的问题。深度残差网络引入了残差网络结构,通过残差网络结构可以把网络层弄得更深,并且,不会发生梯度消失的问题。残差网络借鉴了高速网络的跨层链接思想,其打破了传统的神经网络从n-1层的输入层只能给n层作为输入的惯例,使某一层的输出可以直接跨过几层作为后面某一层的输入,其意义在于为迭加多层网络而使得整个学习模型的错误率不降反升的难题提供了新的方向。

在步骤s130中,将所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量。

具体地,在本申请实施例中,将所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量的过程,包括:将所述多条文本形式的动态信息中各条动态信息分别通过词嵌入模型,以获得多个文本向量。本领域普通技术人员应知晓,文本是一类非常重要的非结构化数据,可通过词袋模型、tf-idf、主题模型和词嵌入模型将文本转化为结构化数据,即,以向量的形式表示文本数据。这里,以词嵌入模型来讲文本形式的动态信息转化为词嵌入向量,该词嵌入模型例如word2vec等。

在步骤s140中,将所述多个文本向量分别通过多个全连接层进行编码,以获得多个文本特征向量,其中,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同。也就是,通过全连接层将学到的“分布式特征表示”映射到样本标记空间。应可以理解,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同的目的:使得输出的文本特征向量便于与所述原图像特征图相乘。

在步骤s150中,将所述原图像特征图分别与所述多个文本特征向量中每个文本特征向量进行矩阵相乘,以获得多个动态信息特征向量。也就是,将多个特征向量分别与所述原图像特征图相乘,以便获得多个映射到原图像特征图的特征空间的动态信息特征向量,以便在与输入图像相同的特征空间中表达需要添加的动态信息。

在步骤s160中,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图。应可以理解,将动态信息特征向量按照样本维度进行拼接之后再进行插值,就可以获得与原图像特征图相同维度的动态信息特征图。

具体地,在本申请实施例中,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图的过程,包括:首先,将所述多个动态信息特征向量按样本维度进行拼接,以获得拼接矩阵。然后,对所述拼接矩阵以所述原图像特征图的全局平均值进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图,其中,所述原图像特征图的全局平均值表征着所述原图像特征图中的背景信息,因此,对所述拼接矩阵以所述原图像特征图的全局平均值进行插值相当于在所述拼接矩阵中引入所述原图像特征图中的背景语义信息,这样,在后续的图像融合阶段,插值不会对最终的融合图像带来不良的影响,以使得最终获得的生成图像具有更自然的图像效果。

图4图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法中,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图的流程图。如图4所示,在本申请实施例中,将所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图,包括:s210,将所述多个动态信息特征向量按样本维度进行拼接,以获得拼接矩阵;s220,对所述拼接矩阵以所述原图像特征图的全局平均值进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图。

在步骤s170中,将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图。应可以理解,将原图像特征图与动态信息特征图融合,例如计算加权和,就可以获得用于输入生成器网络的输入特征图。

具体地,在本申请实施例中,将所述动态信息特征图与所述原图像特征图融合,以获得融合特征图的过程,包括:以预设权重计算所述动态信息特征图与所述原图像特征图之间的按像素位置的加权和,以获得融合特征图。也就是,将动态信息特征图和原图像特征图的权重作为超参数,计算动态信息特征图和原图像特征图之间的按像素位置的加权和。

在步骤s180中,将所述融合特征图输入生成器网络,以获得新的基于源图像的生成图像。应可以理解,将所述融合特征图作为输入特征图输入生成器网络,获得的生成图像融合了用户当前自定义的手机息屏界面的图像和可以添加的动态信息。

具体地,在本申请实施例中,所述生成器网络为对抗生成网络,所述对抗生成网络的训练过程,包括:首先,将已完成的动态信息添加的图像作为参考图像通过所述深度卷积神经网络以获得参考特征图,也就是,将已经完成动态信息添加的图像作为参考图像,并通过上述卷积神经网络以获得参考特征图。然后,将所述参考特征图与所述融合特征图输入对抗生成网络以获得鉴别器损失函数值;然后,以所述鉴别器损失函数值对所述对抗生成网络进行训练,即,基于所述鉴别器损失函数值更新所述对抗生成网络的参数,此时,也可以进一步通过梯度的反向传播训练上述的卷积神经网络。

图5图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成方法中,所述对抗生成网络的训练过程的流程图。如图5所示,在本申请实施例中,所述对抗生成网络的训练过程,包括:s310,将已完成的动态信息添加的图像作为参考图像通过所述深度卷积神经网络以获得参考特征图;s320,将所述参考特征图与所述融合特征图输入对抗生成网络以获得鉴别器损失函数值;以及,s330,以所述鉴别器损失函数值对所述对抗生成网络进行训练。

值得一提的是,在本申请实施例中,对所述动态信息中图标类的图像数据,可直接添加到所述生成图像中,也就是,在本申请实施例中,所述方法,进一步包括:将所述待添加的动态信息中图标类的图像数据添加到所述生成图像中。

综上,本申请实施例的基于原图像和动态信息融合的息屏画面生成方法被阐明,其基于卷积神经网络的图像生成器的方案,将用户当前自定义的手机息屏界面的图像和可以添加的动态信息在高维空间中进行融合,以生成新的基于原图像的生成图像,通过这样的方式,向目前的手机息屏界面添加符合原图像的动态信息,可以提升aod的趣味性和互动性。

示例性系统

图6图示了根据本申请实施例的基于原图像和动态信息融合的息屏画面生成系统的框图。

如图6所示,根据本申请实施例的基于原图像和动态信息融合的息屏画面生成系统600,包括:信息获取单元610,用于获取用户当前自定义的手机息屏界面的图像和待添加的动态信息,所述待添加的动态信息包括多条文本形式的动态信息;原图像特征图生成单元620,用于将所述信息获取单元620获得的所述手机息屏界面的图像作为输入图像通过深度卷积神经网络以获得原图像特征图;文本向量生成单元630,用于将所述信息获取单元610获得的所述多条文本形式的动态信息中各条动态信息分别转化为文本向量,以获得多个文本向量;文本特征向量生成单元640,用于将所述文本向量生成单元630获得的所述多个文本向量分别通过多个全连接层进行编码,以获得多个文本特征向量,其中,所述多个全连接层中最后一个全连接层的输出位数与所述原图像特征图的宽度或者高度维度相同;动态信息特征向量生成单元650,用于将所述原图像特征图生成单元620获得的所述原图像特征图分别与所述文本特征向量生成单元640获得的所述多个文本特征向量中每个文本特征向量进行矩阵相乘,以获得多个动态信息特征向量;动态信息特征图生成单元660,用于将所述动态信息特征向量生成单元650获得的所述多个动态信息特征向量按样本维度进行拼接之后再进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图;融合特征图生成单元670,用于将所述动态信息特征图生成单元660获得的所述动态信息特征图与所述原图像特征图生成单元620获得的所述原图像特征图融合,以获得融合特征图;以及,生成图像生成单元680,用于将所述融合特征图生成单元670获得的所述融合特征图输入生成器网络,以获得新的基于源图像的生成图像。

在一个示例中,在上述基于原图像和动态信息融合的息屏画面生成系统600中,所述文本向量生成单元630,进一步用于:将所述多条文本形式的动态信息中各条动态信息分别通过词嵌入模型,以获得多个文本向量。

在一个示例中,在上述基于原图像和动态信息融合的息屏画面生成系统600中,如图7所示,所述动态信息特征图生成单元650,包括:拼接矩阵生成子单元651,用于将所述多个动态信息特征向量按样本维度进行拼接,以获得拼接矩阵;以及,插值子单元652,用于对所述拼接矩阵生成子单元651获得的所述拼接矩阵以所述原图像特征图的全局平均值进行插值,以获得与所述原图像特征图具有相同维度的动态信息特征图。

在一个示例中,在上述基于原图像和动态信息融合的息屏画面生成系统600中,所述融合特征图生成单元670,进一步用于:以预设权重计算所述动态信息特征图与所述原图像特征图之间的按像素位置的加权和,以获得融合特征图。

在一个示例中,在上述基于原图像和动态信息融合的息屏画面生成系统600中,所述深度卷积神经网络为深度残差神经网络。

在一个示例中,在上述基于原图像和动态信息融合的息屏画面生成系统600中,所述生成器网络为对抗生成网络。

在一个示例中,在上述基于原图像和动态信息融合的息屏画面生成系统600中,如图6所示,进一步包括:图标添加单元690,用于将所述待添加的动态信息中图标类的图像数据添加到所述生成图像生成单元680获得的所述生成图像中。

这里,本领域技术人员可以理解,上述生成系统600中的各个单元和模块的具体功能和操作已经在上面参考图1到图5的基于原图像和动态信息融合的息屏画面生成方法的描述中得到了详细介绍,并因此,将省略其重复描述。

如上所述,根据本申请实施例的生成系统600可以实现在各种终端设备中,例如用于息屏画面生成的服务器等。在一个示例中,根据本申请实施例的生成系统600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该生成系统600可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该生成系统600同样可以是该终端设备的众多硬件模块之一。

替换地,在另一示例中,该生成系统600与该终端设备也可以是分立的设备,并且该生成系统600可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面,参考图8来描述根据本申请实施例的电子设备。

图8图示了根据本申请实施例的电子设备的框图。

如图8所示,电子设备包括10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于原图像和动态信息融合的息屏画面生成方法的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如动态信息特征向量、动态信息特征图等各种内容。

在一个示例中,电子设备10还可以包括:输入系统13和输出系统14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入系统13可以包括例如键盘、鼠标等等。

该输出系统14可以向外部输出各种信息,包括生成图像等。该输出系统14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图8中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于原图像和动态信息融合的息屏画面生成方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的基于原图像和动态信息融合的息屏画面生成方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1