一种字体设计方法、系统、设备及计算机可读存储介质与流程

文档序号:15271620发布日期:2018-08-28 22:30阅读:147来源:国知局

本发明涉及平面设计技术领域,特别涉及一种字体设计方法、系统、设备及计算机可读存储介质。



背景技术:

由于汉字的复杂多样性,字体设计师在设计一款全新的字体时非常地耗时耗力。在传统的字体自动生成方法中,通常采用把汉字拆分为不同部首并根据字体结构进行组合的方式实现。但是此方法有如下缺点:第一,仅对部分汉字结构有效,比如对“结、灵”等上下结构和左右结构的字比较有效,对于半包围结构的字组合难度较大,如“建”;第二,不能动态地调整生成字体的结构比例,比如部首“十”在汉字“千”和“克”中的大小比例是不一样的;第三,需要过多的人机交互,比如想生成“种”字,需要先手动选择“禾”和“中”,然后再进行合成。因此,传统的字体生成方法的普适性不高,从而导致字体设计难度高、效率低等问题。

由此可见,如何提供一种字体设计方法,以解决传统的字体生成方法的普适性不高,从而导致字体设计难度高、效率低等问题,是本领域技术人员亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明的目的在于提供一种字体设计方法、系统、设备及计算机可读存储介质,以解决传统的字体生成方法的普适性不高,从而导致字体设计难度高、效率低等问题。其具体方案如下:

一种字体设计方法,包括:

获取源字体中的待设计汉字图像;

将所述待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像;

其中,所述字体转换模型为预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的模型,其中,所述训练样本包括字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像。

可选的,获得所述字体转换模型的步骤,包括:

获取所述训练样本;

利用深度学习框架tensorflow创建非对称transfer网络;

利用所述训练样本对所述非对称transfer网络进行训练,得到所述字体转换模型。

可选的,所述利用所述训练样本对所述非对称transfer网络进行训练,得到所述字体转换模型的步骤,包括:

对所述训练样本中的目标字体汉字图像及对应的源字体汉字图像进行预处理,得到相应的汉字图像对;

对所述汉字图像对进行数据增强处理,得到增强后的汉字图像对;

利用所述增强后的汉字图像对训练所述非对称transfer网络,得到所述字体转换模型。

可选的,所述利用所述增强后的汉字图像对训练所述非对称transfer网络的步骤,包括:

获取增强后的源字体汉字图像,然后通过encoder网络获取所述处理后源字体汉字图像的高层特征,得到目标高层特征;

通过decoder网络对所述目标高层特征进行反向卷积操作,得到相应的目标字体汉字图像,完成对所述非对称transfer网络的字体风格转换的训练过程。

可选的,所述利用所述处理后汉字图像对训练所述非对称transfer网络的步骤,包括:

根据预设的loss函数,利用所述处理后汉字图像对训练所述非对称transfer网络。

可选的,所述预设的loss函数包括ganloss、constantloss以及l1loss。

可选的,所述将获取到的待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像的步骤之后,还包括:

若所述字体转换模型输出的目标字体汉字图像中出现任一不符合预设的目标字体风格,则获取微调后目标字体汉字;

利用所述微调后目标字体汉字对所述字体转换网络进行finetuning操作,得到新的字体转换网络;

其中,所述微调后目标字体汉字为字体设计师对不符合预设的目标字体风格的汉字进行微调得到的新的目标字体汉字。

相应的,本发明还提供了一种字体设计系统,包括:

待设计汉字图像获取模块,用于获取源字体中的待设计汉字图像;

待设计汉字图像输入模块,用于将所述待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像;

其中,所述字体转换模型为预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的模型,其中,所述训练样本包括字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像。

相应的,本发明还提供了一种字体设计设备,包括存储器和处理器,其中,所述处理器用于执行所述存储器中存储的计算机程序以实现如前述字体设计方法的步骤。

相应的,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述字体设计方法的步骤。

本发明公开的字体设计方法,获取源字体中的待设计汉字图像;将所述待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像;其中,所述字体转换模型为预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的模型,其中,所述训练样本包括字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像。

与传统的字体自动生成方法相比,本发明的字体设计方法具有以下有益效果:获取源字体中的待设计汉字图像,然后将获取到的待设计汉字图像输入至预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的字体转换,得到所述字体转换模型输出的目标字体汉字图像。可见,本发明利用深度学习中的图像转换技术,将源字体中的待设计汉字先转化为相应的汉字图像,在这过程中不需要对源字体中待设计汉字的部首和字体结构进行拆分和组合,这样也就避免了对字体结构比较复杂的汉字进行组合的操作,有效降低了字体设计的难度,同时提高字体生成方法的普适性。可以理解的是,由于上述训练后模型为预先利用字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像对上述非对称transfer网络训练而得到的模型,也即该模型可识别目标字体的相关特征和风格,因此,只需获取到源字体中待设计汉字的图像便可转换为对应的目标字体汉字图像,便可根据上述字体转换模型以学习到的相关特征和风格生成相应的目标字体汉字,这样可解决传统方法中不能动态调整生成字体的结构比例的不足,同时减少字体设计过程中的人机交互操作。可见,使用本发明的字体设计方法可以有效提高字体生成方法的普适性,进而显著降低字体设计的难度,同时大大提高字体设计的效率。

需要说明的是,本发明公开的字体设计系统、设备及计算机可读存储介质所具有的有益效果与上述有益效果相似或相同,在此不再赘述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的一种字体设计方法流程图;

图2为本发明实施例公开的一种具体的字体设计方法流程图;

图3为本发明实施例公开的一种具体的字体设计方法中非对称的transfer网络的网络结构示意图;

图4为本发明实施例公开的一种具体的字体设计方法中判别器网络的具体结构示意图;

图5为本发明实施例公开的一种具体的字体设计方法中的判别器网络与非对称transfer网络的连接关系示意图;

图6为本发明实施例公开的一种字体设计系统的结构示意图;

图7为本发明实施例公开的一种字体设计设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种字体设计方法,参见图1所示,该方法具体包括:

步骤s11:获取源字体中的待设计汉字图像。

需要说明的是,在本申请实施例中,上述源字体中待设计汉字的图像可以是预先确定并经过相应的技术手段得到的,当然,也可以是在字体设计的过程中根据实际情况而获得的,本申请实施例对如何获取源字体中待设计汉字的图像不做任何限制,同样的,对待设计汉字图像是提前采集,还是在进行字体设计时再获取也不做限定。

步骤s12:将所述待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像。

其中,所述字体转换模型为预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的模型,其中,所述训练样本包括字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像。

可以理解的是,本申请实施例是将字体生成抽象为图像转换问题,通过获取源字体中待设计汉字的图像,然后将获取到的待设计汉字图像输入至预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的字体转换,得到所述字体转换模型输出的目标字体汉字图像。

可见,本发明利用深度学习中的图像转换技术,将源字体中的待设计汉字先转化为相应的汉字图像,在这过程中不需要对源字体中待设计汉字的部首和字体结构进行拆分和组合,这样也就避免了对字体结构比较复杂的汉字进行组合的操作,有效降低了字体设计的难度,同时提高字体生成方法的普适性。可以理解的是,由于上述训练后模型为预先利用字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像对上述非对称transfer网络训练而得到的模型,也即该模型可识别目标字体的相关特征和风格,因此,只需获取到源字体中待设计汉字的图像便可转换为对应的目标字体汉字图像,便可根据上述字体转换模型以学习到的相关特征和风格生成相应的目标字体汉字,这样可解决传统方法中不能动态调整生成字体的结构比例的不足,同时减少字体设计过程中的人机交互操作。可见,本发明的字体设计方法可以有效提高字体生成方法的普适性,进而显著降低字体设计的难度,同时大大提高字体设计的效率。

本申请实施例还相应公开了一种具体的字体设计方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参见图2所示,该方法具体包括以下步骤:

步骤s21:获取所述训练样本。

其中,上述训练样本为字体设计师根据实际情况设计出的少量目标字体汉字对应的汉字图像以及预先确定的源字体汉字对应的汉字图像。

需要说明的是,为了降低非对称transfer网络中的卷积神经网络的学习难度,上述源字体汉字可以是与目标字体汉字的设计风格相接近的字体,例如,已有的黑体与待设计的蘑菇新园体即目标字体的设计风格相对接近,则可以将黑体确定为源字体。可以理解的是,训练样本的数量越多、汉字结构越多样化例如左右结构的汉字、上下结构的汉字、独体字、笔顺少的字以及笔顺多的字等,最后训练出来的字体转换模型输出的目标字体汉字风格越接近字体设计师的设计风格。

步骤s22:利用深度学习框架tensorflow创建非对称transfer网络。

需要说明的是,与传统的unet网络(生物图像分割的卷积网络)相比,非对称transfer网络在decoder(解码)网络中的每一次反卷积之后加入了卷积操作。具体地,以黑体为源字体,蘑菇新园体为目标字体为例,参见图3所示,图3为本申请实施例中非对称的transfer网络的网络结构。通过引入非对称的方式,decoder网络的层数为encoder(编码)网络的层数的两倍,从而使decoder网络中的每一层反卷积的表达能力都能得到了加强。

步骤s23:利用所述训练样本对所述非对称transfer网络进行训练,得到字体转换模型。

需要说明的是,在本申请实施例中的字体转换模型中,encoder网络主要是学习字体的抽象特征。具体的,字体转换模型中的encoder网络获取目标尺寸的图像,例如尺寸为256*256*1的图像,通过一系列卷积操作最后得到相应维数,例如4*4*512维的高层特征,该特征可以理解为字体的表意特征,如通过encoder网络获取到的黑体“明”的高层特征与楷体“明”的高层特征应尽可能一致。字体转换模型中的decoder网络的作用是学习生成目标字体,具体的,decoder网络获取上述encoder网络的结果,并将该结果作为输入,然后对该输入进行一系列的反卷积操作,以使得最后生成的目标字体汉字图像的尺寸为上述目标尺寸,例如256*256*1。

需要说明的是,上述利用所述训练样本对所述非对称transfer网络进行训练,得到所述字体转换模型的步骤,可以具体包括:

对所述训练样本中的目标字体汉字图像及对应的源字体汉字图像进行预处理,得到相应的汉字图像对;对所述汉字图像对进行数据增强处理,得到增强后的汉字图像对;利用所述增强后的汉字图像对训练所述非对称transfer网络,得到所述字体转换模型。

具体的,上述利用所述增强后的汉字图像对训练所述非对称transfer网络的步骤,可以具体包括:

获取增强后的源字体汉字图像,然后通过encoder网络获取所述处理后源字体汉字图像的高层特征,得到目标高层特征;通过decoder网络对所述目标高层特征进行反向卷积操作,得到相应的目标字体汉字图像,完成对所述非对称transfer网络的字体风格转换的训练过程。

需要说明的是,在训练过程中,通过非对称transfer网络得到目标字体后,还可以利用判别器网络来判断生成的目标字体是否为真实的字体。判别器网络可以采用比较简单的二分类网络,需要说明的是,如果判别器网络过深,可能导致生成器的生成难度上升,故通常只需要4层卷积操作。判别器网络的具体结构示意图以及与上述非对称transfer网络的连接关系可参见图4、图5。其中,判别器网络获取的正样本为目标字体汉字对应的汉字图像,负样本为对应的源字体汉字通过上述字体转换网络转换生成的目标字体汉字图像。为了使上述字体转换网络生成的目标字体尽可能的逼真,也即符合实际情况中字体设计师的设计风格,本申请实施例中,上述利用所述处理后汉字图像对训练所述非对称transfer网络的步骤,可以具体包括:

根据预设的loss函数,利用所述处理后汉字图像对对所述非对称transfer网络进行训练。

具体的,上述预设的loss函数包括ganloss、constantloss以及l1loss。

其中,ganloss的设计充分体现了博弈论的思想,下面是字体转换网络中ganloss的定义:

式中,s表示字体转换网络中的源字体,t表示字体转换网络中的目标字体,t(s)表示字体转换网络,可以理解为gan(generativeadversarialnetworks,即生成对抗网络)中的生成器网络,d(t)表示判别网络,d(t)的主要目的是判断生成的字体为真实字体的概率。

在训练的过程中,同一个汉字的源字体和目标字体表达的语义应一致,因此在字体转换的过程中加入此指导信息能加快字体生成网络的训练收敛速度。受域转换网络dtn(domaintransfernetwork,即域转换网络)的启发,可以在字体进入encoder网络后,提取源字体和目标字体的高层语义特征的l2loss作为constantloss。具体公式如下:

式中,f(t)、f(s)表示通过encoder网络获得的源字体汉字图像的高维特征向量和相应的目标字体汉字图像的高维特征向量。

需要说明的是,由于汉字的笔顺变化复杂多样,虽然ganloss能从汉字的全局信息指导生成网络产生尽可能接近目标字体的汉字,但是对笔顺变化等细节信息的指导作用有限。所以,本申请实施例引入l1loss来对生成字体的细节信息进行约束。公式如下:

最后,在训练阶段把三个上述loss(损失函数)通过加权求和形成最终的loss,公式如下。

式中,λ1、λ2表示对应loss的权重。

步骤s24:获取源字体中的待设计汉字图像。

步骤s25:将所述待设计汉字图像输入至所述字体转换模型,得到所述字体转换模型输出的目标字体汉字图像。

需要说明的是,因为前期训练样本中的目标字体很少,故机器训练出来的目标字体可能还不够完美,比如有些笔顺的风格机器可能学习得还不像,此时就需要设计师对不像的部分进行手动的修改。综上所述,上述将获取到的待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像的步骤之后,还可以具体包括:

若所述字体转换模型输出的目标字体汉字图像中出现任一不符合预设的目标字体风格,则获取微调后目标字体汉字;利用所述微调后目标字体汉字对所述字体转换网络进行finetuning操作,得到新的字体转换网络;其中,所述微调后目标字体汉字为字体设计师对不符合预设的目标字体风格的汉字进行微调得到的新的目标字体汉字。

具体的,可以设置上述微调后目标字体汉字的增加条件,例如,若当前微调后目标字体汉字的个数为500,则利用所述微调后目标字体汉字对所述字体转换网络进行finetuning操作,得到新的字体转换网络。

这样,可以在经过多轮迭代训练后,使上述字体转换网络生成的目标字体汉字越来越接近字体设计师的风格,进而显著提高字体设计师设计字体的效率。

本申请实施例以相对合理的情况对本申请实施例公开的方法进行了阐述,其中,所涉及的技术内容所带来的有益效果可参见前述实施例,在此不再赘述。

相应的,本申请实施例还公开了一种字体设计系统,参见图6所示,该系统具体包括:

待设计汉字图像获取模块61,用于获取源字体中的待设计汉字图像。

待设计汉字图像输入模块62,用于将所述待设计汉字图像输入至预先经过训练的字体转换模型,得到所述字体转换模型输出的目标字体汉字图像。

其中,所述字体转换模型为预先利用训练样本对基于深度学习理论构建的非对称transfer网络进行训练后得到的模型,其中,所述训练样本包括字体设计师预先设计好的目标字体汉字图像及对应的源字体汉字图像。

需要说明的是,关于本实施例中各个模块之间的具体工作过程及带来的有益效果请参照本申请前述实施例公开的字体设计方法,在此不再赘述。

进一步的,本申请实施例还公开了一种字体设计设备,参见图7所示,该设备包括存储器和处理器,其中,所述处理器用于执行所述存储器中存储的计算机程序以实现如前述实施例公开的字体设计方法的步骤。

需要说明的是,本申请实施例的技术部分和相应有益效果的具体内容可参见本文上述实施例,在此不再赘述。

进一步的,本申请实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述实施例公开的字体设计方法的步骤。

需要说明的是,本申请实施例的技术部分和相应有益效果的具体内容可参见本文上述实施例,在此不再赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种字体设计方法、系统、设备及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1