转换图像中汉字字体的方法及系统、计算机设备及介质与流程

文档序号：18450801发布日期：2019-08-17 01:15阅读：209来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及图像处理技术领域。更具体地，涉及一种转换图像中汉字字体的方法及系统、计算机设备及介质。

背景技术：

文字是文化知识传播与积累的基石。随着社会的进步，越来越多个性化、自我化、定制化的字体需要被设计出来，尤其是在平面设计、广告等行业中。然而对于汉字而言，由于文字数量的繁多，设计一套完整的新字体需要大量的人力及时间成本。

因此，需要提供一种转换图像中汉字字体的方法及系统、计算机设备及介质。

技术实现要素：

本发明的目的在于提供一种转换图像中汉字字体的方法及系统、计算机设备及介质，以解决现有技术存在的问题中的至少一个。

为达到上述目的，本发明采用下述技术方案：

本发明第一方面提供了一种转换图像中汉字字体的方法，包括：

获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息；

根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，以替代所述待转换汉字。

本发明第一方面提供的方法，可通过对待转换图像中待转换汉字的字体结构分析获取其笔画及笔画的空间分布信息，再根据预先设计得到的指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，自动实现对待转换图像中汉字的字体转换，可将待转换图像中的汉字转换为个性化的新字体的汉字，字体转换的及时性高且有效性高，可大幅节约获得个性化的新字体的汉字的人力及时间成本。

可选地，该方法还包括：

利用深度学习网络生成包含指定字体的标准笔画信息的图像，以获取指定字体的标准笔画信息。

采用此可选方式，可通过深度学习网络快速简便地获取指定字体的标准笔画信息。

可选地，所述获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息进一步包括：

按标准字体的标准笔画的复杂程度由高至低，依次计算待转换图像中各区域与标准字体的标准笔画的相关度，根据所述相关度匹配识别待转换图像中待转换汉字的笔画及所述笔画的空间分布信息，其中，在识别当前笔画时将上一次识别的笔画对应的区域的像素值置零。

采用此可选方式，可通过基于相关度的与标准字体的标准笔画的匹配，快速精确地获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息。

可选地，所述依次计算待转换图像中各区域与标准字体的标准笔画的相关度进一步包括：依次根据按照不同的旋转角度、不同尺寸的图像块计算待转换图像中各区域与标准字体的标准笔画的相关度。

可选地，所述根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字进一步包括：

根据所述待转换汉字的笔画及所述笔画的数量和匹配识别顺序，从指定字体的标准笔画信息中选择对应的笔画，并根据所述笔画的空间分布信息在待转换图像中生成对应待转换汉字的指定字体汉字。

可选地，所述笔画的空间分布信息包括笔画的起始点坐标信息、尺寸信息及方向信息。

可选地，在获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息之后，该方法还包括：

将所述待转换汉字以二维向量表示，其中，所述待转换汉字的笔画及笔画的空间分布信息作为所述待转换汉字的第一维向量，所述待转换汉字的笔画的数量和匹配识别顺序作为所述待转换汉字的第二维向量。

可选地，在所述获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息之前，该方法还包括：

将待转换图像中的待转换汉字转换为标准字体的待转换汉字。

可通过此可选方式处理待转换图像中的待转换汉字为特殊字体的情况，以避免由于原始待转换图像中待转换汉字为特殊字体而带来获取笔画及所述笔画的空间分布信息时精度可能会有所下降的情况，进而提升本发明第一方面提供的方法的普适性。

可选地，所述利用深度学习网络生成包含指定字体的标准笔画信息的图像进一步包括：

利用多个包含指定字体的不同汉字的图像作为训练样本，得到所述深度学习网络；

将包含标准字体的汉字的图像输入所述深度学习网络，得到包含指定字体的标准笔画信息的图像。

采用此可选方式，通过训练少量的训练样本即可得到深度学习网络，实现了快速简便地获取指定字体的标准笔画信息。

可选地，所述深度学习网络为对抗生成网络。对抗生成网络适用于图像的风格迁移，在图像领域，已经能够创造出足够以假乱真的图像。

本发明第二方面提供了一种执行本发明第一方面提供的方法的转换图像中汉字字体的系统，包括：

文字结构获取模块，用于获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息；

字体转换模块，用于根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，以替代所述待转换汉字。

本发明第三方面提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现本发明第一方面提供的方法。

本发明第四方面提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明第一方面提供的方法。

本发明的有益效果如下：

本发明所述技术方案可实现个性化的字体定制，字体转换的及时性高且有效性高，可大幅节约获得个性化的新字体的汉字的人力及时间成本。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的说明；

图1示出本发明实施例提供的转换图像中汉字字体的方法的流程图。

图2中，2-a示出包含待转换汉字的图像示例，2-b示出字体转换后的图像示例。

图3示出获取待转换图像中待转换汉字的笔画及笔画的空间分布信息的流程图。

图4示出本发明实施例提供的转换图像中汉字字体的系统的示意图。

图5示出本发明实施例提供的计算机系统的结构示意图。

具体实施方式

为了更清楚地说明本发明，下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解，下面所具体描述的内容是说明性的而非限制性的，不应以此限制本发明的保护范围。

如图1所示，本发明的一个实施例提供了一种转换图像中汉字字体的方法，包括：

s1、获取待转换图像中待转换汉字的笔画及笔画的空间分布信息，即，获取待转换汉字由哪些笔画构成及这些笔画在待转换图像中的位置分布及尺寸等信息；

s2、根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，以替代待转换汉字。

本实施例提供的方法，可通过对待转换图像中待转换汉字的字体结构分析获取其笔画及笔画的空间分布信息，再根据预先设计得到的指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，自动实现待转换图像中汉字的字体转换，可将待转换图像中的汉字转换为个性化的新字体的汉字，字体转换的及时性高且有效性高，可大幅节约获得个性化的新字体的汉字的人力及时间成本。

在一个具体示例中，如图2所示，2-a示出包含待转换汉字的待转换图像，待转换汉字的字体为标准字体中的正楷字体，2-b示出进行字体转换后的图像。进行字体转换后，各汉字在图像中的空间分布保持不变，具体而言，每个汉字各笔画的起始点坐标、尺寸和方向等基本保持不变，但可能会随着字体的不同略有差异。

在本实施例的一些可选的实现方式中，该方法还包括：

利用深度学习网络生成包含指定字体的标准笔画信息的图像，以获取指定字体的标准笔画信息。

采用此实现方式，可通过深度学习网络快速简便地获取指定字体的标准笔画信息。

在本实施例的一些可选的实现方式中，利用深度学习网络生成包含指定字体的标准笔画信息的图像进一步包括：

利用多个包含指定字体的不同汉字的图像作为训练样本，得到深度学习网络；

将包含标准字体的汉字的图像输入深度学习网络，得到包含指定字体的标准笔画信息的图像。

采用此实现方式，通过训练少量的训练样本即可得到用于字体学习的深度学习网络，实现了快速简便地获取指定字体的标准笔画信息。

在本实施例的一些可选的实现方式中，深度学习网络为对抗生成网络。对抗生成网络适用于图像的风格迁移，在图像领域，已经能够创造出足够以假乱真的图像。

在一个具体示例中，本实施例以标准正楷字体作为文字结构分析的基准，基于少量的几个包含指定字体的不同汉字的图像中的汉字作为目标字体风格的基准，利用深度学习中风格迁移的方法学习指定字体的特性，然后利用训练好的深度学习网络(或者说风格迁移网络)，以包含正楷字体的汉字的图像作为深度学习网络的输入，或者说，是以包含正楷字体的汉字的图像包含的正楷字体的标准笔画作为深度学习网络的输入，生成包含指定字体的标准笔画信息的图像，以获取指定字体的标准笔画信息，以将其用于在后续步骤中重新构建出对应待转换汉字的指定字体的汉字。

具体而言，由于汉字是“形、音、义”的结合体，汉字的一个重要特点是其具有字形特征，所有汉字都是由点、横、竖、撇、捺等基础笔画构成的。因此，通常知道构成汉字的基础笔画的分割以及文字的结构构成，就可以生成指定的汉字。然而仅仅是这些笔画很难让用户能够直观的选择该类字体是否自己希望选择的字体。因此，本实施例选择了以字体的文字风格作为字体选择的基准。通过少量的指定风格的文字样例(即少量的几个包含指定字体的不同汉字的图像)作为训练样本，通过深度学习的方法训练出能够表示该深度学习网络，类似于在深度学习网络在艺术图像合成领域的应用。训练后得到的深度学习网络将具备将标准字体的汉字所包含的标准字体的标准笔画转换为期望风格的指定字体的标准笔画的特性。随后将包含标准字体(正楷字体)的汉字的图像输入深度学习网络，即可生成包含指定字体的标准笔画信息的图像。

在本实施例的一些可选的实现方式中，获取待转换图像中待转换汉字的笔画及笔画的空间分布信息进一步包括：

按标准字体的标准笔画的复杂程度由高至低，依次计算待转换图像中各区域与标准字体的标准笔画的相关度，根据相关度匹配识别待转换图像中待转换汉字的笔画及笔画的空间分布信息，其中，在识别当前笔画时将上一次识别的笔画对应的区域的像素值置零。

采用此实现方式，可通过基于相关度的与标准字体的标准笔画的匹配，快速精确地获取待转换图像中待转换汉字的笔画及笔画的空间分布信息。

在本实施例的一些可选的实现方式中，依次计算待转换图像中各区域与标准字体的标准笔画的相关度进一步包括：依次根据按照不同的旋转角度、不同尺寸的图像块计算待转换图像中各区域与标准字体的标准笔画的相关度。

在一个具体示例中，文字的结构关系固然可以通过人工方式手动建立，然而由于汉字的数量极其庞大，手动建立的方式需要耗费大量的人力及时间成本。因而本实施例采用基于图像匹配的方式分析文字构成的空间关系。可理解的是，相同笔画可能形状也不一定完全一致，例如笔画“横”，就可能有长横、短横等不同的尺度。因而本实施例在文字笔画结构分析时采用不同尺度进行。另外，由于有些较复杂的基础笔画可能是由一些简单的基础笔画构成，例如“横折”由“横”和“竖”两个基础笔画构成。因而本实施例在分析文字结构信息时首先从较复杂的基础笔画结构开始进行图像匹配识别，只有复杂基础笔画图像匹配不成功时才逐次匹配较简单的基础笔画。如图3所示，整个匹配识别过程采用对整个待转换图像的文字区域的不同子区域，按照不同的旋转角度(优选设置为<30°)和尺度计算图像块和基础笔画的相关度，当相关度大于预设阈值时就认为获得了匹配的笔画，这时，记录该笔画的坐标、尺度、方向等空间分布信息。随后将该笔画对应区域的像素值置零(类似于擦除该笔画)，利用以上步骤不断循环迭代直到整个待转换图像的文字区域的像素值接近等于零，则说明整个待转换汉字已经由所有的基础笔画表示，获取了待转换汉字的所有笔画及所有笔画的空间分布信息。

在本实施例的一些可选的实现方式中，根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字进一步包括：

根据待转换汉字的笔画(或者说笔画名称)及笔画的数量和匹配识别顺序，从指定字体的标准笔画信息中选择对应的笔画，并根据笔画的空间分布信息在待转换图像中生成对应待转换汉字的指定字体汉字。

在本实施例的一些可选的实现方式中，笔画的空间分布信息包括笔画的起始点坐标信息、尺寸信息及方向信息。

在本实施例的一些可选的实现方式中，在获取待转换图像中待转换汉字的笔画及笔画的空间分布信息之后，该方法还包括：

将待转换汉字以二维向量表示，其中，待转换汉字的笔画及笔画的空间分布信息作为待转换汉字的第一维向量，待转换汉字的笔画的数量和匹配识别顺序作为待转换汉字的第二维向量。

在一个具体示例中，通过前面的步骤，已经提取到了待转换汉字的笔画表示，同时也获得了指定字体的标准笔画信息。此步骤中，待转换汉字的笔画及笔画的空间分布信息后将待转换汉字以二维向量表示，第一维向量第一个维度是笔画属性，包括笔画(或者说笔画名称)及笔画的空间分布信息；第二维向量包括笔画的数量和匹配识别顺序，其中，不同文字的笔画数量可能存在不同，所以该二维向量的第二维向量的长度并不固定。之后可按照上述第二维向量中匹配识别顺序，根据第一维向量包含的笔画名称从指定字体的标准笔画信息中选择对应的笔画，再根据第一维向量包含的笔画的空间分布信息在待转换图像中生成对应的笔画，最终得到了以指定字体的汉字代替原字体的待转换汉字的图像。

在本实施例的一些可选的实现方式中，在获取待转换图像中待转换汉字的笔画及笔画的空间分布信息之前，该方法还包括：

将待转换图像中的待转换汉字转换为标准字体的待转换汉字。

可通过此实现方式处理待转换图像中的待转换汉字为特殊字体的情况，以避免由于原始待转换图像中待转换汉字为特殊字体而带来获取笔画及所述笔画的空间分布信息时精度可能会有所下降的情况，进而提升本实施例提供的方法的普适性。

在一个具体示例中，将待转换图像中的待转换汉字转换为标准字体的待转换汉字可基于现有的图像识别技术结合自然语言处理技术实现。

如图4所示，本发明的另一个实施例提供了一种执行上述方法的转换图像中汉字字体的系统，包括：

文字结构获取模块，用于获取待转换图像中待转换汉字的笔画及笔画的空间分布信息；

字体转换模块，用于根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，以替代待转换汉字。

需要说明的是，本实施例提供的转换图像中汉字字体的系统的原理及工作流程与上述转换图像中汉字字体的方法相似，相关之处可以参照上述说明，在此不再赘述。

如图5所示，适于用来实现本实施例提供的转换图像中汉字字体的系统的计算机系统，包括中央处理模块(cpu)，其可以根据存储在只读存储器(rom)中的程序或者从存储部分加载到随机访问存储器(ram)中的程序而执行各种适当的动作和处理。在ram中，还存储有计算机系统操作所需的各种程序和数据。cpu、rom以及ram通过总线被此相连。输入/输入(i/o)接口也连接至总线。

以下部件连接至i/o接口:包括键盘、鼠标等的输入部分；包括诸如液晶显示器(lcd)等以及扬声器等的输出部分；包括硬盘等的存储部分；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至i/o接口。可拆卸介质，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器上，以便于从其上读出的计算机程序根据需要被安装入存储部分。

特别地，根据本实施例，上文流程图描述的过程可以被实现为计算机软件程序。例如，本实施例包括一种计算机程序产品，其包括有形地包含在计算机可读介质上的计算机程序，上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。

附图中的流程图和示意图，图示了本实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或示意图中的每个方框可以代表一个模块、程序段或代码的一部分，上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，示意图和/或流程图中的每个方框、以及示意和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器，包括文字结构获取模块和字体转换模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定。例如，字体转换模块还可以被描述为“指定字体合成模块”。

作为另一方面，本实施例还提供了一种非易失性计算机存储介质，该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质，也可以是单独存在，未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序，当上述一个或者多个程序被一个设备执行时，使得上述设备：获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息；根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息，在待转换图像中生成对应待转换汉字的指定字体汉字，以替代所述待转换汉字。

需要说明的是，在本发明的描述中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定，对于本领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张丽杰;陈冠男;刘瀚文;朱丹
技术所有人：京东方科技集团股份有限公司
我是此专利的发明人

上一篇：一种可折叠式气动水果采摘器的制作方法
上一篇：一种无人机起降平台的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。