本技术涉及计算机,尤其涉及一种文字图片的处理方法、装置以及存储介质。
背景技术:
1、随着互联网技术的迅速发展,人们对媒体内容的多样化要求越来越高。设计图即为一种即包含文字内容又包含图像内容的媒体内容,如何进行高效的大规模的文字图片的生成过程成为难题。
2、一般,可以通过人工来对设计图中的文案进行修改,从而批量化的生成文字图片。
3、但是,在海量图文数据需要扩展的场景中,通过人工修改进行文字图片扩展的过程无法符合场景需求,影响文字图片的扩展效率。
技术实现思路
1、有鉴于此,本技术提供一种文字图片的处理方法,可以有效提高文字图片的扩展效率。
2、本技术第一方面提供一种文字图片的处理方法,可以应用于终端设备中包含文字图片的处理功能的系统或程序中,具体包括:
3、获取第一文字图片,所述第一文字图片包括图像图层和文字图层;
4、对所述文字图层中的内容进行提取,以得到第一文字信息;
5、基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,所述文案数据库中的数据基于所述预设维度标注所得;
6、基于所述第二文字信息对所述文字图层中的内容进行替换;
7、对替换后的文字图层和所述图像图层进行结合,以得到第二文字图片。
8、可选的,在本技术一些可能的实现方式中,所述对所述文字图层中的内容进行提取,以得到第一文字信息,包括:
9、确定所述第一文字图片对应的源文件;
10、对所述源文件中的图层分布进行解析,以确定所述文字图层;
11、对所述文字图层中的文字元素进行提取,以得到所述第一文字信息。
12、可选的,在本技术一些可能的实现方式中,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,包括:
13、基于所述预设维度确定所述第一文字信息中的文本内容以及所述第一文字信息对应的主题内容;
14、确定所述文本内容中的字数信息和标点信息;
15、基于所述主题内容中的文本内容进行文本识别,以得到所述主题内容对应的标签信息,以及所述主题内容对应的情感信息;
16、根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息。
17、可选的,在本技术一些可能的实现方式中,所述根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息,包括:
18、获取针对于第一文字图片的展示侧重所配置的扩展需求信息;
19、根据所述扩展需求信息对所述字数信息、所述标点信息、所述标签信息和所述情感信息进行权重配置,以得到权重信息;
20、根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到第一匹配信息;
21、基于所述权重信息对所述第一匹配信息进行加权计算,以得到第二匹配信息;
22、根据所述第二匹配信息对应的匹配度数值确定与所述第一文字信息相似的第二文字信息。
23、可选的,在本技术一些可能的实现方式中,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息之前,所述方法还包括:
24、基于所述预设维度对候选文字信息进行标注,以得到标注了样本标签的训练样本;
25、根据所述标注了样本标签的训练样本对所述文案数据库中配置的深度神经网络进行训练;
26、响应于未标注数据输入所述文案数据库,调用训练后的所述深度神经网络基于所述预设维度对所述未标注数据进行标注。
27、可选的,在本技术一些可能的实现方式中,所述方法还包括:
28、确定所述训练样本对应的训练标签;
29、基于所述训练标签在资源池进行资源爬取,以得到扩展数据;
30、调用训练后的所述深度神经网络对所述扩展数据基于所述预设维度进行标注,以得到扩展文字信息;
31、将所述扩展文字信息写入所述文案数据库。
32、可选的,在本技术一些可能的实现方式中,所述基于所述第二文字信息对所述文字图层中的内容进行替换,包括:
33、获取所述第二文字信息对应的历史信息;
34、基于所述历史信息中的信息使用记录对所述第二文字信息的使用次数进行统计,以确定所述第二文字信息对应的使用频次信息;
35、若所述频次信息满足替换条件,则基于所述第二文字信息对所述文字图层中的内容进行替换。
36、本技术第二方面提供一种文字图片的处理装置,包括:
37、获取单元,用于获取第一文字图片,所述第一文字图片包括图像图层和文字图层;
38、提取单元,用于对所述文字图层中的内容进行提取,以得到第一文字信息;
39、处理单元,用于基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,所述文案数据库中的数据基于所述预设维度标注所得;
40、所述处理单元,还用于基于所述第二文字信息对所述文字图层中的内容进行替换;
41、所述处理单元,还用于对替换后的文字图层和所述图像图层进行结合,以得到第二文字图片。
42、可选的,在本技术一些可能的实现方式中,所述提取单元,具体用于确定所述第一文字图片对应的源文件;
43、所述提取单元,具体用于对所述源文件中的图层分布进行解析,以确定所述文字图层;
44、所述提取单元,具体用于对所述文字图层中的文字元素进行提取,以得到所述第一文字信息。
45、可选的,在本技术一些可能的实现方式中,所述处理单元,具体用于基于所述预设维度确定所述第一文字信息中的文本内容以及所述第一文字信息对应的主题内容;
46、所述处理单元,具体用于确定所述文本内容中的字数信息和标点信息;
47、所述处理单元,具体用于基于所述主题内容中的文本内容进行文本识别,以得到所述主题内容对应的标签信息,以及所述主题内容对应的情感信息;
48、所述处理单元,具体用于根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息。
49、可选的,在本技术一些可能的实现方式中,所述处理单元,具体用于获取针对于第一文字图片的展示侧重所配置的扩展需求信息;
50、所述处理单元,具体用于根据所述扩展需求信息对所述字数信息、所述标点信息、所述标签信息和所述情感信息进行权重配置,以得到权重信息;
51、所述处理单元,具体用于根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到第一匹配信息;
52、所述处理单元,具体用于基于所述权重信息对所述第一匹配信息进行加权计算,以得到第二匹配信息;
53、所述处理单元,具体用于根据所述第二匹配信息对应的匹配度数值确定与所述第一文字信息相似的第二文字信息。
54、可选的,在本技术一些可能的实现方式中,所述处理单元,具体用于基于所述预设维度对候选文字信息进行标注,以得到标注了样本标签的训练样本;
55、所述处理单元,具体用于根据所述标注了样本标签的训练样本对所述文案数据库中配置的深度神经网络进行训练;
56、所述处理单元,具体用于响应于未标注数据输入所述文案数据库,调用训练后的所述深度神经网络基于所述预设维度对所述未标注数据进行标注。
57、可选的,在本技术一些可能的实现方式中,所述处理单元,具体用于确定所述训练样本对应的训练标签;
58、所述处理单元,具体用于基于所述训练标签在资源池进行资源爬取,以得到扩展数据;
59、所述处理单元,具体用于调用训练后的所述深度神经网络对所述扩展数据基于所述预设维度进行标注,以得到扩展文字信息;
60、所述处理单元,具体用于将所述扩展文字信息写入所述文案数据库。
61、可选的,在本技术一些可能的实现方式中,所述处理单元,具体用于获取所述第二文字信息对应的历史信息;
62、所述处理单元,具体用于基于所述历史信息中的信息使用记录对所述第二文字信息的使用次数进行统计,以确定所述第二文字信息对应的使用频次信息;
63、所述处理单元,具体用于若所述频次信息满足替换条件,则基于所述第二文字信息对所述文字图层中的内容进行替换。
64、本技术第三方面提供一种计算机设备,包括:存储器、处理器以及总线系统;所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的文字图片的处理方法。
65、本技术第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一项所述的文字图片的处理方法。
66、根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的文字图片的处理方法。
67、从以上技术方案可以看出,本技术实施例具有以下优点:
68、通过获取第一文字图片,该第一文字图片包括图像图层和文字图层;然后对文字图层中的内容进行提取,以得到第一文字信息;并基于预设维度对第一文字信息进行解析,以从文案数据库中提取与第一文字信息相似的第二文字信息,该文案数据库中的数据基于预设维度标注所得;进一步的基于第二文字信息对文字图层中的内容进行替换;进而对替换后的文字图层和图像图层进行结合,以得到第二文字图片。从而实现文字图片的自动扩展过程,由于采用多维度的文字信息匹配过程,且通过配置的文案数据库进行替换文字的管理,可以快速的提取用于替换的内容,提高了文字图片的扩展效率。