一种logo释义方法、设备及介质与流程

文档序号:17991350发布日期:2019-06-22 00:49阅读:357来源:国知局
一种logo释义方法、设备及介质与流程

本发明属于计算机人工智能领域,具体地涉及一种logo释义方法、设备及介质。



背景技术:

logo是一种可视性标识,通常由记号、几何图形、自然图形等以写实(图形的样式是通过如实描绘并作简化处理)、象征(采用高度概括的、有象征意义的、类似几何图形和色块组织)、夸张(运用想象,夸张某一特征或某一部位的办法)等手法得到。

随着人工智能技术的发展,涌现出了越来越多的在线智能设计产品。近年来,在线智能logo设计的产品不断繁荣,在一定程度上解决了客户在寻求人工设计过程中需要与设计人员频繁沟通、修改的问题。但是,由于目前通过人工智能技术生成的备选logo通常不包括logo图形蕴含的相关释义,客户面对备选logo图形,特别是数量巨大的备选logo图案,难以精准理解logo图形自身蕴含的寓意,也难以确认logo图形与客户品牌(产品或服务)之间的关联性。

目前,图像自动标注方法通常基于卷积神经网络,例如,一种典型的图像自动标注方法包括以下步骤:(1)利用深度卷积神经网络提取图片的多层特征,并据此提取目标对应的视觉单词(visualword);(2)根据得到的目标的视觉单词,通过自然语言模型生成对图像的语义描述(句子)。然而,这样的方法得到的语义描述不能给出图像可能具有的寓意。



技术实现要素:

因此,本发明的目的在于针对现有技术中存在的缺陷,提供一种logo释义方法。另外,本发明还提供了一种实现所述方法的计算机设备和计算机可读存储介质。

本发明的目的是通过以下技术方案实现的。

一方面,本发明提供了一种logo释义方法,所述方法包括以下步骤:

(1)通过网络机器人获得包含logo设计理念和logo图片的logo样本,形成logo图片样本库和logo语料库;

(2)基于所述logo语料库,通过rnn训练语言模型;

(3)基于所述logo语料库,通过tf-idf算法或textrank算法提取设计理念关键词,形成设计理念关键词库;

(4)基于所述设计理念关键词库,利用中文分词方法提取各logo样本中logo设计理念的设计理念关键词作为相应的logo图片的语义关键词标签;

(5)基于由所述步骤(4)中得到的具有语义关键词标签的logo图片形成的样本库,利用深度卷积神经网络多标记分类模型提取各logo样本中logo图片的多层特征,将提取的多层特征与该logo图片的语义关键词标签通过映射建立对应关系;

(6)通过所述步骤(5)中训练好的深度卷积神经网络多标记分类模型提取待释义logo图片的多层特征和确定所述待释义logo图片的多层特征与语义关键词标签(设计理念关键词)之间的映射关系,由此提取得到所述待释义logo图片的语义关键词标签;和

(7)将得到的待释义logo图片的语义关键词标签输入到所述步骤(2)中训练好的语言模型,得到待释义logo图片的释义。

本发明中,术语“logo释义”是指自然语言描述能够体现品牌(商品或服务)理念的、logo所蕴含的象征意义。

本发明中,术语“网络机器人”可以与“网络蜘蛛”、“spider程序”、“网络爬虫”或“webcrawler”互换使用。

根据本发明提供的方法,其中,所述网络机器人可以为通用网络爬虫(generalpurposewebcrawler)、聚焦网络爬虫(focusedwebcrawler)、增量式网络爬虫(incrementalwebcrawler)、深层网络爬虫(deepwebcrawler)或其结合。

本发明中,术语“rnn”是指循环神经网络。

根据本发明提供的方法,其中,本发明方法对所述tf-idf算法和所述textrank算法没有特殊要求。根据本发明提供的方法可以采用本领域中已知的tf-idf算法、textrank算法或其模型。

根据本发明提供的方法,所述步骤(3)和(4)可以同时进行,也可以分开进行。

在一些实施方案中,基于所述logo语料库,在进行中文分词并通过tf-idf算法或textrank算法提取设计理念关键词形成设计理念关键词库的同时,形成相应的logo图片的语义关键词标签。

根据本发明提供的方法,其中,所述步骤(4)中每个logo图片通常可以具有多个语义关键词标签。

根据本发明提供的方法,其中,所述深度卷积神经网络多标记分类模型为vggnet模型。vggnet模型在本领域是已知的,是计算机视觉组(visualgeometrygroup)和googledeepmind公司研发的深度卷积神经网络。

另一方面,本发明提供了一种计算机设备,所述设备包括处理器和存储器,其中,所述存储器用于存储计算机指令,所述处理器用于运行所述存储器存储的计算机指令,以实现所述方法。

又一方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述方法。

本发明至少具有以下优势:

(1)本发明方法通过对logo释义在线辅助用户对logo作品理念的理解,可以加快用户的选择,缩短用户的购买周期,提高在线logo生成和交易的周期。

(2)本发明方法首先通过网络机器人获得充分的logo样本,形成logo图片样本库和logo语料库,然后提取设计理念关键词,建立logo图片的语义关键词标签,并利用深度卷积神经网络多标记分类模型将logo图片的多层特征映射到该logo图片的语义关键词标签,由此训练好深度卷积神经网络多标记分类模型,最后通过训练好的深度卷积神经网络多标记分类模型来生成待释义logo图片的释义,具有高效、精准的特点。

(3)另外,只需要提供一个接口即可将本发明的logo释义方法与logo生成技术结合,简便、易行。

附图说明

图1是rnn训练语言模型的向量化示意图。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果,以下结合附图和实施方式予以说明。

1.由通用网络爬虫(generalpurposewebcrawler)获得包含logo设计理念和logo图片的logo样本,形成logo图片样本库和logo语料库。

2.基于所述logo语料库,通过rnn训练语言模型。

2a.向量化

首先,建立一个包含所有词的词典,每个词在词典中存在唯一编号,任意一个词都可以用一个n维的one-hot向量表示,其中n是词典中包含的词的个数。假设,一个词在词典中编号为i,v是表示这个词的向量,vj是向量的第j个元素,则:

如图1所示,其显示了总长度5000的词典的向量化。

基于这种向量化方法,得到了一个高维、稀疏的向量。

2b.模型输出

语言模型的输出是下一个最可能的词,基于得到的logo语料库,循环神经网络(rnn)计算词典中每个词是下个词的概率,这样概率最大的词就是下一个最可能的词,因此神经网络的输出是一个n维的向量,每个元素对应着词典中相应词是下一个词的概率。

对于输出层,采用softmax作为激励函数,softmax函数的定义如下:

其中,z为k维向量,j=1,…,k。

2c.语言模型的训练

基于监督学习的方法对语言模型进行训练,使用交叉熵误差函数作为优化目标,对模型进行优化,交叉熵函数如下:

其中,n为训练样本个数,向量yn是样本的标记,向量on是网络的输出,标记yn是一个one-hot向量。

3.基于logo语料库,通过tf-idf算法提取设计理念关键词,形成设计理念关键词库。

4.基于设计理念关键词库,利用中文分词方法提取各logo样本中logo设计理念的设计理念关键词作为相应的logo图片的语义关键词标签。

5.基于logo图片样本库,训练深度卷积神经网络多标记分类模型;其中,提取各logo样本中logo图片的多层特征,将提取的多层特征与该logo图片的(1c)中的语义关键词标签通过映射建立对应关系。特别地,

5a.采用步骤4中得到的具有语义关键词标签的logo图片形成的样本库作为多标签分类数据集。

5b.通过一个简化版的vggnet神经网络(smallervggnet),基于keras训练多标签深度学习分类器,该smallervggnet网络结构的特点:

51a.使用3*3conv层。

51b.采用max-pooling层减少尺寸。

51c.网络输出端为全连接层+softmax分类器。

6.通过步骤5中训练好的深度卷积神经网络多标记分类模型提取待释义logo图片的多层特征和确定所述待释义logo图片的多层特征与语义关键词标签之间的映射关系,由此提取得到所述待释义logo图片的语义关键词标签。

7.将得到的待释义logo图片的语义关键词标签输入到所述步骤2中训练好的语言模型,进而得到待释义logo图片的释义。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1