一种实现图像转换标签的方法及系统与流程

文档序号：11276482阅读：213来源：国知局

本发明涉及图像处理技术领域，尤其涉及一种实现图像转换标签的方法及系统。

背景技术：

随着社会的不断发展，计算机视觉领域也进入了高速发展的时代。但是目前的科学研究的发展还未能让计算机像人类一样具备自主思维，因此如何让计算机能够自动的识别一个图片的内容成为了迫在眉睫急需解决的问题。

机器学习和深度学习的出现使得人们得以尝试通过让计算机自主提取特征的方式让计算机对人类世界的图像进行分析。现在通过卷积神经网络模型，已经可以进行有监督的较为精确率的图像识别功能。但是这还远远不足，人们需要让计算机自动的给图像标上标签，从而实现无监督的自主识别，进一步达成真正意义上的计算机对图片分类。但是在信息快速传播的今日，大数据填充着人们的生活，在这些数据中，不可能存在有大量贴好标签的数据，因此一种无监督的图像数据识别自动贴标签的技术越来越受到人们的生活需求。

目前所用的图像识别技术为有监督的图像识别技术，即需要给出图像的标签，利用已知的标签信息对数据库中的图像进行模型的搭建并训练。通过使用训练好的模型架构来进行新的图像的分类。但是在信息快速传播的今日，大数据包围的我们很难有一个准确的已经人工贴好标签的数据集进行模型的训练，因此这种技术水平无法达到人们的需求。

技术实现要素：

本发明的目的在于克服现有技术的不足，本发明提供了一种实现图像转换标签的方法及系统，可以通过计算机自主生产对应的图像标签信息，提高了图像识别的效率和速度。

为了解决上述技术问题，本发明实施例提供了一种实现图像转换标签的方法所述实现图像转换标签的方法包括：

采用卷积神经网络模型对图像信息进行卷积神经网络降采样处理，提取图像基本信息；

采用全连接深度神经网络对所述图像信息的基本信息进行降维处理，获取降维后的图像基本信息；

对所述降维后的图像基本信息通过嵌入层进行简化处理，获取简化图像基本信息；

采用长短期记忆模型对所述简化图像基本信息进行计算，获取计算输出值；

判断所述计算输出值是否为终止符号，若是则输出转换标签，若否，则重复上一步骤。

优选地，所述卷积神经网络模型采用21层神经网络层次架构，所述21层神经网络层次架构分别为16个卷积层和5个降采样层。

优选地，所述采用卷积神经网络模型对图像信息进行卷积神经网络降采样处理，包括：

所述卷积神经网络模型接收所述图像信息，并确定所述卷积神经网络模型最大降采样层；

采用所述卷积神经网络模型最大降采样对所述图像信息进行采样处理，获取图像基本信息；所述图像基本信息至少包括图像长宽、图像像素、图像内容。

优选地，所述采用全连接深度神经网络对所述图像信息的基本信息进行降维处理，包括：

采用全连接深度神经网络中的隐藏层激活函数对所述图像信息进行处理，获取处理结果；

对所述处理结果采用全连接深度神经网络中的输出层激活函数进行处理，获取降维后的图像基本信息；所述获取降维后的图像基本信息为一维数据信息；

所述隐藏层激活函数为relu函数，所述输出层激活函数为softmax函数。

优选地，所述对所述降维后的图像基本信息通过嵌入层进行简化处理，包括：

采用嵌入层中的查找表对所述降维后的图像基本信进行简化处理。

优选地，所述采用长短期记忆模型对所述简化图像基本信息进行计算，包括：

根据当前获取的所述简化图像基本信息与当前留存在单元格内的简化图像基本信息进行计算，获取留存简化图像基本信息；

根据留存简化图像基本信息在所述单元内进行存储信息更新；

根据所述单元格内存储的基本信息进行输出计算，获取计算输出值。

另外，本发明实施例还提供了一种实现图像转换标签的系统，所述实现图像转换标签的系统包括：

基本信息提取模块：用于采用卷积神经网络模型对图像信息进行卷积神经网络降采样处理，提取图像基本信息；

降维处理模块：用于采用全连接深度神经网络对所述图像信息的基本信息进行降维处理，获取降维后的图像基本信息；

简化处理模块：用于对所述降维后的图像基本信息通过嵌入层进行简化处理，获取简化图像基本信息；

输出值计算模块：用于采用长短期记忆模型对所述简化图像基本信息进行计算，获取计算输出值；

判断模块：用于判断所述计算输出值是否为终止符号，若是则输出转换标签，若否，则重复上一步骤。

优选地，所述基本信息提取模块包括：

最大采样层确定单元：用于所述卷积神经网络模型接收所述图像信息，并确定所述卷积神经网络模型最大降采样层；

基本信息提取单元：用于采用所述卷积神经网络模型最大降采样对所述图像信息进行采样处理，获取图像基本信息；所述图像基本信息至少包括图像长宽、图像像素、图像内容。

优选地，所述降维处理模块包括：

隐藏层处理单元：用于采用全连接深度神经网络中的隐藏层激活函数对所述图像信息进行处理，获取处理结果；

降维单元：用于对所述处理结果采用全连接深度神经网络中的输出层激活函数进行处理，获取降维后的图像基本信息；

所述获取降维后的图像基本信息为一维数据信息；所述隐藏层激活函数为relu函数，所述输出层激活函数为softmax函数。

优选地，所述输出值计算模块包括：

留存计算单元：用于根据当前获取的所述简化图像基本信息与当前留存在单元格内的简化图像基本信息进行计算，获取留存简化图像基本信息；

信息更新单元：用于根据留存简化图像基本信息在所述单元内进行存储信息更新；

输出计算单元：用于根据所述单元格内存储的基本信息进行输出计算，获取计算输出值。

在本发明实施例中，解决了以往人们在图像数据处理过程中的人工手动贴标签的功能，通过使用本发明的模型，计算机可以自主生成对应的图像标签；在时间复杂度和模型复杂度的上，极大地优化了现有的模型，实现了计算机视觉处理的进一步深入的复杂功能；通过计算机运行基于卷积神经网络和长短期记忆模型来对输入任意的图像贴标签，从而减少了人们手动进行对图像贴标签然后再通过机器学习进行图像分类的功能，从真正意义上实现人工智能自主进行图像识别分类的无监督学习方法；提高了图像识别的效率和速度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例中的实现图像转换标签的方法的流程示意图；

图2是本发明实施例中的实现图像转换标签的系统的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1是本发明实施例中的实现图像转换标签的方法的流程示意图，如图1所示，

s11：采用卷积神经网络模型对图像信息进行卷积神经网络降采样处理，提取图像基本信息；

s12：采用全连接深度神经网络对所述图像信息的基本信息进行降维处理，获取降维后的图像基本信息；

s13：对所述降维后的图像基本信息通过嵌入层进行简化处理，获取简化图像基本信息；

s14：采用长短期记忆模型对所述简化图像基本信息进行计算，获取计算输出值；

s15：判断所述计算输出值是否为终止符号，若是则输出转换标签，若否，则重复上一步骤。

对s11作进一步说明：

采用卷积神经网络模型对图像信息进行卷积神经网络降采样处理，提取图像基本信息，所述卷积神经网络模型采用21层神经网络层次架构，所述21层神经网络层次架构分别为16个卷积层和5个降采样层；所述卷积神经网络模型接收所述图像信息，并确定所述卷积神经网络模型最大降采样层；采用所述卷积神经网络模型最大降采样对所述图像信息进行采样处理，获取图像基本信息；所述图像基本信息至少包括图像长宽、图像像素、图像内容。

具体的，首先是获取到图像信息，具体获取图像信息方式有采集端自行采集或者由用户自行输入等方式，将获取到的图像信息输入到卷积神经网络模型内进行处理，卷积神经网络模型是通过常规图像训练得到的训练好的卷积神经网络模型，该卷积神经网络模型采用21层神经网络层次架构，分别为16个卷积层和5个降采样层；在本发明实施例中，采用最大降采样层进行降采样处理，首先是确定5个降采样层的最大降采样层，采用模型最大降采样层进行信息采样采集，从而获取图像基本信息，该图像基本信息至少包括图像长宽、图像像素、图像内容。

对s12作进一步说明：

采用全连接深度神经网络对所述图像信息的基本信息进行降维处理，获取降维后的图像基本信息；包括：采用全连接深度神经网络中的隐藏层激活函数对所述图像信息进行处理，获取处理结果；对所述处理结果采用全连接深度神经网络中的输出层激活函数进行处理，获取降维后的图像基本信息；所述获取降维后的图像基本信息为一维数据信息；所述隐藏层激活函数为relu函数，所述输出层激活函数为softmax函数。

对基本信息进行降维，是将多维的基本信息降至一维，从而可以进一步进行下一步计算，具体的，采用全连接深度神经网络中的隐藏层激活函数对图像基本信息进行处理从而减少神经网络的整体预算量，让后获取处理结果，对获取的处理结果采用全连接深度神经网络中的输出层激活函数进行处理来选择最大可能性的值，这样处理之后，即可获取降维后的图像基本信息；所述获取降维后的图像基本信息为一维数据信息；所述隐藏层激活函数为relu函数，所述输出层激活函数为softmax函数。

其中relu函数如下：

f(x)＝max(0,x)，

其中，softmax函数如下：

对s13作进一步说明：

对所述降维后的图像基本信息通过嵌入层进行简化处理，获取简化图像基本信息；既是采用嵌入层中的查找表对所述降维后的图像基本信进行简化处理。

具体的，使用嵌入层的作用主要是通过查找表的方式，使得上述获得的图像基本信息得以简化，从而降低算法的复杂度和时间消耗。

对s14作进一步说明：

采用长短期记忆模型对所述简化图像基本信息进行计算，获取计算输出值；进一步的包括：根据当前获取的所述简化图像基本信息与当前留存在单元格内的简化图像基本信息进行计算，获取留存简化图像基本信息；根据留存简化图像基本信息在所述单元内进行存储信息更新；根据所述单元格内存储的基本信息进行输出计算，获取计算输出值。

具体的，采用长短期记忆模型中的忘记门层进行检测，检测ht-1和xt(这里，ht-1表示当前获取的所述简化图像基本信息，xt当前留存在单元格内的简化图像基本信息)并进行计算，计算获取的值为0到1之间，1表示“完全保持”，而0表示“完全摆脱”。

由上述可以得到如下公式：

ft＝σ(wf·[ht-1,xt]+bf)

这里的

具体的，首先，采用被称为输入门层的sigmoid形层决定了对信息的更新，tanh层创建可以被添加到状态的新候选值的向量，在下一步中，将结合这两个来创建对状态的更新。

更新旧状态的方程如下所示，将更新后的ct-1存入下一个ct中，并继续执行后续步骤的运算：

it＝σ(wi·[ht-1,xt]+bi)

将旧状态乘以ft，忘记了我们之前决定忘记的数据。然后添加它乘这是新的候选值，按照决定更新每个状态值的程度来衡量。

运行一个sigmoid层，它决定了要输出的单元格状态的部分，将单元格状态通过tanh(将值推到-1和1之间)，并将其乘以sigmoid的输出，以便仅输出决定的部分。

其中，计算公式如下：

ot＝σ(wo·[ht-1,xt]+bo)

ht＝ot*tanh(ct)

对s15作进一步说明：

判断所述计算输出值是否为终止符号，若是则输出转换标签，若否，则重复上一步骤。

具体的，通过使用上述的模型，生成语料库中存在的单词，并将生成的单词投入回模型中继续运算一直到模型生成的单词为end为止，表示当前标签已经生成完毕，即完成了整个标签的生成过程，若不是终止符号，则继续返回上一部进行运算，若为终止符号，则转换为标签并输出。

图2是本发明实施例中的实现图像转换标签的系统的结构组成示意图，如图2所示，所述实现图像转换标签的系统包括：