图片的标注方法、装置及电子设备与流程

文档序号：11251448阅读：1266来源：国知局

本发明涉及图片标注技术领域，具体而言，涉及一种图片的标注方法、装置及电子设备。

背景技术：

在多媒体大数据时代，随着越来越多的图片的出现，目前大多数基于内容的图片检索方法并不能得到良好的体验，而自动图片标注(automaticimageannotation)由于可很好的促进图片语义检索及其它相关图片管理任务已经成为多媒体领域最重要的研究方向之一。自动图片标注可通过结合标签和图片，把基于内容的图片检索转换为基于文本的图片检索。当图片特征和相关的语义标签得到以后，可应用多种机器学习算法来适应标签。

现如今，由于智能手机和无线通信网络的发展，图片的获取越来越方便，能够随时随地分享到互联网上去，这带来多媒体应用的迫切需求，包括语义索引、搜索、检索以及其他的图片管理任务。尽管多媒体内容分析方面做了很多工作，主要的搜索引擎产品还是基于文本索引技术。因而在图片大数据的背景下，图片标注算法的效率、稳定性依然不足。

技术实现要素：

有鉴于此，本发明实施例的目的在于提供一种图片的标注方法、装置及电子设备，以改善上述问题。为了实现上述目的，本发明采取的技术方案如下：

第一方面，本发明实施例提供了一种图片的标注方法，所述方法包括对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量；基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果。

第二方面，本发明实施例提供了一种图片的标注装置，所述装置包括特征提取单元和标注单元。特征提取单元，用于对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量。标注单元，用于基于所述特征提取单元获得的所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果。

第三方面，本发明实施例提供了一种电子设备，所述电子设备包括处理器和存储器。所述处理器和所述存储器通过总线电连接。所述存储器用于储存程序。所述处理器用于通过所述总线调用存储在所述存储器中的程序，执行：对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量；基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果。

本发明实施例提供了一种图片的标注方法、装置及电子设备，对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量；再基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果，以此实现采用多视图半监督图片标注模型对图片进行标注，具备良好的噪声认知能力，效率高、稳定性强。

本发明的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的一种电子设备的结构框图；

图2为本发明第一实施例提供的图片的标注方法的流程图；

图3为本发明第一实施例提供的图片的标注方法中获取预设的多视图半监督图片标注模型的流程图；

图4为本发明第一实施例提供的图片的标注方法中以nus-wide为训练数据，提取llc特征、fk特征与已有算法的效果对比示意图；

图5为本发明第一实施例提供的图片的标注方法中以nus-wide为训练数据，提取fc6、fc7特征与已有算法的效果对比示意图；

图6为本发明第一实施例提供的图片的标注方法中以mirflickr-25000为训练数据，提取llc特征、fk特征与已有算法的效果对比示意图；

图7为本发明第一实施例提供的图片的标注方法中以mirflickr-25000为训练数据，提取fc6、fc7特征与已有算法的效果对比示意图；

图8为本发明第一实施例提供的图片的标注方法中以iaprtc-12为训练数据，提取llc特征、fk特征与已有算法的效果对比示意图；

图9为本发明第一实施例提供的图片的标注方法中以iaprtc-12为训练数据，提取fc6、fc7特征与已有算法的效果对比示意图；

图10为本发明第二实施例提供的图片的标注装置的结构框图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参阅图1，图1示出了本发明实施例提供的一种电子设备100的结构框图。所述电子设备100可以作为用户终端，也可以作为服务器。用户终端可以为：pc(personalcomputer)电脑、平板电脑、手机、电子阅读器、笔记本电脑、智能电视、机顶盒、车载终端等终端设备。如图1所示，电子设备100可以包括存储器110、存储控制器111、处理器112、外设接口113、输入输出单元115、音频单元116、显示单元117。

所述存储器110、存储控制器111、处理器112、外设接口113、输入输出单元115、音频单元116、显示单元117各元件之间直接或间接地电连接，以实现数据的传输或交互。例如，这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。图片的标注方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器110中的软件功能模块，例如所述图片的标注装置包括的软件功能模块或计算机程序。

存储器110可以存储各种软件程序以及模块，如本申请实施例提供的图片的标注方法及装置对应的程序指令/模块。处理器112通过运行存储在存储器110中的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现本申请实施例中的图片的标注方法。存储器110可以包括但不限于随机存取存储器(randomaccessmemory，ram)，只读存储器(readonlymemory，rom)，可编程只读存储器(programmableread-onlymemory，prom)，可擦除只读存储器(erasableprogrammableread-onlymemory，eprom)，电可擦除只读存储器(electricerasableprogrammableread-onlymemory，eeprom)等。

处理器112可以是一种集成电路芯片，具有信号处理能力。上述处理器可以是通用处理器，包括中央处理器(centralprocessingunit，简称cpu)、网络处理器(networkprocessor，简称np)等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述外设接口113将各种输入/输入装置耦合至处理器112以及存储器110。在一些实施例中，外设接口113、处理器112以及存储控制器111可以在单个芯片中实现。在其他一些实例中，他们可以分别由独立的芯片实现。

输入输出单元115用于提供给用户输入数据实现用户与服务器(或本地终端)的交互。所述输入输出单元115可以是，但不限于，鼠标和键盘等。

音频单元116向用户提供音频接口，其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

显示单元117在所述服务器(或本地终端)与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中，所述显示单元117可以是液晶显示器或触控显示器。若为触控显示器，其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作，并将该感应到的触控操作交由处理器进行计算和处理。

可以理解，图1所示的结构仅为示意，电子设备100还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

第一实施例

请参阅图2，本发明实施例提供了一种图片的标注方法，所述方法包括步骤s200和步骤s210。

步骤s200：对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量。

步骤s210：基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果。

基于步骤s210，进一步地，基于表达式(1)：

获得所述待标注图片的预测标签值，以此获得所述待标注图片的标注结果；其中，xt,t＝1,2,…,m为所述待标注图片对应的特征向量，wt,t＝1,2,…,m为预设的映射矩阵，bt,t＝1,2,…,m为预设的偏差项，为所述待标注图片的预测标签值。

表达式(1)为所述预设的多视图半监督图片标注模型。将所述所述待标注图片对应的特征向量带入表达式(1)，获得所述待标注图片的预测标签值，即根据所述待标注图片的预测标签值，获得其对应的标注结果。

基于步骤s200，所述方法还包括：对所述待标注图片对应的特征向量通过主成分分析法进行降维，获得降维后的特征向量。

再将所述降维后的特征向量带入预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果。

请参阅图3，为了获取预设的多视图半监督图片标注模型，所述方法还可以包括步骤s300、步骤s310、步骤s320、步骤s330和步骤s340。

步骤s300：对获取到的n个图片进行特征提取，获得所述n个图片对应的多视图特征及标签矩阵。

将所述获取到的n个图片作为训练数据，分别进行特征提取，获得每个图片对应的m个视图特征，获得n个图片对应的n×m个多视图特征。

为n个图片中的第t个多视图特征，其中，为第i个图片中的第t个视图特征，dt为其对应第t个视图特征的维度。训练数据中前l个图片是有标签的，而其余n-l个图片是没有标签的。训练数据中与第t个视图特征相关的标签矩阵为其中，c为标签的数量，当(1≤i≤l),为有标签图片；当(l+1≤i≤n)，为全零向量，为没有标签图片。令表示与第t个视图特征相关的第i个图片的第j个类别，而当第i个图片在第j个类别中，其余情况下，若第i个图没有标签，为0，以此利用有标签图片和没有标签图片来学习视图半监督图片标注模型，提高稳定性(鲁棒性)。

步骤s310：基于所述n个图片对应的多视图特征以及预设的相似度计算规则，获得所述n个图片对应的相似度矩阵。

基于步骤s310，进一步地，基于获得所述n个图片对应的相似度矩阵，s＝[sij],1≤i,j≤n为所述n个图片对应的相似度矩阵，xi,xj(1≤i,j≤n)为所述n个图片中第i、j个图片各自对应的多视图特征，nk(xi)为xi的最近邻集合k，nq(xj)为xj的最近邻集合q。

利用多视图特征来构建相似度矩阵，sij的定义为所述预设的相似度计算规则，反映出了两个图片对应的多视图特征xi和xj之间的特征相似性。为了减少参数数量，本发明实施例定义了以上的相似度矩阵。

步骤s320：获取所述n个图片对应的相似度矩阵中的所有对角元值，获得对角矩阵。

步骤s330：将所述对角矩阵减去所述n个图片对应的相似度矩阵，获得所述n个图片对应的拉普拉斯矩阵。

基于步骤s310，获取对角矩阵d，其第i个对角元值通过计算得到。然后计算l＝d-s，得到所述n个图片对应的拉普拉斯矩阵l。

步骤s340：将所述n个图片对应的标签矩阵、拉普拉斯矩阵带入预设的目标函数进行迭代计算，获得所述预设的映射矩阵和所述预设的偏差项。

进一步地，为了同时得到有标签和没有标签图片，本发明实施例定义作为所有训练数据的标签预测矩阵，其中，为第i个图片的预测标签。作为一种实施方式，根据半监督学习方法，f可通过解目标函数如下的最小优化问题得到：

表达式(2)中，为对角阵，被称为决策方式矩阵。若第i个图片有标签则其对角元uii为很大的数(设置为10¹⁰)，否则，uii＝1。这样设置决策规则矩阵可使求解的标签预测矩阵f和y保持一致。

为了进一步提高得到的预设的多视图半监督图片标注模型的容忍噪声能力，本发明实施例提出了一个集成了适应不同级别噪声能力的鲁棒的损失函数。选择l2,p损失函数，然后表达式(2)可表示为如下形式：

表达式(3)为所述预设的目标函数，其中，||·||2,p为矩阵的l2,p范数，||·||f标签矩阵的frobenius范数，符号(·)^t表示矩阵的转置，tr(·)表示矩阵的迹，μ,γ均为预设的平衡参数，为预设的映射矩阵，为预设的偏差项，为正则项，1n为全1向量。m的l2,p范数定义为：

表达式(4)中，mi为m的第i行。

进一步地，对n个图片中的第t个视图特征，本发明实施例可以从视图特征xt计算得到相关联的拉普拉斯矩阵lt，然后对应的，利用表达式(3)可以计算得到视图依赖的预测标签矩阵ft。据此，本发明把多视图特征学习引入到表达式(3)中以调节不同视图特征中相关的和补充的信息从而获得更好的效果。提出共同最小化所有视图特征的目标函数来尽可能限制某一视图特征的ft，即：

表达式(5)中，λ为预设的平衡参数，可使每对视图特征的输出结果更加一致，从而达到更好的效果。该模型结合了多视图学习和基于图的半监督学习的优点，有效利用了大量的未加标签的数据和不同视图中的补充信息。

由于l2,p损失函数的非凸性和l2,p正则项，直接求解表达式(5)并不容易。为了简化计算，本发明实施例提出了一种高效的迭代算法来求解表达式(5)，首先将表达式(5)转换为：

表达式(6)中，为对角阵，其第i个对角元可以通过公式(7)计算得到：

公式(7)中，为矩阵的第i行。类似地，也为一个对角阵，其对角元可以通过公式(8)得到：

公式(8)中，为矩阵ft-fs的第i行。

由于和都与ft、wt以及bt相关，使得式(6)更加难以求解。据此，本发明实施例设计了一种迭代方法，在前次迭代中固定和来突破障碍，这样可通过式(6)来求解ft,wt以及bt。

通过设置式(6)关于bt的推导结果为0，有：

将公式(9)带入表达式(6)中，并设置表达式(6)关于wt的推导结果为0，有：

wt＝atft(10)

公式(10)中，有：

再将公式(9)和公式(10)带入表达式(6)中，有：

表达式(13)中，设置目标函数关于ft的推导结果为0，有：

ft＝mtqt(14)

公式(14)中，有：

公式(15)、(16)中设置当t＝s,t＝1,2,...,m.。据此，可通过解目标函数来获得ft,wt,bt的最优解。

具体地，将所述n个图片对应的标签矩阵、拉普拉斯矩阵带入表达式(5)，通过迭代方式对表达式(5)进行求解，随机初始化ft,wt,bt,(t＝1,2,...,m)，迭代计算对ft,wt,bt,(t＝1,2,...,m)进行最优求解，直到满足迭代收敛为止，优选的迭代收敛条件为：最近两次的求解结果的变化不超过预设阈值，以此获得所述预设的映射矩阵和所述预设的偏差项。在迭代过程中，首先根据公式(7)和(8)分别计算和再对每个视图(t＝1,2,…,m)，依次有：

根据公式(12)计算ht，根据公式(11)计算at，根据公式(15)计算mt，根据公式(16)计算qt，根据公式(14)、公式(10)、公式(9)，分别更新ft,wt,bt。获得ft,wt,bt的最优解，以此获得多视图半监督图片标注模型，即：

此外，为了更进一步地说明本发明实施例提供的图片的标注方法的有益效果，应用到了三种网络图片数据集，分别为nus-wide(包含269,648张现实场景图片，被标记有81种标签)，mirflickr-25000(包含25,000张图片和24种标签)以及iaprtc-12(包含20,000张来自世界各地的代表性的静止自然景观图片)。数据集被分成两部分，一部分用于训练，另一部分用于测试。

特征提取部分本实施例首先使用了sift局部描述符，提取了图片的两种视觉特征，分别基于两种译码方式即llc(locality-constrainedlinearencoding)和fk(improvedfisherencoding)。llc特征向量的最终维数为k(词汇表大小)，本实施例设置k＝4096。对于fk特征，特征向量最终维数等于2d*k，其中d是sift描述符的维数，k是词汇表大小。在本实施例中，通过pca(主成分分析法)将sift的描述符的维数从128降低到50。在本实施例中，fk特征向量维数为25,600，进而通过pca降维到4096，以节约计算开销。最终llc和fk特征向量都为4096维。本实施例还提取了两种新的深度学习特征，fc6、fc7(均为4096维)使用caffe基于第6层和第7层网络全连接层的输出得到。

通过实验，本实施例对于不同的数据集设置不同的参数值以达到最好的表现。

对于数据集nus-wide，设置参数如下：

μ＝10⁶,γ＝10⁴,λ＝10⁴,p＝0.8,q＝1.9

对于数据集mirflickr-25000，设置参数如下：

μ＝10⁶,γ＝10²,λ＝10²,p＝0.4,q＝1.5

对于数据集iaprtc-12，设置参数如下：

μ＝10⁶,γ＝10⁴,λ＝10⁴,p＝1.0,q＝1.6

基于本发明实施例提供的图片的标注方法得到输出结果，本实施例采用平均准确率(map)来衡量图片标注的表现。如图4和图5所示，以nus-wide(包含269,648张现实场景图片，被标记有81种标签)为训练数据，以提取的llc特征向量、fk特征向量、fc6特征向量、fc7特征向量，分别对比本发明实施例提供的图片的标注方法和已有的算法得出的结果。已有的算法包括典型的多视图学习算法cca(根据是基于最小平方回归(leastsquareregression，ls)或支持向量机(svm)，分别定义为cca-ls和cca-svm)、一种新的基于ls的多视图半监督维度下降法(mvssdr-ls)以及两种半监督算法，即structuralfeatureselectionwithsparsity(sfss)和flexiblemanifoldembedding(fme)、boost算法族中的一个新算法taylorboost。图4中，横坐标表示有标签的图片个数，1xc表示每类一个，纵坐标表示平均准确率，a1为本发明实施例提供的以提取的llc特征向量、图片的标注方法的效果，a2为本发明实施例提供的以提取的fk特征向量、图片的标注方法的效果，a3为sfss算法的效果，a4为mvssdr-ls算法的效果，a5为cca-ls算法的效果，a6为taylorboost算法的效果，a7为fme算法的效果，a8为cca-svm算法的效果。图5中，d1为本发明实施例提供的以提取的fc6特征向量、图片的标注方法的效果，d2为本发明实施例提供的以提取的fc7特征向量、图片的标注方法的效果，d3为sfss算法的效果，d4为mvssdr-ls算法的效果，d5为cca-ls算法的效果，d6为taylorboost算法的效果，d7为fme算法的效果，d8为cca-svm算法的效果。很明显，本发明实施例提供的图片的标注方法在效果上有很大提升。

同理，如图6和图7所示，以mirflickr-25000(包含25,000张图片和24种标签)为训练数据，以提取的llc特征向量、fk特征向量、fc6特征向量、fc7特征向量，分别对比本发明实施例提供的图片的标注方法和已有的算法得出的结果。图6中，横坐标表示有标签的图片个数，1xc表示每类一个，纵坐标表示平均准确率，b1为本发明实施例提供的以提取的llc特征向量、图片的标注方法的效果，b2为本发明实施例提供的以提取的fk特征向量、图片的标注方法的效果，b3为sfss算法的效果，b4为mvssdr-ls算法的效果，b5为cca-ls算法的效果，b6为taylorboost算法的效果，b7为fme算法的效果，b8为cca-svm算法的效果。图7中，e1为本发明实施例提供的以提取的fc6特征向量、图片的标注方法的效果，e2为本发明实施例提供的以提取的fc7特征向量、图片的标注方法的效果，e3为sfss算法的效果，e4为mvssdr-ls算法的效果，e5为cca-ls算法的效果，e6为taylorboost算法的效果，e7为fme算法的效果，e8为cca-svm算法的效果。很明显，本发明实施例提供的图片的标注方法在效果上有很大提升。

同理，如图8和图9所示，以iaprtc-12作为训练数据，以提取的llc特征向量、fk特征向量、fc6特征向量、fc7特征向量，分别对比本发明实施例提供的图片的标注方法和已有的算法得出的结果。图8中，横坐标表示有标签的图片个数，1xc表示每类一个，纵坐标表示平均准确率，c1为本发明实施例提供的以提取的llc特征向量、图片的标注方法的效果，c2为本发明实施例提供的以提取的fk特征向量、图片的标注方法的效果，c3为sfss算法的效果，c4为mvssdr-ls算法的效果，c5为cca-ls算法的效果，c6为taylorboost算法的效果，c7为fme算法的效果，b8为cca-svm算法的效果。图9中，f1为本发明实施例提供的以提取的fc6特征向量、图片的标注方法的效果，f2为本发明实施例提供的以提取的fc7特征向量、图片的标注方法的效果，f3为sfss算法的效果，e4为mvssdr-ls算法的效果，f5为cca-ls算法的效果，f6为taylorboost算法的效果，f7为fme算法的效果，f8为cca-svm算法的效果。很明显，本发明实施例提供的图片的标注方法在效果上有很大提升。

通过以上三种不同的图片数据集作为训练数据，在多视图条件下，本发明提供的图片的标注方法的效果和已知算法的效果对比，适用于多视图条件少量标签下的图片标注，并具有良好的噪声认知能力，能够在较少的迭代次数下收敛。

本发明实施例提供的一种图片的标注方法，对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量；再基于所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果，以此实现采用多视图半监督图片标注模型对图片进行标注，具备良好的噪声认知能力，效率高、稳定性强。

第二实施例

请参阅图10，本发明实施例提供了一种图片的标注装置400，所述装置400包括提取单元410、相似度矩阵获得单元420、对角矩阵获得单元430、拉普拉斯矩阵获得单元440、计算单元450、特征提取单元470、标注单元480。

提取单元410，用于对获取到的n个图片进行特征提取，获得所述n个图片对应的多视图特征及标签矩阵。

相似度矩阵获得单元420，用于基于所述提取单元410获得的所述n个图片对应的多视图特征以及预设的相似度计算规则，获得所述n个图片对应的相似度矩阵。

作为一种实施方式，所述相似度矩阵获得单元420可以包括相似度矩阵获得子单元421。

相似度矩阵获得子单元421，用于基于获得所述n个图片对应的相似度矩阵，s＝[sij],1≤i,j≤n为所述n个图片对应的相似度矩阵，xi,xj(1≤i,j≤n)为所述n个图片中第i、j个图片各自对应的多视图特征，nk(xi)为xi的最近邻集合k，nq(xj)为xj的最近邻集合q。

对角矩阵获得单元430，用于获取所述n个图片对应的相似度矩阵中的所有对角元值，获得对角矩阵。

拉普拉斯矩阵获得单元440，用于将所述对角矩阵减去所述n个图片对应的相似度矩阵，获得所述n个图片对应的拉普拉斯矩阵。

计算单元450，用于将所述n个图片对应的标签矩阵、拉普拉斯矩阵带入预设的目标函数进行迭代计算，获得所述预设的映射矩阵和所述预设的偏差项。

特征提取单元470，用于对获取到的待标注图片进行特征提取，获得所述待标注图片对应的特征向量。

标注单元480，用于基于所述特征提取单元获得的所述待标注图片对应的特征向量以及预设的多视图半监督图片标注模型，获得所述待标注图片的标注结果。

作为一种实施方式，所述标注单元480可以包括标注子单元481。

标注子单元481，用于基于获得所述待标注图片的预测标签值，以此获得所述待标注图片的标注结果；其中，xt,t＝1,2,…,m为所述待标注图片对应的特征向量，wt,t＝1,2,…,m为预设的映射矩阵，bt,t＝1,2,…,m为预设的偏差项，为所述待标注图片的预测标签值。

所述装置400还可以包括降维单元460。

降维单元460，用于对所述待标注图片对应的特征向量通过主成分分析法进行降维，获得降维后的特征向量。

以上各单元可以是由软件代码实现，此时，上述的各单元可存储于存储器110内。以上各单元同样可以由硬件例如集成电路芯片实现。

本发明实施例提供的图片的标注装置400，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨阳;胡孟秋;刘陆琛;申恒涛
技术所有人：成都澳海川科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。