为图像添加标签的方法、系统和装置的制造方法

文档序号:8923184阅读:315来源:国知局
为图像添加标签的方法、系统和装置的制造方法
【技术领域】
[0001]本发明涉及图像处理技术,特别涉及为图像添加标签的方法、系统和装置。
【背景技术】
[0002]当用户通过互联网等观看某一视频文件时,可能会希望了解视频中所出现的某种类型的物品的一些基本信息。
[0003]为了满足用户的上述需求,现有技术中,通常采用人工在视频进度中打上物品标签的方式,即在视频文件中出现所述类型的物品的不同时间点,分别通过人工的方式在图像中添加标签,即展示介绍物品的一些基本信息。
[0004]但是,互联网中的视频文件数量巨大,如果都采用上述人工添加标签的方式,几乎是不可能完成的任务,因此只能选择性地对部分视频文件进行上述处理。
[0005]可见,现有方式不但会耗费大量的人力成本,而且不具有广泛适用性。

【发明内容】

[0006]有鉴于此,本发明提供了为图像添加标签的方法、系统和装置,能够节省人力成本,且具有广泛适用性。
[0007]为了达到上述目的,本发明的技术方案是这样实现的:
[0008]一种为图像添加标签的方法,包括:
[0009]在进行静态图像展示或进行视频文件播放的过程中,当确定当前图像中出现预定类型的物品时,从当前图像中切割出包含所述预定类型的物品的子图像,所述子图像的数量为M,M为正整数;
[0010]针对每幅子图像,分别进行以下处理:
[0011]生成该子图像的指纹;分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的各不同物品图像的指纹进行匹配;
[0012]从匹配成功的指纹中选定一个指纹,将所述指纹库中所保存的、与选定的指纹对应的物品的预定信息作为标签,展示到当前图像中的预定位置。
[0013]一种为图像添加标签的系统,包括:
[0014]图像处理装置,用于在进行静态图像展示或进行视频文件播放的过程中,当确定当前图像中出现预定类型的物品时,从当前图像中切割出包含所述预定类型的物品的子图像,并发送给为图像添加标签的装置,所述子图像的数量为M,M为正整数;将接收自所述为图像添加标签的装置的标签展示到当前图像中的预定位置;
[0015]所述为图像添加标签的装置,用于针对每幅子图像,分别进行以下处理:生成该子图像的指纹;分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的各不同物品图像的指纹进行匹配;从匹配成功的指纹中选定一个指纹,将所述指纹库中所保存的、与选定的指纹对应的物品的预定信息作为标签,发送给所述图像处理装置。
[0016]一种图像处理装置,包括:
[0017]第一处理模块,用于在进行静态图像展示或进行视频文件播放的过程中,当确定当前图像中出现预定类型的物品时,从当前图像中切割出包含所述预定类型的物品的子图像,并发送,所述子图像的数量为M,M为正整数;
[0018]第二处理模块,用于将接收到的标签展示到当前图像中的预定位置。
[0019]一种为图像添加标签的装置,包括:
[0020]第三处理模块,用于接收包含预定类型的物品的子图像,并发送给第四处理模块,所述子图像的数量为M,M为正整数;
[0021]所述第四处理模块,用于针对每幅子图像,分别进行以下处理:生成该子图像的指纹;分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的各不同物品图像的指纹进行匹配;从匹配成功的指纹中选定一个指纹,将所述指纹库中所保存的、与选定的指纹对应的物品的预定信息作为标签,并发送。
[0022]可见,采用本发明所述方案,可自动地为图像添加标签,从而克服了现有技术中存在的问题,不但能够节省人力成本,而且可适用于任意的视频文件以及静态图像,具有广泛适用性。
【附图说明】
[0023]图1为本发明为图像添加标签的方法实施例的流程图。
[0024]图2为本发明64种颜色组合方式及其分别对应的像素点数示意图。
[0025]图3为本发明为图像添加标签的系统实施例的组成结构示意图。
【具体实施方式】
[0026]为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步的详细说明。
[0027]图1为本发明为图像添加标签的方法实施例的流程图。如图1所示,包括步骤11 ?14。
[0028]步骤11:在进行静态图像展示或进行视频文件播放的过程中,当确定当前图像中出现预定类型的物品时,从当前图像中切割出包含所述预定类型的物品的子图像,所述子图像的数量为M, M为正整数。
[0029]本实施例中,假设所述预定类型为服装。
[0030]那么,针对当前图像,可首先采用人脸识别技术确定出其中是否出现了人脸,如果是,则可确定其中出现了服装类型的物品,并可基于人脸识别技术定位出人在图像中的基本位置,之后,可利用Adaboost分类器等,从当前图像中切割出服装的子图像,所述子图像的个数可能为一个,也可能为多个;每个子图像中的服装可为上衣、裤子或裙子等,具体实现均为现有技术。
[0031]步骤12:针对每幅子图像,分别按照步骤13?14所示方式进行处理。
[0032]步骤13:生成该子图像的指纹(Finger Print),并分别将该子图像的指纹与指纹库中预先生成并保存的、属于所述预定类型的各不同物品图像的指纹进行匹配。
[0033]所述指纹也可称为特征值,在实际应用中,每幅图像的指纹可包括:第一指纹和第二指纹。
[0034]相应地,本步骤中,针对每幅子图像,可分别生成该子图像的第一指纹和第二指纹,同样地,指纹库中需要预先生成并保存有各不同物品图像的第一指纹和第二指纹。
[0035]在得到该子图像的第一指纹和第二指纹后,首先,可分别计算指纹库中所保存的各第一指纹与该子图像的第一指纹的相似度,并确定相似度大于预定第一阈值的第一指纹数是否大于预定第二阈值;如果是,则将相似度大于第一阈值的第一指纹作为匹配成功的指纹;如果否,则分别计算指纹库中所保存的各第二指纹与该子图像的第二指纹的相似度,并将相似度大于第一阈值的第一指纹以及相似度大于第一阈值的第二指纹作为匹配成功的指纹。
[0036]也就是说,优先使用第一指纹来查找能够匹配成功的指纹,如果查找到的指纹数过少,再使用第二指纹来进行查找。
[0037]第一阈值和第二阈值的具体取值均可根据实际需要而定,比如,第一阈值可为85%,第二阈值可为5个。
[0038]较佳地,第一指纹的生成方式可为:针对每幅图像,分别生成该图像的颜色分布直方图(Color Histogram),并将生成的颜色分布直方图对应的向量作为该图像的第一指纹。
[0039]第二指纹的生成方式可为:针对每幅图像,分别生成该图像的感知哈希值,并将生成的感知哈希值作为该图像的第二指纹。
[0040]以下分别对第一指纹和第二指纹的生成方式进行详细说明。
[0041]I)第一指纹
[0042]任何一种颜色都是由红、绿、蓝三原色(RGB)所构成的,通常,每种原色均可取256个值,即O?255,那么,整个颜色空间共存在1600万种颜色(256的三次方),如果针对这1600万种颜色生成颜色分布直方图,计算量将会非常巨大,因此本发明所述方案中提出了一种简化后的方式。
[0043]即将红、绿、蓝三原色的取值O?255分别划分为四个区间,其中,第一区间的取值为O?63,第二区间的取值为64?127,第三区间的取值为128?191,第四区间的取值为192?255 ;按照红、绿、蓝三原色所属区间的不同,共可确定出64种(4的三次方)不同的颜色组合方式,任何一种颜色必然属于这64种颜色组合方式中的一种。
[0044]这样,对于每幅图像来说,可针对其中的每个像素点,分别根据该像素点的红、绿、蓝三原色的取值所属的区间,确定出该像素点对应的颜色组合方式,并分别统计每种颜色组合方式对应的像素点数,进而根据统计结果生成该图像的颜色分布直方图。
[0045]图2为本发明64种颜色组合方式及其分别对应的像素点数示意图。如图2所示,四个区间分别用0、1、2、3表示,那么,“0、0、0、7414”即表示图像中共有7414个像素点符合以下情况:红原色的取值位于O?63的范围内,绿原色的取值位于O?63的范围内,蓝原色的取值也位于O?63的范围内,“0、0、1、230”表示图像中共有230个像素点符合以下情况:红原色的取值位于O?63的范围内,绿原色的取值也位于O?63的范围内,蓝原色的取值位于64?127的范围内。
[0046]基于图2所示,可进一步得到一个64维的向量(7414,230,0,0,8,...,109,0,0,3415,53929),该向量即为图像的第一指纹。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1