一种面向谷歌眼镜的图像代码生成方法

文档序号:6507645阅读:112来源:国知局
一种面向谷歌眼镜的图像代码生成方法
【专利摘要】本发明涉及信息处理领域中的一种面向谷歌眼镜的图像代码的生成方法,是将从图像读取设备中获取到的原图像,变换成复数个几何学,或物理学形态的展开图像,并基于自组织的概率尺度,抽出各个图像的特征信息,再进行数值化的处理,生成图像代码。该方法具有图像特征信息占用服务器的存储容量小,处理效率高,适于广域的物联网网站系统的应用。
【专利说明】一种面向谷歌眼镜的图像代码生成方法

【技术领域】
[0001] 本发明属于图像处理领域中的一种面向谷歌眼镜的图像代码生成方法。

【背景技术】
[0002] 近些年来,通过移动电话,智能手机等等读取二维码,然后下载二维码对应的视频 的方法正在被广泛使用。(专利文献1)
[0003] 但是,印刷物上印刷上二维码之后,不仅对于印刷物的美观有损,而且印刷二维码 还需要必须的空间。因此从印刷物的美观以及印刷空间出发来考虑,采用电子水印技术,使 用智能手机进行读取的系统也被广泛采用。比较有代表的手法有"在便携计算设备之上高 速信号检测以及分散计算]专利文档提及的方法"。(专利文献2)
[0004] 同时,也有使用图形识别技术,进行图像读取,基于读取到的图像连接网络,读取 的图像和图像本身相关联的信息同时在画面上显示的所谓AR (Augmented Reality)的扩张 现实技术(www. sbbit. jp)。
[0005] 为了极力减少与图像特征相关联的信息的容量,人们还在摸索由图像直接生成图 像代码的技术,已经申请的专利有"图像代码化设备,方法以及程序"。(专利文献3) 已公开的技术文献 专利文献:
[0006] 【专利文献1】(特開2〇〇9_104164号公告) 【专利文献2】(特開2011-234376号公告) 【专利文献3】(特開2011-94551号公告) 【非专利文献 1】「AR 应用说明」(www. ar. selkosha-p. com<http://wwww. ar.selkosha_D.com>) 访问时间:2013年8月6日
[0007] 上述的专利文献1中记述的方法,使用便携电话读取二维码的技术被广泛使用, 但是二维码需要专用空间,商品标签以及包装上使用的时,会有损美观。
[0008] 上述专利文献2中记载的智能手机读取系统中,因为二维码可以隐藏在商品标签 中,所以对商品的标签包装等等美观上不会有影响,但是需要提前把信息隐藏进去,需要复 杂的印刷手段,印刷成本以及花费时间都会增加,因为需要事先的信息埋入的作业所以此 手段广泛普及需要很长的时间。
[0009] 同时,非专利文献1中提到的AR (Augmented Reality)的扩张现实技术,根据图像 的轮廓解析对图像进行特定,然后对获取关联信息。因此,通过使用相同轮廓的图像有可能 获取到相关的信息,而且很难防止伪造。还有,这种手法采用了图像匹配的识别方法,单个 图像就需要注册数兆的图像匹配信息到内存中,因此需要大容量的记忆介质(内存)。
[0010] 上述的专利文献3中提到的图像代码,指的是事先设定在图像中的标准阈值,将 这中特定的图像分割成若干区域,将各个分割成的区域中的灰度直与实现设定在图像中的 标准阀值进行对比,按大于标准阀值,还是小于标准阀值判断出是信息" 1",还是信息"0"。 这种图像代码的生成方法和专利文献2中提到技术一样,都只能针对特定的图像进行图像 代码的生成,不能针对不特定的图像进行图像代码的生成。


【发明内容】

[0011] 本发明的第一个目的是,提供一个方法,从原图像中抽出图像的特征信息,按照图 像是别的方法,从登录的图像特征数据中检索出原图像的固有的代码。
[0012] 本发明的第二个目的是,提供一个直接将不特定的印刷图像生成图像代码的方 法。
[0013] 本发明的第三个目的是,提供一个可作为防伪的特定图像代码的生成方法。
[0014] 为了解决上述课题,提出如下技术方案: 一种面向谷歌眼镜的图像代码的生成方法,是由图像变换部分,特征信息抽出部分,图 像代码生成部分组成的,具有如下的特征: 图像变换部分将从图像读取设备中获取到的原图像,变换成复数个几何学,或物理学 形态的展开图像; 特征抽出部分将由图像变换部分产生的复数个展开的图像,基于自组织的概率尺度, 抽出各个图像的特征信息; 图像代码生成部分将由特征抽出部分抽出各个图像的特征信息,进行数值化的处理, 生成图像代码。
[0015] 而且,上述图像变换部分,所述图像变换是根据原图像信息的各个像素的灰度的 分布,将原图像变换成具有几何学的形状特征的展开图像,具有物理学的能量特征的展开 图像,边缘展开图像,类似度的展开图像中复数种展开图像。
[0016] 而且,上述特征信息抽出部分,所述自组织概率尺度是指,包括正态分布,多变量 正态分布,指数分布,通信量分布,韦伯分布,三角分布,贝塔分布中至少一种具有概率分布 的概率属性的参数,所述自组织的中心值,是指概率分布的平均值,或者期待值。 而且,上述特征抽出部分,将上述复数展开图像分别分割成多个图像区域,基于自组织 概率尺度,从每个图像分割的领域中,抽出展开图像的特征信息; 上述图像代码生成部分,将复数展开图像的特征信息,用单比特,或多比特的形式进行 数值化处理,并直接生成图像代码。
[0017] 而且,上述特征抽出部分,将复数个展开图像,基于自组织的概率尺度,抽出各个 展开图像的特征信息; 上述图像代码生成部分,将由特征抽出部分抽出的所有的展开图像的特征信息,使用 基于人为经验所定义的复数个从属函数,在0到n数值之间进行数值化,并直接生成图像代 码。
[0018] 而且,上述图像代码生成部分,将数值化的各个原图像的展开图像的特征信息,作 为多个图像的特征向量,并为能登录注册到服务器上而构成了图像的特征向量空间; 计算属于特征向量空间的图像的特征向量和图像的特征向量空间中登录的各个特征 向量的欧氏距离(Euclidean distance),把距离最小的特征向量空间的特征向量作为当前 图像的图像代码。
[0019] 而且,上述代码生成部,为了生成登录用的图像代码,用不同的时机获取到的同一 个读取对象的多个图像,取得各个固定的多个展开图像的特征信息,作为多个图像信息的 特征向量,基于自组织概率尺度,计算当前图像的特征向量的中心值和概率尺度,构成服务 器登录的新的特征向量空间; 针对属于新的特征向量空间的图像特征向量,使用特征向量空间中登录的各个图像的 特征向量的中心值和分散值进行概率尺度的距离概率尺度的距离的计算,把概率尺度的距 离最近的属于特征向量空间的特征向量的中心值作为当前图像的图像代码。
[0020]

【专利附图】

【附图说明】 图1使用谷歌眼镜的读取方法示意图 图2自组织处理流程示意图 图3通过几何学或者物理学进行展开图像的变换方法的示意图 图4通过能量图像的变换抽出图像特征信息的示意图 图5通过形状图像的变换抽出图像特征信息的示意图 图6通过边缘图像的变换抽出图像特征信息的示意图 图7通过类似图像的变换抽出图像特征信息的示意图 图8通过能量图像的分割进行图像代码化示意图 图9多色图之间灰度调整原理示意图 图10是防伪图像代码的图像构成原理示意图 图11利用微镜头阵列实现防伪图像代码的图像生成方法的示意图 图12用于物联网网站的谷歌眼镜系统构成示意图 图13图像代码化检索系统处理流程示意图 图14图像代码化检索系统的系统构成示意图 (401) 能量图像中能量至高点 (402) 能量图像的轮廓 (501) 人物图像的圆形头部部位 (502) 自组织的计算结果 (801) 能量图像的中心领域 (802) 能量图像的左上领域 (803) 能量图像的右上领域 (804) 能量图像的右下领域 (805) 能量图像的左下领域

【具体实施方式】
[0021] 以下结合附图对本发明实施例做进一步详述,但本发明所述的实施例是说明性 的,而不是限定性的。 本发明解决其技术问题是采取以下技术方案实现的: 使用图像对于本发明的实施形态进行说明。
[0022] 图1是本发明的图像代码化变换方法以及变换设备的说明示意图。图1是以谷歌 眼镜为例进行说明的。 在以下的说明中,经常会用谷歌眼镜进行说明,但是本发明不仅仅局限于谷歌眼镜, 使用智能手机,便携电话以及其他的移动终端,电话回路,专用回路接线的在线终端,监视 摄像头,自动检票机的认证摄像头,信用卡终端等的系统都可以使用。
[0023] 图1(a)是使用谷歌眼镜对商品标签或者包装的图像进行读取的示意图,图1(b) 是以谷歌眼镜等移动终端为例,介绍本发明有关具有图像的代码生成功能的装置的功能模 块示意图。图1(b)中对于必须的功能单元均采用实线的方块图。
[0024] 例如,谷歌眼镜等移动终端10的图像读取部11面向商品标签(1-2),CXD摄像头 等构成的图像读取部11,获取到图像信息,然后发送给终端控制部14,然后显示在图像表 示部12。同时,图像信息也会保存到数据记忆部15。从数据输入部13接收到特定信号时, 终端控制部14和图像代码变换部16共同处理,获取到图像的特有唯一代码。图像代码,基 于终端控制部14的控制指令,被保存到数据记忆部15中,也可通过通信部17,基于终端控 制部当前命令,发送到网络连接的外部设备中。来自于网络方面的信息,是通过通信部17, 终端控制部14,然后显示在图像显示部12上,图像读取部分获取的信息也会同时显示在图 像显示部12上。 虽然图1是用移动终端进行的示例,连接有网络的电脑,POS终端设备,以及其他的检 索专用设备等都是可以的。
[0025] 图2是自组织处理流程。如图2所示,基于概率尺度的自组织算法由下边4个步 骤构成。
[0026] STEPl :预处理步骤:Mw作为初始化概率尺度,(x。,yQ)((0作为自组织的中心值,V 作为自组织的收敛值,MN作为自组织最大组织次数值,n = 0作为自组织的当前次数。
[0027] 关于Mw作为初始化概率尺度和(?,%)((1)作为自组织的中心值的决定方法,没必 要进行严密的设定。通过人工预测,对于最终的范围,至少有一部分是包含在初始化概率尺 度M w的范围内的。初始化概率尺度Mw越大,计算的时间就越长,反之太小,有可能得不到 正确的结果。
[0028] 关于V作为收敛值的设定方法,收敛值V越大,就有可能得不到正确的结果。值越 小,计算花费的时间越长。正确的设定方法是最终自组织的概率的10%左右。 关于最大自组织次数MN的设定方法,一般是5-10次就足够了。
[0029] STEP2 :自组织步骤:进行n次自组织处理,把(xn,yn)(n)作为自组织中心值,概率尺 度M (n)作为半径,计算半径以内的所有像素I (Xi,yj) (i = 1,2, ? ? ?,k,j = 1,2, ? ? ?,1)的 灰度密度分散值 S(n+1)。M(n+1) = S(n+1),n = n+1。
[0030]【公式1】

【权利要求】
1. 一种面向谷歌眼镜的图像代码的生成方法,是由图像变换部分,特征信息抽出部分, 图像代码生成部分组成的,具有如下的特征: 图像变换部分将从图像读取设备中获取到的原图像,变换成复数个几何学,或物理学 形态的展开图像; 特征抽出部分将由图像变换部分产生的复数个展开的图像,基于自组织的概率尺度, 抽出各个图像的特征信息; 图像代码生成部分将由特征抽出部分抽出各个图像的特征信息,进行数值化的处理, 生成图像代码。
2. 根据权利要求1所述的面向谷歌眼镜的图像代码的生成方法,其特征在于: 上述图像变换部分,所述图像变换是根据原图像信息的各个像素的灰度的分布,将原 图像变换成具有几何学的形状特征的展开图像,具有物理学的能量特征的展开图像,边缘 展开图像,类似度的展开图像中复数种展开图像。
3. 根据权利要求1所述的面向谷歌眼镜的图像代码的生成方法,其特征在于: 上述特征信息抽出部分,所述自组织概率尺度是指,包括正态分布,多变量正态分布, 指数分布,通信量分布,韦伯分布,三角分布,贝塔分布中至少一种具有概率分布的概率属 性的参数,所述自组织的中心值,是指概率分布的平均值,或者期待值。
4. 根据权利要求1所述的面向谷歌眼镜的图像代码的生成方法,其特征在于: 上述特征抽出部分,将上述复数展开图像分别分割成多个图像区域,基于自组织概率 尺度,从每个图像分割的领域中,抽出展开图像的特征信息; 上述图像代码生成部分,将复数展开图像的特征信息,用单比特,或多比特的形式进行 数值化处理,并直接生成图像代码。
5. 根据权利要求1所述的面向谷歌眼镜的图像代码的生成方法,其特征在于: 上述特征抽出部分,将复数个展开图像,基于自组织的概率尺度,抽出各个展开图像的 特征信息; 上述图像代码生成部分,将由特征抽出部分抽出的所有的展开图像的特征信息,使用 基于人为经验所定义的复数个从属函数,在0到n数值之间进行数值化,并直接生成图像代 码。
6. 根据权利要求1所述的面向谷歌眼镜的图像代码的生成方法,其特征在于: 上述图像代码生成部分,将数值化的各个原图像的展开图像的特征信息,作为多个图 像的特征向量,并为能登录注册到服务器上而构成了图像的特征向量空间; 计算属于特征向量空间的图像的特征向量和图像的特征向量空间中登录的各个特征 向量的欧氏距离(Euclideandistance),把距离最小的特征向量空间的特征向量作为当前 图像的图像代码。
7. 根据权利要求1所述的面向谷歌眼镜的图像代码的生成方法,其特征在于: 上述代码生成部分,为了生成登录用的图像代码,用不同的时机获取到的同一个读取 对象的多个图像,取得各个固定的多个展开图像的特征信息,作为多个图像信息的特征向 量,基于自组织概率尺度,计算当前图像的特征向量的中心值和概率尺度,构成服务器登录 的新的特征向量空间; 针对属于新的特征向量空间的图像特征向量,使用特征向量空间中登录的各个图像的 特征向量的中心值和分散值进行概率尺度的距离概率尺度的距离的计算,把概率尺度的距 离最近的属于特征向量空间的特征向量的中心值作为当前图像的图像代码。
【文档编号】G06T1/00GK104376280SQ201310351226
【公开日】2015年2月25日 申请日期:2013年8月12日 优先权日:2013年8月12日
【发明者】顾泽苍 申请人:天津市阿波罗信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1