图像识别标记和方法_4

文档序号:9872465阅读:来源:国知局
前测试的图像是最后的图像,第三测试34将控制传递给退出38终止操作。
[0086]如果第一测试24没有检测到标签10的图像,第一测试24将控制传递给第三测试34,以检查待测试的最后的图像是否已经获得。
[0087]如果第二次测试30没有检测到已由第五操作28读取的二进制数和第一操作18接收到的二进制数的之间的数字匹配,第二测试将控制传递给第三测试34,以检查是否最后的图像是否已经获得。
[0088]图4的过程仅通过举例的方式给出。虽然图4只示出了在任何一个时间只存在一个输入二进制数,以及只有一个摄影图像的集合生成,但应当理解的是,多个二进制数可以被同时进行检查,以及一个或多个摄影图像的集合可以被建立。也可以理解的是,图4的方法可以在同一时间扫描出多于一个标签10的多个图像,并且如果发现多于一个标签具有多于一个二进制数,多个摄影图像的集合的添加部分可以同时生成。
[0089]参照图5,对用于单个照片的可能的特异性检测制度进行阐述。在进程启动110后,第一步骤111增强了图像。这可以包括将图像的照明和对比度规格化,以及降低噪声(如平滑化步骤)。然后,作为第二步骤,通过检测图像中的轮廓,特别是完整的轮廓,分析所述图像。这可以使用一些已知的技术的一个或多个来完成。在标签存在之处,由该步骤产生的所述边界线对应于如在附图3b至3e中描述的轮廓。异常的(如那些不完整的,交叉的,或者低于一定尺寸或长度的)轮廓可以被过滤掉。
[0090]第三步骤113是要检查由轮廓检测所产生的形状的关系。这是通过在正确的层次结构的设置中,通过本系统寻求的具有正确的形状和相对尺寸的标签或多个标签,检查出正确数目的轮廓来完成。
[0091]如先前所描述的,轮廓的形状尤其意味着凸性缺陷的呈现和数量,凸性缺陷之间的线的性质和大小。这些特定因素的重要性是其对变形的回弹性。使用这些参数,种类繁多的标签样式可以被产生和检测到,其可被更容易地与通常发现结构区分开,并且对失真具有一定的鲁棒性。采用越多的轮廓,就越容易将标签与背景噪声区分开,但也变得更难使标签与小的空间适应,以及更难在有限的分辨率的图像中保持可区分,也更难给予编码元素的空间。如前所述,轮廓的最佳数目是3(含)到7(含)。
[0092]如果在步骤114中标签被发现,图像则在步骤26中被平面化,代码元素被编码用来提取之前所述的ID,所述ID与先前图4所示的步骤24有关。特别地,当所述图像(以及通常固定所述图像的表面)不直接在照相机前面对齐,以及该面(plane)基本上不平行于照相机,而是偏离中心和/或斜交成角或倾斜,所述图像可以发生失真。此处所使用的术语平面化一般涉及应用本领域已知的校正转换。平面化方法也可包括用于校正被施加于弯曲表面的图像的变换,以及用于校正诸如鱼眼失真的镜头失真。
[0093]通过提取关键点的配置如凸性缺陷(例如,图3中所示的角89在部分圆形轮廓82和十字形形状87上的数目和空间分布)并将其与原始模板进行比较,来校正失真。
[0094]应当特别注意的是,用于检测标签(轮廓)的因素和用于校正标签的变形(关键点)的因素是不同的。使用两组不同的用于检测和校正的特征(尽管两组的各方面可能相关联)使得标签设计具有大得多的灵活性。关键点的最佳数目更加难以限定,但它们必须分散在标签的表面,以便校正整个标签表面的变形,所述关键点分散得越多,校正会越好。
[0095]根据所述轮廓,所述标记的预定最小尺寸将限制可被包括的关键点的数目。
[0096]通过必要的元数据,提取并输出所检测到的标记图像(或ID),使所检测到的标记图像(或ID)与原始图像/源相关联。
[0097]以下对该方法涉及的步骤进行详细的说明。
[0098]如果使用彩色标签或代码元素,所述步骤之一,例如步骤28,二进制数的读取,可以包括将所述图像分为单独的颜色通道,以分别处理红、绿和蓝色通道,改善彩色元素的检测。
[0099]图像增强的成功可取决于被执行的对于对比度、亮度、平滑度等等的调整量。相对于一组不同条件下拍摄的图像,一组预选值,或一组特定的技术可以更适合在一组条件下拍摄的图像。如果没有检测到标签,在步骤115中保持对一些设置的尝试,在步骤116中可以进行新的预处理设置的选择。该进程对各种预处理设置进行重复,以达到最广的光照范围。此外,照片可包括多于一个的标签,对于一个单一照片来说,这种重复可以通过使用不同的设置检测不同的标签。
[0100]参考图6,列出了用于识别检测到的标签以及读取编码元素的具体步骤的方便的顺序,其对应于图4和5中更普遍指定的步骤26和28。在进程在步骤117中被启动后,步骤118中所述轮廓的关键点,比如轮廓的角度、尖角、中央点在提取的标签中被识别。步骤119中将这些关键点的设置与非失真模板进行比较以提取变形信息。步骤120中使用所述模板,对所述标签进行变形校正,所述变形通常是由以倾斜的角度拍摄标签导致的在一个方向上的投影缩减,但其他失真也可被校正。
[0101]步骤124中发现非对称特征,并将其与那些在原始模板中的特征对比,以确定旋转方向。例如,在图3a至3e所示的标签中,角部89在部分圆形轮廓82上相对于圆形轮廓84的位置在外部圆形轮廓81内具有特定的定向和角位置。同样地,能够检测所述标签的反射或翻转。步骤125中这些特征然后可以用于校正或补偿所述标签的图像受到的任何旋转和反射。
[0102]现在,任何变形、旋转和反射已被校正,可以在步骤126中在编码特征已知的位置上寻求编码特征,以及在步骤127中寻求被读取的标签的ID。然后在步骤128中,与所述标签有关的元数据通过ID被检索,并与原始图像或原始源一起被传送。这导致步骤129中的编码进程的结束。
[0103]理想情况下,参照图5描述的检测进程和参照图6描述的编码进程被并行运行的单独的例行程序执行,从而使得一旦所述标签被检测例行程序识别,轮廓信息可以被传递给解码例行程序;更理想的是,一些检测例行程序和一些解码例行程序可以并行运行,其中分配资源以使检测例行程序的工作量与解码例行程序匹配。由于被执行的处理设置的数量可能会发生变化,解码进程和特别是检测进程,均将采用不同的时间量来完成图像。分开所述两个例行程序和使之并行运行,可确保资源的有效分配和避免瓶颈的处理,确保该系统还可以扩展到处理大量图像。
[0104]接下来注意图7,其示出了说明本发明所作用的环境的示例性框图。
[0105]网络40,优选但非必须地,互联网40,承载多个网站服务器(此处仅示出两个),所述网站服务器包括代码发行服务器42和图像选择服务器44。
[0106]如下面描述地那样,代码发行服务器42发出用于呈现在标签10中的二进制数的代码。代码发行服务器42与原始客户端46交互以建立代码发行的基础,并分配另一个用于由原始客户端46所指定的特定用途的新的代码。
[0107]图像选择服务器44如参照图4所描述的那样运行。本发明中,一个或多个浏览客户端48以直接或间接的形式与图像选择服务器44交互,查看使用标签10的代码选择的图像集合。提供一种用于图像选择服务器44的类型识别并不是本发明的一部分。图像选择服务器44可以是,但不限于,社会网络站点;调查网站;企业网站;和编辑网站;照片发布网站;照片共享网站;视频发布网站;以及视频共享网站。
[0108]图像选择服务器44和代码发行服务器42也可以彼此通信,以提供所选择的代码和标签10的样式的指示,连同由原始客户端提供的详细信息一起提供。
[0109]接下来注意图8,其示出说明图像选择服务器44的内容的示例性框图。
[0110]原始服务器44包括服务器处理器50,其双向耦合到调制解调器52或其它计算机设备和/或设置,所述设置提供了互联网40内与所述服务器处理器30的双向耦合。
[0111]服务器处理器50耦合到存储器54,从存储器54中所述服务器处理器50可以检索摄影图像并存储选择性的摄影图像。服务器处理器50在来自图像选择服务器程序56的指令下运行,以实现参照图4解释并说明的目的。
[0112]接下来注意图9,说明一种方式的流程图,其中原始客户端46可以设置用于预期目的的二进制代码和标签的样式。
[0113]从步骤58开始,第四测试60等待检测来自原始客户端46的
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1