图像识别标记和方法

文档序号:9872465阅读:3235来源:国知局
图像识别标记和方法
【技术领域】
[0001]本发明涉及一种用于为摄影图像自动提供识别的系统和方法。本发明更紧密地涉及一种系统和方法,通过该系统和方法,图像可以自动地被分类,从而使多个摄影图像能够被收集到一起。
[0002]需要理解的是,所述多个摄影图像在下文被定义为包括静态图像和视频图像中的一个、另一个或两个。
【背景技术】
[0003]虽然来自事件的以及使用中的产品和服务的专业照片和视频通常相当昂贵,但是它们长期以来一直被广泛应用于市场营销中。智能手机和宽带的普及大大加快了数码摄影以及照片和视频共享的兴起,开辟了更多的内容的巨大潜在资源。像这样的由体验事件、月艮务或产品的顾客创建的照片和视频,不仅可能成本低,还带有比品牌拥有者自己创建的内容更大的可信度。
[0004]然而,为了收集这些用户生成的内容需要营销费用,首先要接触客户,然后激励他们通过诸如比赛的机制,积极地将内容投稿给品牌拥有者。所以,每天当成千上万的很多来自事件或捕获使用中的产品和服务的照片和视频上传到互联网上时,其中极少数能以营销目的被识别和开发。
[0005]对另外一些人来说,用户生成的内容意味着威胁而不是机遇,其中一个威胁被认为会渐渐破坏事件的官方图片和视频的价值。现在越来越普遍的是,那些参加高价值事件的用户被要求不得进行拍照或录视频。但这种素材的共享是广泛的,并且到目前为止对于这种素材的识别已经成为一种机遇问题,或者对于非常高价值的内容来说,已经成为了由专业权限管理企业所做的大量外勤工作。
[0006]由于条形码的发明,已经出现了一些系统,其使用打印出来的可以被读取它们身份数据的标签,来指示特定的产品的存在。随着由智能手机的普及带来的便携式数码图像和一般目的的处理能力的日益普及,它们的应用通过诸如二维码或增强现实标记的解决方案而推广。然而,这些全部都被设计成实时以及近距离被读取,从前者的情况下的几厘米到后者情况下可能为I米或2米。这些并不适合用于识别在正常距离拍摄的照片或者视频。
[0007]过去曾经有过许多使摄影图像可被识别的提议。曾经有过一些自动采集公共共享的用户生成图像的尝试,其依赖于添加特定元数据的用户,所述特定元数据与地点和日期有关,通过地点和日期可以推断出某一事件,但是通常情况下并不这样做。
[0008]国际专利申请W02013074895(A2)公开了从具有可识别的对象的照片(或视频)自动提取数据和对其加标签。图像识别和提取的元数据的组合包括地域和日期/时间信息,其被用来寻找和识别照片或视频中的对象。在发现与被识别出的对象匹配的识别符后,通过I个或多个与被识别出的对象相关联或对应的关键字对所述照片或视频自动加标签。
[0009]国际专利申请W02012112449(Al)中公开了包括编码于计算机存储介质上的计算机程序的用于自动的事件识别和照片聚类(clustering)的方法、系统和装置。在一个方面,方法包括从第一用户接收对应于第一图像的第一图像数据,从第二用户接收对应于第二图像的第二图像数据,比较所述第一图像数据和第二图像数据,以及基于所述比较确定所述第一图像和第二图像符合重合事件。
[0010]国际专利申请W003043315(A1)中公开了一种设置在娱乐场地的多个兴趣点的数码相机,其用于自动拍摄在该兴趣点参与活动的个体,作为对于唯一识别参数的检测的响应;其中所述参数对应于每个个体,例如各自的射频识别(RFID)标签代码。这些照片被自动传输到数据库进行存储,从所述数据库中能够通过对该识别参数的演示和识别来访问这些照片,用于查看或打印。
[0011 ]国际专利申请WO 2011051091 (Al)中公开了用于将照片自动整理到事件的方法。事件被定义为一组在同一地点以及在同一时间范围内拍摄的,显示现实世界发生的事件的照片。该方法包括通过照片已知的日期,时间,EXIF数据将照片集分割成片段的步骤或者执行对象识别的步骤。关联具有类似的日期,时间或GPS信息的片段或者基于面部的或对象识别的或社交图谱的片段。提供元数据以帮助标注和标记事件。
[0012]瑞士专利CH703915(A2)中公开了一种用于稳定动态社交网络的两个或多个成员之间的关系的方法。该系统包括由一个或多个服务器承载的网络平台,包括若干成员的动态社交网络,连接到成员上的可视化识别代码,用于识别代码的载体,用于检测代码的光学装置,与光学装置接口并连接到互联网和主服务器的用于识别代码的计算机化装置。所述载体可以是一件衣服。独立权利要求包括:用于稳定动态社交网络的两个或多个成员之间的关系的系统;用于识别代码的载体;以及可视化识别代码的载体。
[0013]美国专利申请US2013119123(Al)中公开了一种设置为与至少一个照相机接口的摄影数据库,并且包括存储器,其用于以拍摄的顺序存储区别条形码和主题公园游客的照片,从而使得该区别条形码能区分主题公园游客各自的照片。处理器与存储器耦合,以通过以下步骤基于由主题公园游客出示的区别条形码来检索已存储照片:检测与由主题公园游客出示的区别条形码匹配的已存储区别条形码,以及检测与由主题公园游客出示的区别条形码不匹配的已存储的下一条区别条形码。在匹配和不匹配已存储条形码之间的所有照片均被检索。至少一个显示器与所述摄影数据库耦合,用于显示所检索到的照片。
[0014]US2012207349示出了一种方法,其中标签被粘贴到将在图像捕获系统的已知视野中被识别的已知个体。所述标签为包括至少一个已知特征的物理标签。在将标签粘贴到所述个体之后,在图像捕获系统的已知视野中捕获图像数据,然后将图像数据提供给处理器。基于捕获的图像数据进行图像分析以检测该已知特征。如果检测到特征,则识别到在捕获的图像数据内已知个体的发生。
[0015]如US2011125735所示,已知例如使用手机拍照并将这些照片提交到可视化查询搜索系统。处理每个提交的可视化查询是通过将其发送到多个并行搜索系统,每个并行搜索系统执行不同的可视化查询搜索方法。这些并行搜索系统可以包括诸如光学字符识别(OCR),面部识别,产品识别,条形码识别,对象或对象类别识别等技术。
[0016]通过US2010266155中所示的方法可以对照片集进行分类或分为特定主题的集合。在拍摄有照片的事件发生之前,用于识别一些或全部主题的信息被提交到自动化辅助器(facilitator)。辅助器生成包括机器可扫描标签或代码的记载(slate),每个被识别的主题具有唯一的记载。在事件下,对于每个主题来说,拍摄的第一张相片包括主题的记载;之后拍摄任意数量的照片。这些照片被上传到所述辅助器并被扫描来识别所述记载。跟随记载的每一张照片与相对应的主题关联,直到另一个记载被识别。
[0017]分析照片或视频以得到文本信息是众所周知的。例如,US2008175479处理包含视频信息的视频信号,所述视频信息涉及可包含车辆牌照的场景。胃02011159460披露了一种在带有地理标签(geo-tagged)的图像中识别机构的方法,该方法通过提取文本短语,并将这些文本短语与已知在图像地理标签中规定的靠近地理位置的文本短语或者信息进行比较。图像中识别的文本串与机构的短语比较,以获得近似匹配,并且基于该近似匹配选择机构作为图像中的机构。
[0018]美国专利申请US20140008436显示了由若干共焦圆圈组成的标记,由所述圆圈的焦点间隔开的单独的防呆元素以及编码元素。从包括所述标记的图像提取多个轮廓。如果图像由于拍摄图像的照相机的位置视角而变形,或者由于放置图像的表面的曲率而变形,该标记的圆圈产生共焦二次曲线。其中系统公开了通过检测这些共焦二次曲线查找所述标记。一旦被检测到,所述共焦二次曲线则被用来确定并矫正该标记的变形。然后防呆元素到圆圈的相对位置被用于校正该标记的定向。然后从存在于该标记上的编码元素中提取数据。
[0019]对于使用共焦圆圈以及检测共焦二次曲线并用其来校正,意味着标记在其设计上非常受限。基本标志的设计也与可能存在的现有的形状很相似,这意味着处理图像丰富的环境可能会不方便。虽然可以在标记已经受到了一定量的失真时检测该标记,并且该方法可能能够在检测后进行失真补偿以提取编码数据,但是该标记仍易受失真和背景噪声影响。
[0020]本发明寻求通过提供识别和自动图像分组的可替代的和增强的手段
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1