快速图像分类的制作方法

文档序号:6607596阅读:144来源:国知局
专利名称:快速图像分类的制作方法
技术领域
本发明涉及搜索引擎领域,更具体地说,涉及用于分析图像的设备和方法。
背景技术
图像分析可用于许多不同的应用,包括基于内容的图像存储和检索。用户可使用 搜索引擎来搜索计算机中的图像。搜索引擎能以硬件和软件的组合的形式实现。但是,快 速图像分类难以有效、高效且一致地执行,尤其是在实时环境中更是如此
发明内容
根据本发明的一方面,本发明涉及一种方法,包括
获取图像;
将所述图像数字化;
从所述图像的一部分中选择行;
执行对所述行的行扫描;
检索参考扫描;
将所述行扫描与所述参考扫描进行比较;
识别特征;以及
将所述图像分类。
所述行选自所述图像的最上四分位。
所述行选自所述图像的最下四分位。
所述图像包括颜色,并且所述行包括像素。
所述方法还包括显示作为所述行中的位置的函数的每个像素的RGB值。
识别所述特征涉及运用规则。
所述规则是从试验导出的。
所述规则是从建模导出的。
所述规则是从仿真导出的。
根据本发明的另一方面,本发明涉及一种方法,包括
选择图像的一部分;
选择参数的值来描述所述图像的所述部分;以及
识别所述图像中的特征。
所述部分包括最上四分位中的行。
所述部分包括最下四分位中的行。
用户选择所述图像的所述部分。
用户选择所述参数的所述值。
用户选择所述图像中的所述特征。
根据本发明的又一方面,本发明涉及一种设备,包括
图像获取模块,用于获取图像;图像数字化器模块,用于将所述图像数字化;行采样器模块,用于从所述图像的不同部分中选择行;行扫描模块,用于沿所述行执行行扫描;库模块,用于检索参考扫描;扫描比较器模块,用于将所述行扫描与所述参考扫描进行比较;特征识别器模块,用于隔离由所述行扫描所遍历的特征;以及特征分类器模块,用于促进所述图像的快速分类。所述设备还包括图形用户接口。所述设备还包括包含规则的机器可读介质。所述设备还包括用于学习之前的行扫描以识别未来行扫描中的特征的部件。所述部件包括人工智能模块。


图1A-1E示出根据本发明一个实施例包括可识别特征的行扫描。图2示出依据本发明一个实施例的方法。图3示出依据本发明一个实施例的设备。图4示出依据本发明另一个实施例的方法。
具体实施例方式在以下描述中,阐述了众多细节、实例和实施例以充分理解本发明。但是,对于本 领域技术人员来说清楚且显而易见的是,本发明不限于所阐述的细节、实例和实施例,并且 在没有所描述的其中一些特定细节、实例和实施例的情况下也可实践本发明。在其它情况 下,本领域技术人员还将意识到,没有特别描述公知的某些细节、实例和实施例,以免使本 发明晦涩难懂。本发明公开一种用于将图像快速分类的方法和一种快速图像分类器。本发明的一个实施例设想一种用于在执行有限图像分析之后将图像快速分类的 方法。提前确定图像的属性。然后,对图像进行表征、辨识并基于预定义属性进行分类。在 一些情况下,在只扫描图像的很小一部分之后便以高置信度辨识图像。图2示出依据本发明一个实施例的方法。参考图2,在块202,获取图像。在块204, 将所述图像数字化。在块206,从所述图像的一部分中选择行。在块208,执行对所述行的 行扫描。在块210,检索参考扫描。在块212,将所述行扫描与所述参考扫描进行比较。在 块214,识别特征。在块216,将所述图像分类。在一个实施例中,在图2所示的方法中,所述行选自所述图像的最上四分位。依据 另一个实施例,所述行选自所述图像的最下四分位。在该方法的上述实施例的再一个实施 例中,所述图像包括颜色,并且所述行包括像素。依据该方法的又一个实施例,该方法还包 括显示作为所述行中的位置的函数的每个像素的RGB值。依据该方法的上述实施例中的还 有一个实施例,识别所述特征涉及运用规则。其中,所述规则是从试验导出的。依据另一个 实施例,所述规则是从建模导出的。依据再一个实施例,所述规则是从仿真导出的。
在一个实施例中,可按照不同的顺序或次序执行这些块。在另一种实施例中,可以 不执行一些块。在又一种情况下,某些块可执行多次。图4示出依据本发明另一个实施例的方法。参考图4,在块402选择图像的一部 分。在块404,选择参数的值来描述所述图像的所述部分。在块406,识别所述图像中的特 征。依据一个实施例,在图4的方法中,所述部分包括最上四分位中的行。在另一个实 施例中,所述部分最下四分位中的行。依据上述实施例的再一个实施例,其中用户选择所述 图像的所述部分。依据再一个实施例,其中用户选择所述参数的所述值。依据又一个实施 例,其中用户选择所述图像中的所述特征中的至少一个。在一个实施例中,可按照不同的顺序或次序执行这些块。在另一种实施例中,可以 不执行一些块。在又一种情况下,某些块可执行多次。快速图像分类器包括几个模块,包括 ⑴图像获取器模块;⑵图像数字化器模块;⑶行采样器模块;⑷行扫描仪模块;(5)库 归档器模块;(6)扫描比较器模块;(7)特征识别器模块;以及(8)特征分类器模块。例如, 图3示出依据本发明一个实施例的设备300。在一种情况下,按照不同的顺序或次序使用这些模块。在另一种情况下,不使用一 些模块。在又一种情况下,某些模块使用多于一次。第一,图像获取器模块按照一个或多个对象的颜色获取图像。第二,图像数字化器模块将图像数字化为像素行。第三,行采样器模块从图像的一个或多个部分中选择一个或多个行。例如,一个行 各选自第一四分位(例如,图像的最上部分)、第二四分位(quartile)、第三四分位、第四四 分位和第五四分位(例如,图像的最下部分)。第四,行扫描仪模块沿所选行例如从左到右执行行扫描。行扫描的曲线图显示作 为沿χ轴的像素定位或位置(例如,从1到441)的函数的沿y轴的红_绿-蓝(RGB)值 (例如,从0到255)。第五,库归档器模块检索之前存储在档案中的参考扫描。档案包括编入索引并且 可搜索的元数据存储系统。也可将一些或所有新的行扫描存储在档案中以改善参考扫描的 数据库的宽度和深度。第六,扫描比较器模块将行扫描与从库模块中检索的一个或多个参考扫描进行比 较。度量标准可包括行扫描与特定参考扫描的百分比匹配。第七,特征识别器模块隔离图像中的由行扫描所遍历的特征,以便识别特定主题。第八,特征分类器模块可利于或促进图像的快速分类。本发明的一个实施例设想一种供用户创建和编辑用于将图像快速分类的图像辨 识过程的自定义部件。本发明的一个实施例设想一种用于快速图像分类的软件接口,例如图形用户接口 (GUI)。GUI允许用户基于用户感兴趣的图像的类型自定义图像分类。用户使用伪数学语言 来描述表征在每次行扫描中所跟踪的图像中的感兴趣的特征的各种参数。用户选择感兴趣的每个参数的值。这些参数用于限定行扫描的各种特性。一个参数涉及在图像中的“位置”,例如第一四分位(例如最上面)、第二四分位、 第三四分位、第四四分位到第五四分位(例如,最下面)。
另一参数涉及“连续”对“离散”。又一参数涉及“均勻”对“不规则”。再一参数涉及颜色例如红、绿、蓝。然后,用户运用一个或多个规则来从行扫描中提取含义。一些规则是从试验导出 的。其它规则是从建模导出的。还有其它规则是从仿真导出的。本发明的另一实施例设想一种包含规则的机器可读介质。本发明的又一实施例设想一种用于学习之前的行扫描以识别未来行扫描中的特 征的部件。本发明的再一实施例设想一种人工智能模块。作为位置的函数、包括“连续”且“带蓝色” 103的对象10的图像的“最上”部分中 的行扫描可识别为“天空”的一部分。参见图1A。图IA中将颜色示为红101、绿102和蓝 103。作为位置的函数、包括由“连续”且“带蓝色” 103的对象点缀着的“离散”且“灰 白”的对象21的图像的“最上”部分中的行扫描可识别为天空中的“云朵”。参见图1B。图 IB中将颜色示为红201、绿202和蓝203。作为位置的函数、包括“离散”、“均勻”且“带红色”301的对象32的行扫描可识别 为粉色肤色的人“脸”。参见图1C。图IC中将颜色示为红301、绿302和蓝303。作为位置的函数、包括由高基线44隔开的至少一个高且窄的尖状物43的行扫描 可识别为由“间隙”或“空白”隔开的“文本行”或“数据表”。参见图1D。图ID中将颜色示 为红401、绿402和蓝403。尖状物的宽度取决于文本字体的类型、大小和大小写(case)。 文本可包括不同颜色401、402和403。作为位置的函数非常参差不齐且不规则的行扫描可识别为需要进一步分析图像 中的更多行的各种对象的复杂并列。第八,特征分类器模块利于或促进图像的快速分类。
在一种情况下,主题包括例如在自然界户外看到的风景。在另一种情况下,主题包括例如一个或多个人的局部或全部的肖像。在又一种情况下,主题包括幻灯片或箔(foil)的Microsoft PowerPoint演示文 稿。在再一种情况下,主题包括拼贴画。在一种情况下,拼贴画包括图片、图形、表格和 文字的连续放置。在另一种情况下,拼贴画包括图片、图形、表格和文字的重叠放置。图3 示出依据本发明一个实施例的设备300。参考图3,该设备300包括图像获取器模块302 ; 图像数字化器模块304 ;行采样器模块306 ;行扫描模块308 ;库归档器模块310 ;扫描比较 器模块312 ;特征识别器模块314 ;以及特征分类器模块316。在一个实施例中,所述设备是 快速图像分类器等图像分析设备。在一种情况下,按照不同的顺序或次序使用这些模块。在另一种情况下,不使用一 些模块。在又一种情况下,所述模块中一个或多个可使用多于一次。在本发明的一个实施例 中,所述模块中的任一个可以软件和/或硬件和/或固件来实现。虽然图3中示出所述模 块位于所述设备300内部,在一个实施例中,所述模块中的一个或多个可位于所述设备300 外部。
虽然图3中未示出,但依据一个实施例,设备300还可包括图形用户接口。依据另 一个实施例,设备300还可包括包含规则的机器可读介质。依据再一个实施例,设备300还 包括用于学习之前的行扫描以识别未来行扫描中的特征的部件。依据还有一个实施例,例 如所述部件包括人工智能模块。依据一个实施例,设备300可包括上述图形用户接口、所述 机器可读介质和所述部件中的一个或多个。上文阐述了许多实施例和众多细节以便充分理解本发明。本领域技术人员将明 白,一个实施例中的许多特征同样适用于其它实施例。本领域技术人员还将明白,能够对本 文描述的那些特定材料、处理、尺寸、浓度等做出各种等效替换。将了解,本发明的详细描述 应视为是说明性而非限制性的,其中本发明的范围应由随附权利要求确定。
权利要求
一种方法,包括获取图像;将所述图像数字化;从所述图像的一部分中选择行;执行对所述行的行扫描;检索参考扫描;将所述行扫描与所述参考扫描进行比较;识别特征;以及将所述图像分类。
2.如权利要求1所述的方法,其中所述行选自所述图像的最上四分位和所述图像的最 下四分位中的至少一个。
3.如权利要求1或2所述的方法,其中所述图像包括颜色,并且所述行包括像素。
4.如权利要求3所述的方法,还包括显示作为所述行中的位置的函数的每个像素的 RGB 值。
5.如权利要求1或2所述的方法,其中识别所述特征涉及运用规则。
6.如权利要求5所述的方法,其中所述规则是从试验、建模和仿真中的一个导出的。
7. 一种方法,包括 选择图像的一部分;选择参数的值来描述所述图像的所述部分;以及 识别所述图像中的特征。
8.如权利要求7所述的方法,其中所述部分包括最上四分位和最下四分位的至少一个 中的行。
9.如权利要求8所述的方法,其中用户选择所述图像的所述部分、所述参数的所述值 和所述图像中的所述特征中的至少一个。
10. 一种设备,包括图像获取模块,用于获取图像; 图像数字化器模块,用于将所述图像数字化; 行采样器模块,用于从所述图像的不同部分中选择行; 行扫描模块,用于沿所述行执行行扫描; 库模块,用于检索参考扫描;扫描比较器模块,用于将所述行扫描与所述参考扫描进行比较; 特征识别器模块,用于隔离由所述行扫描所遍历的特征;以及 特征分类器模块,用于促进所述图像的快速分类。
全文摘要
本发明公开一种方法,该方法包括获取图像;将图像数字化;从图像的一部分中选择一个或多个行;执行对所选行的行扫描;检索参考扫描;将行扫描与参考扫描进行比较;识别特征;以及将图像分类。
文档编号G06F17/30GK101989298SQ20101025198
公开日2011年3月23日 申请日期2010年7月29日 优先权日2009年7月29日
发明者R·L·沃恩 申请人:英特尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1