基于级联过完备字典的图像识别系统的制作方法

文档序号:6359431阅读:123来源:国知局
专利名称:基于级联过完备字典的图像识别系统的制作方法
技术领域
本发明大体上涉及信号处理,且更明确来说,涉及一种用于基于级联库集合的图像识别的方法,所述方法用于提取特征并以不同重新构造级别构建图像的表示。
背景技术
在图像识别中,可利用作为库集合的过完备字典来表示并重新构造图像。所述字典可经优化以包含一组较大的库,但所述字典通常仅使用一群较小的库来重新构造特定图像。因此,所述表示通常是稀疏的。为了对图像进行分类,需要使字典含有来自不同类别的有区别特征,使得稀疏表示将指示类别标签。然而,图像通常可包括一般特征和类别特定特征两者。因此,对于基于通过重新构造方案进行的识别的图像识别系统,需要使字典不仅拥有用于分类目的的区别能力,而且拥有用于容错的重新构造能力。

发明内容
本发明的某些实施例提供一种用于信号处理的方法。所述方法通常包含获得与一个或一个以上主题或种类相关的一个或一个以上信号;基于所述信号来构造所述主题的一个或一个以上一般特征;从所述信号提取并移除所述一般特征以获得每一主题的一个或一个以上已更新图案;基于所述已更新图案来获得每一主题的一组有区别特征;以及仅使用有区别特征来识别所述已更新图案。本发明的某些实施例提供一种用于信号处理的方法。所述方法通常包含获得与多个主题中的一主题相关的图像;基于一般字典来重新构造所述图像的一个或一个以上一般特征,所述一般字典包括所有所述主题或种类的一般信息;以及重新构造一般特征被重新构造并移除的所述图像以使用有区别字典来识别所述主题,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。本发明的某些实施例提供一种用于信号处理的设备。所述设备通常包含用于获得与一个或一个以上主题或种类相关的一个或一个以上信号的装置;用于基于所述信号来构造所述主题的一个或一个以上一般特征的装置;用于从所述信号提取并移除所述一般特征以获得每一主题的一个或一个以上已更新图案的装置;用于基于所述已更新图案来获得每一主题的一组有区别特征的装置;以及用于仅使用有区别特征来识别所述已更新图案的
>J-U装直。
本发明的某些实施例提供一种用于信号处理的设备。所述设备通常包含用于获得与多个主题中的一主题相关的图像的装置;用于基于一般字典来重新构造所述图像的一个或一个以上一般特征的装置,所述一般字典包括所有所述主题或种类的一般信息;以及用于重新构造一般特征被重新构造并移除的所述图像以使用有区别字典来识别所述主题的装置,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。本发明的某些实施例提供一种用于信号处理的设备。所述设备通常包含至少一个处理器,所述至少一个处理器经配置以获得与一个或一个以上主题或种类相关的一个或一个以上信号;基于所述信号来构造所述主题的一个或一个以上一般特征;从所述信号提取并移除所述一般特征以获得每一主题的一个或一个以上已更新图案;基于所述已更新图案来获得每一主题的一组有区别特征;以及仅使用有区别特征来识别所述已更新图案。
本发明的某些实施例提供一种用于信号处理的设备。所述设备通常包含至少一个处理器,所述至少一个处理器经配置以获得与多个主题中的一主题相关的图像;基于一般字典来重新构造所述图像的一个或一个以上一般特征,所述一般字典包括所有所述主题或种类的一般信息;以及重新构造一般特征被重新构造并移除的所述图像以使用有区别字典来识别所述主题,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。本发明的某些实施例提供一种计算机程序产品,所述计算机程序产品包括存储有指令的计算机可读存储媒体。所述指令通常可由处理器执行以获得与一个或一个以上主题或种类相关的一个或一个以上信号;基于所述信号来构造所述主题的一个或一个以上一般特征;从所述信号提取并移除所述一般特征以获得每一主题的一个或一个以上已更新图案;基于所述已更新图案来获得每一主题的一组有区别特征;以及仅使用有区别特征来识别所述已更新图案。本发明的某些实施例提供一种计算机程序产品,所述计算机程序产品包括存储有指令的计算机可读存储媒体。所述指令通常可由处理器执行以获得与多个主题中的一主题相关的图像;基于一般字典来重新构造所述图像的一个或一个以上一般特征,所述一般字典包括所有所述主题或种类的一般信息;以及重新构造一般特征被重新构造并移除的所述图像以使用有区别字典来识别所述主题,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。


为了可详细地理解本发明的上述特征,可通过参考实施例来作出上文简要地概括的更特定描述,所述实施例中的一些实施例在附图中得以说明。然而,应注意,附图仅说明本发明的某些典型实施例且因此不应被视为限制本发明的范围,这是因为所述描述可准许其它同等有效的实施例。图I说明其中可实践本发明的某些实施例的图案识别系统。图2说明根据本发明的某些实施例的与图案库建立接口连接的图案识别引擎的实例。图3说明根据本发明的某些实施例的用于将字典训练为库集合以用于图像重新构造的实例操作。图3A说明能够执行图3所示的操作的实例组件。图4说明根据本发明的某些实施例的用于基于经训练级联字典的图像重新构造和识别的实例操作。 图4A说明能够执行图4所示的操作的实例组件。
具体实施例方式下文描述本发明的各种实施例。应明白,本文的教示可以各种各样的形式进行体现,且本文所揭示的任何特定结构、功能或其两者仅是代表性的。基于本文的教示,所属领域的技术人员应了解,本文所揭示的实施例可独立于任何其它实施例而实施,且这些实施例中的两者或两者以上可以各种方式进行组合。举例来说,通过使用本文所陈述的任何数目个实施例可实施设备或可实践方法。另外,通过使用除了本文所陈述的实施例中的一者或一者以上之外或不同于本文所陈述的实施例中的一者或一者以上的其它结构、功能性或结构和功能性可实施此设备或可实践此方法。此外,实施例可包括权利要求书的至少一个元素。词语“示范性”在本文中用于意味着“充当实例、例子或说明”。在本文中被描述为“示范性”的任何实施例未必被解释为比其它实施例优选或有利。尽管本文描述了特定实施例,但这些实施例的许多变化和排列属于本发明的范围。尽管提到了优选实施例的一些益处和优点,但本发明的范围不意在限于特定益处、用途或目的。而是,本发明的实施例意在广泛地适用于不同无线技术、系统配置、网络和传输协议,其中的一些实施例是作为实例而在图中以及在优选实施例的以下描述中得以说明。详细描述和图式仅说明本发明,而不是限制由所附权利要求书及其等效者界定的本发明的范围。实例图案识别系统本文所描述的技术涉及信号处理,且更明确来说,涉及与需要被识别的主题相关的图案的处理。图I说明其中可实践本发明的实施例的用于图案识别的实例系统100。图案识别系统100可用于识别不同图案或信号,例如用于主题识别的图像或用于语音识别的音频信号。系统100可用于广范的应用中,所述应用包含安全应用(例如,在机场和办公楼中),且系统100可实施在广范的不同类型的平台上,例如桌上型计算机、膝上型计算机,或手持式装置(例如,移动电话)上。根据本发明的某些实施例,输入平台120可包含审查站126,借此,相机122可提供对应于主题的图像的信号;和/或麦克风124,其可提供对应于人类的语音的信号。举例来说,审查站126可定位在安全检查点处,例如在机场或建筑物入口中所见到的安全检查点处。虽然将平台120展示为具有相机122和麦克风124两者,但根据某些实施例,可仅包含此类装置中的一者。另外,还可使用额外或替代装置,例如指纹读取器、虹膜读取器等等。无论使用什么装置或装置组合,图案识别系统100均可经配置以基于已接收信号来标识图案。
图案识别系统100可包含接口 104以接收并处理输入信号。接口 104可包含任何合适电路,例如放大器、滤波器、模-数(A/D)转换器等等,以为一个或一个以上处理器102提供合适图案信号。处理器102可根据由存储器108内的识别引擎110起始以供执行的某一识别算法来处理输入图案信号。可例如通过使输入图案信号(例如,图像或语音)同与多个主题相关联的可用图案库106匹配来实现图案识别。如图2中所说明,识别引擎110可与图案库106建立接口连接。举例来说,识别引擎110可在训练操作期间产生并更新图案库106。图案库可经存取以执行识别操作。换句话说,输入图案(例如,图像或语音)可根据识别算法加以处理以用于主题识别,所述识别算法可由识别引擎110通过使用从图案库106的池中检索的一个或一个以上图案库来运行。此外,可在训练过程期间周期性地更新与现有主题相关的图案库,且也可将与一个或一 个以上新主题相关联的一个或一个以上图案库添加在图案库106的池中。用于稀疏表示和分类的级联字典可在图案识别系统100中利用作为图案库集合的过完备字典,以便表示并重新构造图像。在本发明的某些实施例中,可在不同图像重新构造级别上应用字典。可学习并优化在特定级别上的每一字典以达到捕获一般特征或有区别特征的目的。通过经由用于不同重新构造级别的级联字典查找稀疏表示,可重新构造并识别图像。应注意,处于较低重新构造级别的字典可用于重新构造更一般的特征,而较高级别的字典可专用于更有区别的特征。而且,可通过添加处于较低重新构造级别的一个或一个以上级联字典来增加使用在顶部重新构造级别上的有区别字典的表示的稀疏度,以便改善分类性能。在具有级联字典的图像识别系统中,重新构造一般(即,类别无关)信息和有区别(即,类别有关)信息可被分离。可分离地学习并优化在特定重新构造级别上的每一字典以达到捕获一般特征或有区别特征的目的。在最低重新构造级别上,字典可从所有受支持类别捕获图像的统计。因此,可经由字典更新而发展的库可表示跨越所有类别的共同特征。处于特定较低重新构造级别的具有一般特征的此字典可能能够由达到相同程度的任何类别重新构造图像。剩余信号(如由已重新构造信号从此字典减去的输入信号)可保持由字典在稍后的较高重新构造阶段时重新构造。在最高图像重新构造级别上,可从输入图像提取并减去所有一般特征。剩余信号可用于构造具有类别特定的有区别特征的字典。在此级别上的字典可包括对应于不同类别的子空间。子空间可从一个单一类别捕获图像的统计,且子空间中的库可表示使所述库与图像类别的其余部分区分开的特征。以此方式,当已构造图像是来自一个子空间所表示的类别时,所述子空间可比其它子空间好。因此,当使用此字典时的解决方案可为稀疏的。来自不同子空间的不同重新构造级别可指示正被重新构造的特定图像属于哪一类别。依据图像的复杂性和分类的困难度,可在中等重新构造级别中添加一个或一个以上字典,在中等重新构造级别中所述字典可表示较不一般而更有区别的特征,以便增加在顶部重新构造级别上的表示的稀疏度。图3说明根据本发明的某些实施例的用于将级联字典训练为库集合以用于图像重新构造和主题识别的实例操作300。在302处,可提供N个主题以用于训练字典,其中每一主题可包括一个或一个以上训练图像。在304处,可使用来自所有N个主题的训练图像来训练字典。经训练字典可包括与所有主题相关的一组最一般的特征,且经训练字典可用作与初始图像重新构造级别相关联的一般字典。此后,在306处,可从所有输入图像减去使用所述一组一般特征而获得的已重新构造图像,以获得不具有这些一般特征的已更新训练图案。在308处,可任选地使用一般特征被重新构造并移除的剩余图像来评估一般重新构造的质量。如果质量不令人满意,那么可进一步构造一个或一个以上级联的一般字典。因此,如果质量不令人满意,那么可任选地重复操作304到306达多次以获得级联的一般字典,对于一不同图像重新构造级别有一个一般字典。将在304处基于不具有先前所查找的一般特征的图案而构造的特征对于每个次更高的重新构造级别可能较不一般。因此,对应的经训练字典对于每个次更高的重新构造级别可能包括较不一般且更有区别的特征。在306处从输入图像提取所有剩余的一般特征之后,接着可训练与主题的有区别特征相关的一个或一个以上有区别字典。
此时,用于每一主题的输入图案可仅包括对应原始输入图像的有区别特征。在310处,可基于不具有一般特征的输入图案针对N个主题中的每一者获得一组有区别特征,这可产生具有N个子字典的有区别字典,每一子字典可与一不同主题相关联。在测试阶段中,可首先由较低级别的字典来处理并重新构造图像。可由顶部级别的有区别且类别相关的字典来重新构造剩余信号。可通过查找哪一子字典对于重新构造输入信号最好来识别主题。此有区别字典可对应于最高重新构造级别,且此有区别字典可包括与N个主题相关的最有区别的特征。依据图像的复杂性和其分类的困难度,在应用具有最有区别的特征的字典之前,可训练具有较没有区别的特征的一个或一个以上字典且在图像重新构造中包含所述一个或一个以上字典。图4说明根据本发明的某些实施例的用于基于先前所训练的级联字典(即,处于不同重新构造级别的库集合)来重新构造与主题相关的图像的实例操作400。在402处,可首先使用一般字典中的先前所提取的一般特征来执行测试图像的重新构造。在404处,可基于应用在一般特征被移除的图像上的N个先前所训练的有区别子字典(即,多组有区别特征)来执行图像的重新构造和主题的识别,其中每一子字典可对应于待识别的一个可能主题。所有子字典可为可与最高图像重新构造级别相关联的经训练的有区别字典的部分。如上文所提到,依据图像的复杂性和其分类的困难度,在应用具有最有区别的特征的字典之前,可使用具有较没有区别的特征的一个或一个以上字典,以便增加在顶部重新构造级别上的表示的稀疏度。可将基于重新构造技术的所提出的图像分类器与来自此项技术的现有判别分类器进行比较(当此两种技术均应用于同一图案识别时)。一方面,本发明的学习理论支持判别分类器的使用,所述判别分类器即为例如支持向量机(SVM)等大裕度分类器。而且,存在对这些分类器的一般化误差的更严格理解。另一方面,在使用所提出的重新构造模型进行图案识别时存在某些优点,例如扩展性和容错。通过使用较少数目个库来表示整个图像,所提出的技术可在类别数目和每类别的训练样本数目方面实现有利扩展性。此外,可将在图案识别中所观测的许多误差模型化为相加误差。可在所提出的重新构造模型中容易地移除或校正这些误差。
可由对应于图所说明的装置加功能框的各种硬件和/或软件组件和/或模块来执行上文所描述的方法的各种操作。举例来说,图3所说明的框302到310对应于图3A所说明的装置加功能框302A到310A。相似地,图4所说明的框402到404对应于图4A所说明的装置加功能框402A到404A。更一般来说,在图所说明的方法具有对应的对应物装置加功能图的情况下,操作框对应于具有相似编号的装置加功能框。如本文所使用,术语“确定”涵盖各种各样的动作。举例来说,“确定”可包含推算、计算、处理、导出、研究、查找(例如,在表、数据库或另一数据结构中查找)、断定等等。而且,“确定”可包含接收(例如,接收信息)、存取(例如,存取存储器中的数据)等等。而且,“确定”可包含解析、选择、挑选、建立等等。如本文所使用,涉及项目列表中的“至少一者”的短语指代那些项目的任何组合,包含单成员。作为实例,“a、b或c中的至少一者”意在涵盖a、b、c、a-b、a-c、b_c和a_b_c。上文所描述的方法的各种操作可由能够执行所述操作的任何合适装置(例如,各种硬件和/或软件组件、电路和/或模块)执行。通常,图所说明的任何操作可由能够执行所述操作的对应功能装置执行。可使用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其它可编程逻辑装置(PLD)、离散门或晶体管逻辑、离散硬件组件或其经设计以执行本文所描述的功能的任何组合来实施或执行结合本发明而描述的各种说明性逻辑块、模块和电路。通用处理器可为微处理器,但在替代方案中,处理器可为任何市售处理器、控制器、微控制器或状态机。处理器还可被实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器,或任何其它此类配置。结合本发明而描述的方法或算法的步骤可直接以硬件、以由处理器执行的软件模块或以此两者的组合进行体现。软件模块可驻留于此项技术中已知的任何形式的存储媒体中。可使用的存储媒体的一些实例包含随机存取存储器(RAM)、只读存储器(ROM)、快闪存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸磁盘、CD-ROM等等。软件模块可包括单一指令或许多指令,且可分布在若干不同码段上、分布在不同程序当中且跨越多个存储媒体而分布。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息及将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。本文所揭示的方法包括用于实现所描述的方法的一个或一个以上步骤或动作。在不脱离权利要求书的范围的情况下,方法步骤和/或动作可彼此互换。换句话说,除非指定了步骤或动作的特定次序,否则在不脱离权利要求书的范围的情况下,可修改特定步骤和/或动作的次序和/或用途。所描述的功能可以硬件、软件、固件或其任何组合实施。如果以软件实施,那么可将所述功能作为一个或一个以上指令存储在计算机可读媒体上。存储媒体可为可由计算机存取的任何可用媒体。作为实例而非限制,此类计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用于运载或存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。如本文所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及Bhi-ray".光盘,其中磁盘通常以磁性方式复制数据,而光盘使用激光以光学方式复制数据。、
因此,某些实施例可包括用于执行本文所呈现的操作的计算机程序产品。举例来说,此计算机程序产品可包括存储有(和/或编码有)指令的计算机可读媒体,所述指令可由一个或一个以上处理器执行以执行本文所描述的操作。对于某些实施例,计算机程序产品可包含封装材料。也可经由传输媒体来传输软件或指令。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或无线技术(例如,红外线、无线电及微波)从网站、服务器或其它远程源传输软件,那么同轴电缆、光 纤电缆、双绞线、DSL或无线技术(例如,红外线、无线电及微波)包含在传输媒体的定义中。另外,应了解,用于执行本文所描述的方法和技术的模块和/或其它适当装置可在适用时由用户终端和/或基站下载和/或以其它方式获得。举例来说,可将此装置耦合到服务器以促进传送用于执行本文所描述方法的装置。或者,可经由存储装置(例如,RAM、ROM、例如压缩光盘(CD)或软盘等等物理存储媒体等等)来提供本文所描述的各种方法,使得用户终端和/或基站可在将存储装置耦合或提供到所述装置后即获得所述各种方法。此夕卜,可利用用于将本文所描述的方法及技术提供到一装置的任何其它合适技术。应理解,权利要求书不限于上文所说明的精确配置及组件。在不脱离权利要求书的范围的情况下,可在上文所描述的方法和设备的布置、操作和细节方面作出各种修改、改变和变化。虽然前述内容是针对本发明的实施例,但在不脱离本发明的基本范围的情况下,可设计出本发明的其它及另外实施例,且由所附权利要求书确定本发明的范围。
权利要求
1.一种用于信号处理的方法,其包括 获得与一个或一个以上主题相关的一个或一个以上信号; 基于所述信号来提取所述主题的一个或一个以上一般特征; 从所述信号中移除所述一般特征以获得每一主题的一个或一个以上已更新图案;以及 基于所述已更新图案来获得每一主题的一组有区别特征。
2.根据权利要求I所述的方法,其进一步包括 基于所有所述主题的所述多组有区别特征来识别所述主题。
3.根据权利要求I所述的方法,其进一步包括 基于所述一般特征来训练字典以用于识别所述主题,其中所述字典将被应用于所述识 别的初始阶段中。
4.根据权利要求I所述的方法,其进一步包括 基于所述一般特征来训练字典以用于识别所述主题,其中所述字典将被应用于所述识别的多个阶段中的规定阶段中。
5.根据权利要求I所述的方法,其进一步包括 基于所述多组有区别特征来训练包括多个子字典的字典,每一子字典包括所述多组有区别特征中的一组有区别特征,且其中所述字典用于在所述识别的多个阶段中的规定阶段中识别所述主题。
6.一种用于信号处理的方法,其包括 获得与多个主题中的一主题相关的图像; 基于一般字典来重新构造所述图像的一个或一个以上一般特征,所述一般字典包括所述多个主题的一般信息;以及 使用所述已重新构造的一般特征来重新构造所述图像以基于有区别字典来识别所述主题,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。
7.根据权利要求6所述的方法,其进一步包括 基于另一字典使用具有已重新构造的一般特征的所述图像来重新构造一个或一个以上其它特征,所述字典与所述一般字典相比包括更有区别的信息,且与所述有区别字典相比包括较没有区别的信息;以及 使用所述已重新构造的其它特征基于所述有区别字典来重新构造所述图像。
8.根据权利要求6所述的方法,其进一步包括 在应用所述有区别字典之前从所述图像提取所述已重新构造的一般特征。
9.根据权利要求6所述的方法,其中所述一般字典捕获与所述主题相关联的所述图像的统计。
10.一种用于信号处理的设备,其包括 用于获得与一个或一个以上主题相关的一个或一个以上信号的装置; 用于基于所述信号来提取所述主题的一个或一个以上一般特征的装置; 用于从所述信号中移除所述一般特征以获得每一主题的一个或一个以上已更新图案的装置;以及 用于基于所述已更新图案来获得每一主题的一组有区别特征的装置。
11.根据权利要求10所述的设备,其进一步包括 用于基于所有所述主题的所述多组有区别特征来识别所述主题的装置。
12.根据权利要求10所述的设备,其进一步包括 用于基于所述一般特征来训练字典以用于识别所述主题的装置,其中所述字典将被应用于所述识别的初始阶段中。
13.根据权利要求10所述的设备,其进一步包括 用于基于所述一般特征来训练字典以用于识别所述主题的装置,其中所述字典将被应用于所述识别的多个阶段中的规定阶段中。
14.根据权利要求10所述的设备,其进一步包括 用于基于所述多组有区别特征来训练包括多个子字典的字典的装置,每一子字典包括所述多组有区别特征中的一组有区别特征,且其中所述字典用于在所述识别的多个阶段中的规定阶段中识别所述主题。
15.一种用于信号处理的设备,其包括 用于获得与多个主题中的一主题相关的图像的装置; 用于基于一般字典来重新构造所述图像的一个或一个以上一般特征的装置,所述一般字典包括所述多个主题的一般信息;以及 用于使用所述已重新构造的一般特征来重新构造所述图像以基于有区别字典来识别所述主题的装置,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。
16.根据权利要求15所述的设备,其进一步包括 用于基于另一字典使用具有已重新构造的一般特征的所述图像来重新构造一个或一个以上其它特征的装置,所述字典与所述一般字典相比包括更有区别的信息,且与所述有区别字典相比包括较没有区别的信息;以及 用于使用所述已重新构造的其它特征基于所述有区别字典来重新构造所述图像的装置。
17.根据权利要求15所述的设备,其进一步包括 用于在应用所述有区别字典之前从所述图像提取所述已重新构造的一般特征的装置。
18.根据权利要求15所述的设备,其中所述一般字典捕获与所述主题相关联的所述图像的统计。
19.一种用于信号处理的设备,其包括 至少一个处理器,其经配置以基于信号来提取主题的一个或一个以上一般特征;从所述信号中移除所述一般特征以获得每一主题的一个或一个以上已更新图案;以及基于所述已更新图案来获得每一主题的一组有区别特征;以及 存储器,其与所述至少一个处理器耦合。
20.根据权利要求19所述的设备,其中所述至少一个处理器经进一步配置以 基于所有所述主题的所述多组有区别特征来识别所述主题。
21.根据权利要求19所述的设备,其中所述至少一个处理器经进一步配置以 基于所述一般特征来训练字典以用于识别所述主题,其中所述字典将被应用于所述识别的初始阶段中。
22.根据权利要求19所述的设备,其中所述至少一个处理器经进一步配置以 基于所述一般特征来训练字典以用于识别所述主题,其中所述字典将被应用于所述识别的多个阶段中的规定阶段中。
23.根据权利要求19所述的设备,其中所述至少一个处理器经进一步配置以 基于所述多组有区别特征来训练包括多个子字典的字典,每一子字典包括所述多组有区别特征中的一组有区别特征,且其中所述字典用于在所述识别的多个阶段中的规定阶段中识别所述主题。
24.一种用于信号处理的设备,其包括 至少一个处理器,其经配置以获得与多个主题中的一主题相关的图像;基于一般字典来重新构造所述图像的一个或一个以上一般特征,所述一般字典包括所述多个主题的一般信息;以及使用所述已重新构造的一般特征来重新构造所述图像以基于有区别字典来识别所述主题,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联;以及 存储器,其与所述至少一个处理器耦合。
25.根据权利要求24所述的设备,其中所述至少一个处理器经进一步配置以 基于另一字典使用具有已重新构造的一般特征的所述图像来重新构造一个或一个以上其它特征,所述字典与所述一般字典相比包括更有区别的信息,且与所述有区别字典相比包括较没有区别的信息;以及 使用所述已重新构造的其它特征基于所述有区别字典来重新构造所述图像。
26.根据权利要求24所述的设备,其中所述至少一个处理器经进一步配置以 在应用所述有区别字典之前从所述图像提取所述已重新构造的一般特征。
27.根据权利要求24所述的设备,其中所述一般字典捕获与所述主题相关联的所述图像的统计。
28.一种用于信号处理的计算机程序产品,所述计算机程序产品包括存储有指令的计算机可读存储媒体,所述指令可由处理器执行以 获得与一个或一个以上主题相关的一个或一个以上信号; 基于所述信号来提取所述主题的一个或一个以上一般特征; 从所述信号中移除所述一般特征以获得每一主题的一个或一个以上已更新图案;以及 基于所述已更新图案来获得每一主题的一组有区别特征。
29.一种用于信号处理的计算机程序产品,所述计算机程序产品包括存储有指令的计算机可读存储媒体,所述指令可由处理器执行以 获得与多个主题中的一主题相关的图像; 基于一般字典来重新构造所述图像的一个或一个以上一般特征,所述一般字典包括所述主题的一般信息;以及 使用所述已重新构造的一般特征来重新构造所述图像以基于有区别字典来识别所述主题,所述有区别字典包括一组或一组以上有区别特征,每一组与所述多个主题中的一不同主题相关联。
全文摘要
本发明的某些实施例涉及一种用于图像重新构造的技术,所述技术使用级联过完备字典(即,库集合)来提取特征并以不同重新构造级别构建图像的表示。可学习并优化不同重新构造级别上的每一字典以达到捕获一般特征或有区别特征的目的。通过经由所述级联字典查找出稀疏表示,可重新构造并识别图像。
文档编号G06K9/62GK102741861SQ201180007840
公开日2012年10月17日 申请日期2011年2月1日 优先权日2010年2月1日
发明者托马斯·郑, 柳荫荫, 维克托·H·陈 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1