基于生物视觉机理的物体训练和识别方法

文档序号:6600303阅读:458来源:国知局
专利名称:基于生物视觉机理的物体训练和识别方法
技术领域
本发明涉及模式识别,特别涉及基于视觉神经机理的目标识别。
背景技术
目前,计算机视觉系统与人眼视觉系统仍存在着巨大的差异。科学家常以“过马 路”这个简单的视觉任务为例来说明这一点。现代高速计算机的计算能力已达到相当惊人 的程度,但计算机视觉系统却依然无法指导盲人过马路。很多研究者都将注意力集中在基 于统计学习等传统方法上,而忽略了一个事实人类视觉系统大大超过了当前最优秀的基 于统计学习的计算机视觉系统。因此,借鉴人眼视觉系统特性去研究计算机视觉中的相关问题日益变得迫切和必要。基于以上考虑,我们提出了一种基于生物视觉机理的物体训练和识别方法。传统的物体训练和识别技术大部分是从机器学习的角度入手,从原始输入图像提 取特征后,送入分类器进行模型构建,最后对新来样本进行分类。这些方法强调模型的鲁棒 性,却忽略了生物视觉系统中的两个重要特点1)生物视觉系统并不是对原始图像中提取 的特征进行建模,而是先对原始图像进行复杂但快速的变换,然后再提取特征。2)训练结果 对模型具有反馈作用。传统的物体训练和识别技术在一些较复杂的情况下遇到了较大的挑战,比如,当目标发生位置变化、尺度变化、形状变化、颜色变换时,目标识别的成功率大大降低。

发明内容
为了解决现有技术存在的问题,本发明的目的是提供一种基于生物视觉神经机理 的物体训练和识别方法。根据本发明的一方面,一种基于生物视觉机理的物体训练方法,包括步骤步骤S11,对训练图像进行Gabor滤波操作,生成各种尺度下的Sl图像;步骤S12,对Sl图像进行梯度滤波的稀疏化操作,生成图像的稀疏表达;步骤S13,对Sl的稀疏表达进行降采样操作生成Cl ;步骤S14,对Cl图像进行滤波操作,滤波卷积子随机采样于所有训练样本的Cl图 像,生成S2图像;步骤S15,对S2图像进行求最大值操作,生成C2 ;步骤S16,用C2作为特征向量送入支持向量机SVM分类器。根据本发明的另一方面,一种基于生物视觉机理的物体识别方法,包括步骤步骤S21,对训练图像进行Gabor滤波操作,生成各种尺度下的Sl图像;步骤S22,对Sl图像进行梯度滤波的稀疏化操作,生成图像的稀疏表达;步骤S23,对Sl的稀疏表达进行降采样操作生成Cl ;步骤S24,对Cl图像进行滤波操作,滤波卷积子随机采样于所有训练样本的Cl图 像,生成S2图像;
步骤S25,对S2图像进行求最大值操作,生成C2 ;步骤S26,用C2作为特征向量送入支持向量机SVM分类器,根据SVM模型判断测试 图像类别。根据本发明的方法,图像目标在复杂的情况下,仍然可以鲁棒的达到识别的目的。 在智能视觉监控系统中,帮助监控系统识别场景中目标的类别,使得监控系统能真正理解 场景中正在发生什么,而且可以根据不同的目标类别采取不同的安全级别。对多媒体数字 内容分析中的目标进行分析,判断目标的类别。


图1是基于生物视觉神经机理的物体训练和识别系统框图;图2是稀疏化限制的示意图;图3是反馈控制的示意图。
具体实施例方式下面结合附图详细说明本发明技术方案中所涉及的各个细节问题。应指出的是, 所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。基于生物视觉神经机理,本发明实现了一个物体训练和识别系统。如图1示出基 于生物视觉神经机理的物体训练和识别方法的流程框图,包括训练和识别两个部分所述的训练过程包括步骤对已经标好类别的物体图像列进行特征提取,对提取 的特征进行训练并建模。所述的识别过程包括步骤对含有新来的图像进行特征提取,将提取的特征输入 到步骤Sl训练得到的模型,获得新来图像的类别。下面对本发明的方法涉及的关键步骤进行逐一详细说明,具体形式如下所述首先,对图像进行进行Gabor滤波操作,生成Sl Gabor滤波器与哺乳动物的视觉神经皮的简单细胞的功能非常相似,在图像处 理中,它具有较好的方向和频率选择性。所以我们采用Gabor滤波对输入图像进行处理。
Gabot滤波器的数学表达方式如公式(1)和公式(2)所表示
2 2 2 -X。 +厂少。 2π L0032」= exp(---) x cos(——χ )n )
2σ义 ’x0 = xcos θ +ysin θ , y0 = -xsin θ +ycos θ,(2)其中,χ和y的取值范围由Gabor滤波器的尺寸所决定。θ控制Gabor滤波器的 方向。通过Gabor滤波时候,生成的Sl图像与输入的图像大小一样。其二,对Sl图像进行稀疏化控制,生成Sl图像的稀疏化表达I Fx(i) I +(a)丨 + 丨 Fyw I),(3)
n k = \其中,FjJPFy分别指水平和竖直方向的梯度;11是51图像中像素点的个数;a控制 是稀疏化的程度。采用不同的α会得到不同程度的稀疏化图像表达,参见图2。其三,对Sl的稀疏表达进行降采样操作生成Cl。在该降采样操作中,对每一个局部区域都只保留其最大像素点及其周围四个像素点的和,具体操作为 其中,c对应视觉神经中复杂细胞的响应,s(Xi,yi)对应视觉神经中第i个细胞的 响应,I。表示局部区域的范围(是一个预先定义的参数),m是局部区域中的最大响应,Uffl 是指最大响应点的领域(最大像素点周围的四个像素点)。其四,对Cl图像进行滤波操作,滤波卷积子随机采样于所有训练样本的Cl图像, 生成S2图像。其五,对S2进行求最大值操作,即对每一张S2图像,只保留其最大像素点,生成 C2 (C2特征向量)。其六,把C2特征向量送入SVM分类器中,构造分类器模型。每一个图像块对应一 个SVM模型,所有的SVM模型的权重是根据其分类结果的反馈而确定的,即分类结果越好, 其权重越大。所有SVM模型的加权输出构成了最终的分类结果。其示意图如图3所示。实施例整个基于生物视觉神经机理的物体训练和识别方案主要包含训练和识别两个过 程,为了详细说明该发明的具体实施方式
,以某一个监控场景中行人检测系统为例说明。这 个系统可以判断监控场景是否含有行人。训练的目的是学习行人的特征。首先我们要收集大量行人图像和非行人图像,这 些图像用于训练行人识别模型。训练步骤Si如下步骤Sll 对2OOO张行人图像(正样本)和2OOO张非行人图像(副样本)进行 Gabor滤波操作(参见公式(1)、(2)),生成Sl图像4000张。步骤S12 对4000张Sl图像进行梯度滤波的稀疏化操作(参见公式(3)),生成图 像的稀疏表达。步骤S13 对4000张Sl图像的稀疏表达进行降采样操作生成4000张Cl图像(参 见公式(4))。在该降采样操作中,对每一个局部区域都只保留其最大像素点及其周围四个 像素点的和。步骤S14 每一张Cl图像与多个(比如1000个)滤波卷积子进行滤波操作,滤波 卷积子随机采样于所有训练样本的Cl图像,每一张Cl图像生成1000张S2图像。步骤S15 对每一张S2图像进行求最大值操作,即只保留S2图像中每一张图像的 最大像素值,生成1000个C2。步骤S16 :S14中的每一个图像滤波卷积子对应一个SVM分类模型,根据这些SVM 模型在训练集上的表现来进行反馈(参见图3)。具体操作为每一个图像滤波卷积子与所 有的4000张Cl图像卷积后会生成4000个C2值(正副样本各2000个),将这4000个C2 值送入支持向量机(SVM)分类器进行训练,生成一个SVM模型。所以1000个图像滤波卷 积子就会生成1000个SVM模型。反馈过程中,在训练集上表现最好的多个(比如100个、 200个或300个)SVM模型会被留下来,其他SVM模型会被删除。同时每一个SVM模型的权 重正比于该SVM模型在训练样本上分类正确率,比如分类正确率为80 %,则该SVM的权重为 0. 8。在识别阶段,将摄像头信号通过采集卡接入计算机,初始阶段的处理跟训练阶段的Sll至S15 —致,然后将C2特征输入到训练阶段所得的基于支持向量机的模型进行分 类,输出分类结果。具体识别步骤如下步骤S21 输入一张测试图像,对其进行Gabor滤波操作,生成Sl图像。步骤S22 对Sl图像进行梯度滤波的稀疏化操作,生成Sl图像的稀疏表达。步骤S23 对Sl的稀疏表达进行降采样操作生成Cl。在该降采样操作中,对每一 个局部区域都只保留其最大像素点及其周围四个像素点的和。步骤S24 对Cl图像进行滤波操作,图像滤波子来自S16中选出来的100个(或 200个、300个)SVM模型所对应的100个图像滤波子,生成100张S2图像。步骤S25 对100张S2图像进行求最大值操作,即只保留S2图像中每一张图像的最大像素值,生成100个C2值。步骤S26 用100个C2值分别送入S16中得到的100个SVM模型(一个C2输入 给对应的SVM模型),判断测试图像类别(含有行人还是不含有行人)。具体判断规则是 如果这100个分类器模型输出值的加权和大于某个预先定义的阈值,则认为含有行人,否 则认为不含有行人。总之,本发明提出了一种有效的于生物视觉神经机理的物体训练和识别方案。本发明易于实现、性能稳定。本发明能够提高智能监控系统对监控场景的理解能力,是下一代智能监控系统里的关键技术。以上所述,仅为本发明中的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
权利要求
一种基于生物视觉机理的物体训练方法,包括步骤步骤S11,对训练图像进行Gabor滤波操作,生成各种尺度下的S1图像;步骤S12,对S1图像进行梯度滤波的稀疏化操作,生成图像的稀疏表达;步骤S13,对S1的稀疏表达进行降采样操作生成C1;步骤S14,对C1图像进行滤波操作,滤波卷积子随机采样于所有训练样本的C1图像,生成S2图像;步骤S15,对S2图像进行求最大值操作,生成C2;步骤S16,用C2作为特征向量送入支持向量机SVM分类器。
2.根据权利要求1所述的方法,其特征在于还包括从训练数据上的结果向S2图像的反 馈过程。
3.根据权利要求2所述的方法,其特征在于所述反馈过程包括将训练集上表现最好的 SVM模型保留。
4.根据权利要求1所述的方法,其特征在于在降采样操作中,对每一个局部区域都只 保留最大像素点及其周围四个像素点的和。
5.一种基于生物视觉机理的物体识别方法,包括步骤步骤S21,对训练图像进行Gabor滤波操作,生成各种尺度下的S1图像;步骤S22,对S1图像进行梯度滤波的稀疏化操作,生成图像的稀疏表达;步骤S23,对S1的稀疏表达进行降采样操作生成C1 ;步骤S24,对C1图像进行滤波操作,滤波卷积子随机采样于所有训练样本的C1图像,生 成S2图像;步骤S25,对S2图像进行求最大值操作,生成C2 ;步骤S26,用C2作为特征向量送入支持向量机SVM分类器,根据SVM模型判断测试图像 类别。
6.根据权利要求5所述的方法,其特征在于还包括从训练数据上的结果向S2图像的反 馈过程。
7.根据权利要求6所述的方法,其特征在于所述反馈过程包括将训练集上表现最好的 SVM模型保留。
8.根据权利要求5所述的方法,其特征在于在降采样操作中,对每一个局部区域都只 保留最大像素点及其周围四个像素点的和。
全文摘要
一种基于生物视觉机理的物体训练方法,包括步骤对训练图像进行Gabor滤波操作,生成各种尺度下的S1图像;对S1图像进行梯度滤波的稀疏化操作,生成图像的稀疏表达;对S1的稀疏表达进行降采样操作生成C1;对C1图像进行滤波操作,滤波卷积子随机采样于所有训练样本的C1图像,生成S2图像;对S2图像进行求最大值操作,生成C2;用C2作为特征向量送入支持向量机SVM分类器。本发明用于智能视觉监控系统,帮助监控系统识别场景中目标的类别,使得监控系统能真正理解场景中正在发生什么,而且可以根据不同的目标类别采取不同的安全级别。用于多媒体数字内容分析中的目标分析,判断目标的类别,用于分析顾客对特定产品或者特定娱乐项目喜好。
文档编号G06K9/66GK101840518SQ20101014097
公开日2010年9月22日 申请日期2010年4月2日 优先权日2010年4月2日
发明者谭铁牛, 黄凯奇, 黄永祯 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1