人脸或场景识别数据分类的竞争和协同表示方法及系统与流程

文档序号:16787280发布日期:2019-02-01 19:27阅读:253来源:国知局
人脸或场景识别数据分类的竞争和协同表示方法及系统与流程
本发明属于数据处理
技术领域
,尤其涉及一种人脸或场景识别数据分类的竞争和协同表示方法及系统。同时也适用于场景识别。
背景技术
:目前,业内常用的现有技术主要分成两种。一种是基于线性表达模型构建的分类识别系统,该类识别系统通常依据l1范数正则化的稀疏表示和l2范数正则化的协同表达对测试样本进行编码,但由于对l1范数进行优化求解的方法较为复杂费时,所以业界通常选用协同表达的方式构建真实的识别系统。另外一种识别系统主要利用了深度学习的方式进行模型训练,但是由于深度模型有大量的模型参数需要训练,所以系统针对性不强,现主要应用在安防系统和智慧城市等方面。近期,神经网络模型在图像分类和人脸识别上取得了突破进展。深度网络学习使图像学习与分类学习成为一体并且能够从原始数据中学习仿真。但是在训练深度模型的过程中,有大量的参数需要学习,所以需要大量的数据参与训练。然而在实际的应用场景中,一个小型的公司通常有几百人,然而模型训练需要几万或者几十万的训练数据,这对于采集数据造成了巨大的困难。除此之外,随着模型参数增多,需要训练的时间也会成倍增加,进而不能很好的响应用户需求。然而,在数据库比较小或者训练样本不够充分的情况下,基于线性表达的分类器也许是一个很好的选择。传统的线性分级器,比如最近邻分类器,最近特征线分类器,限行回归分类器,仅仅采用了一小部分的训练样本去表达查询数据。但是,这些方法并不能强健的处理噪声数据,同时,这也存在着不同的线性组合训练样本去重建一个测试样本的问题。因此wright等人利用范数正则化的稀疏性质,提出了基于稀疏表达分类器src的稀疏表达,该方法针对查询样本能够用相对稀疏的编码对其进行表达。但是zhang等人认为,当训练样l1本之间的相关性很高时,稠密的编码比稀疏的编码更好,并能充分展现分类的的协调一致性,从而依据l2范数的协同性质提出了协同表达的方法,该方法能让更多的样本对查询样本进行编码,从而获得与查询样本最一致的编码表达。随后akhtar等人认为稀疏表达和协同表达对于分级都很重要。但是这些方法在训练的过程中,通常是将训练样本分开对待,从而忽视了训练数据的空间结构信息。随后wang等人利用了训练数据的标记信息改进模型,使得识别正确率有所提升,但是该方法却忽视了训练数据本身的性质。由此可见,基于线性表达的分类模型的优劣主要取决于是否能利用类标信息或数据结构信息准确地捕获训练样本间的关系,并利用这些关系对查询样本进行准确唯一的编码。因此,本发明提出了一种竞争和协同表达的方法,一方面能自动地发现训练样本间的关系,另一方面还可以利用新的l范数正则化项在编码的过程中创造竞争表达,进而获得较为稀疏的编码,同时也能得到准确的编码解。综上所述,现有技术存在的问题是:(1)传统的线性分类器,比如最近邻分类器,最近特征线分类器,限行回归分类器,仅仅采用了一小部分的训练样本去表现查询数据,并且,这些方法并不能强健的处理噪声数据,同时,这也存在着不同的线性组合训练样本去重建一个测试样本的问题。(2)现有技术都把训练样本分开对待,忽视了潜伏的训练数据的结构。现有技术改进的方法忽视了数据的局部构造。其他改进的方法,虽然利用了训练数据的标记信息,但却忽视了训练数据本身所包含的信息。(3)现有的方法很难有效地发现训练样本间的关系,并自动地选择稀疏或稠密的编码方式对查询样本进行编码。(4)现有的稀疏编码方式通常是使用基于l1范数的正则化,但是这种约束方式会使得求解不稳定且训练费时,所以需要提出一种易于快速求解且能得到唯一准确解的方法。解决上述技术问题的难度和意义:(1)本发明提出了新的l2范数正则化项,该正则化项利用不同类别数据间的差异性创造一种竞争表达的编码方式,该种竞争表达的方式能够自动地发现训练样本间的关系,从而自动地选择稀疏或者稠密的编码方式。因此该方法有效地解决了基于线性表达模型无法自动选择稀疏或者稠密编码的问题。(2)由于在本发明所提出模型中,只使用了l2范数的正则项约束,从而使得模型既能快速求解训练,还能得到相对稀疏准确的编码解。因此该发明解决了基于线性表达模型中既要获得稀疏解又要快速计算的问题。(3)本发明提出的模型巧妙地使用了样本间的空间结构信息,进而能够加强模型对稀疏编码或稠密编码的选择能力。技术实现要素:针对现有技术存在的问题,本发明提供了一种人脸或场景识别数据分类的竞争和协同表示方法及系统。本方法创造性地提出了一种新的l2范数正则化项,该正则化项利用不同类别数据间的差异性创造一种竞争表达的编码方式,该种竞争表达的方式能够自动地发现训练样本间的关系,从而自动地选择稀疏或者稠密的编码方式。除此之外,由于该方法只使用了l2范数的正则项约束,从而使得模型既能快速求解训练,还能得到相对稀疏准确的编码解。最后,本发明提出的模型巧妙地使用了样本间的空间结构信息,进而能够加强模型对稀疏编码或稠密编码的选择能力。本发明是这样实现的,一种人脸或场景识别数据分类的竞争和协同表示方法,包括:以公司门禁人脸识别系统为例对该方法进行详细地阐述。首先,需要对公司内所有员工进行图像采集工作,进而得到了模型的训练样本,也称之为训练数据库。之后,在系统使用的过程中,一个员工在通过门禁系统时,系统会对员工进行摄像,该张图像也称为测试样本,然后利用训练数据库中的样本对该张图像进行表达。最后,挑选出训练样本中表达系数最大的样本所属的类别作为该员工的识别结果。本发明所提出的方法构建了一个新的l2范数正则化项一方面要求模型能够根据训练样本间的关系自动地选择协同或者稀疏表达,另一方面使得模型能够快速训练,并求得最优编码结果。最后,该方法依据测试样本和训练样本间的结构信息创造性地设计了竞争权重,加强模型对稀疏或稠密编码的方式选择的能力,具体步骤如下:a)竞争约束:建立最佳函数在这里,y代表系统新摄像得到的图像的向量表达,x代表模型所用的训练样本构成的矩阵,x-i表示训练数据中除去第i个人所用样本构成的矩阵,u-i是对应于x-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,c是整个训练样本中所包含的总人数,λ是模型参数。b)设置竞争权重在这里,ri表示测试样本与第i类样本的欧式距离,rmax表示在所用的ri最大的值。c)建立最优化co-crc模型,求解出u,在这里,y代表系统新摄像得到的图像的向量表达,x代表模型所用的训练样本构成的矩阵,x-i表示训练数据中除去第i个人所用样本构成的矩阵,u-i是对应于x-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,c是整个训练样本中所包含的总人数,λ是模型参数。进一步,所述人脸或场景识别数据分类的竞争和协同表示方法具体包括:输入:将采集到的每个员工的图像转化成向量表达,然后将采集到的所有数据拼接成一个矩阵x作为训练样本集,然后将系统再次摄像到的人脸图像转化成向量作为测试样本y,规定模型中的系数为λ,δ;由于原始采集的图像数据是由0-255之间的数值进行表示的,所以本发明需要将原始图像数据标准化到0-1的范围之间;按照训练样本的个数构建单位矩阵,然后将第i类样本所对应的列去除,然后得到p-i,最终得到所有类别的按照计算新拍摄的图像(测试样本)y和训练数据库中第i个类别所构成的矩阵xi的空间距离,获得竞争权重ωi的值;依照等式获得测试样本的最优编码结果在这里,y代表系统新摄像得到的图像的向量表达,x代表模型所用的训练样本构成的矩阵,x-i表示训练数据中除去第i个人所用样本构成的矩阵,p-i表示除去第i类的对角矩阵,u-i是对应于x-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,c是整个训练样本中所包含的总人数,λ是模型参数。输出:计算公式r的最小值,当测试样本与训练库中的数据距离最小时,也就是该样本属于此类的可能性最大,所以将该员工归属于此类之中,从而完成整个识别验证的过程。本发明的另一目的在于提供一种实现所述人脸或场景识别数据分类的竞争和协同表示方法的计算机程序。本发明的另一目的在于提供一种实现所述人脸或场景识别数据分类的竞争和协同表示方法的信息数据处理终端。本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的人脸或场景识别数据分类的竞争和协同表示方法。本发明的另一目的在于提供一种实现所述人脸或场景识别数据分类的竞争和协同表示方法的人脸识别数据分类的竞争和协同表示系统,所述人脸识别数据分类的竞争和协同表示系统包括:输入模块,用于训练样本矩阵x,一个测试样本y,模型超参数λ,δ;l2范数归一化模块,用于将训练样本的原始数据归一化到0到1内;分割矩阵构建模块,设计按列分割的矩阵ωi值获取模块,按照计算在测试样本y和每一个分类xi的空间距离,获得ωi的值;测试样本编码模块,依照(g)公式获得测试样本的最优编码结果;输出模块,用于计算公式r的最小值并决定测试样本的分类记号。本发明的另一目的在于提供一种搭载所述人脸识别数据分类的竞争和协同表示系统的目标图像跟踪识别设备。本发明的另一目的在于提供一种搭载所述人脸识别数据分类的竞争和协同表示系统的场景图像数据追踪监控设备。综上所述,本发明的优点及积极效果为:本发明提出了一种新型的分类竞争与协同表示法(co-crc),它通过l2范数正则化利用训练样本的性质,创建了一个竞争环境,这能够使正确的分类对编码做出更大的贡献。除此之外,在这个算法中推荐的竞争权重,提高了所有分类间的竞争关系,并且对分类器寻找正确的分类有益处。本专利的所提出的方法被应用在很多公开的分类数据集上,例如目标检测、场景分类和人脸识别的图像数据集。为了对该方法进行一个客观公正的评价,一些较为先进且已广泛应用的方法被作为比较方法,如:稀疏表达分类器(src),协同表达分类器(crc)。除此之外,为了描述方便,本发明将本专利所提出的方法简记为co-crc,具体的实验结果如表1所示,该实验主要在扩展的耶鲁人脸数据库(extendedyale-b)进行。表1在扩展的耶鲁人脸数据库的实验结果(平均识别正确率±标准差)算法三个训练样本四个训练样本五个训练样本src63.13±1.2372.97±1.2778.62±1.36crc62.83±1.1273.04±1.2379.39±1.19co-crc66.42±1.0876.22±1.0982.14±1.14然后,本发明针对其他数据集也进行了多组实验,具体的实验结果如附图说明中图3和图6所示。依据大量实验结果显示:提出的完全基于l2范数正则化的算法,实现了利用更少的计算去获得相对稀疏的编码,并且这个算法比现在最先进的几个技术做的要好。本发明推荐的竞争约束模型能够利用合适的样本和减少其他分类的贡献,从而使分类编码有相同的倾向。为了提高正确分类的竞争能力,本发明定义了参照训练数据地理结构的竞争权重。这个竞争权重使用近距离分类的测试样本对测试样本的编码产生更大的贡献。本发明利用竞争约束和权重,提出了co-crc模型。这种方法能够依照合适的数据和创造一个有竞争环境去使正确的分类更好的表现测试样本,从而控制一致性编码的稀疏程度。本发明利用l2范数正则化吸取了前人的经验与教训,完善了模型,使其更稳定,更有竞争力,并且更实用。附图说明图1是本发明实施例提供的人脸或场景识别数据分类的竞争和协同表示方法流程图。图2是本发明实施例提供的分类的贡献远低于相应的分类在src和crc的贡献,使co-crc中表现向量更有辨别力对比图。图3是本发明实施例提供的co-crc的识别率与他方式对比图。图4是本发明实施例提供的co-crc成功的限制了其他分类的贡献并着重强调了最后正确分类的重要性示意图。图5是本发明实施例提供的co-crc能够准确地选择正确的分类去表现测试样本并且表现向量是稀少的。相反地,对于lrsdl,这有很多分类表现测试样本图。图6是本发明实施例提供的15场景数据库示意图。图7是本发明实施例提供的人脸识别数据分类的竞争和协同表示系统示意图。图中:1、输入模块;2、l2范数归一化模块;3、分割矩阵构建模块;4、ωi值获取模块;5、测试样本编码模块;6、输出模块。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。现有技术都把训练样本分开对待并忽视了潜伏的训练数据的结构。现有技术改进的方法忽视了数据的局部构造。利用了训练数据的标记信息,但忽视了训练数据本身。本发明推荐的竞争约束模型能利用合适的样本对测试样本进行表达,并且减少其他非正确类别中的样本对编码的贡献,从而使分类编码对正确的类别更有倾向性。为了提高正确分类的能力,本发明根据训练样本数据的局部结构信息定义了自适应的竞争权重;这个竞争权重会根据测试样本与训练样本的距离进行自动的更新,从而使得与测试样本较近的训练样本对其编码作出更大的贡献;本发明在吸取了前人的经验与教训的基础上,引入了竞争与协同的概念,提出了新的l2范数正则化项以及自适应的竞争权重,完善了模型,使其更稳定,更有竞争力,并且更实用。下面结合具体分析对本发明作进一步描述。本发明实施例提供的人脸或场景识别数据分类的竞争和协同表示方法,包括:竞争与协同表现分类:1竞争约束:建立最佳函数2设置竞争权重3建立最优化co-crc模型,得到最终的优化函数模型求解过程:1)求解(c)式第一项的导数表达如下所示2)对于(c)式第二项设置p-iu=u-i,其中p-i的具体表现形式如下所示:然后将该设置带入(c)式,得目标函数第二项的导数表达:3)将(d)与(e)式合并得4)最后依据下式解出编码u下面结合具体算法对本发明作进一步描述。如图1,本发明实施例提供的人脸或场景识别数据分类的竞争和协同表示方法,包括:s101:输入:训练样本矩阵x,一个测试样本y,模型超参数λ,δ;s102:将训练样本和测试样本的原始表达进行标准化;s103:设计按列分割的矩阵s104:按照计算在测试样本y和每一个分类xi的空间距离,获得ωi的值;s105:依照等式(g)获得测试样本的最优编码结果;s106:输出:计算公式r的最小值并决定测试样本的分类记号。下面结合效果分析对本发明作进一步描述。最后进行竞争与协同表现分析。试验和分析:i)延伸的yale面部数据库b;延伸的yale面部数据库b是包括2414个来自38个客体的正面面部影像。在co-crc中不正确的。co-crc中非正确类别的表达误差值高于其他方法非正确类的表达误差值,从而co-crc能对正确类别进行更有效的编码,如图2.ii)orl标准人脸识别库相似地,co-crc采用了超参数δ去适应分类间的表现并通过竞争约束提高正确分类的影响。可以看出来,co-crc的识别率比其他方式要高.如图3.除此之外,co-crc成功的限制了其他分类的贡献并着重强调了最后正确分类的重要性。相反,dsrc不能抑制其他分类的影响。因此,它说明了co-crc的表现向量更具有区别性。所有的分类能相对提供更多的信息给测试样本编码。然而,co-crc能够通过与其他分类的约束寻找准确的分类去提供更多的分类信息给编码。如图4.iii)某学院101类图像数据库co-crc能够准确地选择正确的分类去表现测试样本并且表现向量是稀少的。相反地,对于lrsdl,这有很多分类表现测试样本。如图5.大部分类别的表达错误值的差距都很小,从而造成模型对于正确类别的辨识力下降。iv)15场景数据库在解决自然场景的分类任务中,co-crc能够获得比当今最先进的技术更好的表现。特别地,对于高速公路场景或者街道场景,他们极其地相似,并且许多分级器不能合适的区分他们。相比较其他方法,本发明的方法在处理这两种场景中是值得赞扬的。如图6.如图7所示,本发明实施例提供的人脸识别数据分类的竞争和协同表示系统包括:输入模块1,用于训练样本矩阵x,一个测试样本y,模型超参数λ,δ;l2范数归一化模块2,用于将训练样本的原始数据归一化到0到1内;分割矩阵构建模块3,设计按列分割的矩阵ωi值获取模块4,按照计算在测试样本y和每一个分类xi的空间距离,获得ωi的值;测试样本编码模块5,依照(g)获得测试样本的最优编码结果;输出模块6,用于计算公式r的最小值并决定测试样本的分类记号。下面结合效果对本发明作进一步描述。对于测试样本的表现,这有一个指标去削减不正确的类别的贡献,和扩大正确类别对编码的影响。本发明提出得这种新的co-crc方法,在所有分类中用竞争约束和权重创建了一个暴力的竞争环境。co-crc使编码近似测试样本。除此之外,附加权重在客观函数中促进了准确的分类在竞争之中的能力。最后,依照数据结构和在大多数分类任务中的表现影响,大量的实验和分析结果阐释了提出得方法适应稀疏的一致性编码。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1