目标物识别方法及识别系统与流程

文档序号:18167716发布日期:2019-07-13 09:43阅读:332来源:国知局
目标物识别方法及识别系统与流程
本公开涉及信息处理
技术领域
,尤其涉及一种目标物识别方法及系统。
背景技术
:目标物的自动识别,例如人脸识别、动物品种识别或植物品种识别,是基于目标物的局部或整体特征信息进行身份识别的识别技术。一种通用的识别技术是基于lbp(localbinarypatterns,局部二值模式)特征算法,hog(histogramoforientedgradient方向梯度直方图)特征算法或者haar-like(特征的计算-积分图特征)特征算法,且需要创建很大的人脸数据库并一一比对;而另一种通用的识别技术基于深度学习的目标物识别方案,计算时则需要大量的参数量,计算则更为复杂;以上两种识别技术对终端处理芯片的内存和计算能力都具有较高要求,需要更高内存开销的存储装置以及更快运算能力的计算装置与之匹配。技术实现要素:有鉴于此,本公开的目的在于提供一种目标物识别方法以及识别系统,以至少部分解决上述的技术问题。根据本公开的一方面,提供一种目标物识别方法,包括:对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据均衡的局部二值模式特征对每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;基于压缩稀疏行的稀疏数据存储方式,存储该稀疏矩阵向量。在进一步的实施方案中,所述基于压缩稀疏行的稀疏数据存储方式,包括只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置。在进一步的实施方案中,所述只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;将各非零元素及其对应地址作为单元数据进行存储。在进一步的实施方案中,所述各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。在进一步的实施方案中,对图像各像素提取局部二值模式特征之前,还包括:输入待识别图像;对该待识别图像进行灰度化;对灰度化的图像进行双线性插值至设定尺寸。在进一步的实施方案中,将所述存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。在进一步的实施方案中,还包括:将所述存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。根据本公开的另一方面,还提供一种目标物识别系统,包括:处理器,用于执行指令,在执行指令时完成以下步骤:对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据均衡的局部二值模式特征对每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;存储器,基于压缩稀疏行的稀疏数据存储方式,存储该稀疏矩阵向量。在进一步的实施方案中,所述存储器中,基于压缩稀疏行的稀疏数据存储方式,包括:只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置。在进一步的实施方案中,所述存储器中,只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;将各非零元素及其对应地址作为单元数据进行存储。在进一步的实施方案中,所述存储器中所述各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。在进一步的实施方案中,所述处理器还用于:对图像各像素提取局部二值模式特征之前:输入待识别图像;对该待识别图像进行灰度化;对灰度化的图像进行双线性插值至设定尺寸。在进一步的实施方案中,所述处理器还用于:将所述存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。在进一步的实施方案中,所述处理器还用于:将所述存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。通过本公开的识别方法,在以压缩稀疏行(csr)的稀疏数据存储方式存储时,存储的矩阵向量占用内存空间可以大大缩小,可以节省近60%内存开销;通过本公开的识别系统,可以减少内存消耗,提高整个识别系统的运算和处理效率。附图说明图1是本公开实施例的目标物识别方法流程图。图2a是本公开另一实施例的目标物识别方法整体示意图;图2b是图2a的具体流程图。图3是图2b中目标物识别方法中实施例的中局部二值模式特征值的计算示意图。图4是图3中加入旋转不变性特性的局部二值模式示意图。图5是图2a实施例的内存开销与现有技术的比较示意。图6是本公开实施例的目标物识别系统方块图。具体实施方式为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开作进一步的详细说明。下面通过实施例,并结合附图,对本公开的技术方案作进一步具体的说明。在说明书中,相同或相似的附图标号指示相同或相似的部件。下述参照附图对本公开实施方式的说明旨在对本公开的总体发明构思进行解释,而不应当理解为对本公开的一种限制。另外,在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。在其他情况下,公知的结构和装置以图示的方式体现以简化附图。现有的目标物识别过程中,存储处理后的目标物识别数据时需要耗费大量的存储空间,根据本公开的基本构思,提供一种目标物识别方法,包括对目标物识别数据(例如ulbph的稀疏矩阵向量)采用稀疏矩阵的存储方式存储,以节省空间,提高效率。图1是本公开实施例的目标物识别方法流程图。本公开实施例提供一种目标物识别方法,如图1所示,其包括步骤:s1:对图像各像素提取局部二值模式特征后,经过uniform(均衡)降维处理得到ulbp(uniformlocalbinarypattern,均衡的局部二值模式)特征,其中,图像的内容包含至少部分目标物;s2:对图像进行单元分割,每个单元对应多个像素,并依据ulbp特征对每个单元求取直方图后拼接在一起,得到ulbph(uniformlocalbinarypatternhistogram,均衡的局部二值模式直方图)的稀疏矩阵向量;s3:基于压缩稀疏行(compressedsparserow,简称为csr)的稀疏数据存储方式,存储该稀疏矩阵向量。步骤s1中涉及对ulbp特征进行降维处理,通常在目标物识别过程中,需要对拍摄的含目标物的图像进行处理,以利于后期进行判断,一种方式是采用基于ulbph算法进行处理,其中包括对图片进行多步骤的处理,包括在对图像各像素提取局部二值模式特征后,可经过uniform降维处理得到ulbp特征。局部二值模式(lbp)是用来描述图像局部纹理特征的算子,另外还可以根据需要加入旋转不变性和灰度不变性特性。经过局部二值处理后,每个像素点都可以得到一个lbp编码,此时得到是一个每一个像素点局部二值的图片。然后,对该lbp图谱进行进一步处理,例如进行uniform降维处理,对lbp特征值uniform的操作可以是:在局部二值模式确定的设定邻域范围内(例如8邻域),对于0-1(1-0)跳变次数小于等于2的lbp特征值uniform为自身,而对于0-1(1-0)跳变次数大于2的lbp特征值uniform为设定数值,例如58。通过该做法,能够保证不失真的基础上降低数据存储量。本公开实施例中所指的目标物可以是动物、植物、人或者物品,或者上述所列的局部,后期如果需要对目标物的种类进行区分的也可以包括其中,例如对人脸进行识别,以区分不同的人;对动物进行识别,以区分不同种类的动物,甚至可以同一科的不同动物,例如可以在犬科中区分出斗牛犬、松狮、吉娃娃、藏獒等具体品种。在一实施例中,图像的内容可以包含至少部分目标物,例如目标物为人脸,则可以包括部分人脸;例如目标物为建筑物,则可以是建筑物的局部轮廓。在一实施例中,对图像各像素提取局部二值模式特征之前,还包括:输入待识别图像;对该待识别图像进行灰度化;以及对灰度化的图像进行双线性插值至设定尺寸。在提取二值模式之前,可能还需要对包含目标物的图像进行预处理,包括但不限于灰度化和线性插值操作。步骤s2中,对进行过降维后的图像进行ulbp特征谱的直方图统计。由于直接对提取的ulbp特征进行分析的话,可能由于位置未对准即进行分析。可以通过对图像进行单元分割(即将一幅图片划分为若干子区域),每个单元对应多个像素,并依据ulbp特征对每个单元求取直方图后拼接在一起,得到ulbph的稀疏矩阵向量。例如图片有10*10个单元,也就有了10*10个统计后的直方图,将它们拼接在一起可以形成一矩阵向量,也就是整张图的ulbp纹理特征向量。当然,分割方式可以有多种,例如图片可以分割成多个为正方形、矩形或者不规则图形。本公开实施例中并不以此为限。由于目标物内容部分图像(例如人脸)除了一些比较有棱角的地方,像素变化比较大,其余整体部分都比较平滑,因此在做直方图统计的时候会有大量的0出现,也就是ulbph会是一个稀疏矩阵(向量)。在步骤s3中,对处理得到的稀疏矩阵向量需进行存储,如按照通常的向量存储方式进行存储,需要占用大量的存储空间,而且存储空间中为0的值较多,空间严重浪费,本公开实施例提出了基于csr的稀疏数据存储方式,以存储该稀疏矩阵向量。在一实施例中基于csr的稀疏数据存储方式,包括:存储稀疏矩阵向量的非零数据以及非零数据对应位置。在进一步的实施例中,存储稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;以及将各非零元素及其对应地址作为单元数据进行存储。在一实施例中,由于ulbph特征为1*n的一个向量,可以只记录各非零元素及偏移量(该偏移量对应元素的地址);作为单位数据进行存储时以链表方式或者组表方式进行存储;链表中的各个节点可以记录地址信息、非零元素信息以及指向下一节点的指针信息;组表进行存储时可以记录的信息中包括非零元素和偏移量。在一实施例中,上述人脸识别方法步骤中还可以包括:将存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库(这里的同种类可以对应于自然界和社会中对于物种的分类,比如隶属于生物学同一种和/或类概念的猫、狗或人)。也就是组建特定目标物的数据库,对各特征向量所代表的物种进行命名,为后期识别未知种类的目标物提供数据库支持。在一实施例中,上述人脸识别方法还包括如下步骤:将存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类,从而实现了对目标物的识别。其中,进行上述比较时,可根据已有的比较方式进行,原则是数据相似度高于设定阈值的则认为相同。通过上述的处理和存储方法后,内存开销降低,处理速度加快。为了更加具体充分的理解本公开,以下特以目标物为人脸进行举例说明,但应理解的是,下述的识别方法的具体细节仅仅用于更好的阐述本公开,而不应该理解为对本公开的限定。实施例1具体实施例1的目标物识别方法中,可基于ulbph算法的人脸识别,具体流程如图2a和图2b所示(图2a是本公开另一实施例的目标物识别方法整体示意图,图2b是图2a的具体流程图):参见图2a所示,人脸识别整体可以包括人脸数据表示、lbph特征特征、人脸图像与特征数据库的建立、以及分类识别),具体内容如下所述:人脸数据表示:首先,参见图2b所示,识别开始后,对输入待识别人脸进行图像灰度化(选择性的进行双线性插值)至与数据库人脸相同尺寸;lbph特征提取:然后,参见图2b所示,对进行图像灰度化(选择性的双线性插值)的人脸结果提取lbp特征,参见图3,图3是图2a中目标物识别方法中实施例的中局部二值模式特征值的计算示意图;其中,对于lbp特征,加入旋转不变性的lbp特征:上述lbp特征值的计算基于8邻域,因此同一个点的lbp特征值会随着起点的不一样而不一样,如图4所示,共有8种情况(例如图4中的lbp特征值225对应的旋转lbp特征值可以有240、120、60、30、15、135和195七种),取这些情况中的最小值,也就是图4所示的数据15(lbp特征值15),作为这个点的lbp特征值,这样不管图片怎么旋转,这个点的lbp特征值都会是15,也就是旋转不变性。接着,参见图2b所示提取后的lbp特征需要经过uniform进行降维处理得到低维度的ulbp特征,例如8邻域做法,维度会从256维降至59维;例如对于一个基于8邻域的lbp特征值,其值可认为是unsignedchar类型,取值范围为[0b00000000,0b11111111],对lbp特征值uniform的操作定义为:对于0-1(1-0)跳变次数小于等于2的lbp特征值uniform为本身,而对于0-1(1-0)跳变次数大于2的lbp特征值uniform为58,其中部分lbp值跳变为ulbp值之间的对应关系如表1所示:表1之后,参见图2b所示,进行单元(cell)分割,并依次求取直方图后拼接在一起,得到ulbph,分割的单元(cell)的个数为7*7;ulbph就是对ulbp按cell进行直方图统计,对提取后的单元分割并依次求取直方图后拼接在一起得到的ulbph如下表2所示,假设图像大小为91*112(宽*高),共有7*7个cell,那每个cell的大小为13*16(宽*高),对每个cell进行直方图统计,每个cell都有59个bin,然后按照顺序将每个cell的ulbph进行拼接,也就是说一张人脸经过上述所有操作后会得到7*7*59的一个特征向量。表20123456789人脸图像与特征数据库随后,参照图2b所示,按照上述方式存储已知目标物种类的特征向量,并且作为已知种类的目标物存入人脸数据库。分类识别最后,参见图2b所示,与按照上述方式存储的人脸数据库中的所有ulbph进行对比,找到与待识别人脸距离最近的ulbph,以此确定待识别人脸的标签(label)。以下,将对按照本实施例1方式的方法处理后的内存开销与现有技术中未经处理的内存开销进行比较:首先,对于现有技术来说,以bin取得的最大值为13*16=208为例,需要用8bit表示,一张人脸所需要的内存开销为7*7*59*8bit=23128bit,需要创建n张人脸的数据库,则需要n*23128bit。其次,针对本具体实施例1的设置,非零元素的位置最大为7*7*59,需要用12bit表示,假设非0元素有nz个,则采用csr的存储方式需要nz*(8+12)=nz*20bit。人脸的ulbph中非零元素所占比例大约为15%~20%,也就是nz≈0.2*7*7*59,基于csr的存储方式需要nz*(8+12)=nz*20bit=11564bit;将两者进行比较:11564bit/23128bit=50%,即可以节省50%的存储空间。还可以通过图5所示的数据库进行验证,例如以yale数据库和att数据库验证;通过输入相应的占用内存显示指令,表明:yale数据库中有165人,未采用本公开实施例1的方式处理时,占用3816120bit,采用本公开实施例1的方式存储后,占用1438860bit,节省了62%的存储空间;类似的,att数据库中,共有400个的数据,未采用本公开实施例1的方式处理时,占用9251200bit,采用本公开实施例1的方式存储后,占用3911640bit,节省了57%的存储空间。因此,采用本公开实施例的以压缩稀疏行的稀疏数据存储方式存储时,存储的矩阵向量占用内存空间可以大大缩小。其中可在电脑程序码或机器可使用指令来执行本公开的方法,指令可为程序模组的电脑可执行指令,其程序模组由电脑或其它机器,例如个人数位助理或其它可携式装置执行。一般而言,程序模组包括例程、程序、物件、元件、数据结构等,程序模组指的是执行特定任务或实现特定抽象数据类型的程序码。本公开可在各种系统组态中实现,包括可携式装置、消费者电子产品、通用电脑、更专业的计算装置等。本公开还可在分散式运算环境中实现,处理由通信网路所连结的装置。如图6所示,本公开实施例还提供了一种目标物识别系统,包括:处理器610,用于执行指令,在执行指令时完成以下步骤:对图像各像素提取局部二值模式特征后,经过uniform降维处理得到ulbp特征,其中,图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据ulbp特征对每个单元求取直方图后拼接在一起,得到ulbph的稀疏矩阵向量;存储器620,基于csr的稀疏数据存储方式,存储该稀疏矩阵向量。在一实施例中,基于csr的稀疏数据存储方式,包括:只存储稀疏矩阵向量的非零数据以及非零数据对应位置。在一实施例中,存储器620中,只存储稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;将各非零元素及其对应地址作为单元数据进行存储。在一实施例中,存储器620中各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。具体存储方式可以参照以上介绍的方法实例内容,在此不予赘述。在一实施例中,处理器610还用于:输入待识别图像;对该待识别图像进行灰度化;以及对灰度化的图像进行双线性插值至设定尺寸。具体处理方式可以参照以上介绍的方法实例内容,在此不予赘述。在一实施例中,处理器610还用于:将存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。具体处理方式可以参照以上介绍的方法实例内容,在此不予赘述。在一实施例中,处理器610还用于:将存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。具体处理方式可以参照以上介绍的方法实例内容,在此不予赘述。其中,目标物识别系统可以包括直接或间接耦接以下装置的总线660、存储器620、一或多个处理器610、一或多个显示器650、输入/输出(i/o)端口630、输入/输出(i/o)元件640。总线660表示可为一或多个总线的元件(例如,位址总线、数据总线或其组合)。虽然图6的各个方块为简要起见以线示出,实际上,各个元件的分界并不是具体的,例如,可将显示装置的呈现元件视为i/o元件;处理器可具有存储器。目标物识别系统一般包括各种电脑可读取媒体。电脑可读取媒体可以是可被目标物识别系统存取的任何可用媒体,该媒体同时包括易挥发性和非易挥发性媒体、可移动和不可移动媒体。举例但不局限于,电脑可读取媒体可包括电脑储存媒体和通信媒体。电脑可读取媒体同时包括在用于储存像是电脑可读取指令、数据结构、程序模组或其它数据之类的信息的任何方法或技术中实现的易挥发性性和非易挥发性媒体、可移动和不可移动媒体。电脑储存媒体包括但不局限于ram、rom、eeprom、快闪存储器或其它存储器技术、cd-rom、数位多功能光碟(dvd)或其它光碟储存装置、磁片、磁碟、磁片储存装置或其它磁储存装置,或可用于储存所需的信息并且可被计算装置存取的其它任何媒体。电脑储存媒体本身不包括信号。通信媒体一般包含电脑可读取指令、数据结构、程序模组或其它采用诸如载波或其他传输机制之类的模组化数据信号形式的数据,并包括任何信息传递媒体。举例但不局限于,通信媒体包括像是有线网路或直接有线连接的有线媒体及无线媒体,像是声频、射频、红外线以及其它无线媒体。上述媒体的组合包括在电脑可读取媒体的范围内。存储器620包括以易挥发性和非易挥发性存储器形式的电脑储存媒体。存储器可为可移动、不移动或可以为这两种的组合。示例性硬体装置包括固态存储器、硬碟驱动器、光碟驱动器等。目标物识别系统包括一或多个处理器,其读取来自像是存储器620或i/o元件640各实体的数据。显示器650向使用者或其它装置显示数据指示。示例性显示元件包括显示装置、扬声器、列印元件、振动元件等。i/o端口630允许目标物识别系统逻辑连接到包括i/o元件640的其它装置,一些此种装置为内建装置。示例性元件包括麦克风、摇杆、游戏台、碟形卫星信号接收器、扫描器、印表机、无线装置等。以上所述的具体实施例,对本公开的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本公开的具体实施例而已,并不用于限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1